Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Зиявутдинов Суннатулла Махмудович

Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем
<
Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Зиявутдинов Суннатулла Махмудович. Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем : ил РГБ ОД 61:85-5/3853

Содержание к диссертации

Введение

Глава I. Обзор исследований в области формализщии кибернетических систем и объектов 8

1.1. Этапы формализации кибернетических систем и объектов 8

1.2. Постановка задачи идентификации. Методы идентификации 13

1.3. Выделение класса трудноформализуемых задач 19

1.4. Использование методов автоматической классификации и распознавания образов для решения трудноформализуемых задач 22

Глава 2. Идентификация трудюформализуемых задач. математические методы в. идентификации задач 30

2.1. Разработка методики идентификации трудноформализуемых задач 30

2.2. Формирование признакового пространства и разработка процедуры его сжатия 37

2.3. Задача таксономии. Разработка алгоритма ее решения 45

2.3.1. Теоретические посылки и необходимые понятия 47

2.3.2. Алгоритмы таксономии, основанные на методе вычисления оценок 51

Глава 3. Программное обеспечение и решение прикладных задач 55

3.1. Пример решения задачи АСТПП 55

3.2. Пример решения задачи АСНИ 60

3.3. Пример решения задачи САПР 63

3.4. Расчет технико-эконоглической эффективности . 65

Выводы 69

Литература 72

Приложения 79

Введение к работе

Актуальность исследований» В "Основных направлениях экономического и социального развития СССР на I98I-I985 годы и на период до 1990 года" указывается на необходимость расширения автоматизации проектно-конструкторских и научно-исследовательских работ с применением электронно-вычислительной техники [I].

Эффективность автоматизированных систем управления технологическими и производственными процессами и автоматизации проектно-конструкторских и научно-исследовательских работ определяется, в частности, уровнем формализуемости соответствующих задач. Исходя из этого дальнейшее повышение эффективности автоматизированных систем управления технологическими и производственными процессами затруднено наличием множества процессов, формализация которых представляет определенные трудности или на этапе создания системы невозможна. Действительно, имеет место альтернатива, с одной стороны - сокращение сроков разработки АСУ и использование формализованных постановок, с другой - потери качества и эффективности АСУ из-за наличия трудноформализуемых задач, решаемых обычно постановкой дополнительных экспериментов для создания методов формализации этих процессов эвристическим подходом к решению.

Количество имеющихся в автоматизированных системах неформализованных задач, их роль, влияние на качество и эффективность систем еще значительны.

Степень автоматизации разработанной системы характеризуется соотношением формализованных и неформализованных задач в ней. Одним из методов повышения степени автоматизации системы является увеличение доли формализованных задач за счет трудноформализовэнных . Поэтому исследования, направленные на решение трудноформали-

зуемых задач актуальны.

Цель исследования. Она состоит в разработке и практическом применении методов идентификации некоторого класса задач, отличающихся сложностью процесса формализации.

Для реализации поставленной цели необходимо:

проанализировать существенные классы задач идентификации и методы их формального описания;

выделить класс трудноформализуемых задач, определить их основные отличительные характеристики и свойства;

разработать общую схему идентификации трудноформализуемых задач.

Научная новизна. Выделен класс трудноформализуемых задач, созданы методы их идентификации с целью повышения эффективности автоматизированного проектирования и систем управления.

Практическая значимость работы. На основе анализа класса задач, отличающихся сложностью формализации, разработана методика их идентификации с привлечением идей распознавания образов и автоматической классификации (таксономия, кластер-анализ).

Данная методика использована для решения некоторых задач АСТПП, САПР, АСНИ.

Показана возможность распространения методики решения для некоторых задач других предметных областей.

Основные результаты исследований внедрены:

на Ташкентском агрегатном заводе - "Автоматизация исследований обрабатываемости машиностроительных материалов резанием" с экономическим эффектом 101 тыс.руб.;

в ШКТБЭ по комплектным устройствам атомной энергетики -"Применение алгоритмов и программ автоматической классификации в технической подготовке производства" с условным экономическим эф-

фектом 142 тысруб,;

- на Узбекском металлургическом заводе им.Ленина - "Примене
ние методов автоматической классификации в технических задачах
машиностроения" с условным экономическим эффектом ИЗ тысруб. в
год.

Апробация работы. Основные положения работы доложены и обсуждены на:

П городской научно-технической и теоретической конференции (Навои,1972 г.);

I Всесоюзной межвузовской конференции "Автоматизация технологической подготовки производства в машиностроении с помощью ЭВМ" (Ворошиловоград,1973 г.);

Республиканской научно-технической конференции "Прогрессивные технологические процессы в машиностроении" (Ташкент,1973

г.);

УШ конференции молодых ученых УзНПО "Кибернетика" АН УзССР (Ташкент,1979 г.);

X конференции молодых ученых УзНПО "Кибернетика" АН УзССР (Ташкент,1981 г.);

Республиканской научно-технической конференции "Состояние и перспективы применения вычислительной техники в машиностроительной промышленности Узбекистана" (Ташкент,1982 г.).

Публикации. По теме диссертации опубликовано восемь статей и докладов.

Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка использованной литературы, приложений, снабжена таблицами и рисунками.

В первой главе рассматривается эволюция расширения области формализации кибернетических систем и объектов, на основании ана-

лиза которой обоснована цель исследования и сформулированы задачи исследования. Методом теоретико-множественного анализа выделен класс трудноформализуемых задач.

Вторая глава посвящена разработке методики идентификации трудноформализуемых задач, решению задач сокращения признакового пространства и таксономии. Описываются алгоритмы решения этих задач.

В третьей главе исследуется возможность применения разработанной методики для решения задач АСТПП, АСНИ и САПР. Применением методов распознавания образов и таксономии решаются задачи технологической подготовки производства, научных исследований и конструкторского проектирования. Приводятся расчеты технико-экономической эффективности.

Г л а в a I

ОБЗОР ИССЛЕДОВАНИЙ В ОБЛАСТИ ФОРМАЛИЗАЦИИ КИБЕРНЕТИЧЕСКИХ СИСТЕМ И ОБЪЕКТОВ

I.I. Этапы формализации кибернетических систем и объектов

Для рассмотрения эволюции расширения области формализации кибернетических систем и объектов дадим определение формализации. Формализация - представление какой-либо содержательной области (рассуждений, доказательств, процедур классификации, поиска ин-формации научных теорий) в виде формальной системы или исчисления.

Формализация, осуществляемая на базе определенных абстракций, идеализации и искусственных символических языков, используется прежде всего в математике, а также в тех науках, в которых применение математического аппарата достигает достаточной для этой цели степени зрелости. Формализация предполагает усиление роли формальной логики как основы теоретических наук, поскольку для формализованных теорий нельзя удовлетвориться интуитивным убеждением, что та или иная аргументация согласуется с логическими правилами, усвоенными так или иначе приобретенной способностью к правильному мышлению.

Полностью могут быть формализованы лишь элементарные теории с простой логической структурой и небольшим запасом понятий. Если же теория сложна, она принципиально не может быть полностью формализована.

Формализация позволяет систематизировать, уточнить и методологически пояснить содержание теории, выяснить характер взаимосвязи между собой различных ее положений, выявить и сформулировать еще нерешенные проблемы [65].

Приведем три примера, показывающие эволюцию развития автоматизированных систем.

В начале 50-х годов в машиностроении начали появляться автоматические линии. По определению [бб], автоматическая линия -система машин, комплекс основного и вспомогательного оборудования, автоматически выполняющего в определенной технологической последовательности и с заданным ритмом весь процесс изготовления или переработки продукта, производства или части его. В функции обслуживающего персонала автоматической линии входят: управление, контроль за работой агрегатов или участков линии, их ремонт и наладка. Такая линия построена на основе физического моделирования.

Линии, которые для выполнения части операций производственного процесса требуют непосредственного участия человека, называются автоматизированными. В этих линиях вмешательство человека вызвано трудностями физического моделирования некоторых частей процесса. В таких случаях задача замены человека на линии решалась созданием роботизированных линий, что явилось новым достижением в автоматизации производственных процессов. Роботизация превращает автоматизированные линии в автоматические.

Третий этап развития характерен появлением задач автоматизированных систем управления, где проводится автоматизация в основном умственного труда. Задачи данного типа, в отличие от автоматических и роботизированных линий, решаются с помощью математического моделирования - формализацией процесса.

Дальнейшее повышение эффективности автоматизированных систем управления технологическими и производственными процессами затруднено наличием в них множества процессов, формализация которых сложна или на этапе создания системы невозможна. Действительно,

имеет место альтернатива: с одной стороны, - сокращение сроков разработки АСУ, использования формализованных постановок, а с другой, - потери качества и эффективности АСУ вследствие наличия трудноформализуемых задач, решаемых путем постановки дополнительных НИР для создания методов формализации этих процессов эвристическим подходом к решению.

Основная проблема технической кибернетики - проблема идентификации, т.е. определение структуры и модели оператора отображения входа системы к ее выходу. Характерно, что решение этой проблемы заключается в индуктивном подходе от простого к сложному. Техническая кибернетика, основываясь на теории автоматизированного регулирования и на классических методах математического моделирования, занималась автоматизированным управлением простым и по своей структуре кибернетическими объектами.

Дальнейшее развитие методов математического моделирования и теории управления позволило не только расширить класс кибернетических объектов, но перейти к управлению более сложными системами. Этому способствовало возникновение теории дуального управления [59], теории оптимального управления [48], теории адаптивного управления [52].

Попытки моделирования более сложных систем привели к появлению таких дисциплин, как системный анализ, теория систем, в которых первостепенным условием является рассмотрение процессов и явлений в целом. Целостное рассмотрение системы и метод ее описания классическим набором методов математического моделирования при такой постановке пришли в несоответствие.

Одним из эффективных приемов исключения несоответствия служит декомпозиция, где система рассматривается как объект, состоящий из множества элементов.

Моделированием элементов и связей между ними синтезируется модель системы.

В последние годы широкое развитие и распространение получило имитационное моделирование, которое позволяет использовать классические методы и приемы, адекватно описывать сложные системы, осуществлять машинные эксперименты для анализа и синтеза алгоритмов управления с целью создания более сложных и совершенных систем.

Первостепенным вопросом на всех уровнях исследования является возможность формализации. Очевидно, что все рассмотренные системы, описание которых возможно указанными выше методами, независимо от их природы, относятся к классу формализуемых задач таким образом, что идентификация их решается тем или иным существующим методом.

В реальной действительности имеется большое множество объективно существующих систем, формализация которых требует огромного количества экспериментальных исследований, их последующей обработки и анализа. Так, в геологических исследованиях закономерности присутствия тех или иных видов ископаемых определялись косвенными факторами как результат многолетних сборов статистических данных.

Попытки создания формализованного описания таких систем не привели к положительным решениям. Это, прежде всего, связано с отсутствием явной взаимосвязи признаков. Исследования подобного класса задач способствовали разработке теории распознавания образов, автоматической классификации [22,53,68].

Практические достижения в области распознавания образов относятся, прежде всего, к созданию читающих автоматов, предназначенных для непосредственного ввода буквенно-цифровой информации в ЦВМ. Существенные успехи получены в распознавании зрительных обра-

зов, а также в области автоматического распознавания сигналов. Однако эти работы не вышли пока за пределы лабораторий. Многочисленные успешные попытки применения методов распознавания сделаны в области обработки геолого-разведочных данных и, прежде всего, для распознавания нефтеносных пластов. Имеются определенные достижения в области распознавания болезней по наборам симптомов. Общая схема решения указанных задач следующая:

определение признакового пространства;

выбор алфавита признаков;

сбор статистических данных по множеству признаков;.

определение меры важности признаков (сокращение размерное-ти признакового пространства);

таксономия и распознавание объекта, принятие решения. Такая схема позволяет решать задачи диагностики, распознавания месторождений полезных ископаемых и т.д.

До сих пор практическое использование (путем встраивания) методов автоматической классификации и распознавания в автоматизированных системах проектирования, управления и т.п. в машиностроении не имело места. Для решения этих задач в основном использовался эвристический метод, который основывается на интуитивных, опирающихся на предшествующий опыт, алгоритмах. Этим эвристические методы в распознавании отличаются от формальных методов, логически выводимых из определенных гипотез о множествах распознаваемых сигналов, о классе, к которому заведомо принадлежит решающая функция, и т.п.

Эвристические методы могут привести к быстрому и успешному решению той или иной проблемы в тех случаях, когда имеется опыт решения сходных, в каком-либо отношении, проблем. Б подобных случаях решение удается найти без больших затрат, усилий и времени

на изучение закономерностей, специфичных для данной конкретной проблемы. Решение находят на основе аналогий и не вполне осознанных ассоциаций с решениями других похожих проблем.

Целенаправленная деятельность человека, в подавляющем большинстве случаев, при решении сложных задач является эвристической, так как формальные правила для наилучших в каком-либо смысле действий почти всегда неизвестны.

1.2. Постановка задачи идентификации. Методы идентификации

Задача идентификации заключается в определении оператора h объекта, т.е. построение такого оператора модели F , который был бы в определенном смысле близок к оператору объекта Го Указанная "близость" весьма относительна, так как операторы f0 и F могут иметь разную структуру, могут быть сформулированы на разных языках и иметь разное число входов. Именно поэтому близость операторов непосредственно оценить трудно или просто невозможно, тем более, что часто об операторе объекта Fo мало что известно. В связи с этим естественно оценивать близость операторов по их реакциям на одно и то же входное воздействие X , т.е. по входам объекта У«;=:1ь[Л' (*)J и модели у* (t) *F(x) . Степень близости этих реакций в каждый момент времени можно оценить, например, значением квадрата модуля разности векторов выхода:

где Ч = ^ і >Ут ) - вектор выхода модели.

В общем случае близость объекта и модели оценивается так называемой функцией невязки X - скалярной функцией двух векторных

аргументов - выходов объекта и модели:

y(t)* ?{У(і),Ун(Ь)) (I)

Сформулируем задачу идентификации. Она заключается в том, чтобы построить такой оператор модели F , который бы реагировал на возмущение входа z аналогично реакции объекта У . Реакция оператора модели на вход х имеет вид У =F(x) . Следовательно, модельный оператор F должен быть таким, чтобы

Уноо!/

где CV) знак эквивалентности, т.е. выходы модели и объекта при одинаковых входных воздействиях х. должны быть эквивалентны. Этого можно добиться, если ввести единую меру близости на всем интервале наблюдения, не только в каждой точке, как в (I).

Такой мерой в случае, когда объект непрерывный, может быть
интеграл J м

Q*]f(y{t),y(V)dt

Действительно, в соответствии с определением функции / С.,.) величина Q выражает степень близости функций !/() и У (^ в интервале 0^ t ^ Т . Значение Q явно зависит от F :

о и задача идентификации заключается в ее минимизации путем соответствующего выбора оператора модели F .

Процесс идентификации, т.е. процесс определения оператора модели , естественно строить так, чтобы минимизировать указанную невязку, т.е. решать задачу минимизации функционала G(F) по оператору F \

Эта символическая запись выражает следующую простую мысль: нужно минимизировать функционал Q(F) , варьируя оператором (или в простейшем случае функцией) F не произвольно, а в некотором определенном классе операторов (или функций)2. . Это обозначается соотношением їєі , т.е. F принадлежит классу Л , где Л -заданный класс операторов или функций. Результатом процедуры минимизации является некоторый оператор (или функция) F (не обязательно единственный), обладающий свойством:

ц ' FGSI

т.е. невязка Q на этом операторе минимальна (точнее, не превышает всех возможных невязок, которые можно получить в классе ъ ) (двойная стрелка => в (2) означает "решением является").

Иначе: для идентификации в заданном классе надо найти оператор (функцию) F , минимизирующий функциональную невязку Q (F) в этом классе.

Утверждение, что идентификация всегда сводится к операции отыскания минимума, преувеличено. Действительно, легко представить себе статический объект, который идентифицируется путем решения системы линейных или в общем случае нелинейных уровней. Однако утверждение о сведении задачи идентификации к задаче минимизации имеет всеобщий характер для всех случаев идентификации с любыми классами допустимых операторов и функций.

Таким образом, использование процедуры минимизации для решения задачи идентификации объектов является принципиальным и важным обстоятельством, свойственным обычно решению сложных задач идентификации.

Методы идентификации различаются по трем классификационным признакам и характеризуются значениями этих признаков:

которые кодируют метод; здесь ^ , {/ , Ц> - структурные признаки, принимающие два значения. Естественно, что структура метода никак не исчерпывается этими тремя признаками. Данная тройка служит, скорее, для обозначения метода, чем для его описания. Рассмотрим и охарактеризуем эти признаки.

I. Признак активности і . Метод идентификации будем называть активным ( f = I), если при его реализации возможно задавать и изменять определенным образом состояние входов объектов, т.е. как бы изменять состояние среды. Это - типичное управление объектом, но для достижения целей идентификации. Если объекта не позволяет управлять состоянием его входа, то метод его идентификации будем называть пассивным ( ^ = 0), т.е. опирающийся на данные ^ , полученные в режиме нормальной эксплуатации объекта; здесь Jp -апостериорная информация об объекте, имеющая количественный характер, т.е. результат (протокол) наблюдений входа и выхода объекта.

Елок-схема реализации активного метода показана на рис.1,

Рисі. Елок-схема активного метода идентификации

где вход объекта управляется в процессе идентификации так, чтобы повысить ее эффективность.

2* Признак адаптивности п . Если информация Я о поведении объекта используется в процессе идентификации не сразу, а по мере ее поступления или циклически и при этом значения идентифицируемых параметров корректируются на каждом шаге или непрерывно, то такой метод будем называть адаптивным. Модель при этом как бы адаптируется к объекту, чтобы ее реакция минимально отличалась от реакции объекта. В противном случае метод будем называть неадаптивным (л = 0).

Если адаптивный метод параметрической идентификации применять в реальном масштабе времени, используя непосредственно измерения входа и выхода объекта, то в этом случае его называют методом самонастраивающейся модели. В каждый момент времени сопоставляются выходы объекта и модели, при этом квадрат разности выходов минимизируется путем соответствующего выбора параметров оператора модели. Для повышения эффективности процесса минимизации используется информация о состоянии среды X . Таким образом модель все время подстраивается к объекту, чтобы их реакции на один и тот же вход в каждый момент времени различались минимально.

Адаптивный метод для дискретных объектов всегда описывается рекуррентной формулой вида

е^ЯСы&.Уь) (3)

где Ei- вектор идентифицируемых параметров на I -м шаге адаптации; У- алгоритм адаптации. Выражение (2) удобно записать в виде

где &Ci- приращение, реализуемое алгоритмом адаптации; В -мерном пространстве идентифицируемых параметров

18 *(?*>...,*) процесс адаптации иллюстрируется ломаной C0t.. .,

„it j*

l>._ ^ CLj iH,... > которая стремится к I - (fit, , *) - точному значению параметров.

Для непрерывного объекта процесс адаптивной идентификации реализуется дифференциальным уравнением

M..rli.xl ш

Однако режим адаптивной идентификации может реализоваться не только по схеме самонастраивающейся модели, но и в режиме реального масштаба времени. Если объем наблюдений мал, т.е. малы К ( в дискретном случае) и Т (в непрерывном), то однократное использо-вание информации $ может не решить задачи идентификации. В этом случае целесообразно образовать цикл Я ~ ft & & * , который решает поставленную задачу.

Одна из особенностей адаптивного метода заключается в том, что он почти никогда не решает задачу идентификации абсолютно точно, во всяком случае в пассивном варианте ( f =0), но позволяет постоянно улучшать значения идентифицируемых параметров. Поэтому его целесообразно применять для идентификации дрейфующих объектов, параметры которых медленно изменяются. В этом случае адаптивный метод позволяет отслеживать медленные изменения.

3. Признак шаговооти Ь . Если идентифицируемые параметры в процессе адаптивной идентификации (= I) изменяются дискретно, то такой метод будем называть шаговым (^ = I). В противном случае метод непрерывный ( = 0). Так, адаптивный метод (3) имеет шаго-вый характер, (4) - непрерывный.

Как видно, хотя этими тремя признаками метод идентификации описать невозможно, они характеризуют структурные его особенности, которые определяются спецификой объекта.

1.3. Выделение класса трудноформализуемых задач

Рассмотрим некоторые трудности, возникающие при идентификации и классификации задач по степени их идентифицируемости.

Одна из основных трудностей постановки и решения задачи идентификации заключается в определении класса оператора (или функций) 2 , в котором ищется это решение. Преодоление этой трудности формальным образом едва ли возможно в настоящее время. Действительно, на стадии определения класса 2 должна быть использована априорная информация об объекте как предмете идентификации для целей управления. Этот этап крайне трудно формализуем и нуждается в эрис-тических решениях. Пока такие решения может принимать только человек.

По характеру задачи такого типа относятся к задачам с нечеткими переменными. Основатель теории нечеткости Л.А.Заде рассматривает ее как аппарат анализа и моделирования гуманистических систем, т.е. систем, в которых участвует человек [23]. Его подход "опирается на предпосылку о том, что элементами мышления человека являются не числа, а элементы некоторых нечетких множеств, или классов объектов, для которых переход от "принадлежности" к "непринадлежности" не скачкообразен, а непрерывен".

По определению Л.А.Заде [24], "Нечеткое подмножество /,- универсального множества А характеризуется функцией принадлежности /иА '/—»-0,1 , которая ставит в соответствие каждому элементу число /иА (&) из отрезка [0,1 ], характеризующее степень принадлежности элемента d подмножеству Л'і .

На основе изложенного приведем определение трудноформализуемых задач: трудноформализуемыми задачами называются задачи, решаемые классом операторов F на множестве входных факторов А , вклю-

чающем в себя нечеткое подмножество А і .

Рассмотрим процесс идентификации с теоретико-множественной точки зрения. Пусть заданы множество входных параметров AQX и множество выходных параметров ВС У , где X , У - метрические пространства. Рассмотрим множество отображений Г из множества А в множество В :

(АСХ)

(B&V)

Пусть F0cF - некоторый оператор, описывающий истинное поведение изучаемой системы. На множестве отображений выделим подмножество операторов:

(А- множество операторов, описывающих систему).

Рассмотрим некоторую метрику f на пространстве Ч и произвольный оператор FcF . Пусть хеА дХ и yc^Fff(X-j , tfi=f}(x). Для наглядности указанные обозначения приведены на рис, 2.

Рис.2.

Класс операторов F имеет несколько уровней идентификации системы:

I) если для любого FtF и любого х А вернор {Ft (х), pD(x))-0* то класс операторов F однозначно описывает систему и ее можно считать детерминированной. Б этом случае систему можно идентифицировать при помощи произвольного оператора Fte.F . при этом каждому значению входных воздействий отвечают определенные

значения выходных параметров;

2) если для любого FteF f любого хе Л и некоторого достаточ
но малого, но заранее определенного б >0 f(Fo(^-)Fi(x.))

то класс операторов описывает систему с заданной точностью и ее можно считать устойчивой, в частности, стохастически устойчивой;

3) если для любого яєА ж некоторого >0

P(F0(X),F1(X))> (5)

для любых fxF , то систему назовем неидентифицируемой в классе операторов F , а задачи, решаемые в этом случае, - неформализуе-мыми;

4) если множества А и F можно разбить на подмножества (воз-
можно имеющие общие части):

А1} Ai, . .., Ак С А ^

и в более узких пределах входного параметра AL класс операторов FL описывает систему с заданной точностью І , то задачи, решаемые на множестве А классом операторов F , назовем трудноформали-зуемыми.

Приведем основные свойства трудноформализуемых задач.

  1. Отсутствие математического описания и необходимость в нем (обязательное свойство). Под математическим описанием подразумева-ется наличие алгоритма вычисления выходных параметров по входным параметрам

  2. Стохастичность (важное свойство, характеризующее трудности процесса анализа и математического описания объекта). Это свойство обусловлено наличием, кроме множества входов, множества случайных помех.

  3. Невозможность математического описания трудноформализуе-

мых задач в широких пределах входных параметров. Это свойство является основной причиной математического описания многих процессов в виде частных эмпирических зависимостей.

  1. Невоспроизводимость результатов эксперимента. Проявляется это свойство в различной реакции объекта на одну и ту же ситуацию в различные моменты времени и представляет собой результат свойства 2.

  2. Адекватность математической модели объекта в пределах области существования , где

- общее количество элементов в пространстве.

6. Отсутствие адекватности математической модели объекта за
пределами области существования.

1.4, Использование методов автоматической классификации и распознавания образов для решения трудноформализуемых задач

Множество прикладных исследований в различных областях науки и техники основано на информации, получаемой в результате постановки эксперимента, и последующей обработке результатов. Схема их решения следующая:

планирование эксперимента;

проведение эксперимента, получение экспериментальных данных и математической модели;

проверка полученной модели на адекватность.

Разрешающая способность моделей, полученных после статистической обработки экспериментальных данных в рамках создаваемых АСУ, неудовлетворительна. Расширение области моделирования, т.е. получение многопараметрической модели, где число параметров сравнимо с числом наблюдений, на основании которых строится модель,

как правило, не приводит к положительным результатам. Примером такой задачи является выявление зависимости между физико-механическими свойствами, химическим составом и обрабатываемостью стали.

С целью проверки количественных закономерностей в системе "Химический состав - физико-механические свойства - обрабатываемость" рассмотрим корреляционные связи между к+1 исходными пере-менными величинами х0,ХрХ2»...хк при наличии наблюдаемых соответственных значений переменных 33 .

На основе статистических данных для 92 марок сталей нами была сделана попытка выявить зависимость их физико-механических свойств от химического состава в виде линейного уравнения регрессии. Получены уравнения регрессии в натуральном и стандартизованном масштабе. Приведем некоторые из уравнений регрессии в натуральном масштабе:

-/$S + Sl3ir + 2^HBt +-6,0? Hi *161/,3TL + $9їГїс -9tZSY+*/,**/--/&,?№-020В9

(Oj = . $,/2 +39,32.(1+/2,0581 + /0,9/Ип -- И5Р - /4/, 6$ +/36,getr +2?,3 07. + + З.бЄЖ + /5ї,ЗТі~2,9/Мо-/3>бУ-~0,{5M-17JJL -2.00 3,

К у = /,6 -0,Z/SC-O,//SL -0,/їМп -3,9P -

-/,8 5- 0,32?v-О,//Zl -0,0M№ -0,32 Ті --0,0Є/Н0 -O,ZHY-O.039\l -о,//М + + 5,23 3. .

24 и в стандартизованном масштабе:

ёб ~0,5S? + 0J3?& + 0,1%?ЇЇл +0,СВ15Р+0,О5МЪ + + 0,3Z?вії +0,53 г + OMSK і +0,15% Ті + 0,02* ІГо-

- 0,ОІ*П-0,03*3 W' -0.096*It -OOZ95 З,

ёг = 0,202?' +0,12% $С + 0,/ЗМл -0,015 Р- 0,044'$ +

+ 0,ЇЕ&> ч.0,4йї!і +0J5sm + 0,1*1 Ті -0,OOS2lTo-

- 0,0&У - 0,ООШ ~ 0,0%Л -0,0?? в,

KY ~о,П -ojl&i-OAMn -0,19 Р + 0,0%!> -0,11 Сії" - 0,29Ft ~0,k6Kl -0,0*34 -0,Є25Кс -0,04&Т-

-о,оіз\ї-о,оіііс ~ 0,0133

где бв и бт - предел прочности и текучести стали; Кут- коэффициент обрабатываемости стали.

Адекватность полученных уравнений проверялась по критериям Фишера и Стьюдента. Наблюдаемые статистические значения коэффициентов Фишера и Стьюдента для всех приведенных уравнений попадали в пятипроцентную критическую область. Адекватность уравнений также проверялась сравнением действительных значений (Y , гт, Кусо значениями, рассчитанными по уравнениям регрессии для трех произвольно выбранных марок стали I5HM, 35ХМ, 38АЮ; эти значения приведены в табл.1, откуда следует, что расхождение действительных и расчетных данных достаточно большое.

По мнению специалистов по материаловедению, знаки перед коэффициентами уравнения регрессии в стандартизованном масштабе должны показывать увеличивающее или уменьшающее действие соответствующего элемента, однако в некоторых случаях происходит обратное.Нал-

Таблица I

Марка : стали :-

:деист- :расчет-:витель-:ное :ное :

:дейст- :рас- :дейст- :расчет-гвитель-:четное:вит ель-:ный :ное : :ный :

ошибка, %

ример, по уравнению регрессии в стандартизованном масштабе для с ростом содержания ванадия предел прочности падает, а с ростом серы - растет, хотя в действительности ванадий увеличивает, а сера уменьшает предел прочности.

и получены следующие дан-

Согласно 58 , коэффициент частной корреляции характеризует чистое влияние входного фактора на выходной. С этих позиций нами вычислены коэффициенты частной корреляции по тому же алгоритму

ЛИНКОР для зависимости ные:

Химическая сое- Коэффициент част-
тавляющая ной-корреляции

^ -0,15

3 -0,27

В справочнике [57J приведены данные качественного влияния химического составляющего на прочность 6^ : Si- повышает, #л, С* -повышает, Я і - повышает, Ті - мало влияет,Мо- незначительно повышает, У - повышает, Со, Си- слабо повышают,W - слабо повышает, М- незначительно повышает.

Сравнивая полученные коэффициенты частной корреляции с данными справочника [37], можно сделать выводы:

данные по элементам Ип , Ct, Ui, Си , Я о соответствуют данным справочника;

данные по элементам W ,Сс , fit показывают уменьшающее действие, а [57] - повышающее действие;

данные по элементам $ї , V" показывают, что они практически не влияют, а в [57] - их повышающее действие;

коэффициент частной корреляции при Ті показывает повышающее действие, а по [57] - мало влияет. Если учесть, что зональная ликвация в стальных отливках снижает ее прочность, а в отливках заметно ликвируют главным образом Р и $ , то коэффициент частной корреляции при $ не соответствует действительности.

Авторы [38] приводят уравнения регрессии для определения сил резания при точении стали на станке ІК62:

Р, = 100 - 1,621/ + 1405+ 91,5 t- 1,47 в , р = 19,875- 0,4072/"*+ 123,5$ + 28,2 t+ 0,406 0, Pz= -101,7 - 0,514^+ 38IS+ 8I,7t- 1,3/?. Там же рассмотрена адекватность полученных уравнений и даны значения оптимального режима резания: if- 70 м/мин, = 0,3 мм/об,

t = I мм, Q- ± 5. Подставив их в приведенные выше уравнения, получим:

/J= 100 - 1,62-70 + 140-0,3 + 91,5-1 - 1,47-5 = 112,75, Ру= -19,875-0,407-70 + 123,5*0,3 + 28,2*1 + 0,406*5 = 18,88, А= -101,7 - 0,514-70 + 381*0,3 + 81,7-1 - 1,3*5 = 61,8. Согласно [47J,

Рх= (0,15 4 0,3) Рг ру = (0,25* 0,5) Pz в нашем же примере Рх превышает Рд почти в два раза.

Расчет по приведенным уравнениям значений сил резания для режима if = 10 м/мин, 5 = 0,1 мм/об, і = 0,8 мм, Q = 5 приводит к отрицательному значению.силы / » что категорически противоречит законам резания материалов.

В работе [б] даны уравнения регрессии для определения стойкости (по утверждению автора, адекватные математические зависимости T=-f (S, V>d-)) режущего инструмента при сверлении стали I2X I8H ЮТ для случаев Tt - без дробления стружки, \ - с дроблением:

ff= 50,49 - 17,5^ - 18,7 S + 11,0 і , 7= 60,5 - 19,37 V - 8,01 S + 27,9 (L . Эти уравнения получены на основе экспериментальных данных, приведенных в табл.2.

Подставив значения IT , S » d. в уравнения регрессии, найдем для:

верхнего уровня -

Ъ = 50,49 - 17,5*23 - 18,7*0,6 + 11,0*38,7 = 62,46, 7, = 60,5 - 19,37-23 - 8,01-0,6 + 27,9-38,7 = 694,23, нижнего уровня -Tt= 50,49 - 17,5.11,5 - 18,7*0,4 + 11,0-16,5 = 23,26,

Таблица 2

т*

Уровни варьирования

V м/мин

3 : диаметр мм/об : сверла,

: мм

Стойкость, мин

Т,

^ = 60,5 - 19,37-11,5 - 8,01-0,4 + 27,9-16,5 = 194,9. Как видно, расхождение между экспериментальными и расчетными значениями большое, в некоторых случаях оно превышает 13 раз.

Авторы [Зі] изучали влияние химических составляющих хромо-марганцевых сталей (в основном - марганца) на их обрабатываемость, В исследуемых сталях содержание марганца колебалось в пределах 16,3 4 24,3%. Для исследования были отобраны две выборки - из 24 и 34 заготовок. Содержание углерода, кремния и хрома в них колебалось в очень узких пределах, что существенно не влияло на обрабатываемость. Полученные экспериментальные данные обработаны методом корреляционного анализа. Формы связи между и определены в виде прямой линии и гиперболы.

По результатам статистической обработки экспериментальных данных по первой выборке обнаружена линейная корреляционная связь - с увеличением содержания марганца обрабатываемость ухудшается, а по второй выборке эта связь не обнаружена, что противоречит тому, что с увеличением количества экспериментов в выборке точность

статистической обработки должна увеличиться.

Следовательно, существует ряд сложных систем, по своим свойствам цринадлежащих к классу трудноформализуемых задач, идентификация которых невозможна традиционными методами моделирования. Поэтому для решения подобных задач целесообразно применять более современные методы - методы распознавания образов и автоматической классификации, основанные на эвристике и обеспечивающие более точное решение без больших затрат усилий и времени.

Постановка задачи идентификации. Методы идентификации

Задача идентификации заключается в определении оператора h объекта, т.е. построение такого оператора модели F , который был бы в определенном смысле близок к оператору объекта Го Указанная "близость" весьма относительна, так как операторы f0 и F могут иметь разную структуру, могут быть сформулированы на разных языках и иметь разное число входов. Именно поэтому близость операторов непосредственно оценить трудно или просто невозможно, тем более, что часто об операторе объекта Fo мало что известно. В связи с этим естественно оценивать близость операторов по их реакциям на одно и то же входное воздействие X , т.е. по входам объекта У«;=:1ь[Л ( )J и модели у (t) F(x) . Степень близости этих реакций в каждый момент времени можно оценить, например, значением квадрата модуля разности векторов выхода: аргументов - выходов объекта и модели:

Сформулируем задачу идентификации. Она заключается в том, чтобы построить такой оператор модели F , который бы реагировал на возмущение входа z аналогично реакции объекта У . Реакция оператора модели на вход х имеет вид У =F(x) . Следовательно, модельный оператор F должен быть таким, чтобы где CV) знак эквивалентности, т.е. выходы модели и объекта при одинаковых входных воздействиях х. должны быть эквивалентны. Этого можно добиться, если ввести единую меру близости на всем интервале наблюдения, не только в каждой точке, как в (I).

Такой мерой в случае, когда объект непрерывный, может быть интеграл

Действительно, в соответствии с определением функции / С.,.) величина Q выражает степень близости функций !/() и У ( в интервале 0 t Т . Значение Q явно зависит от F : и задача идентификации заключается в ее минимизации путем соответствующего выбора оператора модели F .

Процесс идентификации, т.е. процесс определения оператора модели , естественно строить так, чтобы минимизировать указанную невязку, т.е. решать задачу минимизации функционала G(F) по оператору F \ Эта символическая запись выражает следующую простую мысль: нужно минимизировать функционал Q(F) , варьируя оператором (или в простейшем случае функцией) F не произвольно, а в некотором определенном классе операторов (или функций)2. . Это обозначается соотношением їєі , т.е. F принадлежит классу Л , где Л -заданный класс операторов или функций. Результатом процедуры минимизации является некоторый оператор (или функция) F (не обязательно единственный), обладающий свойством: т.е. невязка Q на этом операторе минимальна (точнее, не превышает всех возможных невязок, которые можно получить в классе ъ ) (двойная стрелка = в (2) означает "решением является").

Иначе: для идентификации в заданном классе надо найти оператор (функцию) F , минимизирующий функциональную невязку Q (F) в этом классе.

Использование методов автоматической классификации и распознавания образов для решения трудноформализуемых задач

Множество прикладных исследований в различных областях науки и техники основано на информации, получаемой в результате постановки эксперимента, и последующей обработке результатов. Схема их решения следующая:

- планирование эксперимента;

- проведение эксперимента, получение экспериментальных данных и математической модели;

- проверка полученной модели на адекватность.

Разрешающая способность моделей, полученных после статистической обработки экспериментальных данных в рамках создаваемых АСУ, неудовлетворительна. Расширение области моделирования, т.е. получение многопараметрической модели, где число параметров сравнимо с числом наблюдений, на основании которых строится модель, как правило, не приводит к положительным результатам. Примером такой задачи является выявление зависимости между физико-механическими свойствами, химическим составом и обрабатываемостью стали.

С целью проверки количественных закономерностей в системе "Химический состав - физико-механические свойства - обрабатываемость" рассмотрим корреляционные связи между к+1 исходными пере-менными величинами х0,ХрХ2»...хк при наличии наблюдаемых соответственных значений переменных 33 .

На основе статистических данных для 92 марок сталей нами была сделана попытка выявить зависимость их физико-механических свойств от химического состава в виде линейного уравнения регрессии. Получены уравнения регрессии в натуральном и стандартизованном масштабе. Приведем некоторые из уравнений регрессии в натуральном масштабе:

Адекватность полученных уравнений проверялась по критериям Фишера и Стьюдента. Наблюдаемые статистические значения коэффициентов Фишера и Стьюдента для всех приведенных уравнений попадали в пятипроцентную критическую область. Адекватность уравнений также проверялась сравнением действительных значений (Y , гт, Кусо значениями, рассчитанными по уравнениям регрессии для трех произвольно выбранных марок стали I5HM, 35ХМ, 38АЮ; эти значения приведены в табл.1, откуда следует, что расхождение действительных и расчетных данных достаточно большое.

По мнению специалистов по материаловедению, знаки перед коэффициентами уравнения регрессии в стандартизованном масштабе должны показывать увеличивающее или уменьшающее действие соответствующего элемента, однако в некоторых случаях происходит обратное.Например, по уравнению регрессии в стандартизованном масштабе для с ростом содержания ванадия предел прочности падает, а с ростом серы - растет, хотя в действительности ванадий увеличивает, а сера уменьшает предел прочности.

и получены следующие дан Согласно 58 , коэффициент частной корреляции характеризует чистое влияние входного фактора на выходной. С этих позиций нами вычислены коэффициенты частной корреляции по тому же алгоритму линкор для зависимости ные:

В справочнике приведены данные качественного влияния химического составляющего на прочность 6 : Si- повышает, #л, С -повышает, Я і - повышает, Ті - мало влияет,Мо- незначительно повышает, У - повышает, Со, Си- слабо повышают,W - слабо повышает, М- незначительно повышает.

Сравнивая полученные коэффициенты частной корреляции с данными справочника [37], можно сделать выводы:

- данные по элементам Ип , Ct, Ui, Си , Я о соответствуют данным справочника;

- данные по элементам W ,Сс , fit показывают уменьшающее действие, а [57] - повышающее действие;

- данные по элементам $ї , V" показывают, что они практически не влияют, а в [57] - их повышающее действие;

Теоретические посылки и необходимые понятия

Приводимое ниже упрощенное описание метода включает в себя только те его элементы, которые в последующем потребуются для построения алгоритма, предназначенного для решения задачи таксономии.

Центральным элементом метода вычисления оценок является функция сходства частей объектов. Из множества X исходных признаков выделим некоторое подмножество иіШсХ) . Совокупность значений координат объекта $ , соответствующих подмножеству гС , называется «J -частью этого объекта. На множестве гО -частей всех рассматриваемых объектов определяется бинарное отношение неразличимости. Искомая функция (S, S ) сходства между гО „і частями объектов 5 и « задается в виде Таким образом, функция сходства - это характеристическая функция отношений неразличимости.

Пусть теперь в множестве X тем или иным способом выделено некоторое семейство Q подмножеств признаков и на каждом элементе и) этого семейства (uJeSl ) определено отношение Яа/ CS, S ) Каждая пара объектов g и 3 разбивает это семейство на два непересекающихся подсемейства 1(! Ч и ( $ S) :

Очевидно, что SI =1($,$ ) USl (S,S ) В методе вычис ления оценок в качестве функции оценок / (S,S J близости между двумя объектами предлагается выбирать мощность l& ($,s )( множества Х (&,$ ) . Она, очевидно, равна числу характеристических функций соответствующих отношений ftu,(S,S ) неразличимости, которые включают в себя пару ( S, s ). Это число можно записать в виде суммы

Из изложенного следует, что гибкость метода вычисления оценок основана, с одной стороны, на широких возможностях изменения семейства 1 и отношений Rto(S,S ) , а, с другой, на возможности включения априорных сведений об анализируемых объектах в выбор семейства 1 ив определение на нем множества отношений Я (S,s )

Рассмотрим случай, когда все признаки являются двоичными. При этом часто используются два простых варианта выбора семейства 1 опорных множеств:

а) множество 1п всех одиночных признаков (л„=Х):

б) множество ЛИ всех возможных подмножеств множества X" . В обоих вариантах полагается, что где через P(5,s ) обозначено расстояние хэмминга между векторами с двоичными координатами (число несовпадающих разрядов у сравниваемых векторов). Функция rL - линейная функция, а 4 - существенно нелинейная функция расстояния / .

Оценку Г($,$ ) в описываемом методе обычно называют числом голосов, поданных объектом 3 за объект 5 .

Прежде чем перейти к изложению предлагаемых алгоритмов решения задачи таксономии, введем необходимые определения.

Бусть Г(А, Ь) - число голосов, поданных множеством объектов за множество объектов В .

Пример решения задачи АСНИ

Рассмотрим решение задачи АСНИ - автоматизацию исследований физико-механических и технологических свойств машиностроительных материалов с помощью разработанной в диссертации методики.

Создание и освоение новых, качественно лучших машиностроительных материалов обусловлено всевозрастающими требованиями к параметрам машин и механизмов, а также возникновением новых отраслей промышленности: атомной, электронной, ракетной и т.д. Очевидно, что улучшение рабочих параметров машин, развитие новых отраслей будет происходить нарастающими темпами. Соответственно будет увеличиваться потребность в новых машиностроительных материалах, обладающих высокой прочностью и специальными свойствами.

Важное место среди общемашиностроительных задач занимают теоретические и практические вопросы исследования физико-механических и технологических свойств материалов как основа скорейшего технологического освоения множества вновь создаваемых материалов или уже созданных, но:«качественно улучшенных.

Известно, что освоение каждого нового материала требует значительного труда и времени, т.е. для каждого материала прежде, чем его рекомендовать производству, требуется проводить разносторонние исследования, в том числе определить его технологические свойства. В связи с этим возникает задача коренного пересмотра существующих представлений и методов исследований системы "химический состав - физико-механические и технологические свойства".

Освоение машиностроительных материалов представляет собой большой комплекс исследований, позволяющий, в конечном итоге,дать научно обоснованные рекомендации по техническим и технологическим условиям. Одно из основных затруднений при решении этой задачи заключается в том, что эксперименты проводятся в условиях недостаточной информации об изучаемых явлениях в процессах.

Решение этих задач настоятельно требует привлечения новых, более современных методов исследования. Немаловажную роль в анализе множества существующих факторов, их взаимосвязи играют такие дисциплины, как системный анализ, распознавание образов и т.д. В сочетании с широкими возможностями ЭВМ они уже сегодня обусловили качественный скачок в развитии ряда фундаментальных и прикладных наук.

В исследовании физико-механических и технологических свойств материалов классификации с последующим распознаванием нового неосвоенного материала является важной задачей. Это объясняется тем, что четкая классификация позволила бы изучить лишь один представитель из класса и полученные результаты обобщить на весь класс. Но добиться желаемой четкости без применения ЭВМ и соответствующих алгоритмов человек не в состоянии, так как при классификации он может учесть лишь несколько признаков.

Наиболее целесообразно рассматривать эту задачу как задачу автоматической классификации (таксономии) - разделение объектов материалов на таксоны по химическому составу. При этом обеспечивается объективность разделения материалов на классы, достижение которого при наличии множества признаков и использовании человеческого труда практически невозможно. Применением для классификации ЭВМ и соответствующих алгоритмов можно охватить все многообразие существующих машиностроительных материалов, а также отнести вновь создаваемые материалы к соответствующим классам.

Итак, рассмотрим классификацию 92 марок стали по химическому составу. Для этих марок стали собраны статистические данные по химическому составу {С ,Si,Mn »Р $ , &/ » Сі , JlL f n ,Мо y»W, -Я, В ). Располагая объекты - марки материала по строкам, признаки -химический состав - по столбцам, составляем таблицу (приложение 2).

Задача решена по той же программе, по которой решена задача АСТПП. Получено разбиение на 17 таксонов в следующем виде:

В результате распознавания данный материал отнесен к таксону й II, т.е. при одинаковых термических условиях физико-механические и технологические свойства таксона Ш II можно распространить и для данного материала без предварительных исследований и постановки эксперимента,

Похожие диссертации на Исследование, разработка и практическое применение идентификации трудноформализуемых задач для повышения эффективности автоматизированных систем