Содержание к диссертации
Введение
Глава 1. Методы анализа динамических систем 14
1.1. Анализ существующих подходов исследования состояния динамических систем 14
1.2. Характеристика нейронных сетей и динамических систем как объекта анализа с применением нейронных сетей 19
1.3. Описание объекта исследования и области применимости метода 26
1.4. Постановка задачи 31
Выводы по главе 33
Глава 2. Нейросетевой метод анализа состояния динамических систем 34
2.1. Подготовка и анализ входных и выходных данных 34
2.1.1. Кодирование данных 36
2.1.2. Нормирование данных 40
2.1.3. Работа с малыми выборками и восстановление пропущенных данных 43
2.1.4. Снижение размерности и формирование оптимального пространства признаков 50
2.2. Методика настройки параметров нейронной сети и выбор структуры для анализа динамических систем 57
2.2.1. Влияние отдельных параметров на работу нейронной сети 59
2.2.2. Оценка ограничений применимости метода анализа состояния динамических систем с помощью нейронных сетей 61
2.3. Методы кластерного анализа, применяемые при исследовании состояния динамических систем 62
2.4. Построение фазового пространства динамической системы с помощью нейронной сети 66
2.5. Идентификация изменений в состоянии динамической системы по результатам анализа изменений в структуре нейронной сети 75
Выводы по главе 80
Глава 3. Математическое обеспечение нейросетевой распределенной обработки данных и анализа состояний динамических систем 81
3.1. Формирование иерархических коллективов нейронных сетей 82
3.2. Математическое обеспечение распределения коллективов нейронных сетей для анализа динамических систем 89
3.3. Построение системы оценок параметров нейронных сетей 95
3.3.1. Оценочные показатели однородных нейронных сетей 95
3.3.2. Критериальные оценки нейронных сетей 100
3.4. Статистическая оценка нейронных сетей 101
3.4.1. Статистический метод качественного сравнения нейронных сетей для анализа динамических систем 102
3.4.2. Методика качественного сравнения нейронных сетей 108
Выводы по главе 109
Глава 4. Программный комплекс на основе аппарата нейронных сетей для анализа динамических систем 111
4.1. Описание разработанного программного комплекса 111
4.2. Сравнение характеристик программного комплекса с аналогами 118
4.3. Результаты экспериментальной проверки метода анализа состояния динамических систем на основе применения нейронных сетей 122
4.3.1. Классификация дефектов малых размеров на поверхности металлопроката 122
4.3.2. Анализ экономико-математической модели поступления основных бюджетных налогов 132
4.4. Использование полученных результатов в других областях 136
Выводы по главе 139
Заключение 140
Список литературы 143
Приложения 156
- Характеристика нейронных сетей и динамических систем как объекта анализа с применением нейронных сетей
- Работа с малыми выборками и восстановление пропущенных данных
- Оценочные показатели однородных нейронных сетей
- Классификация дефектов малых размеров на поверхности металлопроката
Характеристика нейронных сетей и динамических систем как объекта анализа с применением нейронных сетей
Нейронные сети представляют мощный инструмент для обработки данных. Работа нейросетевого аппарата основана на использовании матричных операций, теоремы Колмогорова о возможности разложения функции от многих переменных на множество функции от одной переменной, и моделей, заимствованных из биологии. Работа с матрицами позволяет достигать высокого и естественного параллелизма вычислений для данного инструмента, а применение теоремы о разложении функции дает нейросетям способность к высокой аппроксимации функций [86].
Таким образом, получается почти универсальный инструмент для проведения аппроксимации функций, прогнозирования, кластерного анализа, распознавания образов. Для достижения универсализма применения данного инструмента без снижения качества получаемого результата каждая из указанных задач требует специализированного подхода к предварительной обработке данных для нейронной сети.
Важнейшими этапами использования нейронных сетей (НС) являются: постановка задачи, предварительная обработка данных и выбор соответствующей парадигмы и структуры нейронной сети.
Эти этапы играют большую роль из-за их огромного влияния на скорость решения поставленной задачи и на качество результата. Правильно выделенные и подготовленные данные позволяют снизить требования к вычислительным мощностям и, соответственно, уменьшить время решения задачи. Однако, исключение некоторых не ключевых параметров может привести и к искажению результата, выдаваемого построенной моделью.
Одной из областей применения нейросетевого аппарата является анализ состояний динамических систем и создание моделей их функционирования. При этом объектом исследования являются сами динамические системы. Под динамической системой в данной работе понимается система, которая изменяется во времени, то есть в которой происходят непрерывные изменения и переходы из одного состояния в другое [55]. Множество состояний динамической системы образует фазовое пространство [134].
При исследовании динамической системы строится математическая модель. Эта модель соответствует реальным системам (физическим, химическим, биологическим и другим), эволюция которых однозначно определяется начальным состоянием и краевыми условиями. Чаще всего поведение таких систем описывается системой уравнений: дифференциальных, разностных, интегральных и так далее. Обыкновенные дифференциальные уравнения описывают зависимость скорости изменений некоторых величин, называемых фазовыми или динамическими переменными от значений самих этих величин. Фазовые переменные имеют самый разный смысл, определяемый исследуемой системой. Кроме значений изучаемых величин, в такие уравнения входят коэффициенты, определяемые внутренними свойствами моделируемой системы или внешними условиями. Величины такого рода называются параметрами модели [117].
Такие системы встречаются в нашей жизни повсеместно: в промышленности (например, на металлургическом комбинате при плавке металла), в экономике (например, финансовая устойчивость предприятия, зависящая от множества параметров, которые явно выделить и оценить достаточно сложно). Определение поведения таких систем, выделение ключевых состояний является важной и актуальной задачей. Однако «запись» поведения системы в виде системы уравнений представляется весьма сложной задачей.
При структурном подходе функционирование системы рассматривается с позиций взаимодействия подсистем, образующих ее структуру и для ее исследования важно определить ее структуру (рис. 1.1):
- элементы системы;
- совокупность связей между элементами, отражающие их взаимодействия;
- внешние воздействия в виде входного вектора;
- результаты обработки в виде выходного вектора.
Структура системы может изучаться с точки зрения состава отдельных подсистем и отношений между ними
Второй существующий подход - функциональный. Система в этом случае описывается как набор отдельных функций (свойств), приводящих к достижению цели ее функционирования. Свойства отображают операции, производимые системой S над входным вектором, и эти свойства могут выражаться как через характеристики отдельных подсистем Si системы, так и через системы в целом, приводя к получению выходного вектора [117].
Создаваемая модель М с точки зрения системного подхода тоже является системой: S =S (М), на вход которой подается входной вектор , а с выхода снимается результат функционирования системы. Нейронные сети представляют собой модели, в которых сохраняются лишь общие законы и закономерности функционирования исходной системы, не представляя собой аналогию структуры систем. Структура системы выражается в связях между нейронами и дополнительно вводимых параметрах, включаемых во входной вектор. С выхода нейронной сети могут сниматься и значения параметров, характеризующих состояние исследуемой динамической системы.
Построенную модель можно рассматривать как набор взаимосвязей между отдельными частями модели, являющимися отображением связей между отдельными подсистемами исследуемой системы. Однако этот подход подходит для изучения простых систем
С усложнением объектов моделирования и исследования система рассматривается как некоторая подсистема системы более высокого ранга. Этот подход позволяет рассматривать систему как некий "черный ящик" на вход которого подаются воздействия, а на выходе получаются результаты ее функционирования. Данный подход позволяет учитывать факторы, воздействующие на систему пропорционально их значимости. Нейронная сеть позволяет исследовать состояние систем именно с этих позиций (рис. 1.2).
Проявление функций системы во времени S(t), то есть функционирования системы, означает переход системы из одного состояния в другое, то есть ее развитие в пространстве состояний Z.
Анализ состояния систем при фиксированных значениях параметров производится по фазовому портрету системы, то есть по совокупности всех ее траекторий, изображенных в пространстве фазовых переменных.
При анализе состояний системы в условиях изменения значений параметров необходимо использовать другие подходы, так как при этом изменяется и фазовый портрет системы. Из теории катастроф известно, что такие качественные перестройки фазового портрета называются бифуракциями [55]. При таких изменениях определяются бифуракционные (критические) значения параметров и описание явлений происходящих при этом. Для этого строится параметрический портрет системы, который в совокупности с фазовыми портретами, содержит информацию о возможных в системе динамических режимов и их качественных перестройках.
Не так давно появившийся нейросетевой аппарат переживает эпоху своего развития. Разработано множество парадигм, позволяющих применять нейронные сети для решения самых разнообразных задач, в том числе строить параметрические и фазовые портреты.
Особенностью применения нейронных сетей является то, что они могут использоваться для решения плохо формализуемых задач, в частности, при поиске закономерностей в сложных динамических системах, где применяемые методы теории управления (ТУ) и математики приводят к значительным временным затратам, если вообще позволяют их решать.
Общепринятый подход к решению таких задач [96] подразумевает разработку математической модели динамической системы, обычно записываемой в виде системы обыкновенных нелинейных дифференциальных или разностных уравнений. Такой подход имеет определенные недостатки.
Во-первых, математическая модель описывает поведение системы приблизительно. Во-вторых, очень часто поведение динамической системы вообще не удается формализовать традиционными методами.
К тому же, при возможности формализации поведения математической моделью с точностью, приемлемой для последующего решения задачи, она представляет собой сложную систему нелинейных дифференциальных уравнений в обыкновенных или частных производных. Решение таких уравнений требует громадных вычислительных мощностей. И, в свою очередь, это приводит к упрощениям моделей для решения таких задач в реальном масштабе времени.
Работа с малыми выборками и восстановление пропущенных данных
Из-за возможности резких изменений в динамической системе обучение нейронной сети на достаточно длинном интервале, включающем всю историю изменения состояния системы, может приводить к значительному усложнению структуры и процесса обучения нейронной сети. Помимо этого, из-за ограниченности виденья функционирования исследуемой системы возможна ситуация, когда в модель включаются вторичные факторы. Это в свою очередь приводит, при изменении законов функционирования, к полному или частичному их отбрасыванию и исследованию поведения динамической системы на вновь получаемой малой выборке. Поэтому, решение проблемы малой обучающей выборки в нейронных сетях имеет большое практическое значение.
Работа с малыми выборками. Рассмотрим особенности методики [73], описывающей синтез алгоритмов адаптации нейронных сетей в условиях малой обучающей выборки:
1. Возможным способом реализации нейронной сетью свойства обобщения по подобию данных из малой выборки может быть искусственная генерация дополнительных выборок с математическим ожиданием в виде составляющих малой исходной выборки и различной дисперсией. При этом величина дисперсии может варьироваться в процессе выполнения плана экспериментов.
2. Выбор начальных условий при настройке нейронных сетей является важным фактором и активно влияет как на скорость обучения, так и на качество решения задачи. При различных методах выбора начальных условий каждый раз будут получаться разные результаты настройки, усреднение по которым в дальнейшем даст при конкретной конечной исходной выборке дополнительную информацию о качестве работы сети. Начальные условия могут задаваться как случайно - начальные веса генерируются с помощью генератора случайных чисел, так и по определенному правилу.
3. Проведение преобразований над малой выборкой и дальнейшее добавление, полученных таким образом примеров, к обучающему множеству для повышения обобщающей способности нейронной сети.
4. Учет априорных знаний об исследуемой системе, позволяющий получить дополнительные обучающие примеры.
5. Одним из способов искусственного дополнения данных может быть повышение числа примеров, основанное на использовании для этого тех или иных априорных соображений об инвариантности динамики временного ряда. При этом используется генерация искусственных примеров, на основе уже имеющихся применением к ним различного рода преобразований. Чаще всего обращают внимание на форму кривой изменения параметра, а не на конкретные значения по осям. Поэтому если немного растянуть во времени (вдоль оси абсцисс) весь временной ряд, то полученный в результате такого преобразования ряд также можно использовать для обучения наряду с исходным. Этим самым удваивается число примеров. При этом не только увеличивается число примеров, но и ограничивается класс функций, среди которых ищется решение.
В общем, можно сделать вывод о том, что в некоторых случаях недостаток экспериментальных данных может быть частично восполнен дополнительными вычислительными ресурсами.
Для задач исследования сложных динамических систем, описываемых многомерным пространством, предлагается следующий способ, основанный на приведенных выше преобразованиях: добавление к ряду с малой выборкой аддитивной составляющей и включение результирующего ряда в обучающее множество. Этим не только увеличивается обучающая выборка для нейронной сети, но и заодно повышается обобщающая способность нейронной сети.
В качестве аддитивной составляющей могут выступать:
1) случайный шум с небольшой амплитудой;
2) природные закономерности;
3) технические и технологические закономерности;
4) инертность системы, вытекающая из структуры системы и обусловленная наличием обратных связей или используемых инерционных элементов;
5) результаты имитационного моделирования.
Добавление случайного шума позволяет задать нейронной сети больше неопределенности при аппроксимации функции. За счет этого она не занимается простым запоминанием этих значений, а пытается обнаружить закономерности. Такое добавление шума позволяет учесть значения функции, принадлежащие и окрестности элемента основного ряда.
В качестве источника шума может выступать обычный белый шум, или шум с нормальным распределением, математическим ожидание которого равно 0. Амплитуда шума не должна быть большой по величине, чтобы не изменять сути обрабатываемых данных и ее значения изменяются в пределах от 1 до 15 % от значения ряда (рис. 2.2).
Восстановление пропущенных данных. Восстановление данных является еще одной важной задачей, возникающей при анализе состояния динамических систем. Она связана с ситуацией, когда значения параметров для определенных временных интервалов отсутствуют. Это приводит к образованию пропусков во временных рядах [133].
При использовании подхода заполнения данных реконструированные данные не могут полностью заменить реальные значения, но для решения многих задач они вполне пригодны [133]. Преимущества использования данных с заполненными пропусками в сравнении с анализом только комплектных наборов данных (то есть данные с пропусками исключаются из рассмотрения) состоят в следующем. Во-первых, возможно применение стандартных методов и программ, ориентированных на обработку полных данных. Во-вторых, при интерпретации результатов анализа можно опираться на традиционные статистические характеристики. К числу наиболее распространенных методов заполнения пропусков относятся:
- заполнение подбором - подставляются значения переменных других элементов выборки;
- заполнение средним по присутствующим значениям в выборке;
- заполнение средним с взвешиванием - подстановка средних значений с учетом распределения значений пропущенных переменных;
- заполнение по методу ближайших соседей - подставляется среднее арифметическое двух ближайших присутствующих значений;
- заполнение с помощью регрессии.
При решении задач анализа временных рядов с пропусками данных применимы лишь два последних метода, так как остальные способны существенно исказить динамику ряда. Более точные результаты показывают методы заполнения с помощью регрессии [65]. Суть их состоит в том, что по имеющимся данным выявляются закономерности, которым подчиняется ряд, и, если они найдены, интерполируются и экстраполируются неизвестные уровни ряда. Для нахождения таких закономерностей выявляются зависимости между уровнями восстанавливаемого ряда и уровнями других доступных рядов. Например, если вместе с неполным рядом имеются полноценные ряды однотипных параметров, то, пользуясь определенными соотношениями этих рядов, можно оценить отсутствующие уровни. Также оцениваются и используются зависимости между уровнями исходного ряда.
Для нахождения зависимостей используют в основном методы линейной регрессии и авторегрессии.
Из линейных методов восстановления пропущенных данных удобным является метод главных компонент. Он дает наилучшее линейное приближение входных данных меньшим числом компонент [94]: X = АХ (2.8) где X - матрица стандартизованных исходных данных; А - матрица факторного отображения; X - матрица значений факторов.
Однако получаемые в результате линейные уравнения не всегда могут в полной мере отражать сложные закономерности в данных. Более точно и полно выявить нелинейные зависимости, которым подчиняется ряд, способны методы на основе самообучающихся алгоритмов, в частности нейросетевые методы. При их использовании независимые переменные регрессии становятся входами, а зависимая переменная - выходом нейронной сети. Уровни ряда формируют базу примеров для обучения [65]. Такой подход позволяет не задавать заранее вид функциональной зависимости, описывающей взаимосвязи временных рядов. Нейронная сеть автоматически строит модель взаимодействия независимых и зависимых переменных.
Разработана методика заполнения пропусков данных во временных рядах с использованием нейронной сети. Она основана на совместном использовании рассмотренных выше методов. Исходными данными служит базовый временной ряд с пропущенными уровнями и массив вспомогательных временных рядов, в отношении которых есть предположение о взаимосвязи с базовым рядом.
Оценочные показатели однородных нейронных сетей
Выбор критерия для оценки нейронной сети - сложная и неоднозначная задача. Одним из способов для получения независимой оценки могут служить тестовые задачи, на основе анализа решений которых, производится сравнение моделей, функционирующих на основе нейронных сетей. При создании тестовых задач и выбора частных показателей работы нейронной сети необходимо учитывать специфику поставленной задачи для получения наиболее адекватной оценки. При этом предлагается подход, аналогичный тому, который принят для оценки вычислительной техники -создание системы оценок нейронных сетей и получение на ее основе комплексного показателя.
Рассмотрим подробнее каждый из предлагаемых параметров в отдельности, чтобы сделать обобщающий вывод.
Скорость обучения. Наиболее важное достоинство нейросетей - это возможность решать с их помощью любые задачи. Однако вопрос времени обучения может оказаться критическим при решении задач, в которых результаты обучения нейросети необходимы в режиме «реального» времени. Следовательно, при оценке нейросетей одним из важных критериев является критерий, оценивающий скорость обучения нейросети. Для получения его численного значения предлагается использовать специальные обучающие выборки при максимально возможных значениях погрешности обучения. После проведения обучения модели нейронной сети измеряется временной промежуток, за который нейронная сеть обучается до требуемой точности. Далее необходимо перейти от понятия скорости обучения к его временному или итерационному оценочному коэффициенту - времени обучения.
Вариантов единиц измерения времени обучения может быть несколько. Рассмотрим их:
1. Итерации. Недостатки этих единиц измерения: при отложенном и стохастическом обучении итерации (эпохи) имеют различный смысл. С помощью одних итераций невозможно сравнить реальное время обучения сетей, реализованных различным способом.
2. Количество используемых математических операций. Его недостатки следующие. Не учитываются возможности параллелизма вычислений при аппаратной реализации. При эмуляции разные математические операции требуют разное время на выполнение, к тому же скорость выполнения одних и тех же математических операций разными процессорами различна. Как и для итераций, этот недостаток проявляется, когда необходимо сравнить нейронные сети, реализованные разными способами.
3. Секунды и их доли. Недостаток: не возможно оценить внутреннюю структуру сети, так как сравниваются (как в случае с итерациями и мат. операциями) по-разному реализованные нейронные сети. Этот показатель на практике является наиболее значимым. Его легко измерить и он довольно точно характеризует исследуемую модель, в том числе и с точки зрения ресурсоемкое процессора.
Хотя в реальности сущность и качество модели на практически используемых задачах оценить по времени невозможно. Процесс оценки желательно проводить несколько раз и на разных обучающих выборках.
Следующим оценочным параметром является способность обобщения. Очень важно чтобы сеть в процессе обучения не просто запоминала данные, а обобщала их, то есть помимо точной аппроксимации обучающего множества она правильно находила закономерности среди них и переносила эти закономерности уже на распознаваемые образы. Для оценки способности обобщения можно воспользоваться понятием ошибки обобщения. При этом оценка этого критерия требует наличия контрольного множества, которое не участвует в самом процессе обучения.
Способность обобщения является одним из главнейших свойств нейросети при использовании их для прогнозирования и распознавания. Так как важной чертой работы нейронной сети является ее способность к выявлению нелинейных закономерностей между входными и выходными данными, то вводится следующий критерий оценки - нелинейность нейронной сети. Для оценки нелинейности предлагается создание ряда специальных выборок, размерность которых будет постепенно уменьшаться, а длинна увеличиваться.
Комплексный показатель характеризует систему в целом. На практике, при решении конкретной задачи при заданных условиях и ограничениях, сравниваются только один или два из рассмотренных оценочных параметров. При этом оставшиеся показатели должны быть приблизительно равны друг другу или принадлежать допустимому диапазону значений. Значения параметров и диапазоны их изменения во многом определяются условиями, определенными в решаемой задаче.
Полученный комплексный показатель лишь отчасти дает характеристику нейронной сети. Для качественного сравнения результатов работы моделей, построенных на базе нейронных сетей, необходимо учитывать и выборки данных, с которыми работает нейронная сеть.
Для этого, в работе предлагается ввести обобщенный критерий, позволяющий уменьшить субъективность оценки. Этот критерий основан на проведении статистических испытаний нейронной сети. При этом можно проводить качественное сравнение работы нейронных сетей.
Классификация дефектов малых размеров на поверхности металлопроката
В металлургии системы дефектоскопии применяются при неразрушающем контроле металлопроката. Для поиска, идентификации дефектов, а также выявления причин их появления и выбора соответствующих управляющих воздействия для корректировки технологического процесса используется множество различных параметров. В качестве таких параметров выступают:
- параметры окружающей среды (температура, освещенность, задымленность, запыленность);
- параметры, характеризующие используемое в системе оборудование;
- параметры, описывающие металлопрокат и возникающие на нем дефекты.
Таким образом, системы дефектоскопии, совместно с управляющими системами, представляют сложные динамические системы с большим числом информационных и контролируемых параметров. Для отрезка времени существования определенного конгломерата всех перечисленных выше факторов, основываясь на статистических испытаниях и расчете весов каждого из параметров, проводится выбор подмножества, адекватного текущей ситуации. Это подмножество параметров изменяется во времени.
Необходимость смены структуры подмножества оценивается вероятностью нахождения и классификации дефекта. При ее снижении производится поиск новой структуры по вероятностной оценке выявления дефектов каждым параметром, входящим в общее множество рассматриваемых показателей.
Одним из рассмотренных в работе этапов функционирования системы дефектоскопии является поиск и классификация дефектов. Задача классификации дефектов на поверхности металлопроката состоит из двух этапов. На первом этапе необходимо обнаружить дефекты на поверхности металла. На втором этапе с помощью алгоритма связывания дефекты группируются в связные области. Далее, вычисляя и анализируя параметры полученных дефектов, проводится классификация дефектов.
Задача обнаружения дефектов на поверхности металлопроката
Системы обнаружения дефектов на поверхности металлопроката должны обеспечивать высокую надежность выявления слабоконтрастных и незначительных по величине поверхностных дефектов при условии неоднородности входного изображения. Это обусловлено тем, что фоновый сигнал, формируемый бездефектной поверхностью, не остается постоянным. Неоднородность фонового сигнала связана с отклонениями в выходной энергии источника света, неравномерностью освещенности контролируемой поверхности, оптическими искажениями, а также с изменением отражающей способности исследуемой поверхности. Указанные факторы требуют разработки специальных алгоритмов, учитывающих неоднородности и изменения видеосигнала [141].
Дефекты, которые необходимо классифицировать в данной задаче были выявлены алгоритмом, основанным на дифференцировании видеосигнала, с компенсацией неоднородностей и постоянной составляющей уровня фонового сигнала при различной степени его изменения, предложенным в работе [136].
В основе этого алгоритма лежит тот факт, что с помощью дифференцирования исходного видеосигнала формируется информационный сигнал, который содержит положительные и отрицательные составляющие. Обнаружение переднего и заднего фронта дефекта осуществляется путем сравнения положительных и отрицательных составляющих сигнала с пороговыми значениями. Кроме координат самого дефекта, фиксируется его суммарная и максимальная интенсивности, характеризующие степень повреждения. Если конечного перепада не фиксируется, то считается, что дефект длится до конца текущей строки.
В случае, когда изображение характеризуется высоким уровнем помех или значительными перепадами интенсивности, то работа алгоритма выполняется после процедуры предварительной фильтрации.
Определение вектора признаков дефекта
Для решения задачи классификации поверхностных дефектов офсетного листа наиболее целесообразно использовать параметрический подход, поскольку методы параметрического распознавания отличаются простотой реализации и достаточно высоким быстродействием обработки большого объема данных в масштабе «реального» времени [136]. В основе этих методов лежит сравнение набора признаков (параметров) распознаваемого дефекта с наборами эталонных признаков, соответствующих различным типам повреждений контролируемой поверхности, которые в векторном пространстве признаков задаются в виде некоторой области.
На первом этапе с помощью алгоритма связывания дефектов [136] производится проверка связности обнаруженных дефектов.
На третьем этапе происходит принятие решения после формирования вектора признаков V(i): L(i), S(i), HcP(i), Hmin(i), Hmax(i), 3(i), 3cp(i), G(i), I(i), M(i), D(i), Kmax(i), Kcp(i), который содержит информацию о геометрических параметрах дефекта, местонахождении по ширине полосы, степени повреждения поверхности.
Разделение дефектов на классы обычно выполняется в результате поочередного сравнения признаков в зависимости от их значимости (веса) с соответствующими предельными величинами. Это позволяет классифицировать дефект и выполнять процесс принятия решения не по всей совокупности признаков, а последовательно от признака с большим весом к признаку с меньшим весом.
Однако при описании каждого из классифицируемых дефектов большим числом разнообразных параметров, среди которых нет параметров, однозначно характеризующих каждый из классов, следует применять алгоритмы обучения классификации «без учителя» [137]. Такая классификация подразумевает разделение многомерных объектов на классы, основанное на том, что каждому классу соответствует обособленная группа точек в векторном пространстве признаков.
Проведенный анализ показал, что именно применение нейронных сетей позволяет получить конгломерат, который, во-первых, вычисляет веса признаков, и, во-вторых, осуществляет их смешивание для окончательной классификации.
Классификация дефектов при помощи нейронной сети
Для обнаружения, объединения и классификации дефектов создано специальное программное обеспечение, которое считывает изображение, и по приведенным выше алгоритмам, проводит соответствующую обработку. Внешний вид ПО приведен на рисунке 4.7.
Для проведения этапа классификации с помощью НС применяются реализованные в программном обеспечении возможности СОМ-технологии.
В результате экспериментальных исследований получены следующие результаты.
Классификационные группы дефектов, формируемые при работе нейронной сети следующие:
1) излом;
2) накол, раковина-вдав;
3) царапина;
4) цвета побежалости;
5) окалина, отпечаток, коррозия, загрязнение, сквозной разрыв, неметаллические включения, раскатанный пузырь;
6) неопознанный дефект;
7) сомнительная ситуация.