Содержание к диссертации
Введение
Глава 1. Формализация задачи распознавания состояний сложного динамического объекта и обзор методов ее решения 32
1.1. Основные понятия и определения. Введение в проблему и постановка задачи... 32
1.2. Формализациязадачи.распознавания состояний сложного динамического объекта 47
1.3. Обзор современных методов и информационных технологий распознавания состояний сложного динамического объекта 51
1.4.О проблемах адаптивного управления сложными объектами 67
1.5. Выводы по главе 1 75
Глава 2. Модель выделения тренда стохастического временного ряда 76
2.1. Построение проблемно-ориентированной модели синтеза корректной
процедуры выделения тренда стохастического временного ряда 76
2.1.1. Описание класса задач 85
2.1.2. Локальные системы аксиом разметки стохастического временного ряда и выбор оптимальной системы окрестностей 89
2.1.3. Критерий регуляризации разметки на основе максимального правдоподобия 100
2.2. Алгоритмы распознавания и оценивания состояний сложных объектов 111
2.3. Метод скользящей реконструкции временного ряда 117
2.4. Численное моделирование разметки временного ряда 121
2.5. Применение модели разметки временного ряда для решения прикладных задач 123 2.5.1. Выявление закономерностей в данных электромагнитных измерений геофизических процессов 126
2.6. Выводы по главе 2 130
Глава 3. Модель корректного многокритериального оценивания альтернатив. алгоритмические композиции ... 133
3.1. Особенности применения метода парных сравнений и обоснование необходимости его коррекции 134
3.2. Модификация метода парных сравнений на принципах технологии построения проблемно-ориентированной теории 135
3.2.1. Условия разрешимости и регулярности задачи многокритериального ранжирования альтернатив 141
3.3. Примеры решения прикладных задач 153
3.4. Алгоритмические композиции на основе корректной модификации метода парных сравнений 155
3.4.1. Композиции алгоритмов эталонной разметки временного ряда 158
3.5. Численное моделирование алгоритмических композиций 162
3.6. Выводы по главе 3 164
Глава 4. Модель оценивания информативности признаков при распознавании состояний объекта 166
4.1. Описание класса задач и постановка задачи распознавания вектор-разметок состояний сложного объекта 171
4.2. Метод оценивания информативности признаков и тестов на основе формализма мультимножеств и модификации метода АНР+ 174
4.3. Коллективный алгоритм для определения информативности признаков 180
4.4. Численное сравнительное моделирование методов оценивания информативности признаков и тестов 184
4.5. Формализация прикладной задачи: мониторинг состояния строительного объекта 191
4.6.Выводы по главе 4 196
Глава 5. Информационная модель распознавания и оценивания качества распознавания состояний сложного объекта 198
5.1. Обзор современного состояния интеллектуальных систем для распознавания объектов 198
5.2. Информационная модель оценивания состояний сложного объекта на основе выявления закономерностей во временных рядах 200'
5.3. Вероятностная модель оценивания качества алгоритма распознавания состояний сложного объекта 206
5.4. Оценка информативности квантования временного ряда в задаче распознавания состояний динамического объекта 216
5.5. Сравнительный анализ алгоритмов распознавания состояний сложного объекта на основе численного моделирования 230
5.6. Решения прикладных задач 240
5.6.1. Экологическое диагностирование и прогнозирование на основе эталонной модели разметки временных рядов 240
5.6.2. Предсказание неизвестных значений непрерывных атрибутов в базах данных246
5.7. Выводы по главе 5 249
Глава 6. Модель адаптивного управления сложным объектом на основе инвариантных многообразий и распознавания образов 252
6.1. Принципы нелинейной адаптации на многообразиях и условия их применения253
6.2. Задача синтеза системы управления плохоформализуемым объектом 256
6.3. Аналитическое конструирование наблюдателя возмущений нелинейных систем без задания класса модельных функций 268
6.4. Синтез наблюдателя для модели электромеханического объекта с неизмеряемыми возмущениями 274
6.5. Численное сравнительное моделирование регуляторов 297
6.6. Выводы по главе 6 301
Заключение 303
Список литературы 307
Приложения 333
- Обзор современных методов и информационных технологий распознавания состояний сложного динамического объекта
- Локальные системы аксиом разметки стохастического временного ряда и выбор оптимальной системы окрестностей
- Условия разрешимости и регулярности задачи многокритериального ранжирования альтернатив
- Численное сравнительное моделирование методов оценивания информативности признаков и тестов
Введение к работе
Актуальность проблемы. Проблема оценки текущего состояния сложных объектов (технических, экологических, геофизических и пр.), аналитическое описание которых неполно, или невозможно в силу нелинейности и стохастичности характеристик является весьма актуальной, несмотря на большое число публикаций по этому вопросу. На практике большинство процессов, сопровождающих функционирование плохо формализуемых сложных динамических объектов (СДО) являются нестационарными, нелинейными и порождают следующие классы актуальных задач распознавания состояний сложных объектов: 1) мониторинг характера образования и развития нежелательных (потенциально опасных, катастрофических) состояний объекта в реальном времени (в оборудовании нефтегазовой отрасли и геодинамических процессах); 2) построение оценки состояния объекта или системы, находящейся в режиме управления (реконструкция координат в системах без измерительных датчиков); 3) управление в структурно сложных системах, являющихся нелинейными, многомерными и многосвязными, в которых протекают неустойчивые переходные процессы (экологические системы). Задачи поиска закономерностей процессов в СДО во многом практически недоступны для классических методов (Н.Н.Моисеев, И.Р.Пригожий, И.Стенгерс).
Исторически процедуры оценивания состояний сложных объектов основаны, главным образом, на методах моделирования сложных систем (ЯЗ. Цыпкин, Н.П. Бусленко и др.); теории анализа, обработки и оценивания сигнальной информации (Л. Льюнг и многие др.); методах технической диагностики (Ю.С. Попков, В.В. Клюев и др.); методах анализа и прогнозирования временных рядов (Дж.Бокс, Г.Дженкинс, С.W. Granger, Ю.Б.Михайлов, Ю.Н.Орлов, В.В.Конев, Г.М.Кошкин, С.Э.Воробейчиков, В.Н.Афанасьев, М.М.Юзбашев и многие др.); методах нелинейной динамики и синергетики (П.Л.Капица, С.П.Курдюмов, Г.Г.Малинецкий, Г.Хакен и многие др.) и распознавания образов (Ю.И.Журавлев, Н.Г.Загоруйко, И.Б.Гуревич, В.Л.Матросов, К.В.Рудаков, В.Н.Вапник, А.Я.Червоненкис, А.Г.Ивахненко, В.В.Рязанов, К.Фу, Л.А.Растригин, Дж.Ту, Р.Гонсалес, В.Б.Кудрявцев, К.В.Воронцов и многие другие ученые).
Известно, что нелинейность модели сложных объектов вкупе с размерностью и присутствием немоделируемой динамики является серьезным препятствием для применения известных подходов к управлению (А.А.Красовский, А.Л.Фрадков, K.S.Narendra, J.Balakrishnan, A.Isidori, В.Н.Афанасьев, Х.К.Халил, А.В.Тимофеев, А.И.Рубан, В.И.Смагин, И.Ю.Тюкин, В.А.Терехов и многие другие ученые). В этой связи возрас-
тает интерес к теории инвариантности, восходящей к работам Г.В.Щипанова, Н.Н.Лузина, В.С.Кулебакина, Б.Н.Петрова и представленной в современных методах нелинейной адаптации на многообразиях (А. А. Колесников, A. Astolfi, R. Ortega и других ученых).
Современные исследования распознавания состояний сложных объектов связаны с именами Ю.И. Неймарка (автоматизация огрубленного численного исследования динамических систем на основе методов распознавания образов и статистического моделирования), Т.П. Грызловой (распознавание последовательности состояний сложного источника, как чередование и наложение характерных последовательностей сигналов), P.M. Юсупова, Б.В. Соколова, М.Ю. Охтилева (управление состояниями сложных технических объектов на основе полимодельного многокритериального описания) и многими другими учеными.
Направление, связанное с применением алгебраического подхода к решению некорректных задач, развитого Ю.И. Журавлевым1, К.В. Рудаковым2 и их научными школами, является основным при автоматическом построении алгоритмов для распознавания нежелательных ситуаций (предаварийных) динамических систем и развивается в трудах ВЦ РАН как исследование и апробация проблемно-ориентированной теории выделения тренда в конечных плоских конфигурациях3, в основе которой лежит идея разметки точек ряда аксиомами (правилами). Выбор аксиом является ключевой проблемой (ручная подборка для длинных стохастических временных рядов (СВР) - задача весьма трудоемкая и вряд ли разрешимая за конечное время с приемлемым качеством). В настоящее время формализованный подход к разметке СВР отсутствует (известны отдельные эвристические решения с использованием нейросетей и генетических алгоритмов).
Дальнейшее развитие исследований СДО возможно на основе построения проблемно-ориентированных моделей синтеза корректных процедур распознавания и оценивания состояний, создание которых предполагает выполнение условий: а) способ построения ориентирован на конкретную проблемную ситуацию принятия решения и заданную прецедентную информацию; б) сформулирована система задач распознавания, отражающая структуру объекта исследования и дающая основу для поэтапного построения проблемно-ориентированных теорий:
Журавлев Ю.И. Корректные алгебры над множествами некорректных (эвристических) алгоритмов. 1-Ш//Кибернетика. 1977. № 4. С. 5-17, 1977. № 6. С. 21-27, 1978. № 2. С. 35-43. 2Журавлев Ю.И., Рудаков К.В. Об алгебраической коррекции процедур обработки (преобразования) информации//Проблемы прикладной математики и информатики. 1987. С.187-198.
Рудаков К.В., Чехович Ю.В. Алгебраический подход к проблеме синтеза обучаемых алгоритмов выделения трендов //Доклады РАН. 2003. Т. 388. № 1.С. 33-36.
I) создание абстрактной модели предметной области (анализ связей между входной и выходной информацией), выяснение условий разрешимости и регулярности поставленных задач; II) выбор моделей алгоритмов и корректирующих операций для конструирования корректных (безошибочных на прецедентах) алгоритмических композиций, используемых для распознавания состояний СДО, оценивания неизмеряемых входов-выходов сложного объекта, а также моделирования возможных состояний объекта путём подачи на модель информации об изменениях входных величин.
Несмотря на развитость перечисленных математических и информационных подходов, существует ряд нерешенных проблем, связанных с особенностями нелинейных и нестационарных СДО: а) большой процент ошибок при использовании в задачах обнаружения предвестников зарождающихся «опасных» состояний (дефектов, разрушений), связанный с тем, что разброс величин измеряемых параметров превышает изменения, характерные для появления контролируемых состояний; б) проблема моделирования нестационарных рядов в настоящее время в теоретическом плане не разрешена, а в практическом - производится «подгонкой» и не всегда успешно; в) нейросетевые методы, логические методы и методы нечеткой логики позволяют строить более точные модели в условиях ограниченного набора обучающих данных, но при этом характеризуются относительной сложностью практической реализации, высокими требованиями к ресурсам ЭВМ, ограничениями применимости в реальном времени для СДО с нелинейным описанием и измерительными пумами.
В этой связи разработка информационных моделей и сопровождающих их методов с вычислительно реализуемыми алгоритмами, позволяющих строить достаточно точные описания сложных объектов и процессов в условиях малых выборок с целью распознавания и оценивания состояний СДО, является по-прежнему весьма актуальной.
Объект и предмет исследования. Объектами исследования являются нелинейные динамические объекты с неполным описанием (дифференциальные и разностные уравнения с частью неизвестных переменных, стохастические временные ряды с неизвестной детерминированной составляющей). Предметом исследования являются математические модели и методы автоматизированного выявления закономерностей в данных и знаниях с целью синтеза корректных алгоритмов распознавания и оценивания состояний СДО в реальном времени.
В диссертационной работе поставлена важная научно-техническая проблема построения проблемно-ориентированной теории синтеза корректных процедур автоматизированного распознавания и оценивания состояний сложных плохо формализуемых динамических объектов.
Цель работы. Математическое и алгоритмическое обеспечение синтеза проблемно-ориентированных моделей автоматизированной обработки информации для повышения качества распознавания и оценивания состояний сложных объектов в системах управления и мониторинга.
Для достижения цели необходимо:
формализовать задачу распознавания и оценивания состояний сложных объектов как задачу интеллектуального анализа данных (выявления закономерностей) в стохастических временных рядах, сопровождающих функционирование плохо формализуемого объекта;
решить задачу выделения тренда стохастического ряда в виде последовательности (нелинейных) трендов на основе развития теории выделения тренда в конечных плоских конфигурациях с теоретико-множественными ограничениями;
формализовать и решить задачу ранжирования динамических наборов альтернатив (алгоритмов) на множестве метрических критериев (показателей качества алгоритмов) с целью создания корректных алгоритмических композиций;
формализовать и решить задачу выбора и оценивания признаков в тестовом распознавании состояний сложных объектов;
обосновать применение алгебраического подхода к построению корректных моделей процедур решений задач пп. 2)-4): а) выделить конкретную проблемную ситуацию принятия решения и задать прецедентную информацию; б) сформулировать задачи распознавания образов; в) установить критерии разрешимости и регулярности задач; г) выбрать модели алгоритмов распознавания объектов и корректирующих операций; д) построить корректные алгоритмические композиции;
создать метод скользящей реконструкции стохастического временного ряда для оценивания состояний объектов в реальном времени;
создать математическое и алгоритмическое обеспечение программной системы для решения задачи распознавания состояний сложных объектов в реальном времени;
разработать подход к управлению динамическим объектом с неполным аналитическим описанием и сконструировать пример системы управления сложным объектом на основе совмещения алгоритмов распознавания и оценивания состояний объекта и теории аналитического конструирования агрегированных регуляторов (АКАР4);
построить алгоритм наблюдения неизвестных параметров (возмущений) сложного объекта управления;
Колесников А.А. Синергетические методы управления сложными системами: теория системного синтеза. - М.: Едиториал УРСС, 2005. - 230 с.
10) апробировать разработанные модели выявления закономерностей в первичном описании сложных динамических объектов на решении прикладных задач: синтез системы управления нелинейным электромеханическим объектом (ЭМО) с наблюдением неизмеряемых координат и неизвестных возмущений; мониторинг сложных объектов; предсказание неизвестных значений непрерывных атрибутов в базах данных; обнаружение предвестников нежелательных состояний геофизических и экологических объектов.
Методы исследования. При решении поставленных задач использовались методы теории распознавания образов (алгебраический подход к синтезу корректных процедур обработки информации на базе эвристических алгоритмов), методы теорий вероятностей, информации и математической статистики, формализма мультимножеств, теории принятия решений и многокритериального оценивания, теории дифференциальных уравнений. Для моделирования и программной реализации алгоритмов использовались приложения Matlab/Simulink, методы программирования в средах разработки C++ Builder и С Sharp.
Научную новизну составляют:
проблемно-ориентированная модель выделения тренда стохастического временного ряда, включающая метод разметки стохастического ряда аксиомами на основе функций (классов) с определенными свойствами и ее теоретическое обоснование;
проблемно-ориентированная модель нелинейной модификации метода парных сравнений динамических наборов альтернатив (методов, алгоритмов), используемая для корректирующих операций в алгоритмических композициях и многокритериальном оценивании признаков сложных объектов;
теоретическое обоснование метода нелинейной скаляризации критериальных оценок, обеспечивающего парето-оптимальный выбор альтернатив на множестве метрических критериев и выполнение аксиомы независимости К.ДжЭрроу о неизменности предпочтений при введении дополнительных альтернатив;
проблемно-ориентированная модель выявления закономерностей в описании данных и знаний для тестового распознавания состояний сложных объектов, включающая метод определения весовых коэффициентов взаимозависимых признаков и тестов, основанный на формализме мультимножеств и введенных мерах их относительной важности;
подход и реализующий его метод синтеза системы управления сложным объектом с неполным аналитическим описанием на базе совмещения техники конструирования регуляторов на многообразиях
АКАР и корректных алгоритмов распознавания состояний сложных динамических объектов;
6) метод скользящей аппроксимации стохастического временного ряда для оценивания состояний сложных объектов в реальном времени и основанный на нем метод наблюдения неизмеряемых состояний динамических объектов без априорного задания аналитического описания (координат, параметров) как развитие теории асимптотических наблюдателей на многообразиях.
Практическая ценность работы заключается в разработке алгоритмического обеспечения интеллектуальной системы IReDSS [6, 41] для качественного распознавания и оценивания состояний СДО и применении полученных теоретических результатов для эффективного решения ряда прикладных задач [4,7,9,10,19,21].
Достоверность и обоснованность полученных результатов подтверждается математическим обоснованием разработанных моделей в виде утверждений, лемм, теорем; корректной постановкой экспериментов и их обработкой; качественным и количественным соответствием теоретических исследований и экспериментальных данных, полученных как самим автором, так и другими исследователями, а также практическим применением результатов исследований.
Реализация и внедрение результатов работы. Результаты диссертационной работы легли в основу математического обеспечения программного комплекса IReDSS (); системы обработки данных геофизических явлений [42], используемой в исследовательских работах лаборатории института неразрушающего контроля ТПУ (г.Томск); баз данных «Торфяные ресурсы», «Химия торфов» [38, 39]; программы моделирования процессов в асинхронном электроприводе с робастным регулятором частоты вращения двигателя [43]. Разработанные модели системы управления с наблюдателем неизвестных координат и возмущений интегрированы в программное обеспечение оборудования, выпускаемого ООО «ЭлеТим» (г. Томск); имеется свидетельство на полезную модель «Система управления с распознаванием образов динамических состояний стохастического объекта» [40]. Модель разметки [13,15] и многокритериального оценивания динамических наборов альтернатив [7,11,14] положена в основу методик, использованных в практике планирования закупок и учета заказов предприятия 000 «Класс Вуд» и в практику мониторинга, контроля и оценивания объектов технического надзора предприятия 000 «Агентство контроля над Вашим строительством» (г. Москва). Метод оценивания весовых коэффициентов взаимо-
зависимых признаков и тестов [2,3,17,21] внедрен в ИИС ИМСЛОГ лаборатории интеллектуальных систем ТГАСУ (г.Томск);
Результаты исследований внедрены в учебный процесс подготовки бакалавров и магистров кафедры экономической математики, информатики и статистики ТУСУР (курсы «Распознавание образов», «Компьютерные технологии в науке и образовании», «Базы данных», «Управление данными», «Системный анализ», «Принятие решений», «Теория вероятностей и математическая статистика») и являлись предметами исследований ряда магистерских диссертаций.
Основные положения, выносимые на защиту:
1) модель выделения тренда стохастического временного ряда и ее
теоретическое обоснование:
описание класса задач и объектов распознавания;
определение локальных систем аксиом разметки стохастического ряда и условий их полноты и однозначности;
выбор критериев оптимальности системы окрестностей, обеспечивающей разрешимость задачи разметки стохастического ряда;
определение критерия асимптотической регулярности задачи разметки и способа ее регуляризации;
определение признаков сложных динамических объектов на основе разметок состояний и их значимости для построения корректной процедуры распознавания состояний объектов;
обоснование выбора семейств корректирующих операций и построение композиций алгоритмов;
модель ранжирования динамических наборов альтернатив (методов, алгоритмов) на множестве метрических критериев (показателей качества), обеспечивающая: а) парето-оптимальный выбор «наилучших» альтернатив; б) выполнение аксиомы независимости К.Дж.Эрроу; теоретическое обоснование модели;
модель выявления закономерностей в описании данных и знаний для тестового распознавания состояний сложных динамических объектов, включающая метод оценивания информативности взаимозависимых признаков состояний;
метод скользящей реконструкции стохастического временного ряда (вьщеления последовательности трендов на основе модели разметки), позволяющий оценивать состояние объекта в реальном времени с целью построения алгоритмов наблюдения неизвестных координат и управления объектом с неполным аналитическим описанием;
математическое и алгоритмическое обеспечение интеллектуальной системы IReDSS для распознавания и оценивания состояний сложных объектов с целью управления и мониторинга;
подход к построению экспертно-аналитической системы управления сложным динамическим объектом (с неполным аналитическим описанием) на основе совмещения проблемно-ориентированной технологии построения корректных алгоритмов, метода АКАР и реконструкции координат объекта с апробацией соответствующих алгоритмов на электромеханическом объекте с нелинейным описанием;
алгоритм наблюдения неизвестных параметров и возмущений сложного объекта управления на основе совмещения техники построения асимптотического наблюдателя на многообразиях и метода оценивания состояний сложного объекта в реальном времени;
решения прикладных задач: управление нелинейным электромеханическим объектом с применением апостериорной информации и построением наблюдателя для неизмеряемых координат и возмущений; диагностирование и прогнозирование экологических объектов; предсказание неизвестных значений непрерывных атрибутов в базах данных; выявление закономерностей (разладки) в базе данных результатов электромагнитных и акустических измерений геофизических процессов.
Апробация работы. Результаты работы докладывались на конференциях и научных семинарах: всероссийская конференция «Математические методы распознавания образов» ММРО-11, Москва, 2003; ММРО-13, Ле-нингр. обл., г. Зеленогорск, 2007; международные конференции: «Интеллектуализация обработки информации» ИОИ-4, Симферополь, 2004; 7th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-7, St. Petersburg, 2004; PRIA-9, Nizhni Novgorod, 2008; «Информационные технологии в науке, образовании, телекоммуникации, бизнесе», IT+S&E'05, Украина, Крым, Ялта-Гурзуф, 2005, IT+S&E'09, 2009; «Системный анализ и информационные технологии» Переславль-Залесский, САИТ-2005; Обнинск, САИТ-2007; Звенигород, САИТ-2009; «Интеллектуальные системы», «Интеллектуальные САПР» Москва AIS-2004, AIS-2006; AIS-2007; AIS-2008, «Цифровая обработка сигналов и ее применение», Москва, DSPA-2009; «Кибернетика и высокие технологии XXI века» С&Т-2009, Воронеж, 2009; «Интегрированные модели и мягкие вычисления в искусственном интеллекте», Коломна, 2009; «Компьютерные науки и технологии», Белгород, КНИТ-2009; научная сессия МИФИ, Москва, МИФИ-2004; МИФИ-2006; национальная конференция по искусственному интеллекту с международным участием, Москва, КИИ-2004; КИИ-2006; Sixth Joint Confer, on Knowledge-Based Software Engineering, Moscow,
2004; Российско-украинский научный семинар «Интеллектуальный анализ информации», Киев, ИАИ-2004; Киев, ИАИ-2007; International Congress on Mathematical Modeling, Nizhny Novgorod, 2004; Сибирская научная школа-семинар с международным участием «Компьютерная безопасность и криптография», Горно-Алтайск, SIBECRYPT07, 2007; Тюмень, SIBECRYPT10, 2010; всероссийская конференция ФАМ-2008, Красноярск, 2008; Российская конференция с международным участием «Новые информационные технологии в исследовании сложных структур», Иркутск, 2004; Томск, 2008, 2010; международные конференции-выставки «Экологические системы, приборы и чистые технологии», «Промышленные АСУ и контроллеры 2010: от А до Я», Москва, 2010; всероссийская научная конференция с участием зарубежных ученых «Математическое и физическое моделирование опасных природных явлений и техногенных катастроф», Томск, 2010; международный симпозиум «Наноматериалы для защиты промышленных и подземных конструкций» и XI Международной конференции «Физика твердого тела» (ФТТ-ХІ), Усть-Каменогорск, 2010.
Диссертация в полном объеме докладывалась на научно-технических семинарах: СПИИРАН, Санкт-Петербург, 2010, 2011; факультета прикладной математики и кибернетики ТГУ, 2010; энергетического института ТПУ, 2009-2011; кафедры экономической математики, информатики и статистики ТУСУР, Томск, 2009-2011.
Научные исследования поддержаны грантами РФФИ: №04-01-00144-а (2004-2006); №07-01-00452-а (2007-2009); №09-01-99014-р-офи (2009-2010, руководитель); №10-01-00462-а (2010-2011).
Публикации. Результаты выполненных исследований отражены в 68-ми печатных работах, которые включают в себя одну монографию, 15 статей в журналах, рекомендуемых ВАК РФ, 13 статей в рецензируемых журналах, 33 доклада в сборниках научных трудов, 1 свидетельство на полезную модель, 5 авторских свидетельств о государственной регистрации программ для ЭВМ.
Личный вклад автора. Все основные научные результаты, выносимые на защиту и составляющие основное содержание диссертации, получены автором самостоятельно. В работах, опубликованных в соавторстве, личный вклад автора состоит в следующем. В публикациях [1, 5, 6, 9, 13, 23, 24, 31-34] автором сформулированы задачи, определены способы их решения, выбраны методы исследования, получены основные теоретические результаты; в публикациях [2, 12, 17, 18, 25-29, 35-37] автору принадлежат основные теоретические результаты; в работе [40] выполнено теоретическое обоснование свойств заявленной полезной модели; в [38, 39] разработано математическое и программное обеспечение, в работах [41, 42, 43] - матема-
тическое и алгоритмическое обеспечение. Экспериментальные исследования выполнялись под руководством автора, или лично автором.
Структура и объем диссертации. Диссертация состоит из введения, шести глав, заключения, списка использованной литературы, включающего 246 наименований. Работа изложена на 332-х страницах, содержит 58 рисунков, 19 таблиц, приложения на 32-х страницах.
Обзор современных методов и информационных технологий распознавания состояний сложного динамического объекта
В отношении реальных объектов (систем) термин «динамический объект» понимается в смысле: объект (система), описание которой возможно и целесо образно с помощью динамических моделей, причем не только детерминиро ванных, но и стохастических, состояние которого изменяется (дискретно или непрерывно) во времени [42; 56-58, 68, 94, 100, 106, 161, 168, 173, 178, 188, 229]. Методы обработки информации в системах со случайной скачкообразной структурой. В дискретных нелинейных системах со случайной скачкообразной структурой методы обработки информации и управленияразвивались в работах А.Н. Скляревича, В.М. Артемьева, И.Е. Казакова, Ю.П. Гришина, Ю.М. Казаринова, В.А. Бухалева, Ю.Б. Михайлова и др.
Рассматривался класс стохастических динамических систем, заданная структура которых (состав элементов и связи между ними) может изменяться случайным образом. При этом, структура S описывается индексом (меткой), который является случайным процессом, имеющим конечное число возможных состояний СДО, сменяющих друг друга в случайные моменты времени с некоторой вероятностью. Состояние системы описывается вектором фазовых координат и структуры S. Использовался методологический подход, основанный на фундаментальных концепциях теории марковских систем, байесовского оценивания, динамического программирования и дифференциальных игр. Находились рекуррентные алгоритмы взаимосвязного распознавания, оценивания и управления фазовыми координатами и структурой объектов на основании показаний измерителей и индикаторов, рассматривались задачи оптимального сглаживания и игрового управления.
Современное состояние методов обработки информации СДО со скачкообразной структурой в рамках отдельных формализации отражено также в работах [58, 76, 78, 161,162, 165-169, 171, 177, 179,188-190]. В работе [188] исследуется подход к формализации и решению проблемы комплексной автоматизации процессов мониторинга и управления состояниями сложных технических объектов на основе полимодельного многокритериального описания с использованием аппарата теорий управления структурной динамикой, распознавания образов, неопределенных вычислений и программирования в ограничениях. Суть исследований состоит в поиске одного управления, реализующего заданный набор программных движений в зависимости от начальных условий и обеспечивающий асимптотическую устойчивость, системы управления. Класс рассматриваемых систем описывается линейными . уравне: ниями, билинейными и типа Лотки-Вольтерры. Используется метод позиционной оптимизации, разработанный Р.Ф. Габасовым, применимый к определённому классу нелинейных систем. Для системы в отклонениях используется кусочно-линейная аппроксимация.
В [78] осуществлен подход к разработке модели сигнала,.на основе которой можно было бы проектировать системы автоматического анализа сложных сигналов без предположений, необходимых при аналитическом решении задачи оптимального приема сигнала. Модель позволяет разложение сигнала на составные элементы и распознавание как элементов, так и сигнала в целом. «Сложность сигнала» понимается как чередование или наложение характерных последовательностей друг с другом или с другими, элементарными (известными) последовательностями; а характерная последовательность s(t) понимается как суперпозиция s(t)=@Sj(t) заданных элементарных Sj. Метод характерных последовательностей (в обход традиционной сегментации) автоматически ищет признаковое множество для диагностики следующим образом: выбираются случайные эталоны; если около него образуется кластер, то эталон, переопределяется как характерная последовательность.
В работе [162] в качестве исходных признаков для определения состояния СДО брались случайные величины значимых (превышающих заданный порог) амплитуд гармоник спектрограммы в разложении временного ряда в ряд Фурье. Исследования проводились в предположении, что в зависимости от состояния исследуемого СДО математическое ожидание исходного вектора признаков будет различным. Осуществив предварительные эксперименты при заранее известных состояниях СДО, получали обучающую выборку, по которой определялись выборочные средние векторов групп признаков. В качестве решения выдавалась метка той группы, к которой евклидово расстояние между исходным вектором признаков для неизвестного состояния объекта и выборочными средними векторов групп оказывалось наименьшим. Понятно, что такая процедура годна при условии различия выборочных средних векторов групп, соответствующих разным состояниям СДО, и имеет ограничения спектрального анализа, изложенные ниже.
В работах школы Ю.И. Неймарка [180] был предложен подход к автоматизации огрубленного численного исследования многомерных динамических объектов (задача построения фазового портрета) на основе использования методов распознавания образов и статистического моделирования на базе обучающей выборки. При этом образы - это фазовые траектории, установившиеся движения и их области притяжения. Теоретический аппарат решения данных задач базируется на методах исследования специально построенных одномерных временных рядов, синдромального анализа данных и использовании рекуррентной формы метода наименьших квадратов.
Методы технической диагностики решают задачи распознавания состояний системы, определения причин нарушения работоспособности, а также установления вида и места дефекта. Методы условно классифицируют [76, 79] на три большие группы: методы параметрической идентификации, статистические и вероятностные методы, логические методы.
Методы параметрической идентификации строятся на основе минимизации ошибки между измерениями выходного сигнала СДО и выходом модели СДО при условии подачи на вход сигнала определенного типа. Различают подходы к идентификации параметров на основе: 1) применения нелинейного МНК и ММП [106]; 2) использования импульсных характеристик [196]; 3) метода множителей Лагранжа. Однако вопрос о типе структуры модели и ее минимальной сложности не решается.
Статистические и вероятностные методы. Одна группа методов основана на решении интегрального уравнения Винера-Хопфа при различных ограничениях; другая - для определения диагностической характеристики объекта требует решения уравнения Риккати с заданными начальными условиями; третья - основана на методах последовательного анализа Вальда и условных марковских процессов, развитых в работах Р.Л. Стратоновича, А.Н. Ширяева, Э.М. Хазен и др., и позволяет получить двухэтапную процедуру диагностики-динамической системы, реализация-которой вычислительно возможна: На 1-м этапе определяется оптимальная проверка, на 2-м проводится оценка диагностической характеристики элемента проверки, по значениям которой уточняются априорные сведения о состоянии блоков, включенных в элемент проверки. Группа методов характеризуется относительной простотой реализации, обладает хорошей обобщающей способностью при невысоких требованиях к вычислительным ресурсам, но с ограничениями на условия малых выборок и нестационарных характеристик.
Локальные системы аксиом разметки стохастического временного ряда и выбор оптимальной системы окрестностей
Рассмотрим пример, где представлен модельный фрагмент ряда, значения которого получены табуляцией 3-х функций из заданного набора, включающего 14 функций. В верхней части рис. 2.7 а), 2.7 Ь) проставлены присвоенные алгоритмом разметки номера функций: а) для исходного фрагмента ряда; Ь) для зашумленного ряда с нормальным шумом N(0; 0.05) и интервальной разметкой. На рис. 2.7 с) представлены результаты скользящей разметки с величиной окна, равной 5 у.ед. по ряду с нормальным шумом iV(0;0.05). По оси ординат - номера функций (метки), для наглядности соединены кривыми на графике. Как следует из рис. 2.7 с), идентификация «разладки» прошла со 100%-м успехом, но с присутствием меток, не совпадающих с предполагаемой на рис. 2.7 а), что свидетельствует об актуальности задачи регуляризации а-разметки. Здесь алфавит Р-разметки р состоит из элементов: ?={В\={\, 2}; В2={3, 10}; В3={4, 6, 9}; В4={5, 7}; В5={$}}, полученных на обучении. Из рис. 2.7 а)-с) следует корректность Р-разметки сигнала 2.7 Ъ) в алфавите Р.
Выводы по результатам моделирования. На модельных данных показана возможность распознавания состояний объекта по признаку формы детерминированной составляющей, тип которой сопоставлен значениям коэффициентов авторегрессионной модели, построенной по стохастическому временному ряду. 1. Ширина окна влияет на величину задержки обнаружения момента разладки (как момента смены модели описания фрагмента временного ряда). 2. Признаком разладки может служить рост разнообразия (меток) функциональных зависимостей (увеличение энтропии). 3. Из рис. 2.7 с) следует, что для слабозашумленного ряда возможно практическое определение момента разладки с последующей проверкой значимости полученного результата. 4. Процедура регуляризации а-разметки существенно влияет на качество идентификации выделенных состояний сложного объекта (рис. 2.8). 5. Результаты экспериментальных исследований свидетельствуют, что изложенные алгоритмы при соблюдении определенных условий и подборе параметров алгоритмов позволяют распознавать смену состояний динамических объектов с неопределенностью. Применение модели разметки временного ряда для решения прикладных задач Приведем примеры практического применения модели разметки СВР и решение прикладной задачи на основе полученных результатов. 1. Традиционной операцией перед распознаванием элементов сигнала является сегментация (для выделения элементов сигнала и их распознавания вычисляются разные функционалы; сегментация выполняется по значениям функции сложности [54], распознавание - по вектору спектральных коэффициентов). Функции сложности5, введенные в [54], вычисляются при заданном размере блока данных, однако вопрос о способе выбора размера блока данных (ключевого параметра сегментации) является открытым. Для корректного корреляционного анализа требуется информация о фазе сигнала, но при равномерном способе сегментации разрушается информация о фазе элементов сигнала. Предложенный метод разметки СВР может быть полезен для анализа произвольных сложных сигналов, так как позволяет определить не только границы сегментов, но и отделить «основные» сегменты от переходных сегментов. 2. Метод разметки СВР может быть применен для классификации динамических объектов, если в качестве меры сходства между порожденными ими временными рядами взять величину, равную числу размеченных интервалов совместного роста или спада значений сравниваемых рядов [102], определение которых возможно по производной, взятой на интервалах аппроксимации, помечая промежутки «сшивания» сегментов символами: «неопределенность», «max», «min», составляющими алфавит дополнительной разметки. 3. Алгоритм 2.4 на базе метода скользящей аппроксимации использован для оценки состояния объекта при управлении в реальном времени (гл. 6). 4. При формировании одномерного временного ряда zy из многомерного по формуле [180]: 5 Функция сложности одного из типов вычисляется по трем блокам как скалярное произведение между рассматриваемым блоком отсчетов и вектором средних значении соседних блоков. где за xkt обозначено значение к-й координаты я-мерного динамического объекта, и применении к ряду (2.26) алгоритма 2.4, можно оценивать скорость движения к аттрактору аналитически, что важно для применения управления на многообразиях [113], где весовой коэффициент сопровождающего оптимизирующего функционала качества управления (гл. 6) интерпретируется как время движения изображающей точки x(t) системы до пересечения многообразий. 5. Алгоритмы 2.1 (2.4) могут быть применены для установления вида функциональной зависимости между двумя показателями X, Y. С этой целью на основе метода ARADS и обучающей выборки с известными сочетаниями пока заний наблюдаемой Y и ненаблюдаемой X переменных (xpyj), j = \,п, xj=X(jA), 3 =Г(/Д), А 0, получают динамические модели по алгоритму 2.1 x=g(t), y=f{i). В результате находят функциональную зависимость между наблюдаемой Y и ненаблюдаемой Xпеременными: х = g (f \t)), где/_1(-) - функция, обратная к/{-), значимость которой можно осуществить на дополнительной выборке. Этот прием практически был апробирован для подбора аппрокисмирующих функций при построении асимптотического наблюдателя (гл. 6).
Условия разрешимости и регулярности задачи многокритериального ранжирования альтернатив
Экспериментальное исследование качества сглаживания временного ряда (рис. 3.5) проводилось в сравнении с результатами непараметрической идентификации нелинейной регрессионной модели сигнала [64]. На модельный сигнал накладывались различные шумы уровня, не превышающего 30% от максимального значения полезного сигнала: равномерный шум на интервалах [-5;5], [-10;10], [-150;150], [-300;300]; гауссовский шум с параметрами N(0,10), N(0,50), 7V(0,10000), JV(0,50000). По полученным данным (временным рядам) были построены фильтрованные значения по 1000 точкам.
Численное моделирование проведено на примерах нескольких временных рядов, являющимися моделями некоторых характеристик технических систем по имитационной модели, разработанной в среде Matlab.
На рис. 3.5 показана удовлетворительная-точность сглаживания временного ряда композициями алгоритмов с корректирующими операциями на основе АНР+ по трем моделям эталонов, (Stolp [95], мета-эталоны [7] и RVM), тогда как непараметрическая фильтрация по работе [64] дает эффект в. 14 % против 30 %-й первоначальной зашумленности. Для фильтрации использовался алгоритм П3.1, содержательное описание которого приведено в приложении 3.
Результаты главы 3 представляют собой развитие метода анализа иерархий (АНР) с целью его корректного применения для динамически изменяющихся наборов альтернатив. В главе 3 получены результаты. 1. Формализована корректная модификации метода парных сравнений на основе проблемно-ориентированной технологии синтеза корректных алгоритмов. На этапе I построения абстрактной модели предметной области за объект исследования принята модель парных сравнений АНР для динамических наборов альтернатив, индуцирующая, как известно, противоречивые оценки при изменении мощности сравниваемых наборов по метрическим критериям и/или при использовании неподходящей функции скаляризации критериев. На этапе II в качестве локальных алгоритмов ранжирования альтернатив приняты алгоритмы, выдающие частные ответы в виде собственных векторов матриц парных сравнений (параметризованных критериями в классической модели АНР); специальным образом введенная функция относительного сходства использована для корректирующих операций. 2. Введено понятие корректности ранжирования динамических наборов альтернатив, понятие корректного метода (и алгоритма) ранжирования на мно жестве критериев, доказаны свойства корректной модификации метода анализа иерархий с метрическими критериями, лишенной следующих нежелательных особенностей классического метода: 1) нарушение аксиомы К. Эрроу (бинарные отношения предпочтений зависят от дополнительных альтернатив при неизменной системе критериев), вызванное эффектом единичной нормировки; 2) некорректное применение линейной свертки критериев, на основе которой- в определенном классе многокритериальных задач невозможно найти «наилучшее» решение. 3. На основе модели АНР+ построены алгоритмические композиции и апробированы на эталонной разметке временного ряда. 4. Доказаны следующие свойства модификации АНР+: 1) сохранение отношения предпочтения при изменении множества сравниваемых альтернатив классический АНР не гарантирует; 2) в модифицированной процедуре АНР+ предпочтения, индуцированные на множествах (альтернатив, признаков) при их изменении, на основе нелинейной свертки критериев, совпадают (теорема 3.1); 3) «наилучшее» решение, выбираемое на основе модификации АНР+ с нелинейной сверткой критериев, принадлежит парето-оптимальному множеству (теорема 3.2) и может быть выбрано максимизацией специальной (подходящей) функции относительного сходства. Модификация АНР+ внедрена в ИИС ИМСЛОГ [60], метод апробирован на решении ряда прикладных задач. Результаты, представленные в 3-й главе, опубликованы в работах [118, 122-125, 148, 150, 238-240]. Объектом исследования в главе 4 является модель сложного объекта, аналогичная рассмотренной в задаче 1.2 (п. 1.2), имеющей следующие варианты. Задача сравнения и классификации динамических объектов и их состояний. Пусть матрица «объект-признак» представляет собой набор вектор-разметок (определения 2.1, 2.2), порождаемых динамикой либо одного СДО в разных состояниях (вектор-разметки статистически, эквивалентных вектор-объектов (2.2)), либо нескольких разных динамических объектов на одном временном отрезке; в качестве признакового описания выступает разметка в алфавите L в соответствии с правилами разметки 1, 2 (гл. 2). Требуется построить решающие правила для отнесения нового вектор-объекта к одному из образов состояний (к одному из классов динамических объектов).
Процедура разметки СВР, представленная в гл.2, реализует отображение из пространства вектор-объектов со значениями в вещественном пространстве R в пространство вектор-разметок со значениями в Z+ ; применение к целочисленным вектор-разметкам дополнительной разметки из алфавита с метками состояний {!,...,1} и окрестностью размера d приводит к варианту решения основной задачи. Если определить состояния объекта как совокупности сдвиг-эквивалентных вектор-разметок (что не противоречит физическому содержанию задач (1.1)-(1.4)), применимы техники исследования, развиваемые в работах ВЦ РАН (например, [65, 66, 111, 112]), теоретически обоснованные базовыми работами [206, 230].
Перечислим некоторые классические понятия и определения хорошо зарекомендовавшего тестового подхода к распознаванию образов [83, 91, 160] и введем новые [148] применительно к задаче распознавания состояний сложного объекта по предварительно проведенной операции разметки сопровождающего его поведение временного ряда типа (2.2).
Численное сравнительное моделирование методов оценивания информативности признаков и тестов
Приведем пример, связанный с целесообразностью корректного оценивания при изменении анализируемого набора признаков (динамического набора).
Пример 4.1. В примере на рис. 4.3 наборы признаков i={zi, zi, z$}, 2={zi, Z2, Z4} и з={г2, Z3, z4} являются тупиковыми тестами (матрица Т). Применение тестового алгоритма по принципу совпадения значений всех признаков не позволит новый объект 0={\, 2, 3, 2) отнести к одному из выделенных классов, однако фрагмент (1, 2), порождаемый набором ={zb Z2}, полученным удалением одного из признаков, содержится в О и соответствующих объектах из первого класса и не содержится в объектах из второго класса, что дает нам основание полагать, что распознаваемый объект более близок к первому классу.
Непосредственное применение АНР в вышеизложенном методе определения весовых коэффициентов признаков может привести к 100%-й ошибке (неверному выбору) и к неточности в принятии решения. Применение метода АНР+ при построении коллективов алгоритмов. Обозначим MAHPreg - метод определения весовых коэффициентов признаков на основе формализма мультимножеств и АНР+ с регуляризацией матрицы парных сравнений. 1. Регуляризация матрицы парных сравнений и применение критерия (4.4) для оптимального вычисления весовых коэффициентов алгоритмов. Теорема 4.2. Регуляризация матрицы парных сравнений, полученная на основе мер относительной важности (4.5) и базисных наборов, является корректной (в смысле выполнения ограничений (3.1)). Доказательство теоремы 4.2 производится непосредственной проверкой свойств а)-с) (3.1) (см., напр., доказательства утверждений 3.2, 3.3). Пусть дан набор мер относительной важности мультимножеств (например, дополнительно к введенным мерам вида (4.5), меры, приведенные в [192]), на основе которых определены базисные наборы из (-1) элементов (определение 3.12). Определение остальных элементов МПС А = лу транзитивности (3.1 с)) влечет справедливость всех свойств (3.1), в чем нетрудно убедиться. Корректность регуляризации означает, что преобразование несовместно приводит к выполнению требуемых свойств (3.1) для преобра-зованной матрицы, парных сравнений Areg. Как известно, только в этом случае обоснована интерпретация весовых коэффициентов признаков как собственных векторов соответствующих МПС [170, 186, 208] (см. утверждение 3.1). Следствие теоремы 4.2. Регуляризация матрицы парных сравнений, полученная по одному из способов: 1) первая строка МПС составлена на основе мер относительной важности (4.5) и соотношений (3.8); 2) элементы МПС а12,а23,... ,ak_lk составлены на основе мер относительной важности (4.5) и соотношений (3.8), а остальные элементы МПС составлены по правилу (3.1 с)) является корректной. 2. Определение условной степени близости исследуемого объекта к і-му образу для каждого метода (алгоритма) оценивания весовых коэффициентов признаков. Каждый из выбранных базовых методов оценивания ВКП, входящих в тест, порождает коэффициенты сходства к, (і - номер образа, і = 1,1) объектов внутри образа (внутриклассового сходства) и- коэффициенты сходства к? исследуемого объекта х с і-м образом (классом), формулы для вычисления которых при qve{0, 1, «-»} для метода МАНР (I этап) даны в приложении 4 как пример, поскольку этот вопрос решается для каждого метода отдельно. Отношение ту, коэффициентов к? к коэффициентам Kt (по каждому образу отдельно) вида 77/ =к%/кі называется условной степенью близости распознаваемого (исследуемого) объекта к г -му образу. Весовые коэффициенты методов (алгоритмов, признаков) возможно находить, взяв в качестве меры относительной важности методов (алгоритмов) величины aay i/Vj Принятие решений относительно исследуемого объекта по каждому тесту в рамках логико-комбинаторного подхода осуществляется с использованием порогового значения условной степени близости данного объекта к образам, а принятие итогового решения осуществляется на основе специальной процедуры голосования по всем решающим правилам. Вычислим по одному из тестов т = (z5, z9, zu) значения ВКП (табл. 4.1-4.4) по вышеперечисленным методам 1-3 для данных и знаний с описанием на рис. 4.412. Для удобства соотнесения номеров признаков в матрицах Q и Т, в матрице Т использованы все 13 признаков, хотя столбцы 1,2, 8, 13 избыточны, поскольку соответствующие им признаки не входят во множество тупиковых тестов, представленных матрицей Т. Так как каждая из строк 3, 6, 7 представляет собой интервал булева пространства (содержит по одному символу «-») и представляется двумя строками, то число строк матрицы Q увеличится на 3.