Содержание к диссертации
Введение
Глава 1. Обзор моделей анализа рядов наблюдений и постановка задачи 11
1.1 Обзор параметрических моделей анализа массовых наблюдений 11
1.2 Мониторинг и структурный анализ наблюдений в задачах эксплуатации судов в ледовых условиях 16
1.3 Постановка задачи исследования 25
1.4 Общая характеристика диссертационной работы 27
Глава 2. Модели сепарации пространства параметров на основе нечеткой кластеризации зашумленных измерений 34
2.1 Математическая постановка задачи нечеткой кластеризации зашумленных результатов массовых наблюдений 34
2.2 Методы описания структуры временных рядов нагрузок 38
2.3 Применение статистического моделирования к алгоритму нечеткой кластеризации 48
2.4 Метод статистической оценки результатов работы алгоритма нечеткой кластеризации 54
2.5 Синтез нечеткого классификатора 58
Глава 3. Модель, метод и алгоритм геометрической кластеризации в пространстве параметров 63
3.1 Постановка задачи геометрической кластеризации плоскостями в многомерном пространстве параметров 63
3.2 Применение метода SVM в.вапника для синтеза геометрического классификатора 70
3.3 Модель гиперквадрирования кластера с учетом неполной информации о его расположении в пространстве параметров 75
3.4 Алгоритм случайного выбора точек в зависимости от способа описания границ кластера в пространстве параметров 79
Глава 4. Алгоритм анализа зашумленных рядов наблюдений с использованием моделей нечеткой, геометрической и иерархической кластеризации 85
4.1 Создание модели классификации иерархических векторов на основе искусственной нейронной сети 85
4.2 Адаптация спектрального метода предобработки к случаю зашумленных данных 91
4.3 Применение иерархического классификатора к предобработанным спектральными методами данным 101
4.4 Методика структурного анализа зашумленных рядов наблюдений на основе разработанных моделей 104
Глава 5. Модель и численный метод восстановления ведущих компонент зашумленного временного ряда 109
5.1 Постановка задачи восстановления ведущих периодических компонент зашумленного временного ряда при помощи численного эволюционного алгоритма 109
5.2 Теорема о достижении окрестности оптимального решения квазигенетическим алгоритмом 114
5.3 Теорема о скорости сходимости квлзигенетического алгоритма 121
Глава 6. Применение алгоритмов структурного анализа рядов наблюдений к задачам, связанным с эксплуатацией судов 125
6.1 Структурный анализ показаний датчиков нагрузки на корпус судна в ледовых условиях 125
6.2 Анализ ледовых нагрузок на ледостоикие опоры причала при помощи квазигенетического алгоритма 136
Заключение 146
Библиографический список 14?
Приложение а 156
- Мониторинг и структурный анализ наблюдений в задачах эксплуатации судов в ледовых условиях
- Применение статистического моделирования к алгоритму нечеткой кластеризации
- Модель гиперквадрирования кластера с учетом неполной информации о его расположении в пространстве параметров
- Применение иерархического классификатора к предобработанным спектральными методами данным
Введение к работе
В последнее время значительное влияние на развитие математических моделей, методов и алгоритмов оказывает рост возможностей и быстродействия вычислительной техники.
Значительная часть инженерных задач связана с обработкой и анализом больших потоков данных. Точность анализа и прогноза в таких случаях зависит от характера применяемой модели. Поэтому возникает потребность в создании новых математических моделей, методов и алгоритмов, пригодных для обработки больших потоков данных, непрерывно поступающих в течение длительного времени.
В отраслях техники, где производятся последовательные наблюдения за различными величинами, актуальной является задача структурного анализа временных рядов [11]. Особенную актуальность приобретает задача выявления и оценки индивидуальных особенностей фрагментов наблюдений. Ей, в ряде случаев, отдают приоритет перед задачей построения долгосрочных и общих закономерностей из-за сложности или, наоборот, тривиальности последней.
Постановку задачи, решаемой в настоящей работе, можно кратко сформулировать в виде следующей последовательности подзадач:
установить наличие фрагментов, содержащихся в ряде наблюдений и обладающих схожими характеристиками. Осуществить выделение таких фрагментов. Выделенные фрагменты отнести к нескольким группам - кластерам;
найти параметры, характерные для каждого кластера, содержащего фрагменты записи. Составить усредненные «портретные» фрагменты-образцы, соответствующие каждому из кластеров;
осуществлять соотнесение вновь поступающих фрагментов ряда наблюдений с «портретными».
При такой обработке у исследователя появляются возможности оперативного выявления происходящих структурных изменений в наблюдаемом процессе. А это,
4 в свою очередь, позволит решить многие задачи, связанные с автоматическим мониторингом различных величин. Даже в отсутствие накопленных знаний для экстраполяции такая методика позволит установить сам факт наблюдающегося или произошедшего изменения.
В современной технике поставленная задача актуальна также в связи со следующими особенностями:
регистрация полезного сигнала неизбежно связана с помехами;
часто полезный сигнал приходится выделять из труппы сопутствующих сигналов. Его можно зарегистрировать только в совокупности с другими сигналами, поступающими в этих же условиях.
Первый случай является следствием несовершенства или технологических сложностей при установке, подключении и передаче сигнала измерительной аппаратурой. Второй случай является следствием выбора доступных для исследователя точек поступления сигнала на измерительную аппаратуру. Оба случая могут вносить свой вклад в повышение сложности задач анализа наблюдений сигнала, как по отдельности, так и в совокупности.
Часто применяемый на практике инженерный прием увеличения частоты съема наблюдений с одной стороны повышает достоверность наблюдений, а с другой — усложняет их интерпретацию из-за увеличения объема поступающих данных при неизменном влиянии перечисленных факторов 1) и 2). В таких случаях становится особенно актуальным наличие подходящих моделей, включающие методы и алгоритмы обработки наблюдений.
Основной целью настоящей работы является создание методики на основе сепарции пространств параметров. Эта методика предназначена для осуществления структурного анализа рядов наблюдений. Совокупность численных методов и вспомогательных алгоритмов этой методики должна основываться на возможностях и быстродействии современных вычислительных машин и использовать новейшие подходы в формализации. Также целью является построение комплекса программ, пригодного для информационного анализа больших потоков данных, и решение при помощи этого комплекса прикладных задач, связанных с эксплуатацией судов в ледовой обстановке.
Диссертация состоит из 6 глав, введения, заключения и приложений. В главе 1 произведен обзор моделей структурного анализа рядов наблюдений и обоснована актуальность постановки задачи. В 1.1 осуществлен обзор математических методов, применяющихся для анализа наблюдений, записанных в виде временных рядов. Перечислены различные модели структурной декомпозиции временных рядов. Подчеркнута актуальность часто встречающейся в технике задачи - структурного анализа существенно нестационарных временных рядов. Отмечена несостоятельность вероятностной модели для решения многих инженерных задач, где требуется представлять наблюдаемые процессы суперпозицией детерминированных функций от времени.
В 1.2 демонстрируется актуальность прикладной задачи структурного анализа нестационарных наблюдений нагрузок, вызываемых льдом, на корпуса судов и морских конструкций. Сделан обзор особенностей мониторинга показаний тензометрических датчиков сопротивления, при помощи которых осуществляется регистрация нагрузок. Перечислены причины, влияющие на результирующую нестационарность показаний. Сделан обзор методов, применяющихся в настоящее время для анализа результатов массовых показаний датчиков нагрузок.
Таким образом, сделан вывод о необходимости создания методики структурного анализа временных рядов, состоящих, преимущественно из нестационарных колебательных процессов.
Подчеркнуто, что создание автоматических систем мониторинга ледовых нагрузок отвечает современным требованиям надзорных организаций [59]. Поэтому в параірафе отмечено, что комплекс программ, позволяющий проводить такие исследования со значительной степенью автоматизации работы, должно стать частью работы по созданию методики.
В 1.3 осуществлена постановка задачи исследования.
В 1.4 изложена общая характеристика диссертационной работы, отмечены ее научная новизна и практическая значимость.
В главе 2 осуществлено построение нечеткой кластеризационной модели на основе алгоритма С-средних. Изложена авторская модификация этого алгоритма,
предназначенная для решения задач в многомерных пространствах и на зашумленных данных. Построение модели завершается синтезом нечеткого классификатора.
В 2.1 произведена постановка задачи нечеткой кластеризации зашумленных результатов массовых наблюдений. Использована математическая формализация нечеткого итерационного алгоритма С-средних (C-means), который начал применяться с широким распространением быстрых вычислительных машин[60|. Перечислены недостатки этого алгоритма для случая работы с зашумленными данными, которые устраняются при помощи авторской модификации, изложенной в последующих параграфах.
В 2.2 обращено внимание на методы предобработки временных рядов и их фрагментов с целью осуществления кластеризации в пространстве параметров. Существует множество различных методов предобработки данных. Подчеркнут колебательный характер регистрируемых нагрузок на обшивке конструкций. Для решения прикладной задачи исследования тензометрических данных сделан вывод о целесообразности применения спектрального анализа как вида предобработки, а также выявления характера всплесковых явлений при помощи методов аппроксимации функций.
В 2.3 разработана система моделирования стартовых параметров алгоритма С-средних. Предложено к использованию два типа инициализации параметров - с использованием равномерно распределенных случайных величин, и с использованием непрерывных унимодальных случайных величин. На примере продемонстрировано, что оба способа имеют свои преимущества. Результаты этого параграфа были доложены автором на Ш-й Всероссийской конференции по имитационному моделированию «ИММОД-2007» в октябре 2007 г [28].
В 2.4 разработано дополнение алгоритма С-средних статистической моделью оценки результатов работы этого алгоритма на зашумленных многомерных данных. В связи с тем, что число кластеров при задании стартовых параметров нечеткого алгоритма оценивается экспертным путем, оказывается необходимой разработка специальных характеристик успешного решения задачи кластеризации.
Синтез в 2.5 нечетко-нейросетевого классификатора, способного относить вновь поступающие предобработанные фрагменты наблюдений к одному нз классов, является завершающим этапом построения модели.
В главе 3 осуществлено построение модели геометрической кластеризации в пространстве параметров. Для синтеза геометрического классификатора применено построение разделяющих гиперплоскостей по методу опорных векторов Вапника (SVM). Метод SVM впервые полностью изложен в работе Вапника «The Nature of Statistical Learning Theory»[65], изданной в 1995 году.
Также в этой главе разработана модель гиперквадрирования кластеров с учетом неполной информации о его расположении в пространстве параметров.
Постановка задачи геометрической класіеризации в многомерном пространстве при помощи разделяющих гиперплоскостей изложена- в 3.1. При этом возникающая задача квадратичной оптимизации сведена к решению последовательности задач линейного программирования.
В 3.2 осуществлен синтез геометрического классификатора, обучение которого производится по методу SVM. Этот классификатор способен относить предлагаемую к распознаванию точку в пространстве параметров к одному из выпуклых кластеров в этом пространстве,.
В связи с необходимостью специального описания кластера для целей имитационного моделирования, в параграфе 3.3 разработано и обосновано правило для осуществления квадрирования кластера при наличии неполной информации о его расположении в пространстве параметров.
Собственно процедура имитационного моделирования точки из одного кластера или совокупности кластеров, расположенных в многомерном пространстве параметров, формализована в 3.4. При этом использована модель описания кластера из 3.3.
В главе 4 разработана модель иерархического классификатора, а также произведена формализация предлагаемой в работе методики в виде последовательности шагов.
Иерархический классификатор, формализованный в виде совокупности принимающих решение элементов, связанных в ориентированный граф, предложен в 4.1. В параграфе предложена система настройки параметров принимающих
8 решение элементов, и весов связей между элементами так. что оказывается возможным доказать теорему (Теорема 1) о классификации иерархических векторов.
Решение прикладной задачи кластеризации при исследовании ледовых нагрузок на корпус судна и морских конструкций успешно получается при проведении предобработки, связанной с оценкой формирующих наблюдения периодических компонент. Адаптация спектрального метода предобработки фрагментов временного ряда к случаю зашумленных данных осуществлена в 4.2.
Некоторые инженерные задачи, в частности - прикладная задача, рассматриваемая в настоящей работе, предусматривает сравнение фрагментов временных рядов по ведущим частотам их периодических компонент. Таким образом, в задаче устанавливается приоритетность диапазонов частот. Для целей такого анализа в 4.3 используется разработанный ранее в 4.1 иерархический классификатор.
Методика структурного анализа зашумленных результатов последовательных массовых измерений сформулирована в 4.4. В основу методики легли три модели - нечеткой кластеризации, геометрической кластеризации и иерархической кластеризации, изложенные и обоснованные в главах 2, 3 и 4.
В главе 5 предлагается модель восстановления ведущих компонент зашумленного ряда. Эта модель основана на аппроксимации наблюдаемых процессов функциями, нелинейными по параметрам, при помощи эволюционного алгоритма.
В 5.1. сформулирован эволюционный квазигенетический алгоритм, основанный на принципах работы генетических алгоритмов, и использующий операцию арифметического скрещивания. Сформулированный алгоритм способен находить на выпуклом замкнутом подпространстве U метрического пространства поиска искомую окрестность минимума функции. При помощи этого численного алгоритма предложено решить задачу поиска минимального состава ведущих колебательных компонент, адекватно представляющих рассматриваемые фрагменты временного ряда.
Для эволюционного квазигенетического алгоритма в 5.2 доказываются леммы и теорема о достижении окрестности оптимального решения.
Опишем эти леммы и теорему (Теорему 2). Рассматривается случай существования двух экстремумов в области поиска. Лемма 1 является утверждением о сохранении найденного наиболее оптимального решения на протяжении двух соседних итераций. Лемма 2 задает условие, при котором через конечное число итераций алгоритм перейдет к множеству более оптимальных решений. Теорема 2 утверждает, что при любом множестве начальных решений для квазигенетического алгоритма существует ненулевая вероятность отыскания окрестности оптимального решения за конечное число шагов.
В 5.2 доказывается теорема (Теорема 3) о скорости сходимости сформулированного эволюционного алгоритма. Теорема 3 сравнивает в предельном случае скорости сходимости квазигенетического алгоритма и алгоритма случайного поиска.
В главе 6 описывается решение прикладных задач анализа мониторинга нестационарных нагрузок, вызываемых льдом, на корпусы судов и детали морских конструкций. Решение этих задач осуществляется при помощи разработанной методики, а также сформулированного и обоснованного соответствующими теоремами эволюционного алгоритма.
Решение задачи кластеризации фрагментов натурных наблюдений корпусной тензостанции при движении судна ледового класса во льдах рассмотрено в 6.1. Существенно новые результаты, полученные при помощи применения методики, были доложены автором на НТК «Проблемы мореходных качеств судов и корабельной гидромеханики. XLII Крыловскис чтения» в Санкт-Петербургском ЦНИИ им. академика А.Н. Крылова в декабре 2006 года [32].
В 6.2 приводится постановка задачи и основные результаты отыскания при помощи- эволюционного квазигенетического алгоритма минимального состава ведущих колебательных характеристик в наблюдениях сконструированного на основе тензодатчиков динамометра, регистрирующего нагрузки при протягивании моделей опоры ледостойкого причала. Опоры этого причала с 2007 года установлены на о. Варандей.
Изучаемые модели предполагали различное конструктивное решение опоры причала, и испытания для них в ледовом бассейне проводились с целью изучения соответствующего воздействия моделированного льда.
Применение квазигенетического алгоритма для отыскания ведущих колебательных характеристик в рядах наблюдений позволило провести новое и более детальное и изучение нестационарного воздействия льда на модели конструкции.
В Заключении сформулированы основные результаты диссертационной работы.
В Приложениях приведены результаты некоторых проведенных исследований, иллюстрирующих или поясняющих текст основных глав диссертационной работы. Также в приложениях приведены 26 страниц распечаток основных модулей комплекса проірамм на языке программирования C++. Остальные модули комплекса программ по объему превышают 30 страниц, и не включены в приложения. Созданный комплекс программ реализует совокупность моделей и алгоритмов по структурному анализу рядов наблюдений, являющихся составной частью предлагаемой в работе методики.
Мониторинг и структурный анализ наблюдений в задачах эксплуатации судов в ледовых условиях
В настоящем параграфе рассматриваются следующие аспекты прикладной значимостиразрабатываемой методики: - автоматизация мониторинга и систем слежения за показаниями нагрузок. сопровождающих движение судна в ледовых условиях, является актуальной задачей; исследования в области этой задачи ведутся в настоящее время; - для структурного анализа данных, полученных в результате такого мониторинга, используется ряд статистических методов; использование в имитационном моделировании эксплуатационных условий только случайных компонент имеет некоторые недостатки; - при мониторинге нагрузок с помощью тнзодатчиков сопротивления нестационарность наблюдений обуславливается конструкцией и условиями эксплуатации этих датчиков, что предъявляет дополнительные требования к системам структурного анализа показаний датчиков. Выбор задачи создания методики структурного анализа зашумленных нестационарных рядов наблюдений продиктован актуальностью и необходимостью оперативного решения задачи мониторинга различных характеристик при эксплуатации судов ледового плавания. Отметим актуальность названной прикладной задачи: а) в настоящее время происходит интенсификация арктического морского судоходства, в связи с широкими перспективами добычи полезных ископаемых па арктическом шельфе, а также в прибрежной зоне Арктики. По прогнозным оценкам извлекаемые ресурсы континентального шельфа российской части Арктики составляют, в пересчете на нефть, более 100 млрд. тонн. [42] Установка и обслуживание ледостойких добывающих морских сооружений, безопасная эксплуатация судов ледового плавания как средств транспортировки добытого сырья и снабженческих грузов являются важными задачами; b) На 76-й сессии Комитета по безопасности на море (Maritime Safety Committee) Международной морской организации (International Maritime Organization, IMO). а также на 48-й сессии Комитета по защите окружающей среды на море (Marine Environment Protection Committee) этой же организации, было принято руководство по эксплуатации судов в покрытых льдом районах Арктики [59]. Согласно этому руководству. каждое судно, эксплуатирующееся в покрытых льдом районах Арктики, должно иметь на борту по крайней мере одного ледового штурмана (пункт 1.2.1 указанного руководства). Наряду с прочими навыками, ледовый штурман, согласно руководству, должен уметь распознавать виды льда. оценивать его характеристики, а также должен уметь оценивать нагрузку па корпус, причиняемую льдом (пункт 14.2 указанного руководства):
В то же время, ведутся поиски в области создания автоматизированных систем, способных работать в отсутствии входных данных. воспринимаемых оператором (штурманом) визуально. Например, опытные разработки в этой области ведет финское конструкторское бюро «ILS», о чем оно сообщило на 9-й международной выставке по судостроению. судоходству, деятельности портов и освоению океана и шельфа «НЕВА-2007», проходившей в Санкт-Петербурге 24-27 сентября 2007 г. Рассмотрим работы в области структурного анализа данных в задачах. связанных с эксплуатацией судов в ледовых условиях. Методы статистики традиционно применяются для обработки результатов тензометрии корпуса судна, например, в работе [52] [51]. В частности, в работе [52], весь доступный ряд наблюдений разбивался на фрагменты, по каждому из которых производилось построение гистограммы. Построенная гистограмма сравнивалась с эталонной, которая соответствовала некоторым типовым условиям наблюдений. В качестве набора параметров, характеризующих отличие исследуемой гистограммы от эталонной, выбирались отношения высот столбцов. К недостаткам этого подхода можно отнести отсутствие четких оснований, по которым выбрано то или иное число интервалов гистограммы, а также отсутствие критериев отличия исследуемой гистограммы от эталонной. Поставим задачу в статистической интерпретации. Рассматриваются две выборки - Х} и X2. Есть ли основания предполагать, что законы распределения генеральных совокупностей, из которых извлечены эти выборки, существенно отличаются? Такой метод анализа массовых наблюдений является достаточно распространенным, и иногда применяется в качестве единственного метода анализа наблюдений. Рассмотрение выборочных статистик позволяет сравнивать между собой не только две, но и несколько выборок. Целесообразно использовать исследование выборки и построение выборочных характеристик в качестве предобработки и предварительного исследования данных, в совокупности с более детальными методами, позволяющими осуществлять структурный анализ. Например в статье, опубликованной автором настоящей работы [27], в качестве методов предобработки массивов наблюдений использовалось построение выборочных характеристик асимметрии и эксцесса. а также выборочного центрального момента второго порядка (приложение А). В статье рассматривались наблюдения над уровнем воды в гидрологических скважинах. Выборочные средние, характеризующие средний замеренный уровень, не рассматривались, поскольку при схожести порождающих повышение уровня воды процессов, эти характеристики могут отличаться в силу особенностей размещения скважин на территории. Таким образом ясно, что выбор характеристик для рассмотрения в значительной мере зависит от специфики задачи. Исследование постоянных напряжений, возникающих в результате непрерывной работы некоторых механизмов, допускает использование статистического подхода в описании результатов натурных наблюдений. Например, в статье [12] рассмотрена электротензометрия газотурбинных двигателей. Рабочий процесс в газотурбинных двигателях имеет стохастический характер. Поэтому при электротензометрии, в этом случае, требуется ряд повторных измерений. В статье [12], в целях упрощения рассуждения, предполагается, что случайная погрешность каждого измерения имеет нормальное распределение, и не коррелированна с погрешностями других измерений. При такой формализации задачи сложность состоит в отделении полезного сигнала от погрешности. Если рабочий процесс не является стационарным, следует ожидать нестационарность и в тепзонаблюдениях. В таких случаях эффективным будет разделение наблюдений на две составляющих - детерминированную и случайную. Вид и характеристики детерминированных составляющих могут определяться различными методами, их общий обзор выходит за рамки настоящей работы. Для предобработки данных с целью дальнейшего применения предлагаемой в настоящей работе методики структурного анализа рассматриваются два относительно универсальных подхода - спектральный и аппроксимационный. Поясним недостатки модели с отсутствующей детерминированной компонентой, описывающей наблюдения физических величин. При составлении моделей ледовых условий в [53] вынесена рекомендация рассматривать параметры метеорологических и ледовых условий в качестве случайных величин, распределенных по некоторому закону. Но при этом, в литературе [53], [17], [5] указывается на трудность составления законов распределения тех или иных параметров, представленных как случайные величины. Еще сложнее, как правило, указать основания, по которым следует предпочесть тот, или иной закон распределения параметра.
Применение статистического моделирования к алгоритму нечеткой кластеризации
Модель, носящую название «Искусственный нейрон» ([37], [38], [44], [47] и др.) можно рассматривать, как модель преобразователя входного сигнала. Такая модель, как самостоятельно функционирующий элемент в составе некоторой системы, была предложена на основе знаний о нейроне - нервной клетке человека [38]. В настоящее время под искусственным нейроном понимают модели, осуществляющие преобразование сигнала, поступающего с одного или нескольких входов, при помощи функции, или некоторого простого алгоритма.
Поэтому каждый раз при задании искусственного нейрона, оговаривается характер зависимости между его входами и выходом. [44]
Из искусственных нейронов составляют сети, представляющие собой ориентированные графы, в узлах которых находятся нейроны. Направленным ребрам графов, называемым в нейросетевой терминологии связями между нейронами, могут приписываться некоторые веса.
Сигнал, поступающий на вход нейронной сети изменяется: путем взвешивания при проходе через ребра; путем преобразования функциями или элементарными алгоритмами при проходе через узлы - нейроны. При помощи искусственных нейронных сетей решаются аппроксимационные, классификационные, задачи анализа, сжатия образов, и ряд других задач [47]. Настройка нейронной сети для решения конкретной задачи заключается в выполнении следующих шагов: - выборе архитектуры сети - числа нейронов, и вида связей между ними; - выборе вида нейронов - задании передаточных функций, или описании элементарных алгоритмов; - определении весовых коэффициентов связей между нейронами или расчет параметров передаточных функций. Искусственные нейронные сети являются эффективной формой организации преобразователя или анализатора поступающих данных [44]. Как правило, для решения некоторого типа задач выбирается архитектура сети, и алгоритм настройки весовых коэффициентов и параметров передаточных функций, то есть - алгоритм обучения сети. Для решения задач классификации в условиях дефицита дополнительной информации применяются специальные нейронные сети, принимающие решения на основе нечеткого вывода. Нечеткая логика и системы нечеткого вывода позволяют решать задачи. которые не позволяли эффективно решать классическая теория множеств, и двузначная логика. Теория нечетких множеств была предложена в 1965 году Л. Заде специально для описания явлений и понятий, которые имеют многозначный и неточный характер. [47] Л. Заде допустил [56], что функция принадлежности элемента множеству может принимать любые значения на интервале [0,1], а не только значения 1 и 0. Па нечетких множествах также определены операции объединения, пересечения и взятия дополнения. Исходя из предположения, что передаточные функции в моделях «искусственный нейрон» представляют собой функции расчета принадлежности различным классам (кластерам) объектов, можно составить нейронную сеть, которая бы принимала решения на основе нечеткого вывода. При этом необходимо определить алгоритм подбора коэффициентов передаточных функций нейронов, исходя из известных данных. Если известны только данные в виде координат точек в некотором многомерном пространстве параметров, без дополнительной информации о принадлежности точек тому или иному классу, то все же возможно сделать вывод о наличии областей, в которых данные сгруппированы достаточно плотно. Постановка такой задачи и ее решение для случая многомерных зашумленных данных приведена в 2.1-2.4 настоящей главы. Обозначим U - все множество точек в многомерном пространстве, и будем рассматривать его как универсальное. Пусть в U существует К кластеров точек. Результаты отыскания статистически достоверных центров кластеров (2.4) можно использовать для построения параметров передаточных функций нейронов. Определенные таким образом нейроны будем использовать для синтеза нейросстевого классификатора. На основе найденных центров кластеров ct, i = \..K, выберем функции принадлежности ц.,(с,,х)произвольной точки х из U кластеру с центром в с,. Построение ц, может проходить, например, по следующим схемам [38]: 1. по принципу симметричной треугольной функции: В этих схемах с,- центр /-го кластера, d - ширина симметричной треугольной функции (2.5.1), а, Ъ - параметры формы для гауссовской кривой (2.5.2). Пространство — линейное метрическое, норма - евклидова. Удобно принять в качестве схемы построения ц, схему симметричной треугольной функции. В таком случае, мы имеем всего лишь один параметр, который можно определить на основе предложенной в 2.4 оценки (2.4.5) радиуса кластера. Синтезируем нечеткий классификатор - классифицирующую нейронную сеть (рис. 2.5.1). Выбранные функции принадлежности будем использовать как передаточные функции нейронов. На вход классификатора будем подавать произвольный аргумент х из U. Каждый нейрон осуществляет построение своего выхода цс, на основе близости входа х к центру с, кластера /. Соответственно, рассчитанные значения цс,, i = \..K, характеризуют принадлежность распознаваемого примера х каждому из кластеров под номерами 1,2,..К. Синтезированный таким образом классификатор определяет на U К нечетких множеств, в общем случае — пересекающихся. Обозначим эти множества Af"::y, В инженерных целях может потребоваться получить бинарный ответ о принадлежности произвольного примера кластерам. Для любой точки х из Y АІ"::у можно произвести процедуру дефуззификации - определения бинарной принадлежности точки тому или иному кластеру. По результатам дефуззификации можно определить на U четкие множества А,, соответствующие кластерам / = і ...к . При этом где suppAUZZ) - носитель нечеткого множества Af"::y, и каждое множество А, содержит точку с, - центр кластера /. Дефуззификацию можно проводить различными способами. В частности. чтобы избежать противоречий при построении разделяющих гиперплоскостей. будем считать множеством At замкнутое множество точек, отстоящих от точки-центра с, не более, чем на R (2.4.5). Обратимся к исходной задаче анализа временных рядов. Если имеется п фрагментов записи наблюдений, и используются методы предобработки, сопоставляющие каждому из фрагментов соответствующий векіор пространства параметров, то эти векторы образуют множество, которое обозначим D: Нечеткая кластеризация в смысле алгоритма С-средних производится для точек из D . Осуществив статистический эксперимент кластеризации, и оценив радиус кластера (2.4.5), можно определить подмножества Д множества D, а в общем случае - и кластеры А, универсального множества U. Если решение инженерной задачи классификации является основанием для управляющего воздействия, связанного со значительной ответственностью, то окончательное принятие решения должно осуществляться человеком-оператором [45]. Синтезированный нейросетевой классификатор играет в этом случае роль анализирующего алгоритма, оперирующего на основе предобработанных доступных данных.
Модель гиперквадрирования кластера с учетом неполной информации о его расположении в пространстве параметров
Пусть исследуется некоторый временной ряд наблюдений. В классической постановке задачи анализа временного ряда декомпозиция состоит в выявлении постоянной тенденции, авторегрессионном и спектральном анализе и выделении соответствующих компонент.
Задача отыскания ведущих колебательных характеристик наблюдаемого процесса может быть представлена как составная часть задачи исследования структуры зашумленных временных рядов. Как правило, для исследования колебательных характеристик производится построение периодограммы или спектрограммы
Построенная по временному ряду периодограмма позволяет судить о характере гармонических компонент, в виде комбинации которых можно представить временной ряд или его фрагмент. Периодограмма содержит информацию о большом числе гармонических компонент, с частотами вплоть до Я/, где Т- длина временного ряда, в наблюдениях.
В инженерной практике часто требуется оценить наблюдаемый процесс суперпозицией небольшого числа синусовых функций. Восстановить по периодограмме заданное число неизвестных пар «частота-амплитуда» этих синусовых функций, наилучшим образом приближающих временной ряд, часто затруднительно.
Будем осуществлять приближение временного ряда суперпозицией функций: где п - номер наблюдения хи временного ряда X, а к - некоторое небольшое натуральное число. Здесь неизвестными являются как частоты — со,, так и амплитудные характеристики А, и Bt, i=l..k. Приближение этой суперпозиции функций к исходному временному ряду Сбудем осуществлять численно. В таком случае можно построить целевую функцию и поставить задачу отыскания ее экстремального значения: здесь N - число наблюдений временного ряда X. При этом значения аргументов функции F могут находиться только внутри каких-либо конечных интервалов. Рассмотрим алгоритм, который осуществляет поиск экстремального значения функции внутри области поиска. Пусть функция, экстремум которой требуется отыскать, нелинейна по параметрам поиска. Пусть областью задания функции является линейное метрическое пространство. Будем рассматривать выпуклое замкнутое подпространство U этого линейного метрического пространства. Пусть целевая функция существует в каждой точке U. При этом функция не обязательно является гладкой, то есть в общем случае - в некотором счетном числе точек U ее первая производная может не существовать или терпеть разрыв, в том числе — и второго рода. Для осуществления численной оптимизации используем принципы генетических алгоритмов. Рассмотрим эволюционный алгоритм поиска минимума функции, для которого достаточно выпуклости подпространства поиска U и существования целевой функции в каждой точке этого подпространства. С помощью эволюционных алгоритмов находят возможно лучшее решение, но не обязательно глобальный оптимум. Частным случаем эволюционных алгоритмов являются.генетические алгоритмы. В эволюционных алгоритмах для обозначения множеств решений и способов их получения используют «биологическую» терминологию [47]. Генетические алгоритмы являются частным случаем эволюционных алгоритмов. Принцип работы эволюционных алгоритмов заключается в последовательном переходе от одного множества (популяции) решений к другому множеству решений. Такой переход осуществляется путем выполнения некоторых операций для элементов предыдущего множества решений. В генетических алгоритмах [41] существует два класса таких операций — операции скрещивания решений в популяции, и операции мутации. При этом под мутацией понимается случайное изменение, вносимое в решение. Генетические алгоритмы предполагают [47], [62] представление точки пространства решений в виде совокупности битовых строк, и определение операций скрещивания и мутации па битовых строках. Осуществим формализацию эволюционного алгоритма, выполняющего операции скрещивания и мутации не на битовых строках, а непосредственно па аріументах целевой функции, воспользовавшись при этом известным принципом арифметического оператора скрещивания решений [71]. Пусть рассматривается некоторое исходное множество точек Р0 подпространства U, которое будем считать стартовой популяцией. Для инициализации процесса итераций множество Р0 может быть выбрано случайным путем (3.4). Обозначим /-ю популяцию решений Pj. Исходной экстремальной задачей будем считать задачу минимизации целевой функции F (5.1.2). Пусть для каждой точки из Р; можно найти значение функции F. Для /-й популяции решений Pj можно найти максимальное значение целевой функции F: На основе Р; построим множество Р , такое, что Р, с Р . Способ такого построения опишем ниже. Тогда из множества Р можно выбрать такое множество P,fI: что для любого элемента из Р,+1 значение целевой функции F будет меньше либо равно т, (5.1.3). Следовательно, элементы множества Р(+1 будут являться не худшими решениями оптимизационной задачи, чем элементы множества Pj. Таким образом, осуществляется п итераций, путем последовательного построения множеств Pj, i=l..n. Успешность отыскания удовлетворительного решения задачи минимизации существенным образом зависит от способа построения Р . для каждого /, і-l..n. Будем строить Р , введя операцию арифметического скрещивания [71] и мутации элементов множества Р; на основе аналогичных операций генетических алгоритмов [41], [47]. Пусть для каждой упорядоченной пары точек р] и р2 пространства поиска определена метрика d{j x,p 2), и для точек этого пространства определены операции сложения и умножения на константу.
Применение иерархического классификатора к предобработанным спектральными методами данным
На множестве точек, координаты которых представляют ведущие частоты проведем процедуру кластеризации, и отыщем центры кластеров (2.4.4). Используя центры кластеров в качестве образцов, и введя иерархию для ведущих частот. построим распознающую иерархическую нейронную сеть (4.1). При этом потребуется задать некоторые иерархические коэффициенты w\ и w2 - для более высокой и для более низкой ведущих частот.
Такая сеть предназначена для использования в модели, распознающей тип внешней нагрузки на морскую ледостойкую конструкцию по зарегистрированному косвенному отклику. Применение квазигенетического алгоритма позволило решить ранее нерешенную задачу выявления и сравнения внутренней структуры наблюдений, сделанных в условиях воздействия суперпозиции различных физических процессов, шума и помех при регистрации наблюдений. Приведенный в настоящем параграфе успешный пример использования методики структурного анализа нестационарных временных рядов при решении задач, связанных с безопасностью эксплуатации морских конструкций в ледовых условиях, демонстрирует актуальность и практическую значимость этой разработанной методики.
В работе получены следующие основные результаты: 1. Произведен общий обзор моделей структурного анализа рядов наблюдений. Осуществлен обзор прикладной задачи анализа больших массивов тензометрических наблюдений нагрузок в процессе эксплуатации судов и морских конструкций в ледовых условиях. Отмечена важность решения этой задачи в режиме реального времени. Произведено обоснование необходимости разработки специальной методики, предназначенной для изучения сіруктур потоков наблюдений в условиях недостатка информации о характере этих структур 2. Предложена методика, объединяющая три модели - нечеткой кластеризации, геометрической кластеризации и классификации с использованием иерархии. Для модели нечеткой кластеризации С-средних автором предложены стохастические модели инициализации численного алгоритма в многомерных пространствах. Также для этого алгоритма автором предложена система статистической оценки результатов, пригодная для работы модели на зашумленных данных. Использована модель геометрической кластеризации, основанная на методе опорных векторов Вапника (SVM). При составлении программной реализации этой модели использовалось сведение задачи квадратичного программирования к системе задач линейного программирования. Предложена авюрская модель иерархической классификации. Для этой модели доказана теорема (Теорема 1) о классификации двух иерархических векторов, производимой на основе запомненного образца. 3. Осуществлен синтез трех видов классификаторов, способных работать в режиме реального времени - нечеткого, геометрического на основе SVM и иерархического. 4. Предложена нечеткая модель квадрирования кластера с учетом неполной информации о его расположении в многомерном пространстве парамеїров. На основе этой модели осуществлено теоретическое обоснование процедуры имитационного моделирования точки из единственного кластера и из нескольких кластеров в пространстве параметров. Построенные при этом алгоритмы имитационного моделирования предназначены для работы в имитационных системах, изучающих результаты кластерного анализа данных, и уточняющих соответствующую физическую интерпретацию. 5. Предложено использовать эволюционные алгоритмы для отыскания параметров ведущих колебательных компонент временных рядов. Сформулирован численный итеративный эволюционный алгоритм, основанный на принципах генетических алгоритмов, и использующий операцию арифметического скрещивания. Этот алгоритм позволяет решить численно задачу оптимизации целевой функции на выпуклом замкнутом подпространстве линейного метрического пространства. При этом целевая функция может быть нелинейна по параметрам поиска. Доказаны теоремы о достижении оптимального решения при помощи сформулированного квазигенетического алгоритма. Лемма 1 является утверждением о сохранении найденного лучшего решения на протяжении двух соседних итераций. Лемма 2 задает условие, при котором через конечное число итераций алгоритм перейдет к множеству лучших решений, чем исходное множество. Теорема 2 утверждает, что при любом множестве начальных решений для квазигенетического алгоритма существует ненулевая вероятность отыскания окрестности оптимального решения за конечное число шагов. Теорема 3 утверждает, что сформулированный эволюционный алгоритм сходится к окрестности искомого экстремума по вероятности, в пределе, быстрее, чем алгоритм случайного поиска. 6. Составлен комплекс программ на языке C++, реализующий модели и численные методы построенной методики, для их использования на IBM совместимых ЭВМ. Объем комплекса программ — свыше 2300 строк. 7. В задачах исследования наблюдений нагрузок на корпус судна, идущего во льдах, и нагрузок на морские конструкции под воздействием льда, осуществлен анализ нового типа, ранее не выполнявшийся. Последовательно применены: - спектральная предобработка предварительно разбитого на фрагменты временного ряда наблюдений; - нечеткая кластеризационная модель, являющаяся авторской модификацией алгоритма С-средних; кластеризация периодограмм, кумулятивных периодограмм; иерархическая классификация по диапазонам частот; - сформулированный квазигенетический алгоритм для поиска минимального состава ведущих колебательных компонент, адекватно представляющих рассматриваемые фрагменты временного ряда. В задаче мониторинга корпуса судна проведенное исследование позволило установить наличие характерных структурных периодических компонент, позволяющих аналитически группировать фрагменты наблюдений нагрузок по характеру внешних ледовых воздействий. Проведен анализ влияния конструктивного решения опоры причала на колебательные характеристики конструкции в процессе разрушения льда о стенки опоры. Такой анализ дает основания для дальнейшего изучения вибрации конструкции при помощи соответствующих физических моделей. Созданный на языке C++ комплекс программ позволяет проводить такие исследования со значительной степенью автоматизации работы. Создание автоматических систем мониторинга ледовых нагрузок отвечает современным требованиям надзорных организаций [59]. Таким образом, продемонстрирована пригодность моделей предлагаемой методики, разработанных авторских модификаций математических методов и численных алгоритмов для решения прикладных задач.