Введение к работе
АКТУАЛЬНОСТЬ ТЕМЫ. Одной из проблем, возникающих при решении задач статистического анализа, классификации и распознавания образов, прогнозирования и некоторых других, является выбор наиболее подходящей математической модели обработки и описания данных. При этом соответствующая информация представляет собой многомерные временные ряды, и довольно часто в общем потоке имеющихся данных исследователя интересуют лишь аномальные явления и части данных, которые предшествуют этому явлению и следуют после него. Идентификация аномального явления по совокупности измерений представляет собой задачу распознавания образов (РО), эффективность решения которой существенным образом связана с качеством рабочего словаря признаков (РСП).
Существующие методы построения РСП можно условно разделить на две большие группы: методы минимизации систем описания образов и структурные методы. Первая группа методов не всегда эффективна, т.к. признаки, включенные в РСП, не учитывэют внутреннюю структуру объекта идентификации. Недостатком второй группы методов является то, что одни из них ориентированы на решение статических задач РО (факторный анализ), а другие предполагают довольно жесткие ограничения (нелинейное преобразование параметров, аппроксимация параметров).
Актуальность работы определяется, с одной стороны, недостаточной разработанностью методов, обеспечивающих определение признаков, и отсутствием программных средств построения РСП для идентификации стохастических объектов, а с другой, - настоятельной необходимостью решения таких задач в научной и практической деятельности.
ЦЕЛЬ РАБОТЫ. Разработка принципов, математических методов и
программных средств построения РСП для автоматической
идентификации стохастических объектов при решении задач
обработки временных рядов, представляющих собой
кусочно-стационарные последовательности.
В теоретическом и методическом плане цель исследования заключается в обосновании эффективного подхода к формированию признакового пространства, учитывающего внутреннюю структуру стохастических объектов.
Технически аспекты преследуемой озли состоят в реализации соответствующих моделей, алгоритмов и программ, включая апробацию на реальных данных.
-
Обоснован новый подход к формированию пространства признаков, аккумулирующих в себе характерные особенности заданной совокупности наблюдений, с минимумом допущений и простой в вычислительном отношении.
-
Разработан метод выбора робастного признака с целью построения рабочего словаря.
3) Разработана диалоговая система моделирования и выбора
робастных признаков.
4) Предложенные подходы, метода и средства апробированы в задаче
выявления совокупности робастных признаков в технологии
идентификации областей околоземной плазмы: солнечного ветра
<СВ), переходной области <ПО) и магнитосферы <МС) по измерениям
на спутнике ПРОГНОЗ-?. Разработана методика автоматического
выделения различных областей околоземной плазмы (АВРО) и
соответствующий комплекс программ идентификации.
ПРАКТИЧЕСКАЯ ЦЕННОСТЬ. Разработанные алгоритмы и Диалоговая Система моделирования Статистик, различающих случайные величины (ДИСИМОС), могут быть использованы в медицине, биологии, химии, физике, геологии и других областях, где информация представляет собой многомерные временные ряды» присутствуют аномалии и необходимо находить информативные признаки для идентификации отдельных явлений. Созданные методика и комплекс программ идентификации прошли отработку на данных высокоапогейного спутника ПРОГНОЗ-7 и будут применяться для идентификации различных областей околоземной плазмы при обработке данных перспективных проектов ИНТЕРБОЛ и др., осуществляемых Институтом космических исследований РАН. ЛИСИМОС используется в учебном процессе Иркутской государственной -экономической академии по курсам "Математическая статистика", "Основы теории случайных процессов ", "Имитационные системы" и др.
АПРОБАЦИЯ РАБОТЫ. Теоретические и практические результаты работы докладывались и обсувдались на Всесоюзной конференции "Проблемы теоретической кибернетики" (Иркутск, 1985 г.), її і Всесоюзной научно-технической конференции "Программное,
алгоритмическое и техническое обеспечение АСУ ТГГ (Ташкент, 1985 г.). Научно-технической конференции "Автоматизированные системы научных исследований" (Иркутск, 1988 г.). xi Всесоюзном совещании по проблемам управления (Ташкент, 1989 г.), Всесоюзной научно-технической конференции "Идентификация, измерение характеристик и имитация случайных сигналов" (Новосибирск, 1991 г., 1994 г.). Региональной школе-семинаре "Информационные системы в экономике (опыт, проблемы, перспективы)" (Чита, 1996 г.).
Работа выполнялась в рамках хоздоговорных исследований по темам "Парус-2" (N гос.per. 01860010663) и "Парус-4" (N гос.per. 0Г9І0056840) по договорам меящу Иркутской государственной экономической академией и Институтом космических исследований РАН.
ПУБЛИКАЦИИ. Основные результаты диссертации отражены в 6 работах /1-6/.
СТРУКТУРА И ОБЪЕМ РАБОТЫ. Диссертация состоит из введения, четырех глав, заключения, списка литературы (103 наименования) и трех приложений. Основной текст диссертации изложен на 115 страницах машинописного текста.