Введение к работе
Диссертация посвящена разработке теоретико-математических методов, применению численных методов и методов математического моделирования для исследования математических моделей случайного движения точек на плоскости.
Актуальность темы исследования. Разработка, исследование и реализация методов решения задач статистической теории распознавания образов относится к одному из ведущих направлений прикладной математики. Результаты теоретических и прикладных исследований в области статистической теории распознавания образов находят применение в медицинской диагностике, радиотехнике, криминалистике, биоинформатике, прогнозировании (погода, геология, сейсмология и т. д.), анализе изображений, обработке речи. Очевидно, что этот список приложений может быть продолжен.
Решение задач, связанных с определением вероятностных и статистических характеристик распознаваемых образов, основано на статистической теории распознавания образов. Это научное направление представлено в трудах зарубежных и отечественных ученых, таких как Р. Дуда, П. Харт, Р. Гонсалес, Дж. Ту, К. Фукунага, К. Фу, Э. Патрик, Ю. И. Журавлев, А. В. Миленький, В. Н. Вапник, А. Я. Червоненкис, Я. А. Фомин, Г. Р. Тарловский, А. Л. Горелик, В. А. Скрипкин, В. В. Моттль, И. Б. Мучник и многих других.
Статистическая теория распознавания включает в себя два основных раздела - анализа и синтеза. Задачи анализа решаются методами теории вероятностей, задачи синтеза - методами математической статистики.
Раздел анализа включает в себя построение вероятностных моделей и преобразование одних вероятностных моделей в другие. При решении задач анализа применяются следующие методы и подходы: монотонные и немонотонные преобразования случайной величины; преобразование Фурье; теория обобщённых распределений; композиция распределений независимых случайных величин, составляющих сумму; расщепление смесей распределений и др. Результатом решения задач анализа являются законы распределения вероятностей и результаты усреднения некоторых характеристик.
Задачи синтеза представляют собой оптимизационные задачи. Типичными являются задачи нахождения оптимальных решающих правил при ограничениях на некоторые характеристики, например, средний риск, вероятность ошибки, ошибка измерения и т. д. Статистический подход в задачах распознавания базируется на использовании методов математической статистики для вычисления оценок параметров объекта, плотностей и функций распределения, на проверке статистических гипотез. Исходные данные об объекте для вычисления таких оценок получают в результате наблюдений или измерений. При решении задач распознавания на основе статистического подхода используются байесовский критерий, минимаксный критерий, критерий Неймана - Пирсона и др. Детализация предметных областей приводит к более тонким и изощрённым критериям для решения задач распознавания. Результатом решения задач синтеза являются решающие правила (алгоритмы распознавания) и их вероятностные характеристики.
В различных предметных областях требуется развитие моделей и методов статической теории распознавания образов. Отметим три из них, имеющие отношение к тематике диссертационного исследования. Это стохастическая геометрия, адаптивное поведение в биологии и случайные блуждания.
В современной стохастической геометрии исследуются задачи, в которых конечное число геометрических объектов одного вида независимо расположены и имеют сложные распределения. Например, распределения геологических структур, пористых сред, биологических тканей. Другие примеры: цельный объект, в результате взрыва распадающийся на конечное число объектов, или косяк рыб, который может двигаться целиком, а в силу каких-то причин - разделиться на конечное число подмножеств. Во всех приведённых примерах движение объекта как целого или в виде разделённых объектов можно моделировать, используя случайные аффинные преобразования.
В настоящее время развивается направление, связанное с адаптивным поведением, которое заключается в построении искусственных организмов, которые могут приспосабливаться к окружающей среде . Движение является неотъемлемой частью взаимодействия организма со средой, при этом движение может иметь случайный характер. Например, бабочки чередуют две тактики движения, а именно движение в выбранном направлении и случайные повороты, приводящие к выбору нового направления. Движение бактерий может быть описано длинными прямыми смещениями, разделёнными периодами очень коротких случайных поворотов. Приведённые примеры движений можно отнести к классу задач о случайных блужданиях.
Степень разработанности темы исследования. В различных предметных областях рассматриваемые объекты удобно представлять как множества точек плоскости. Движение таких объектов можно моделировать, используя случайные аффинные преобразования или задавая вероятности перехода из одной точки в другую, а также движение может быть комбинацией аффинных преобразований с заданием вероятности перехода из одной точки в другую. Новые координаты объекта, полученные в результате движения, могут содержать шумы различной природы. Случайные блуждания можно рассматривать как движения точки на плоскости. Случайные движения, при которых наблюдаемый объект представляется как множество точек плоскости или заменяется точкой (например, это может быть центр масс), можно наблюдать в биологии, геологии и т. д. При изучении различных источников не выявлено работ, в которых исследованы вероятностные характеристики (законы распределения вероятностей и начальные моменты) движения точечного объекта на плоскости, когда объект разбивается на конечное подмножество точек и каждое из этих подмножеств подвергается
Мосалов О. П. и др. Модель поискового поведения анимата. Препринт Ин-та прикладной математики им. М. В. Келдыша РАН. М., 2003. № 19. С. 1-16.
Кириллова В. В. Распределение расстояний между точечными геологическими объектами. Вестн. Ин-та геологии Коми науч. центра Урал. отд. РАН. Сыктывкар, 2012. №7. С. 15-21.
случайному повороту или отражению. Также не найдены работы, в которых бы оценивалась вероятность правильного распознавания направления сдвига точки на плоскости, когда помехой движению служат случайные повороты.
Цели работы: разработка теоретико-математических методов, применение численных методов и методов математического моделирования для исследования математических моделей случайного движения точек на плоскости.
Задачи. Для достижения поставленных целей сформулирован и решён ряд задач. Эти задачи можно разбить на две группы.
Первая группа - это вероятностные задачи. В данной группе исследовано движение упорядоченного множества точек на плоскости. Множество точек разбивается на к произвольных подмножеств с сохранением упорядоченности в каждом из них. Решены два класса задач. Первый класс задач соответствует варианту, когда каждое подмножество с номером г (г = 1, ..., к) подвергается случайному повороту. Второй класс задач соответствует варианту, когда каждое подмножество с номером г (г = 1, ..., к) подвергается случайному отражению. В обоих случаях получены следующие результаты:
выражения для вычисления плотностей распределения вероятностей евклидовых расстояний между исходным и преобразованным множеством точек в виде элементарных функций, когда исходное множество целиком подвергается преобразованию и в виде несобственных интегралов I рода от произведения функций Бесселя и некоторой экспоненты, когда исходное множество разбивается на два и более произвольных подмножества, каждое из которых подвергается преобразованию;
выражения в виде конечных сумм и сходящихся числовых рядов для вычисления начальных моментов евклидовых расстояний, когда множество точек целиком подвергается преобразованию;
выражения в виде конечных сумм и сходящихся числовых рядов для вычисления начальных моментов евклидовых расстояний, когда множество точек разбивается на два подмножества, каждое из которых подвергается преобразованию;
программное средство "Моделирование псевдослучайных чисел с различными законами распределения" (разработано на языке С# в среде Microsoft Visual Studio 2005), использованное для статистического моделирования евклидовых расстояний между исходным и преобразованным множеством точек;
программы в Matlab для вычисления плотностей распределения вероятностей евклидовых расстояний, представленных в виде несобственных интегралов I рода с управлением пределами интегрирования.
Вторую группу представляют задачи проверки статистических гипотез. В данной группе задач рассмотрено случайное движение точки на плоскости в одном из т эквидистантных по углу направлений. Решены два класса задач. Первый класс соответствует варианту, когда помехой движению служат повороты на случайные углы. Во втором классе задач помехой
движению служат изотропные гауссовские отклонения. В обоих случаях получены следующие результаты:
решающие правила для распознавания направления сдвига точки на плоскости на фоне случайных поворотов;
решающее правило для распознавания направления сдвига точки на плоскости на фоне изотропных гауссовских отклонений;
выражения для вычисления вероятностей правильного распознавания направления сдвига точки на плоскости на фоне случайных поворотов или на фоне изотропных гауссовских отклонений за п шагов наблюдения;
программное средство "Имитационное моделирование случайного сдвига точки на плоскости на фоне случайных поворотов и реализация асимптотически оптимального метода распознавания направления сдвига" (разработано на языке Visual Basic for Applications в среде Microsoft Office Excel 2007) для подтверждения корректности работы алгоритма распознавания направления сдвига точки на плоскости на фоне случайных поворотов, основанного на полученных в диссертации решающих правилах;
программы в Matlab для подтверждения корректности алгоритма распознавания направления сдвига точки на плоскости на фоне изотропных гауссовских отклонений, основанного на полученном в диссертации решающем правиле;
программы в Matlab для вычисления вероятностей правильного распознавания направления сдвига точки на фоне случайных поворотов или изотропных гауссовских отклонений.
В диссертации объектами исследования являются: 1) случайная величина (признак), которая представляет собой евклидово расстояние между множеством точек и его копией после сложного случайного движения этой копии; 2) случайное движение точек на плоскости с точно известными распределениями вероятностей параметров этого движения.
Предметами исследования являются: 1) плотности распределения вероятностей и начальные моменты евклидовых расстояний между множеством точек и его копией после сложного случайного движения этой копии; 2) вероятности распознавания направления сдвига точки на плоскости на фоне случайных поворотов или на фоне изотропных гауссовских отклонений.
Научная новизна. Все результаты, полученные в диссертации, являются новыми. Эти результаты представлены двумя группами.
1. Новые аналитические методы вычисления вероятностных характеристик евклидовых расстояний между двумя копиями упорядоченного множества точек плоскости после сложного случайного поворота или отражения одной из копий. В частности можно отметить:
теоремы о виде плотностей распределения вероятностей евклидовых расстояний между двумя копиями упорядоченного множества точек после сложного случайного поворота или отражения одной из копий;
теоремы о виде начальных моментов евклидовых расстояний между двумя копиями упорядоченного множества точек после сложного случайного поворота или отражения одной из копий;
программы для вычисления плотностей распределения вероятностей евклидовых расстояний между двумя копиями упорядоченного множества после сложного случайного поворота или отражения одной из копий;
программное средство "Моделирование псевдослучайных чисел с различными законами распределения" для проведения статистического моделирования распределений евклидовых расстояний.
2. Новые статистические методы распознавания направления сдвига точки на плоскости на фоне случайных поворотов или изотропных гаус-совских отклонений. В частности можно отметить:
утверждения о решающих правилах распознавания направления сдвига точки на плоскости на фоне случайных поворотов или изотропных гауссовских отклонений;
утверждения о вероятностях правильного распознавания направления сдвига точки на плоскости на фоне случайных поворотов или изотропных гауссовских отклонений;
программы для подтверждения корректности решающих правил распознавания направления сдвига точки на фоне случайных поворотов или на фоне изотропных гауссовских отклонений;
программы для расчета вероятностей правильного распознавания направления сдвига точки на плоскости на фоне случайных поворотов или изотропных гауссовских отклонений.
Теоретическая и практическая значимость работы. Теоретическая значимость работы состоит в следующем:
исследована математическая модель случайного движения множества точек на плоскости, предполагающая случайные независимые повороты или отражения отдельных подмножеств;
получены выражения для вычисления плотностей распределения вероятностей евклидовых расстояний между двумя копиями множества точек плоскости после сложного случайного поворота или отражения одной из копий;
получены выражения для вычисления начальных моментов евклидовых расстояний, когда множество точек подвергается случайному преобразованию целиком и когда исходное множество разбивается на два подмножества, каждое из которых подвергается случайному преобразованию поворота или отражения;
исследована математическая модель случайных сдвигов точки на плоскости на фоне случайных поворотов или на фоне изотропных гауссовских отклонений;
получены выражения для вычисления вероятностей правильного распознавания направления сдвига точки на фоне случайных поворотов или на фоне случайных гауссовских отклонений;
предложена методика расчета вероятностей распознавания направления сдвига точки на плоскости на фоне случайных поворотов, основанная на усреднении по распределениям исходных случайных параметров движения;
предложена методика расчета вероятностей распознавания направления сдвига точки на плоскости на фоне случайных поворотов или на фоне изотропных гауссовских отклонений, основанная на использовании условных плотностей распределения вероятностей выборочных средних координат наблюдаемой точки;
произведено сравнение двух моделей случайного движения точки на плоскости, в одной сдвиг осуществляется на фоне случайных поворотов, в другой - на фоне случайных гауссовских отклонений.
Практическая значимость работы состоит в следующем: предложенные методы и алгоритмы могут использоваться для анализа случайного движения физических и биологических объектов на плоскости, а также в экономико-математическом моделировании. Аналитические методы и программные средства, разработанные в диссертации, могут быть использованы в учебном процессе.
Методология и методы исследования. Выполненное в диссертации исследование базируется на методологии статистической теории распознавания образов. Для решения поставленных задач в диссертации использовались теоретико-математические методы, методы математического моделирования и численные методы. В качестве теоретико-математических использованы следующие методы: теории вероятностей, математической статистики, математического анализа, теории функции комплексного переменного, теории обобщенных функций, теории преобразования Фурье. В качестве методов математического моделирования использовались методы статистического и имитационного моделирования. В качестве численных методов использовались методы численного интегрирования несобственных интегралов I рода с управлением пределами интегрирования.
Положения, выносимые на защиту:
теоретико-математические методы, базирующиеся на доказанных теоремах, для вычисления вероятностных характеристик евклидовых расстояний между двумя упорядоченными копиями множества точек на плоскости после сложного случайного поворота или отражения одной из копий;
результат применения численного метода для расчета несобственных интегралов I рода с управлением пределами интегрирования для вычисления плотностей распределения вероятностей евклидовых расстояний между двумя копиями множества точек после сложного случайного поворота или отражения одной из копий;
программное средство "Моделирование псевдослучайных чисел с различными законами распределения" для расчета нормированных гистограмм распределения вероятностей евклидовых расстояний между двумя копиями множества точек плоскости после сложного случайного поворота или отражения одной из копий;
результат применения программного средства "Моделирование псевдослучайных чисел с различными законами распределения";
теоретико-математические методы, базирующиеся на обоснованных утверждениях для вычисления вероятностей правильного распознавания
направления сдвига точки на фоне случайных поворотов или на фоне изотропных гауссовских отклонений;
результат применения численного метода для вычисления несобственных интегралов I рода с управлением пределами интегрирования для вычисления вероятностей правильного распознавания направления сдвига точки на плоскости на фоне случайных помех;
обоснованные утверждения о решающих правилах для распознавания направления сдвига точки, когда помехой является случайный поворот или когда помехой являются изотропные гауссовские отклонения;
программа "Имитационное моделирование случайного сдвига точки на плоскости на фоне случайных поворотов и реализация асимптотически оптимального метода распознавания направления сдвига" (разработана на языке Visual Basic for Applications в среде Microsoft Office Excel) для подтверждения корректности решающих правил распознавания направления сдвига точки на фоне случайных поворотов и программы в Matlab для подтверждения корректности решающего правила распознавания направления сдвига точки на фоне изотропных гауссовских отклонений.
Степень достоверности результатов исследования подтверждена совпадением характеристик, полученных в результате теоретического исследования, и применения разработанных программных средств.
Апробация работы. Результаты, изложенные в диссертации, докладывались на следующих конференциях и семинарах:
XV Международная конференция "Ломоносов" (Москва, 2008 г.);
XIV Всероссийская конференция "Математические методы распознавания образов" (Суздаль, 2009 г.);
Международная научно-техническая конференция "Наука и образование - 2010" (Мурманск, 2010 г.);
Международный молодежный научный форум "Ломоносов" (Москва, 2010г.);
Международная конференция "Интеллектуализация обработки информации - 2010" (Пафос, респ. Кипр, 2010 г.);
Международная конференция "Pattern Recognition and Image Analysis: New Information Technologies - 2010" (Санкт-Петербург, 2010 г.);
XV Всероссийская конференция "Математические методы распознавания образов" (Петрозаводск, 2011 г.);
семинар в Институте прикладных математических исследований Карельского научного центра РАН (Петрозаводск, 3 ноября 2011 г.);
Международная конференция "Идентификация систем и задачи управления SICPRO 42" (Москва, 2012 г.);
XIII Всероссийский симпозиум по прикладной и промышленной математике (осенняя открытая сессия) (Сочи-Вардане, 1-8 октября 2012 г.);
семинар кафедры ВМ и ПО ЭВМ МГТУ "Математические модели и численные методы в естественнонаучных, инженерных и социально-экономических исследованиях" (Мурманск, 6 декабря 2012 г.);
- Международная научно-техническая конференция "Наука и образование - 2013" (Мурманск, 2013 г.).
Соответствие диссертации паспорту научной специальности. В диссертации предложены теоретико-математические методы для исследования математических моделей случайного движения точек на плоскости. Проверка достоверности полученных теоретических результатов выполнялась с использованием численных методов и разработанных программных средств. Таким образом, выполненное исследование соответствует формуле специальности 05.13.18 (математическое моделирование, численные методы и комплексы программ) и пунктам 2, 3, 5, 8 паспорта данной специальности.
Публикации. По теме диссертации автором опубликовано 19 работ, в том числе 6 статей в журналах, входящих в перечень рецензируемых изданий ВАК РФ. Список публикаций приведен в конце автореферата.
Замечание: часть работ автора выполнено под фамилией Лясникова. Это девичья фамилия СМ. Бычковой.
Структура и объем диссертации. Работа состоит из введения, трёх глав, списка литературы из 82 наименований и 15 приложений. Общий объём работы - 148 страниц, включая 48 рисунков и 3 таблицы.