Введение к работе
Диссертация посвящена разработке, исследованию и анализу основных свойств квантильных многомерных моделей регрессий на основе дифференциальных уравнений Пфаффа и данных парных наблюдений.
Актуальность темы
Главная цель создания регрессионной модели некоторой системы состоит в оптимальном построении функциональной зависимости между наблюдаемыми переменными, характеризующими работу этой системы.
Возникновение регрессионных моделей относят к концу 18 века в связи с астрономическими и геодезическими работами П.С. Лапласа, A.M. Лежандра и К.Ф. Гаусса. Термины регрессия и корреляция впервые появляются в конце 19 века в работах Ф. Гальтона, посвященных генетике и психологии.
В настоящее время регрессионные модели имеют большое многообразие форм, степеней сложности и возможностей применения для решения теоретических и прикладных задач. Регрессионные модели составляют важную часть статистической теории распознавания образов и изображений (К. Fukunaga, A. Webb, S. Li, P. Qin, L. Devroye, R. Ledley, B.B. Сергеев, В.A. Сойфер, Л.П. Ярославский), методов машинного обучения (Е. Parzen, М. Rosenblatt, ЭА. Надарайа, И.А. Ибрагимов, В.Н. Вапник, А.Я. Червонен-кис, А.Б. Цыбаков), фильтрации и анализа данных, обнаружения закономерностей в данных и их извлечениях (W. Cochran, J. Tukey, R. Little, D. Rubin, Н.Г. Загоруйко, М.Б. Лагутин, Ю.Н. Тюрин).
В основе квантильных статистических регрессионных моделей различных структур и процессов лежит широкое использование математической техники условных медиан и квантилей многомерных вероятностных распределений (J. Tukey, P. Bhattacharya, R. Koenker, P. Chaudhuri, Ch. Thomas-Agan, С.Я. Шатских, О.В. Горячкин). Это связано с появлением новых статистических моделей, в которых ошибки наблюдений имеют негауссовские распределения с "тяжелыми хвостами". Для таких моделей предположение о существовании моментов функций распределения уже не является справедливым. Поэтому в регрессионном анализе и теории фильтрации развивается "безмоментный" подход, в рамках которого условные медианы и квантили, как функции "объясняющих факторов", используются вместо условных средних. Кроме того, по сравнению с оценками наименьших квадратов, выборочные условные медианы и квантили менее чувствительны к появлению резко отклоняющихся наблюдений.
Настоящая работа посвящена разработке новых квантильных многомерных моделей регрессий на основе дифференциальных уравнений Пфаффа и данных парных наблюдений. Таким образом, тематика диссертационной работы является актуальной как с точки зрения развития теории, так и с точки зрения возможных практических приложений.
Цель и задачи исследования
Целью диссертации является разработка и исследование квантильных многомерных моделей регрессий на основе дифференциальных уравнений Пфаффа и данных парных наблюдений, разработка алгоритмов линеаризации дифференциальных уравнений.
Для достижения поставленной цели в диссертации решаются следующие задачи:
Создание новой квантильной многомерной регрессионной модели, основанной на данных парных наблюдениий и дифференциальных уравнениях Пфаффа, применение этой модели к решению задач медианной фильтрации и интерполяции изображений.
Разработка алгоритма обнаружения закономерностей в данных парных наблюдений и их извлечениях.
Построение теории квантильной многомерной регрессионной модели (на основе использования исчисления внешних дифференциальных форм, теорем Фробениуса и Дарбу).
Разработка алгоритма приближенного решения вполне интегрируемых квантильных уравнений Пфаффа и его программная реализация.
Разработка алгоритмов линеаризации квантильных уравнений Пфаффа, автономных дифференциальных уравнений п—го порядка, и их практическая реализация.
Методы исследований
В диссертационной работе используются методы теории вероятностей и многомерного статистического анализа, анализа данных, статистической теории распознования образов и изображений, линейной алгебры, математического анализа, дифференциальных уравнений и вычислительной математики.
Научная новизна работы
Разработана новая квантильная регрессионная модель (КРМ), основанная на данных парных наблюдений и дифференциальных уравнениях Пфаффа. Рассмотрена возможность применения этой модели к решению задач медианной фильтрации и интерполяции изображений.
Разработан алгоритм обнаружения закономерностей в данных парных наблюдений и их извлечениях.
Разработана теория КРМ (на основе использования исчисления внешних дифференциальных форм, теорем Фробениуса и Дарбу).
Разработан алгоритм приближенного решения вполне интегрируемых квантильных уравнений Пфаффа для условных квантилей и его программная реализация.
Разработаны новые алгоритмы линеаризации квантильных уравнений Пфаффа, автономных дифференциальных уравнений п—го порядка, и их практическая реализация.
Практическая ценность работы
Диссертационная работа носит теоретический характер. Однако, разработанные в ней квантильные регрессионные модели могут быть положены в основу решения многих конкретных прикладных задач связанных с распознаванием образов и изображений, медианной фильтрации, интерполяции изображений, а также с разработкой алгоритмов анализа данных.
Реализация результатов работы
Материалы диссертации внедрены в учебный процесс кафедры теории вероятностей и математической статистики Самарского государственного университета.
Апробация работы
Основные результаты диссертационной работы были представлены на конференциях:
Third Int. Conf. "Symmetry in nonlinear math, physics Kyiv, Ukraine, 12-18 July 1999.
Int. Sci. Conf. on Mathematics, ISCM HERL'ANY, Slovak Republic, Oct. 21-23, 1999. University of Technology Kosice.
The International Conference MORGAN 2000. Modern Group Analysis for the New Millennium, Ufa, RUSSIA, 27 September- 03 October, 2000.
Всероссийская научная конференция "Качественная теория дифференциальных уравнений и её приложения Рязань, 9-13 октября 2006.
XVII Всероссийская школа - коллоквиум по стохастическим методам, г. Кисловодск, 1-8 мая 2010 г.
Семинар кафедры теории вероятностей и математической статистики СамГУ (рук. проф. С.Я. Шатских), (2010 - 2012 гг.)
Публикации. По теме диссертации опубликовано 8 работ, в том числе 8 статей, из них 4 - в изданиях, входящих в Перечень ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени доктора и кандидата наук.
Структура и объём диссертации
Поставленные задачи определили структуру работы и содержание отдельных разделов. Диссертация состоит из введения, четырех разделов, заключения, списка использованных источников и приложения. Она изложена на 135 страницах машинописного текста (без приложения), содержит 24 рисунка, 3 таблицы, список использованных источников из 118 наименований.
На защиту выносятся
Новая квантильная многомерная регрессионная модель, основанная на данных парных наблюдениий и дифференциальных уравнениях Пфаффа.
Алгоритм обнаружения закономерностей в данных парных наблюдений и их извлечениях.
Теория квантильной многомерной регрессионной модели (на основе использования исчисления внешних дифференциальных форм, теорем Фробениуса и Дарбу).
Алгоритм приближенного решения вполне интегрируемых квантиль-ных уравнений Пфаффа и его программная реализация.
Алгоритмы линеаризации квантильных уравнений Пфаффа, автономных дифференциальных уравнений п—го порядка, и их практическая реализация.