Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях) Жданов Александр Иванович

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Жданов Александр Иванович. Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях) : автореферат дис. ... доктора физико-математических наук : 05.13.16. - Санкт-Петербург, 1994. - 34 c. : ил. РГБ ОД,

Введение к работе

Актуальность теми, Методы регрессионного анализа в настоящее время с успехом применяются при анализе экспериментальных данных в различных областях науки и техники: биологии, экологии, экономике, физике, химии, автоматизации и др. Регрессионный анализ по праву мо;кет быть назван основным методом современной математической статистики. Идея регрессионного анализа зиждется на мысли о том, что все доступные нам ресурсы важно использовать полно и эффективно,особенно если речь идет о накоплении и переработке информации.

Исторически одной из первых областей применения регрессионного анапиза пзляется биология. Ь настоящее время методы современного регрессионного анализа продолжают находить самое широкое применение в различных биологических, а также медико-биологических исследованиях. Среди многочисленных применений в биологических исследованиях особое место занимает применение м.етодов регрессионного анализа к исследованию динамических характеристик (в частности процессов роста) в биологических системах. Для этих целей широко используются параметрические регрессионные модели временных рядов, описываемые в форме линейных разностных уравнений, или так называемые функции тренда в виде полиномиальных зависимостей. Специфигл возникающих при этом задач регрессионного анализа состоит в следующем. Во-первых, для этих задач хараістерно наличие свойства мулътиколлинеарности, которое ведет к проблеме плохой обусловленности и является одним из основних препятствий эффективного применения аппарата регрессионного анализа. Плохая обусловленность пги ревении задач идентификации параметрических моделей вгеменных рядов такте часто возникает из-за неточного гкбора порядка модели. Fo-вторых, применение дина-.л-ч"ских регрессионных моделей в форме линейных разностных уравнений для описания процессов роста приводит к необходимости учета погреіиюстей в независимых переменных.

П".'$,'=численш.'э задачи относятся к классу некорректных задач регрессионного ана/црч для которых характерно, что малі-гм случайным возмущениям в исходных данных будут соответствовать очень r"'(i.ibwf "редн"ктдрагіі'!>;сі:іі'-'1 оиі'бки в оценках ііпрчмт-

ров моделей, т. е. эти задачи являются неустойчивыми. В настоящее время имеется огромное число подходов, алгоритмов и программ, позволяющих в этих нелегких условиях более или ме-

нее рационально организовать процесс определения оценок параметров регрессионных моделей.

Несмотря на отдельные результаты, полученные в рассматриваемой области, проблема ими далеко не исчерпывается. Остается нерешенным целый ряд существенных вопросов, связанных с развитием теории стохастической регуляризации некорректных задач регрессионного анализа, в том числе задач идентификации нестационарных параметрических моделей временных рядов в биологических и других исследованиях. Следует отметить, что некорректные задачи регрессионного анализа представляют собой частный случай задач решения приближенных стохастических систем линейных алгебраических уравнений (СЛАУ). В свою очередь задача отыскания эффективных способов решения СЛАУ в ее различных постановках является по видимому, в историческом плане одной из древнейших проблем в математике. Наличие неизбежных погрешностей (неточностей) в задании коэффициентов как в правой так и в левой (матричном операторе) ее частях, порожденных либо неточностью самих исходных данных в той содержательной задаче, математической моделью которой является рассматриваемая система уравнений, либо конечной точностью представления чисел в ЭВМ, либо и тем и другим вместе, приводит к неопределенности искомого решения.

Как было указано А.Е Тихоновым, при-построении решения СЛАУ принципиальным фактором является наличие погрешности задания правой . части и матрица Классические алгоритмы решения СЛАУ, основанные на концепции абсолютной точности при наличии погрешностей, не могут быть положены в основу универсальных вычислительных программ для ЭВМ в силу неустойчивости к погрешностям. В последующих работах А. Н. Тихонова, В. К. Иванова, В. А. Морозова, В. Я. Арсенина, А. В. Гончарского, А. Г. Яголы, Ы.М. Лаврентьева, В. В. Воеводина, М. А. Красносельского, Р. Ш. Липцера, Е. Л. Жуковского, а также зарубежных ученых Дж. Голуба, Р. Хенсона, Ч. Лоусона, Дж. Форсайта и др. были созданы

«'Эффективные универсальные алгоритмы решения СЛАУ с учетом
погрешностей задания возмущенных матрицы А и вектора f систе-
2 V ;

мы при детерминированных возмущениях.

Значительно менее разработанными являются методы решения некорректных СЛАУ при случайных возмущениях к числу которых как раз и относятся некорректные задачи регрессионного анализа, возникакяцие в задачах моделирования процессов роста в биологических и других исследовниях, а также в задачах параметрической идентификации дискретных динамических систем, описываемых линейными разностными уравнениями. Вероятно впервые на эти задачи было обращено внимание именно при решении плохо обусловленных задач линейного регрессионного анализа, которые в принципе сводятся к решению некорректных СЛАУ с неточно заданной правой частью. Для решения этого класса задач был создан метод ридж-регрессии. Несомненные заслуги в развитие этого метода принадлежат А. Херлу и Р. Кеннарду. Однако метод ридж-регрессии обладает серьезными недостатками и не решает полностью проблему. Еще сложнее обстоит дело с некорректными СЛАУ при случайных возмущениях как в правой части, так и матрице системы. Определенный вклад в решение этой проблемы принадлежит Е. А Лыковскому, В. а Федорову, R И. Мелекко, А. а Кряневу и II М. Исламову. О важности проблемы регуляризации при решении задач идентификации параметров объектов управления отмечалось также в работах а 3. Цыпкина и Б. Т. Поляка.

Сформулированные задачи составляют научную проблему, имеющую важное теоретическое и прикладное значение. Решение этой проблемы будет способствовать существенному расширению класса эффективно решаемых задач математического моделирования с применением ЭВМ на основе экспериментальных данных сложных систем в биологических, медико-биологических, экологических, технических и др. приложениях.

Тема диссертационной работы совпадает с планом госбюджетных и хоздоговорных научно-исследовательских работ, выполняемых Самарским политехническим институтом им. Е а Куйбышева в рамках комплексных научно-технических проблем.

Цель работы заключается в разработке эффективных численно и статистически устойчивых методов решения некорректных задач регрессионного анализа и идентификации нестационарных параметрических моделей временных рядов в биологических и других исследованиях, а также задачах параметрической иденти-

фикации сложных дискретных стохастических динамических систем, описываемых линейными разностными уравнениями. Для достижения поставленной цели в работе решались следующие задачи:

- построение теории, методов и алгоритмов,, стохастической
регуляризации СЛАУ возникающих в некорректных задачах регрес
сионного анализа в которых бы существовала органически нераз
рывная связь между статистической устойчивостью оценок реше
ний и численной устойчивостью алгоритмов их реализующих;

-получение методов стохастической регуляризации СЛАУ в которых бы асимптотически оптимальные статистические свойства сочетались с определенными оптимальными статистическими свойствами на конечной выборке, что является очень важным фактором при решении многих практических задач в биологических исследованиях;

изучение оптимальной статистической формы принципа невязки при решении некорректных стохасических СЛАУ, возникающих в плохо обусловленных и вырожденных задачах регрессионного анализа;

разработка эффективных численных алгоритмов нахсздения регуляризованных оценок решений некорректных стохастических СЛАУ и их реализация на современных ЭЬМ;

исследование эффективности представленных в диссертации методов, алгоритмов и программ с помощью тестового ста-

» тистического моделирования на ЭВМ и на примерах решения реальных задач математического моделирования нестационарных временных рядов в медико-биологических исследованиях.

Общие методы исследования. Разработанные в диссертации методы опираются на результаты современной теории регуляризации, развитой А. Н. Тихоновым, теории статистического оценивания параметров, вычислительной линейной алгебры, теории мартингалов, анализа временных рядов и современной теории идентификации параметров дискретных динамических систем по экспериментальным данным. Полученные алгоритмы вычисления регуля-ризовЕлных оценок параметров некорректных задач регрессионного анализа исрледованы методом статистического моделирования на ЭВМ.

Научная новизна работы заключается в следующем.

1. На основе обобщения предшествующих исследований выяв-4 ,

лены основные причины некорректности в задачах регрессионного и конфлюентного анализов, а также задачах идентификации нестационарных моделей временных рядов в биологических исследованиях и идентификации параметров динамических систем, описываемы}; линейными разностными уравнениями.

  1. Сделан обзор современного состояния проблемы решения некорректных стохастических СЛАУ в задачах регрессионного анализа по неточным данным.

  2. Дана классификация методов решения некорректных стохастических СЛАУ по уровню априорной информации о неизвестном решении и случайных возмущениях в элементах матрицы и векторе правой части.

  3. Дано обобщение определения А. К ' Тихонова приближенной детерминированной СЛАУ на стохастические системы.

  4. Обоснована и исследована статистическая форма обобщенного принципа невязки и дана ее связь с регуляризованным методом ортогональных проекций.

  5. Получены условия существования и однозначной разрешимости задачи вычисления регуляризованных оценок решений некорректных СЛАУ с применением статистической формы обобщенного принципа невязки.

  6. Исследовано влияние априорной информации о возмущениях в исходных данных системы на статистические свойства регуляризованных оценок решений и получены оптимальные в среднек-вадратическом смысле регуляризоЕанние оценки решений с несмещенным квадратом длины, что гарантирует их статистическую устойчивость при решении некорректных стохастических СЛАУ на конечной выборке.

  7. Доказана сильная состоятельность нерегуляризованных и регуляризованных оценок решений метода ортогональных проекций для возмущений в элементах матрицы и правой части СЛАУ представляющих случайные процессы типа мартингал-разностей.

  8. Исследованы важные для практичекого применения вопросы нахождения оценок решений с несмещенным квадратом длины в случае, когда отсутствует априорная информация о дисперсиях погнувшій в элементах матрицы и вектора правой части.

1(1. Исследованы рекуррентные алгоритмы нахождения минн-мальнм\ собственных значении информационных матриц и на их

основе получены итеративные методы регуляризации некорректных стохастических СЛАУ.

  1. Разработаны и исследованы численно устойчивые алгоритмы нахождения псевдорешений некорректных стохастических СЛАУ с неточно заданными матрицей и вектором правой части.

  2. Получены общие условия сильной состоятельности оценок метода ортогональных проекций в задачах идентификации параметров стохастических динамических систем, описываемых линейными разностными уравнениями.

  3. Показано, что задачи параметрической идентификации большого класса динамических систем с дискретным временем, описываемых линейными разностными уравнениями, сводятся к задачам решения некорректных стохастических СЛАУ с неточно заданными матричным оператором и вектором правой части; на основании предложенных в работе методов стохастической регуляризации СЛАУ получены регуляризованные оценки параметров стохастических динамических систем.

  4. Для математического моделирования процессов роста в медико-биологических исследованиях предложено использовать дискретные передаточные функции с помощью которых удается существенно расширить класс моделируемых процессов.

Практическая ценность и реализация результатов работы. Разработанный цикл методов, методик, алгоритмов и программ позволяет существенно расширить класс эффективно решаемых прикладных задач математического'моделирования нестационарных временных рядов в биологических, медико-биологических и других исследованиях на основе экспериментальной информации. Основной практический выход диссертационной работы заключается в разработке единой методики решения класса некорректных задач регрессионного анализа на основе их сведения к задачам определения оценок решений приближенных СЛАУ с неточно заданными случайными данными, включающему предложенные в диссертации базовые алгоритмы стохастической регуляризации. Реализуемые в рамках предложенной методики вычислительные схемы решения приближенных стохастических СЛАУ содержат как универсальные, так и адаптированные к конкретным классам задач идентификации нестационарных параметрических моделей временных рядов в биологических и медико-биологических исследованиях.

Предложенные в диссертации алгоритмы вычисления регуля-ризовачннх оценок решений некорректных стохастических СЛАУ не требуют никакой недоступной на практике экспериментатору информации и поэтому могут широко использоваться при решении значительного круга проблем автоматизации научного измерительного эксперимента, связанных с необходимостью получения устойчивых решений многочисленных задач обработки, интерпре' тации и моделирования данных.

Практическая ценность результатов представленных в настоящей диссертации такж объясняется тем бесспорным фактом, что вагшейиим алгоритмом Енчислительной"математики, используемым в качестве блока решения большинства практических вычислительных задач, является алгоритм решения СЛАУ при построении решений которых принципиальным фактором является наличие случайных погрешностей задания исходных данных.

Методы, алгоритмы и программы, разработанные в диссертации, использованы:

в -задачах моделирования по экспериментальным данным процессов роста биологических популяций;

при разработке пакета прикладных программ (ГОШ) для исследования дишмики роста некоторых-видов заболеваний вызванных промышленными загрязнениями окружающей среды;

при разработке І7ПП для прогнозирования среднесуточных концентраций вредных веществ в воздухе, вызванных промышленными загрязнениями.

Эффективность использования предложенних в диссертации методов, алгоритмов и программ для решения указанных задач подтверждена актами соответствующих орга шзаций.

Апробация работы. Основные результаты диссертации докладывались на 5-й Всесоюзной конференции по планированию и автоматизации эксперимента л научных исследованиях (Москва, 1976), 3-й Всесоюзной научной конференции "Применение вероятностно-статистических методов в бурении п.нефтедобыче" (Баку, 1981), Всесоюзной конференции "Теория адаптивных систем'и ее применения" (Ленинград, 13ЯЗ) , 5-м Всесоюзном совещании "Уп-равленне многосвязинми системами" (Тбилиси. 1934), 1-й Всесоюзной п.к іло-конФТ'Єншіи "M.".TjCKce моделирование v машиностроении" СКуґіОіr:"t'T3. H!'JO) , 5-и Ленинградском симпозиуме по

теории адаптивных и экспертных систем в управлении (Ленинград, 1991), обсуждались на семинаре "Современные проблемы численного анализа" НИВЦ МГУ (1988, 1989) и общемосковскш семинаре по теории адаптивных систем в Институте проблем управления АН СССР (1989).

Автором опубликованы по теме диссертации 18 работ [1-181.

Структура и обгам работы. Диссертация состоит из введения, шести глав, заключения, списка литературы. Объем диссертации составляет 259 машинописных страниц.

Похожие диссертации на Некорректные задачи регрессионного анализа и идентификации динамических моделей по экспериментальным данным (с применениями в медико-биологических исследованиях)