Введение к работе
Актуальность темы диссертации.
В последнее десятилетие во всем мире наблюдается заметный ио.дьем биомедицинской науки. Происходит качественный скачок как результат накопленных в различных отраслях науки знаний о природе, функциях и назначении Живого на Земле. Интегрируются знания, накопленные в биологии, генетике, физиологии, экологии и многих других, иногда весьма далеких друг от друга областях знаний на фоне возрастающего использования математики и других точных наук. Широкое распространение и доступность (даже в условиях экономического кризиса) вычислительной техники с одновременным ростом ее возможностей и развитием сетевых технологий дает возможность оперативной обработки больших массивов данных непосредственно исследователем, что позволяет существенно увеличить результативность проводимых исследований. Этому же способствует развивающаяся система программного обеспечения с удобными пользовательскими интерфейсами, для работы с которыми необязательно иметь обширные знания в области математики и статистики.
Все вышеперечисленное в свою очередь вызвало качественный скачок is развитии методов обработки данных. Развиваются ранее известные методы математической статистики, появляются новые. Ежегодно публикуются статьи о нескольких сотнях новых методов и их разновидностей, а также об использовании уже известных методов «совершенно новых, не предусмотренных разработчиками целях. Это свидетельствует, с одной стороны, о практической необходимости таких методов, а с другой - об отсутствии в настоящее время достаточно общих и универсальных методов обработки больших массивов биомедицинских данных. Основной причиной этою подъема является то, что методы, разработанные и успешно применявшиеся для решения технических задач, часто совершенно непригодны для использования в медицине и биологии в силу существенно большей сложности исследуемого объекта и граничных условий либо требуют слишком больших затрат вычислительных ресурсов, не соответствующих получаемому результату.
Условно выделим две основных цели такой обработки. Первая - сведение многообразия данных к некоторому сравнительно небольшому их числу и представление в удобной для исследователя форме. Вторая - выявление скрытых зависимостей в массиве данных и соотнесение их с процессами, проходящими в исследуемом объекте. В качестве аналогии такой обработки можно привести пример использования авиации в археологии. Исследователь на поверхности земли видит однородный ландшафт, но если охватить взглядом несколько десятков километров одновременно - в глаза бросаются контуры древних рвов, крепостных стен, строений и т.п. Методы обработки являются в бпо-медицинских исследованиях аналогичным инструментом для дистанцирования, позволяющим исследователю "охватить глазом" пр блему в целом.
Традиционной и весьма распространенной формой представлення ре-
зультатоа экспериментальных исследований в науке, технике, медицине, на производстве являются экспериментальные кривые. Регистрируемый сигнал несет косвенную информацию о состоянии и характеристик ч порождающего его источника и анализируется с целью изучения недоступных либо труднодоступных для непосредственного наблюдения явлений. Полученная информация об источнике, порождающем крив)ю, может быть использована для решения задач управления, прогнозирования его поведения, либо для понимания механизма его функционирования. Среди экспериментальных кривых можно выделить группу кривых, являющихся результатом наблюдения процесса с выраженной внутренней структурой. Обработка таких кривых связана с выделением фрагментов кривой, обладающих определенными характеристиками (однородных участков). Кривые такого типа в ряде работ называют структурными. Для их анализа применяются методы распознавания образов и методы обнаружения изменения свойств случайных процессов.
Математические модели и алгоритмы, используемые.при анализе структурных кривых, разнообразны и подчас весьма непросты, чю обусловлено разнообразием источников кривых. Учитывая, как правило, обширные объемы данных, получаемых в эксперименте и требующих представления в сжатом виде для последующей обработки п осмысления, становится очевидным огромная потребность в автоматизированных методах обработки кривых. При решении задач управления в биологии и медицине возникают дополнительные трудности в связи тем, что решение о виде управляющего воздействия практически всегда (исключая непосредственно моменты хирургического вмешательства и ряд сходных ситуаций) проводятся по косвенным данным, искаженным различною рода помехами, а также при возможной неполноте данных.
Существующие методы обработки экспериментальных кривых можно условно разделить на две большие группы. Первая основывается на предположении, что для наблюдателя важно усредненное поведение кривой и обрабатывать следует всю кривую в целом. К этой группе методов относятся спектральный анализ кривых, методы идентификации параметров моделей динамических систем на основании анализа входного и выходного сигналов, оценивание параметров математической модели временного ряда по всей реализации в цег лом. Наиболее распространенными при обработке биомедицинских данных являются методы, основанные на быстром преобразовании Фурье, несколько реже используются регрессионные модели.
Вторая'группа методов обработки, собственно и называемых структурными, основывается на предположении, что состояние исследуемого источника кривой меняется и представляет собой последовательность отдельных элементарных событий. При этом каждое элементарное событие приводит к появленню характерных особенностей формы кривой на соответствующих фрагментах. Анализ экспериментальных кривых, обладающих внутренней структурой, связан с необходимостью выделения однородных фрагментов, соответствующих элементарным событиям.
Приведенное разделение методов обработку временных рядов на две группы, разумеется, в некоторой степени условно. При использовании структурного подхода на выделенных участках однородности в полной мере могут использоваться классические методы обработки кривых, а при исследовании временных рядов классическими методами необходимым может оказаться разбиение их на части в соответствии с полученными этими методами признаками. Весьма показательными в этом смысле являются активно разрабатываемые в последние годы методы вейвлет-аналіпа. Оіці являются некоторой модификацией традиционного спектрального анализа, основанного на преобразовании Фурье; который эффективен при обработке периодических сигналов. На практике же нередка возникает необходимость знать спектральные свойства сигналов, не являющихся периодическими и, к тому же, известными лишь на ограниченном отрезке времени (или ряде отрезков, отстающих друг от друга на различные расстояния). Зачастую интерес представляют сигналы, спектральный состав которых меняется со временем. В этом случае необходим "локальный" анализ спектра. С последней задачей хорошо справляется вейв-лет-ацализ, сформировавшийся в последнее десятилетие в самостоятельный раздел прикладной математики. Используя разложение по осциллирующим фуикпиям, локализованным как в физическом, так и в фурье-пространствах, вейвлет-преобразованиё отображает исходный одномерный сигнал на полуплоскость время-частота, характеризуя спектральный состав сигнала в каждый момент времени. В ряде случаев для последующей обработки используется так называемый "скелет максимумов" - множество точек, в которых находятся локальные "пики" вейвлет-преобразования (реакция на негладкость сигналов). Эти методы используются для обработки электро- и эхокардиогра'мм И позволяют выявлять различные сердечные аномалии на ранней стадии. При обработке ЭЭГ оші позволяют локализовать источник импульсов, свидетельствующих о том или ином, поражении (заболевании) для принятия решения о границах хирургического вмешательства.
'Основным отличием от структурных методов анализа является тот факт, что результаты вейвлет-преобразования требуют некоторой дальнейшей обработки для получения результатов, удобных для непосредственного использования (например, в диагностике). Поэтому определяющим признаком методов структурного анализа кривых считаем наличие модели для описания ненаблюдаемого процесса (истопника, формирующего последовательность участков различного тина на наблюдаемой кривой). В зависимости от постановки задачи эта модель либо используется при разбиении кривой на однородные участки, либо является объектом оценивания по экспериментальным данным и изучения с целью установления связи между параметрами этой модели и характеристиками изучаемого объекта (диагностических признаков). Сказанное tie означает невозможность применения структурного подхода к вейвлет-анаЛиЗу. Использование структурных методов обработки таким образом определяется в первую очередь задачами Исследования. Их основное преимущество - возможность
6-.
получения информации о структуре исследуемого объекта, которую невозможно иолучип. другими методами.
13 связи со всем вышеизложенным актуальной задачей я ляется разработка моделей и алгоритмов выбора статистических моделей структурных кривых и оценивания их параметров. Пыбор модели включает задачи концептуального выбора общего класса моделей и оценивания целочисленных параметров, характеризующих структуру модели в пределах выбранного класса. Эги параметры будем называть первичными, в отличие ог вторичных, окончательно.определяющих конкретную количественную модель.
В настоящей работе предлагаются методы структурного анализа для обработки экспериментальных кривых, отдельные участки которых характеризуются повторяющимися на них признаками формы наблюдаемой-кривой. Рассматриваются -задачи разбиения кривой на однородные участки, задачи оценивания вюричных (численных) и первичных (структурных) параметров модели и задача выбора класса модели и ее конкретного'вида. Особенность всех используемых в настоящей работе моделей кривых - они порождающие, то есть имеется возможность интерполяции и эксфаноляцни данных, что необходимо при обработке бномедпцпнеких данных, которые часто имеют ограничения по выборке и иногда приходится прибегать к восстановлению зависимости в отдельных местах.
Оььект исслідоїишія: Любой медико-биологический процесс, являющийся источником сигнала, характер поведения которого на различных участках изменяется и отражает изменения состояния'исходного процесса.
Используемые методы: за основу в настоящей работе принят струк
турный подход, описывающий наблюдае.чгую кривую как реализацию двух
уровневого случайного процесса. Такой подход предполагает наличие моделей-
как для описания наблюдаемого процесса (кривой), так и для ненаблюдаемого
процесса чередования однородных участков и их типов. В іюследі'іем-н состоит
основное отличие от популярной в настоящее время методологии вейвлет, не
использующей модели (и понятия) ненаблюдаемого процесса. Методологиче
ски к предполагаемым методам наиболее близки разрабатываемые в работах
И.Б. Мучника (США), В.Г, Яковлева, Т.О. Ивановой, В.В. Моттля структурные
методы обработки кривых, описываемых уравнениями авторггрессии со скач
кообразно изменяющимися параметрами. За основу для разработки методов
оценивания размерности и выбора типа и структуры модели взят информаци
онный критерий Акаике, использованный в работах Т.О. Ивановой для оцепи-'
вания размерности авторегрессионной модели со скачкообразно изменяющи
мися параметрами. Для той же цели используется известный метод проверки
статистических гипотез.
В предлагаемой работе подобные, методы используются для обработки структурных кривых с. различными признаками повторяющейся формы, что вызывает необходимость существенных изменений этих методов и применения ряда оригинальных подходов. Задача выбора шага дискретизации обрабатьь
. ваемых кривых в настоящей работе не рассматривается, поскольку должна решаться для каждого конкретного случая (теорема отсчётов Котельникова).
Цель.диссертации: Разработка методологии построения моделей для описания структурных кривых с различными способами задания признака повторяющейся формы и методов обработки таких кривых.
Задачи диссертации:
=> формирование комплекса моделей, пригодных для описания процессов формирования достаточно широкого класса структурных экспериментальных кривых с повторяющимися на однотипных участках признаками формы; => разработка методов сегментации кривых при различной организации процесса поступления информации для полностью зарегистрированной кривой или в режиме реального времени для всех предложенных моделей; => создание методов идентификации неизвестных числовых параметров моделей для различных режимов поступления информации;
=> выработка методов выбора типа модели для описания исследуемого процесса из множества предложенных и ранее известных моделей, и методов оценивания неизвестных структурных параметров этих моделей.
Научная понизил. В диссертации предложена концепция математического описания процессов, являющихся источниками структурных кривых с повторяющимися признаками формы, включающая три принципиально разных способа задания признаков формы и возможность описания кривых "смешанного" тина, содержащих как участки повторяющейся формы, так и шумоподобные участю;; предложен комплекс методов разбиения обрабатываемой кривой на однородные участки при различной организации процесса поступления информации и. известных параметрах модели (для всех предложенных в работе моделей), включающий принципиально новый класс методов, сочетающих свойства вероятностного и детерминированіїого подхода; методов оценивания неизвестных параметров для-всех предложенных моделей при различной организации процесса поступления информации и известных структурных параметрах; методов выбора вида модели кривой из множества всех предложенных н настоящей работе моделей и, кроме того, моделей кривых, описываемых случайным процессом авторегрессн'и со скачкообразно изменяющимися параметрами модели., и методой оценивания неизвестных структурных параметров этих моделей; обеспечена сорместішость разработанных методов с известными методами обработки структурных шумоподобных кривых.
Практическая ценность работы заключается в предложенных алгоритмах обработки экспериментальных кривых, позволяющих в медико-биологической нракшке производить оценку состояния исследуемого процесса или объекта.
Достоверность полученных результатов подтверждается данными имитационного моделирования и использования разработанных алгоритмов для решения ряда практических задач. .
Основные молотщшя, выцоешцщ на защиту диссертации
-
Концепция моделирования экспериментальных кривых в виде реализации одной in компонент двухуровневых Или трёхуровневых структурных случайных процессов;
-
Три различных способа задания признака іювіоряющсік.і форМЫ кривой для событии данною класса: посредством одной, нескольких эталонных форм или их линейной комбинацией;
-
Методы сегментации кривых для различных режимов их регистрации, включая: методы оптимальной поточечной классификации; методы динамического программирования сегментации кривых, в том числе пригодные для работы в реальном масштабе времени с автоматически определяемой задержкой; ускоренные методы сегментации, сочетающие свойства детерминированных п вероятностных методов распознавания;
-
Методы идентификации неизвестных параметров моделей, включая; методы оценивания параметров для полностью зарегистрированной кривой; методы пересчета параметров в ходе регистрации кривой; точные и ускоренные методы "с обратной связью", а также оценивания параметров "с учителем";
-
Методы оценивания неизвестной структуры моделей с использованием метода сравнения статистических гипотез и информационного критерия Акаи-ке;
-
Методы выбора типа модели нз множества предложенных и модели автр-регрессии со скачкообразно изменяющимися параметрами;
Публикации. Основные результаты исследовании по теме диссертации
опубликованы и 50 печатных работах, из них 48 на русском языке.
Апробация работы. Результаты работы были представлены на:
0 II симпозиуме JFAC по стохастическому управлению (Вильнюс, 1986 г.);
О Всесоюзной НТК "Разработка энергосберегающих и малоотходных технологий в металлурги)! цветных металлов" (Москва, 1986 г,);
О Всесоюзном семинаре по обнаружению изменения свойств случайных процессов (Воронеж, 1990 г.);
0 Всесоюзных конференциях "Распознавание образов и анализ изображений: новые информационные технологии" РОАИ-2-95 (Ульяновск, 1995 г.) и РОАИ73-97 (Нижний Новгород, 1997 г.);
О Всероссийских НТК "Микроэлектроника и информатика-97 и 98" (Звенигород, 1997 и 1998 г.г.);
О Международной НТК "Нечеткая логика, интеллектуальные системы и технологии" (Владимир, 1997 г.);
О Л и III Всероссийских НТС "Методы и средства измерений физических величин" (Нижний Новгород, 1997 и 1998 г.г.);
ф 3~ей Международной конференции "Теория и техника передачи, приема и обработки информации", (Харьков, 1997 г.);
0 II международной НТК "Управление в технических системах" (Ковров
1998); . . '''..' ''
О 1} международном симпозиуме "Биофизика полей п излучений и бионнфор-
матнка" (Тула, 1998 г.); О і Всероссийской НТК "Компьютерные технологии в науке, проектировании
и производстве" (Нижний Новгород, 1999 г.); 0 Международной конференции "Перспективные технологии автоматизации"
ПТЛ-99 (Вологда, 1999 г.) и на ежегодных научно-технических конференциях в Тульском Государственном университете, а также на научных семинарах, проводимых в 1995-98 гг. В НИН новых медицинских технологий.
Структура и шл.км І'АПОШ. Диссертация состоит из введения, семи глав, заключения, списка литературы (346 наименований) и Приложений. Объём основного текста диссертации - 250 маишнописных страниц, 20 страниц рисунков, приложение на 59 страницах включает доказательства теорем И тексі и некоторых а.чюрптмов, а также акты о практическом использовании результатов и выводов диссертации.