Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Чепиков Эдуард Васильевич

Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора
<
Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Чепиков Эдуард Васильевич. Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора : Дис. ... канд. техн. наук : 05.13.18, 05.13.17 : Таганрог, 2005 184 c. РГБ ОД, 61:05-5/3378

Содержание к диссертации

Введение

1. Особенности анализа функционального состояния человека-оператора 12

1.1. Проблема оценки функционального состояния человека-оператора 12

1.2. Специфика моделирования медико-биологической базы данных человека-оператора 22

1.3. Современные модели поиска закономерностей в базах данных 30

1.4. Выводы 39

2. Генерация и синтез моделей знаний на основе анализа базы данных человека-оператора 40

2.1. Моделирование базы данных человека-оператора в процессе проведения медико-биологического эксперимента 40

2.2. Модель поиска нечеткий правил if-then в базе значений атрибутов результатов деятельности 57

2.3. Модель поиска закономерностей в медико-биологической базе данных человека-оператора 78

2.4. Выводы 108

3. Программно-алгоритмическое обеспечение системы поиска закономерностей 109

3.1. Система обнаружения индивидуальных стратегий поведения человека-оператора 109

3.2. Система кластеризации экспериментальных данных 126

3.3. Принципы построения и структура интеллектуальной системы медико-биологического эксперимента 130

3.4. Выводы 138

Заключение 139

Список использованных источников 140

Приложения 149

Введение к работе

Актуальность проблемы. Получение практически полезных и доступных интерпретации знаний необходимо для принятия решений в различных сферах человеческой деятельности. Подобные задачи актуальны в областях, где присутствуют большие информационные массивы неоднородных, меняющихся во времени данных высокой размерности.

Проблема извлечения знаний и выявления скрытых закономерностей в массивах данных подразделяется на пять различных задач: нахождение ассоциаций, нахождение последовательностей, классификацию, кластеризацию и прогнозирование [1]. Обобщение и аналитическое представление накопленной информации осуществляется с двумя целями. Первая состоит в том, чтобы гарантировать принятие рациональных решений, риск потерь которых сведен к минимуму. Вторая заключается в том, чтобы понять механизм принятия решений. Пользователь, принимая определенное решение, нуждается в содержательном ответе на вопросы, как он получил это решение, почему он должен следовать этому решающему правилу, и т.д.

В связи с этим, актуальной становится задача создания эффективных методов обобщения и интерпретации многомерных данных.

Фактически базы данных выполняют функцию памяти, доступ пользователя к хранилищу данных обеспечивает только извлечение небольшой части из хранимой информации в ответ на четко задаваемые вопросы. Но когда мы имеем огромный поток информации, встает задача максимально целесообразно использовать эту информацию, чтобы извлечь спрятанное в данных знание с целью оптимизировать управление какими-либо процессами, улучшить деятельность организации. Можно было бы использовать армию аналитиков, статистиков, которые бы разбирались с этими данными, используя традиционные средства анализа данных. Но сейчас эта задача не может быть решена только силами человека в силу гигантского объема данных экономической неэффективности такого решения. Кроме того, не всегда получаемые аналитиками результаты являются объективными, поскольку люди руководствуются некоторыми соображениями, априорными представлениями об изучаемом предмете, что отражается на объективности получаемых результатов.

Предпосылками для исследований области интеллектуального анализа данных являются:

• накопление баз данных и сложность их непосредственного эмпирического анализа. Исследовательские базы данных даже по очень узкой тематике, могут содержать сведения о нескольких десятках, а то и сотнях различных показателей [2]. Эмпирический анализ даже такого малого объема информации весьма сложен и трудоемок;

• развитие математических алгоритмов выявления закономерностей и поиска взаимосвязей различных показателей в базах данных, успешная апробация этих алгоритмов в других областях человеческого знания;

• развитие аппаратного обеспечения. Ключевой возможностью применения технологий data mining стало огромное падение цены на устройства хранения информации за последние несколько лет, с десятков долларов за хранение мегабайта информации, до десятков центов. Падение цен на процессоры с одновременным увеличением их быстродействия также способствует развитию технологий, связанных с обработкой огромных массивов информации. Распространение клиент-серверной архитектуры также является необходимым атрибутом технологии data mining. Такой подход предоставляет возможность выполнять наиболее трудоемкие процедуры обработки данных на высокопроизводительном сервере как разработчикам проектов, так и конечным пользователям.

Модели «добычи» знаний (data mining) позволяют уменьшить остроту проблемы. Используя продвинутые аналитические методы в области добычи знаний из исходных, "сырых", данных, многие организации увеличивают прибыль, повышают производительность, сокращают затраты и увеличивают удовлетворенность клиентов. Они уже активно используются при анализе рынка, маркетинге, прогнозе фондовых котировок и других бизнес-приложениях. В отличие от данных приложений, методы анализа медико-биологических баз данных практически отсутствуют. В особенности такая ситуация характерна для человеко-машинных систем, где остро стоит проблема оценки функционального состояния человека-оператора на основе поиска значимых отношений между параметрами деятельности, психофизиологии и психологического тестирования.

Вопросы построения концептуальных схем, рассматривающих организм человека с системных позиций, рассматривались в работах Анохина П.К, Амосова Н.М., Судакова К.В., Глушкова В.М., Медведева В.И., Михиенко Е.В. Методы интеллектуального анализа данных представлены в работах D.Wettschereck , D.Aha, D.Heckerman, R.Srikant, R.Agrawal, A.Gyenesei, Дюка B.A., Арсеньева СБ., Цветкова А. М. Разработке методов и моделей нечеткой логики и правдоподобных рассуждений посвящены работы Д.Дюбуа, А.Прада, Вагина В.Н., Берштейна Л.С., Астанина СВ.

В представляемой диссертации разрабатываются вопросы, связанные с исследованием особенностей медико-биологических баз данных человека-оператора на основе концепции функциональных систем организма, разработкой математических методов обнаружения закономерностей в таких базах данных, созданием алгоритмического и программного обеспечения поиска закономерностей. Данная работа является частью исследований в области анализа качества функционирования человеко-машинных систем, проводимых в Таганрогском государственном радиотехническом университете.

Исследования выполнялись в рамках научно-исследовательских работ, согласно программам Министерства образования и науки Российской Федерации.

Диссертация посвящена решению научной проблемы, связанной с разработкой моделей формирования гипотез и поиска закономерностей в медико-биологических базах человека-оператора, основанных на концепции функциональных систем, введенной Ухтомским и Анохиным.

Целью исследований является повышение эффективности средств извлечения знаний в темпоральных медико-биологических базах данных, формируемых в процессе профессиональной деятельности человека-оператора.

Основными задачами диссертации являются:

1. Анализ проблем, возникающих при оценке функционального состояния человека-оператора.

2. Анализ особенностей обработки медико-биологической базы данных человека-оператора.

3. Анализ существующих интеллектуальных методов обнаружения знаний применительно к медико-биологическим базам данных человека-оператора

4. Разработка модели поиска закономерностей базы данных деятельности человека-оператора;

5. Разработка модели поиска закономерностей при анализе базы медико-биологических данных на основе концепции функциональных систем организма;

6. Построение программно-алгоритмического обеспечения системы интеллектуального анализа медико-биологических данных.

В диссертации разрабатываются, исследуются и защищаются следующие основные положения:

• моделирование базы данных человека-оператора в процессе проведения медико-биологического эксперимента;

• модель поиска нечетких правил ifhen в базе значений атрибутов результатов деятельности;

• модель поиска закономерностей в медико-биологической базе данных человека-оператора;

• программно-алгоритмическое обеспечение системы поиска закономерностей в базах данных медико-биологического эксперимента. Метод исследований заключается в системном подходе к разработке принципов, методов и моделей поиска закономерностей в медико-биологических базах данных человека-оператора, базирующихся на использовании теорий функциональных систем организма, интеллектуального поиска закономерностей в базах данных, мягких вычислений, интервальной математики, кластерного анализа, математической статистики.

Научная новизна. Основным научным результатом диссертации является разработка моделей поиска закономерностей в медико-биологических базах данных человека-оператора. Вклад в развитие исследований в области контроля и управления функциональным состоянием человека-оператора составляют:

• моделирование базы данных человека-оператора в процессе проведения медико-биологического эксперимента;

• модель поиска нечетких правил в базе значений атрибутов результатов деятельности на основе кластерного анализа и алгоритмов нечеткой логики;

• модель обнаружения закономерностей в медико-биологических базах данных человека-оператора на основе концепции функциональных систем организма.

Достоверность полученных в диссертации результатов подтверждается апробацией математических методов и моделей поиска закономерностей в медико-биологических базах данных человека-оператора на основе концепции самоорганизующихся систем организма.

Практическая ценность и рекомендации по применению. Полученные в диссертации результаты позволяют повысить эффективность обнаружения закономерностей в медико-биологических базах данных обучения на основе математической интерпретации самоорганизации функциональных систем человека-оператора. Предложенные математические методы и модели доведены до уровня алгоритмического и программного обеспечения. Научные # и практические результаты, полученные в диссертации, представляют интерес при построении интеллектуальных экспериментальных стендов и тренажно-моделирующих комплексов, предназначенных для анализа и оценки функционального состояния человека-оператора.

Разработанные программные средства используются в процессе лабораторных исследований функционального состояние человека-оператора, проводимых в рамках научно-исследовательской программы Таганрогского государственного университета и применяются в циклах лабораторных работ по курсам «Системы искусственного интеллекта», «Теория принятия решений», «Математическое моделирование на ЭВМ».

Результаты диссертации были внедрены в НКБ «МИУС» (г.Таганрог), Центре дистанционного образования ТРТУ (г.Таганрог), на предприятии ЗАО «Югсвязьмонтаж» (г.Кропоткин), ЗАО «ЮТИСС» (г.Кропоткин), Южном отделении ЦНПО «Каскад» (г.Кропоткин), при выполнении в Таганрогском государственном радиотехническом университете госбюджетной НИР «Исследование и разработка методов представления и обработки знаний в тренажно-моделирующей среде на основе методологии искусственного интеллекта».

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на Всероссийской научно-методической конференции «Развитие методов и средств компьютерного адаптивного тестирования» (г.Москва, 2005), на всероссийской научно-методической конференции «Телематика-2004», (г.Санкт-Петербург, 2004); на всероссийской научно-практической конференции «Человеческое измерение в информационном обществе», (Москва, 2003); на VII всероссийской научно технической конференции студентов и аспирантов (г.Таганрог, 2003), на всероссийской научно-технической конференции «Компьютерные и информационные технологии в науке, инженерии и управлении» (Таганрог, 2004).

Публикации. Результаты теоретических и экспериментальных исследований нашли свое отражение в 8 печатных работах, а также в трех отчетах по НИР.

Объем работы. Диссертация содержит 148 страниц машинописного текста, включая введение, три раздела, заключение, приложение содержит 37 страниц, список источников из 87 наименований, 23 рисунка, 4 таблицы.

В первой главе рассматриваются проблемы оценки функционального состояния человека-оператора, анализируется специфика обработки медико-биологической базы данных человека-оператора, рассматриваются преимущества и недостатки современных моделей интеллектуального анализа данных применительно к специфике задач исследований.

Во второй главе рассматривается технология моделирования базы данных человека-оператора в процессе проведения медико-биологического эксперимента, позволяющая в среде виртуальной реальности имитировать профессиональную деятельность и формировать поведенческую функциональную систему человека-оператора. Здесь же разрабатываются: модель поиска нечетких правил в базе значений параметров деятельности, основанная на кластерном анализе и нечеткой логике; и модель формирования гипотез и нечетких правил в медико-биологической базе данных, основанная на концепции функциональных систем организма.

В третьей главе рассматривается программно-алгоритмическая реализация разработанных моделей и результаты их применения при анализе экспериментальных баз данных.

Все результаты, представленные в диссертационной работе, получены автором лично. В совместных научных публикациях имеет место неделимое соавторство.

Данная многоплановая работа не претендует на исчерпывающую разработку всех рассмотренных вопросов.

Специфика моделирования медико-биологической базы данных человека-оператора

Задачи обработки экспериментальных данных всегда зависят от некоторой концептуальной схемы, в рамках которой выдвигаются определенные гипотезы относительно изучаемого объекта и цели эксперимента. В качестве такой концептуальной схемы, в диссертации, используется теория функциональных систем, предложенная П.К.Анохиным [23] и развитая К.В.Судаковым [24]. Как было показано в предыдущем разделе, несмотря на признание системного характера ФС, его оценка сводится к оценке одного или нескольких параметров. При этом разные исследователи по-разному трактуют ФС. Иногда речь идет о функциональном состоянии организма, иногда и психофизиологическом состоянии, иногда о функциональном состоянии органа или железы, иногда о стрессе и т.д.

В частности, в [26] под психофизиологическим функциональным состоянием понимается системная реакция (от организменного до личностно-психологического уровня), обеспечивающая необходимый уровень ресурсного обеспечения деятельности и компенсацию возникающих затруднений, что является важнейшим показателем работоспособности. В [27] утверждается, что наиболее перспективным направлением оценки состояния здоровья и психоэмоционального статуса являются исследования, проводимые на базе современных представлений об организме человека как сложной саморегулирующейся системе, способной реагировать на изменяющиеся условия среды. А далее анализ ФС сводится к анализу вариабельности кардиоритма, что обосновывается непостоянством интервала между кардиоциклами и стремлением к некой средней величине, являющейся оптимальной для определенного функционального состояния организма.

В [28] ФС определяется как фоновая активность нервных центров, при которой реализуется та или иная конкретная деятельность человека. При этом предлагается оценивать ФС по комплексу взаимосвязанных физиологических реакций.

Подобных определений можно привести множество и как показывает анализ литературы, исследователей в меньшей степени интересует определение ФС и постановка экспериментов на его основе, а в большей степени свои собственные познания в области физиологии и психологии, и как следствие, постановка таких экспериментов, которые их не опровергают. Большинство медицинских данных имеют описательный характер, выражаются с помощью формализмов, подверженных крайней вариабельности. Данные, даже выражаемые с помощью чисел, также в большинстве случаев не могут быть хорошо упорядочены и классифицируемы, т.к. изменяются в зависимости от клинических традиций различных школ, геосоциальных особенностей регионов и даже отдельных учреждений, а также от времени.

В этой связи будем использовать определение ФС, в наибольшей степени соответствующее современным представлениям об организме человека-оператора как системе, а именно как интегрального комплекса наличных характеристик тех функций и качеств человека, которые прямо или косвенно обуславливают выполнение профессиональной деятельности [29]. Из этого определения следует, что: 1) должна быть поставлена цель деятельности и возможные ее результаты с точки зрения качества; 2) должны быть выделены показатели (физиологические, психологические, психические, поведенческие) влияющие на результат деятельности, или иначе информативные показатели; 2) должна наблюдаться динамика информативных показателей; 3) должна быть зафиксирована взаимосвязь между информативными показателями; 4) с математической точки зрения оценка ФС является функцией значений информативных показателей. Фактически пункты 1)-4) являются задачами обработки экспериментальных данных. С целью формализованной постановки этих задач рассмотрим более подробно понятие функциональных систем организма и их взаимодействие в процессе деятельности. В работах [23, 24] норма понимается не как набор стандартных критериев, а как процесс, определяющий оптимальный режим функциональной деятельности. Одним из наиболее глубоких представлений нормы для живых систем, изложенных в отечественной литературе, является характеристика ее как функционального оптимума. В выдвинутой концепции оптимального состояния норма трактуется как интервал оптимального функционирования живой системы с подвижными границами, в рамках которых сохраняется оптимальная связь со средой и согласование всех функций организма [30]. Определение нормы как процесса, направленного на сохранение оптимального состояния, приводит к необходимости анализа общих принципов системной организации функциональных отношений. В изучении и выявлении общих принципов в системной организации функциональных отношений проведен большой объем исследований, среди которых особую значимость имеют работы П. К. Анохина. Одним из основополагающих принципов, который определяет существование общего подхода в оценке нормы как процесса вне зависимости от уровня организации и конкретной формы протекания функциональной деятельности рассматриваемой системы, является принцип изоморфизма. Существование этого принципа указывает, что в зависимости от конкретного уровня исследования или системы могут наблюдаться самые различные формы проявления функциональной деятельности, но принципы ее организации остаются инвариантными. Следовательно, для определения нормы как процесса важна не его конкретная форма проявления, а установление взаимосвязи принципов, определяющих этот процесс.

Характерным принципом системной организации функциональной деятельности, который выделяется различными авторами, является мультипараметрическая, или (в других источниках) многопараметрическая, организация обеспечения конечного результата любой функциональной системы [24]. Если принцип изоморфизма в организации функциональных систем определяет существование общей закономерности в проявлении нормы, то принцип мультипараметрического взаимодействия функциональных систем по конечному результату указывает на форму проявления нормы, ее качественную характеристику.

Мультипараметрическая взаимообусловленность некоторой совокупности компонентов порождает статистическую закономерность их проявления. Каждый компонент из рассматриваемого комплекса мультипараметрических отношений в проявлении своей активности имеет конечные границы вариации, и сам комплекс их отношений тоже имеет ограниченный набор. Эти критерии и определяют характеристики наблюдаемых статистических закономерностей вариации активности компонентов мультипараметрического комплекса. В зависимости от конечного результата функциональной деятельности рассматриваемой системы (интенсивности работы) определяется ее состояние.

Модель поиска нечеткий правил if-then в базе значений атрибутов результатов деятельности

Характеристика состояний модели поведения является интегральным показателем, зависящим от параметров выполняемой человеком-оператором деятельности. В частности, для рассматриваемой модели деятельности в среде виртуальной реальности, к таким параметрам относятся: число или процент уничтоженных объектов нападения, живучесть носителя, расход боеприпасов, время решения і-го этапа задачи (время перехода из пункта aj в пункт bj). Для реальной деятельности подобных параметров может быть значительно больше. В этой связи стоит задача получения зависимости между параметрами деятельности и характеристиками состояний. В подобной постановке данная задача является типичной задачей поиска закономерностей, решаемой методами интеллектуального анализа данных.

Традиционно построение правил вывода, и баз знаний считается прерогативой экспертных систем. Экспертные системы ориентированы именно на обработку данных с помощью некоторых правил вывода, которые формируют эксперты в той или иной области знаний. Другими словами, при проектировании экспертной системы изначально предполагается, что база знаний может быть создана экспертом. Поэтому одной из основных задач проектирования является извлечение знаний от эксперта. Однако при решении этой задачи исследователи сталкиваются с рядом принципиальных трудностей. В частности, необходимо использовать знания очень квалифицированных экспертов, которые, вообще говоря, не стремятся поделиться информацией. Но даже при наличии мотивированного эксперта, последний не всегда может внятно формулировать те правила, которыми он пользуется при подготовке экспертного заключения. Очень многое в его работе связано с интуитивными качественными оценками, распознаванием ситуации в целом, а не с формализуемыми процедурами.

В этой связи в последнее время неуклонно растет интерес к методам обнаружения знаний в базах данных (Knowledge discovery in databases) и обработки (раскопки) данных (Data Mining). Объемы современных баз данных, которые весьма внушительны, вызвали устойчивый спрос на новые алгоритмы анализа данных. Одним из популярных методов обнаружения знаний стали алгоритмы поиска ассоциативных правил. Ассоциативные правила позволяют находить закономерности между связанными событиями. Первый алгоритм поиска ассоциативных правил AIS [67] был разработан в 1993 году сотрудниками исследовательского центра IBM Almaden. С этой пионерской работы возрос интерес к ассоциативным правилам; на середину 90-х годов прошлого века пришелся пик исследовательских работ в этой области. Вместе с тем известные методы поиска логических правил не поддерживают функцию обобщения $ найденных правил и функцию поиска оптимальной композиции таких правил [68]. Отсюда следует актуальность разработки новых подходов и алгоритмов Data Mining в классе ifhen правил. Основные требования к новым подходам определяются следующим образом [67]: - способность находить лучшие (наиболее полные при заданной точности) логические правила неограниченной сложности, в данных высокой размерности; - умение обобщать найденные логические правила и осуществлять поиск их оптимальной композиции. Процесс поиска правил включает несколько этапов: накопление сырых данных, обобщение и преобразование данных, поиск закономерностей в данных, оценка, обобщение и структурирование найденных закономерностей. В данной работе рассматривается подход к обобщению данных и преобразование некоторых их совокупностей в форму нечетких множеств. Такой подход позволяет осуществить переход от отдельных числовых значений, характеризующих свойства объекта или системы, к интервалам, каждое значение которого определяется нечеткой степенью его принадлежности некоторому свойству. Необходимость применения методов обобщения информации в интеллектуальных системах обусловлена как построением обобщенных моделей данных, так и обработкой больших массивов экспериментальных данных, полученных в ходе различного рода процессов и явлений. С помощью методов обобщения выделяются признаки, характеризующие группу, к которой принадлежит тот или иной объект, и выявляются новые, нетривиальные и полезные знания. Будем рассматривать базу экспериментальных данных с количественными значениями, относящимися к различным характеристикам (атрибутам) объекта, например - температура, давление и т.п. Задача состоит в поиске закономерностей между совокупностями свойств атрибутов объекта и некоторым заключением, относительно рассматриваемого объекта, например управляющего решения, изменяющего его состояние, принадлежности объекта к некоторому классу и т.п. Другими словами задача состоит в построении правил типа «если X есть А, то Y есть В». Неопределенность решения состоит в том, что заранее известны либо лингвистические метки, характеризующие атрибуты X, либо их число, а также количество лингвистических меток, характеризующих заключение Y. Например, рассмотрим объект с атрибутами Х={Хь Х2}={возраст, уровень дохода}. Тогда лингвистические метки (значения) Ai и А2 могут быть следующими: Aj={молодой, средний, пожилой} и А2={низкий, высокий}, а В={класс1, класс2, классЗ}. Первый этап решения поставленной задачи построения правил ifhen состоит в определении формальных описаний лингвистических меток. Идея подхода к описанию меток состоит в следующем [69]: 1) используя методы кластерного анализа, по базе экспериментальных данных определяются кластеры количественных значений атрибутов и центры кластеров; 2) на основе выделения в каждом кластере минимального и максимального значений атрибутов, а также центров различных кластеров, строятся интервалы значений, являющиеся областями определений лингвистических меток; 3) генерируются функции принадлежности значений интервалов к лингвистическим значениям атрибутов; 4) осуществляется переход от базы данных с количественными значениями атрибутов к базе данных с лингвистическими значениями атрибутов. Формально это состоит в следующем.

Модель поиска закономерностей в медико-биологической базе данных человека-оператора

Под индукцией (от лат. inductio - выведение) понимается процесс логического вывода на основании перехода от частных положений к общим положениям [76]. Среди наиболее важных законов индуктивной логики выступают правила доказательства, связывающие причину и следствие: - всегда, когда возникает причина, возникает и феномен (следствие); - всегда, когда есть феномен (следствие), ему предшествует причина; - если варьирует причина, варьирует и феномен; - если причина имеет дополнительные свойства, то и феномен приобретает дополнительные свойства. Выделение закономерностей базируется на выявлении сходства частных случаев, формировании предположения относительно общих характеристик, отражающих сходство, подтверждения предположения на достаточно большом числе примеров, и, наконец, обобщения предположения в виде закономерности. В настоящее время, исследования в этой области направлены на изучение, анализ и формализацию отдельных схем индуктивного и традуктивного выводов [77, 78]. В частности в [77] предложена теория построения индуктивных рассуждений на основе математического анализа следующей схемы. Наблюдатель выдвигает априорную гипотезу о наличии некоторого свойства у тех или иных явлений и использует эту гипотезу в новых заключениях, наблюдая последовательность явлений и обнаруживая в них интересующее его свойство. В [78] предложен ДСМ-метод, базирующийся на схемах индукции Дж.Милля [79], и использовании монотонных и немонотонных стратегий выдвижения и обоснования гипотез. Данные методы позволяют решать задачи со следующей формулировкой [80]. Рассматривается выборка объектов, причем для каждого объекта из выборки известно - обладает он некоторым свойством или нет. Предъявляются объекты из другой выборки. Требуется получить правдоподобные гипотезы относительно обладания этими объектами ранее зафиксированных свойств. При этом записи базы данных считаются независимыми во времени. В подразделе 1.2 была поставлена задача поиска закономерностей, связанная с функционированием акцептора действий ПФС, в виде правил, которые определяют влияние поведенческих параметров человека-оператора на психофизиологические параметры, и обратно. При этом возможны следующие варианты: - изменение значений психофизиологических параметров является подготовкой к будущим изменениям внешней среды в предположении выполнения некоторого действия; - изменение значений поведенческих параметров является следствием изменения функциональной системы; при изменении значений поведенческих параметров, психофизиологические параметры не изменяются.

Подобная особенность поведения акцептора действий называется опережающим отражением или антиципацией [81, 82]. В отличие от задачи поиска закономерностей, рассмотренной в подразделе 2.2, здесь важна динамика наблюдаемых значений параметров и фиксация момента, когда значения параметров функциональной системы существенно изменяются, либо на основе прогноза результатов собственных действий другой функциональной системы, либо при изменении цели. Подобная постановка задачи отличается от постановки задачи формирования гипотез, рассмотренной в [80], в первую очередь тем, что при анализе базы данных необходимо учитывать последовательное во времени изменение значений поведенческих и психофизиологических параметров, т.е. записи базы данных считаются зависимыми во времени. Формально данное отличие можно сформулировать следующим образом. Пусть, как и раньше, Е={еь е2, ..., ем} - база количественных данных с N записями. Запись ej (i=l, N) - является множеством значений ajj атрибутов (параметров) Aj, j=l,m, т.е. Єі={аі)Ь aj 2, ...а; т}, где т -число атрибутов (параметров), ієТ={1,2,..., N}. Здесь множество Т определяет последовательные моменты времени синхронно фиксируемых параметров, ац, ai,2, --- ,11,-1 являются значениями психофизиологических параметров, а аит — является значением поведенческого параметра, которое характеризует соответствующий кластер, выявленный в ходе кластеризации параметров деятельности человека-оператора в соответствии методикой, использованной в подразделе 2.2. Иначе говоря, значения а;)Ь а , ...ai,m.i являются количественными, a ai m -качественным (лингвистическим) значением.

Проблема состоит в поиске правил, определяющих влияние значений поведенческих параметров на значения психофизиологических параметров, и, наоборот, на основе обнаружения эффекта опережающего отражения при анализе базы данных.

При подобной постановке значения а; т являются лингвистическими характеристиками кластеров, число которых определяется числом значений а,-,т. Пусть, для определенности Am={pi, р2, ... pq}, т.е. число значений поведенческого атрибута Ат, как и число кластеров, равно q. Очевидно, что каждый кластер pf, f=l, q, определяется теми записями ЄІ (i=l,N), в которых

Для решения поставленной проблемы перейдем от количественных значений атрибутов к лингвистическим значениям [83]. Для простоты изложения будем рассматривать два атрибута. Пусть ау, ЗІ+IJ, a;,m, a;+i m - значения атрибутов Aj, Am, зафиксированные в последовательные моменты времени і и i+1, причем aj7m=ai+iim. В этом случае значения ay, а1+ц принимаются за точки плана эксперимента на интервале INTi=[ci, di], границы которого неизвестны. Тогда, в соответствии с [84], координаты aij, ai+i j будут равны: числа Фибоначчи, которые определяются последовательностью Fo=Fi=l, Fk=Fk-i+Fk-i для к 1, причем к выбирается достаточно большим. Интервал INT!=[cb di] является первым приближением области определения некоторой лингвистической метки атрибута Aj. Пусть ai,m=ai+1,m==Pі - Тогда, в соответствии с [83], можно сформировать первую гипотезу, относительно влияния поведенческого атрибута на интервал значений психофизиологического атрибута, а именно pi- INTj. Если для последующих записей базы данных выполняются условия aj+ij, SL\+2J, ...GINTI=[CI, di], ai+i,m=ai+2,m-..=Pi, то данная гипотеза будет окончательной.

Принципы построения и структура интеллектуальной системы медико-биологического эксперимента

Многие проблемные задачи строятся на предположениях исследователей и выдвижения ими гипотез относительно природы и структуры анализируемой предметной области. К таким задачам относятся задачи поиска новых методов диагностики, лечения и управления на основе построения математических моделей предметной области. К числу подобных задач относятся задачи исследования динамики состояния человека-оператора в человеко-машинных системах, выявление информативных показателей оценки состояния и закономерностей между ними. Для решения такого рода задач требуется инструментарий адекватный по сложности поставленной задаче и позволяющий осуществлять проверку гипотез в ходе эксперимента с формированием системы знаний о предметной области. К числу таких инструментариев относятся интеллектуальные системы медико биологического эксперимента, в состав которых входят АРМ экспертов, взаимодействующих с подсистемами статистической и логико лингвистической обработки экспериментальных данных.

Одной из важных проблем исследований динамики состояния человека-оператора является слабая интерпретируемость экспериментальных данных традиционными формальными средствами. В этой связи системы медико-биологического эксперимента строятся на принципах конгломерата знаний экспертов, формальных моделей и методов анализа и синтеза экспериментальной информации.

Рассмотрим принципы построения, структуру и состав интеллектуальной системы медико-биологического эксперимента (ИСМБЭ), предназначенной для анализа показателей состояния человека-оператора и синтеза диагностирующих правил [87]. Основной целью ИСМБЭ является формирование и анализ гипотез относительно взаимодействия элементов функциональных систем человека-оператора, а также построение базы знаний, включающей выделенные и верифицированные экспертом состояния оператора при решении им типовых задач.

На рис.3.13 представлена структурная схема ИСМБЭ. Функционально ИСМБЭ делится на три программно-аппаратных модуля [87]: модуль съема и первичной обработки данных; модуль анализа гипотез и формирования закономерностей; модуль адаптивной поддержки принятия решений. В общем случае модуль съема и первичной обработки данных предназначен для съема психофизиологических параметров, параметров деятельности и поведения, и последующей вторичной обработки с целью получения показателей, являющихся функциями параметров. Модуль анализа гипотез и формирования закономерностей, на основе методов интеллектуальной обработки данных, формирует гипотезы относительно причинно-следственных отношений атрибутов и на их основе осуществляет построение базы знаний. Модуль адаптивной поддержки принятия решений анализирует текущее функциональное состояние человека-оператора и выдает рекомендации по выбору управляющих решений. Заметим, что каждый модуль функционирует во взаимодействии с экспертом. Подобное взаимодействие необходимо для уточнения оценок, сформированных на этапе интеллектуального анализа базы данных и корректировки базы знаний. ИСМБЭ строится на следующих основных принципах: системности подхода к анализу состояния человека-оператора и синтезу программно-аппаратных модулей; обучения в ходе решения типовых задач; адаптации к пользователю на основе оценки функционального состояния.

Функционирование ИСМБЭ осуществляется следующим образом. Человек-оператор решает типовую многошаговую задачу принятия решений (планирование, назначение, выбор, контроль, управление). На основе его индивидуальных приемов решения строится поведенческая модель. На следующем этапе оператор решает ту же самую типовую задачу, но в условиях разного рода помех. При этом в базу данных ИСМБЭ поступают значения показателей физиологии, психологического портрета испытуемого, характеристики тактики и стратегии при решении задачи. По этой информации на основе методов интеллектуальной обработки данных, ИСМБЭ строит, классифицирует и анализирует гипотезы, относительно типов взаимодействий элементов функциональных систем человека-оператора. Достоверные гипотезы поступают в базу знаний. На этом первоначальный этап обучения ИСМБЭ заканчивается. Следующий этап функционирования ИСМБЭ состоит в поддержке процесса принятия решений человека-оператора в зависимости от изменения его функционального состояния. Кроме этого ИСМБЭ выделяет те управляющие воздействия, которые могут перевести человеко-машинную систему в оптимальный режим функционирования. Данные процедуры осуществляются модулем поддержки принятия решений.

Рассмотренное функционирование ИСМБЭ предполагает два основных блока обработки информации. Первый связан с работой модуля съема и первичной обработки данных и модуля анализа гипотез; второй - с работой модуля адаптивной поддержки принятия решений. Отличительной особенностью первого блока является обработка числовых данных. Второй блок связан с обработкой знаний, т.е. информации в основном нечислового (символьного) характера. Работа первого блока предполагает параллелизм обработки данных, связанный как с разделением функций ИСМБЭ на этапе первичной обработки (обработка физиологических параметров, параметров деятельности и т.д. должна осуществляться параллельно), так и необходимостью обучения в апостериорном режиме (работа модуля анализа гипотез происходит и после формирования закономерностей с целью обучения и получения новых закономерностей, например, при появлении других задач). Для этого случая необходимо решать вопросы, связанные с ускорением и параллельной обработкой данных, исходя как из функционального параллелизма, так и из анализа структуры модулей, выделяя процедуры с максимальным по периодичности обменом данными и выполняющихся параллельно.

Похожие диссертации на Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора