Введение к работе
Актуальность темы Рост уровня технического и информационного обеспечения медико-биологических исследований увеличивает количество информации в повседневной работе Современный уровень информационного потока ограничивает время для наработки «опыта», продукта длительного осмысления полученной информации, который необходим для процедуры принятия решения (ППР) ПНР, основанная на анализе окружающей среды, можно отнести к трудно формализуемым проблемным ситуациям (Терехов С А , 1995, 1998, Фролов Ю В , 2000, Калмыков В Л и соавт , 2004, Дьяченко О А , 2006, Коренев-ский Н А , 2007, Мексон М X и соавт, 1995 и др) Так, ППР в области медико-биологических исследований имеет свои особенности, обусловленные описательным характером большинства данных, выражающихся с помощью формализмов, оценка которых бывает субъективной В биологии на организменном уровне случайность связана с сущностью самого биологического объекта и является его неотъемлемым внутренним признаком, заведомо характеризующим исследуемые процессы, в том числе при воздействии комплекса факторов Многофакторное воздействие в процессе формализации полученной информации ведет к имеющему сложный профиль ответу, далекому от линейной зависимости При этом статистические методы обработки информации не обеспечивают требуемой достоверности (Ежов А, Нечеткий В , 1997, Россиев Д А , 1998, Попов В И и соавт, 2000, Коре-невский Н А , 2001, 2004, Агуреев И Е , Атлас Е Е , 2007) Еще одним фактором, затрудняющим ППР, является то, что человеческий мозг не приспособлен для выполнения большого объема вычислений в процессе анализа сложных систем, состоящих из цепочек взаимосвязей, из-за чего при работе с комплексной и изменяющейся во времени информацией эффективность принятия решений снижается (Вертгеймер М, 1987,СолсоРЛ,1996)
Поэтому для лиц принимающих решения (ЛПР) необходимо умение использовать в своей работе системы, аккумулирующие опыт (интуицию) К ним относятся интеллектуальные системы (ИС) на базе искусственного интеллекта. Использование ИС для хранения и актуализации информации позволяет не только выявить наиболее значимые взаимозависимые факторы в больших массивах данных, но и избежать когнитивных деформаций, свойственных памяти человека (Попов Э В , Фоминых Е Б , 1996, Рыбина Г В, 2000, Уотерман Д , 1989, Эддоус М, Стенсфильд Р, 1997)
Одним из инструментов создания подобных систем служат искусственные нейронные сети (ИНС) ИНС - информационная технология, ориентированная на анализ сложных нелинейных задач, в частности,
на работу с образной информацией, удельный вес которой в информационном потоке постоянно растет Нейроинформационные технологии (НИТ) - новЬе междисциплинарное направление, связанное с созданием и внедрением в практику современных методов обработки информации, которые позволяют автоматизировать процесс анализа полученных результатов и формирования выводов Искусственные нейронные сети применяются для идентификации и классификации информации в случае ограниченных, неполных и нелинейных источников данных НИТ отличаются универсальностью одна и та же программа обеспечивает возможность работы в разных областях знаний Интеллектуальные системы на базе ИНС, в отличие от классических экспертных систем, основанных на жесткой логике, не нуждаются в перепрограммировании при изменении состава базы данных Эта особенность ИНС значима при постоянно увеличивающемся объеме информации в уже хорошо изученных областях Комплексное внедрение НИТ исключает необходимость привлечения сторонних специалистов (программистов, математиков и т п ) к ППР и интенсифицируют этот процесс Внедрение НИТ актуально для естественнонаучных дисциплин, связанных с обработкой и интерпретацией больших массивов слабоструктурированных и слабо формализованных данных (Горбань АН, Россиев Д А, 1996, Круглов В В , Борисов В В , 2001; Комарцова Л Г, Максимов АВ, 2002, Котов ЮБ, 2004; Haykin S 1994, Bishop С, 1995) Изучение НИТ становится неотъемлемой составляющей учебного процесса подготовки специалистов различного профиля и уровня компетенции, связанных с решением трудно формализуемых задач прогнозирования и классификации в слабо формализованных областях знаний (Поспелов Г С, 1988, Петрушин В А, 1992, Беспалько В П, 1995)
Цель исследования. Создание методологии использования НИТ для комплексного решения медико-биологических проблем на основе применения ИНС различных типов при обработке и интерпретации информации, а также в качестве инструмента унификации и минимизации набора информационных технологий для интеллектуализации учебного процесса
Задачи исследования:
Доказать возможность и целесообразность применения различных типов ИНС для обработки информации, полученной в ходе медико-биологических исследований, на широком спектре объектов и методов исследования
Разработать метод количественной оценки изучаемого множества с использованием ИНС
Разработать метод для решения задач моделирования, возникающих в ходе медико-биологических исследований с использованием ИНС.
4 Создать схему обработки массива трудноформализуемой информации с использованием ИНС
5. Создать экспертные системы на базе нейросетевых технологий для обработки информации, полученной в ходе биологических исследований
6 Подготовить методическую базу обучения (создать базы дан
ных и обучающие интеллектуальные системы на базе ИНС, разрабо
тать программы, методические пособия, систему оценки знаний по
овладению программными продуктами и их применению в практиче
ской деятельности)
7 Разработать психолого-педагогические приемы обучения и
внедрить их в учебный процесс
Научная новизна. Впервые разработана универсальная, комплексная и детальная методология применения ИНС для обработки и интерпретации информации, полученной в ходе медико-биологических исследований на широком спектре биологических объектов
Впервые разработана методология применения нейросетевых технологии для обработки и интерпретации результатов анализа элек-трофоретических спектров белков, молекулярных методов маркирования генома (RAPD и ISSR анализа) и цитогенетических исследований
Впервые разработан метод количественной оценки схожести исследуемых образцов в выбранной системе параметров, основанный на применении сети Кохонена
Впервые разработан подход по использованию сети Кохонена для решения задач моделирования, возникающих в ходе медико-биологических исследований
Впервые разработана комплексная методология преподавания нейроинформатики, как специального курса, при подготовке специалистов медико-биологического профиля
Научно-практическая значимость. Внедрение нейросетевых технологий в процесс обработки и интерпретации информации повышает объективность оценки результатов проводимых исследований и принимаемых на их основе решений и прогнозов.
Созданные научно-практические и учебные электронные базы данных применимы для развития теории и практики различных областей медико-биологических исследований, в частности, для идентификации видов ,по результатам цитогенетических исследований, преподавания ряда учебных дисциплин (биохимии, микробиологии, медицинской генетики, терапии и др )
Внедрение нейросетевых технологий в процесс обработки и интерпретации информации, полученной в ходе медико-биологических исследований, делает доступным анализ результатов сложных методов исследования (анализ электрофоретических спектров белков, методы
молекулярного маркирования генома, цитогенетическии анализ) для специалистов средней технической подготовленности (уровня компетенции), что способствует повышению их статуса в качестве ЛПР
Внедрение в практику результатов исследования. Основные результаты исследования, включая теоретические данные и разработанные методы, используются в научно-исследовательской работе Института общей генетики им Н И Вавилова РАН, в частности в рамках проекта Российского фонда фундаментальных исследований 06-04-08244 «Характеристика внутри и межпопуляционного разнообразия видов культурных растений с использованием интеллектуальных систем автоматического анализа генетически детерминированного полиморфизма белков (на примере пшеницы)», программы «Динамика генофондов растений, животных и человека» и в учебном процессе ряда учебных учреждений на территории РФ, в том числе и МГУ им М В Ломоносова
Апробация Результаты исследования доложены на международных и всероссийских конференциях, в том числе на IV и VI ежегодной сессиях НЦ ССХ им А Н Бакулева (Москва, 2000), научных конференциях МИФИ (Москва, 2000, 2001), «Second PEN/GIB workshop» (St Petersburg, Russia, October 2001); I национальной конференции «Информационно-вычислительные технологии в решении фундаментальных научных проблем и прикладных задач химии, биологии, фармацевтики и медицины» (ИВТН-2002) (Москва, 2002), VIII съезде генетиков и селекционеров республики Беларусь (Беларусь, 2002), VII Международной конференция по электронным публикациям «EL-Pub2002» (Новосибирск, 2002), II научной конференции, посвященной 115-летию со дня рождения Н И. Вавилова «Актуальные проблемы генетики» (Москва, 2003), II национальной конференции «Информационно-вычислительные технологии в решении фундаментальных научных проблем и прикладных задач химии, биологии, фармацевтики и медицины» (ИВТН-2003) (Москва, 2003), Международной научно-практической конференции «Информационные технологии в системе «Школа - ВУЗ» (Казань, 2005), XV Международной конференции-выставке «Информационные технологии в образовании» («ИТО-2005») (Москва, 2005), «Нейро-информатика 2006» (Москва, 2006), Всероссийской конференции, посвященной 60-летию ЦСБС (Новосибирск, 2006)
Работа апробирована на совместном заседании кафедры внутренних болезней Тульского государственного университета и Ученого совета Государственного унитарного предприятия «НИИ новых медицинских технологий», 2007
Публикации. По теме диссертационной работы опубликовано 39 печатных работ, из них монографий - 1, статей - 19, из которых 10 в рекомендованных ВАК России журналах, 3 учебно-методических пособия.
Структура и объем диссертации. Диссертация имеет общепринятую структуру, состоит из введения; трех глав, в которых представлен обзор литературы, объект и методы исследования, результаты собственных исследований и их обсуждение, заключения, выводов, практических рекомендаций, списка литературы, приложения Работа изложена на 220 страницах, иллюстрирована 31 таблицей и 66 рисунками Список литературы представлен 295 источниками (190 отечественных и 105 зарубежных авторов)
Основные положения, выносимые на защиту:
Нейросетевые технологии являются универсальным, естественным, адекватным и эффективным средством реорганизации и модернизации научно-исследовательской и практической деятельности в области медико-биологических исследований
Разработанный универсальный подход позволяет пользователю без привлечения посторонних специалистов (программистов, математиков и т п ) решать профессиональные задачи по обработке и интерпретации информации, полученной в процессе профессиональной деятельности
Разработанная схема работы с массивом трудноформализуе-мой информации приемлема для практического использования.
4. Нейроинформационные технологии представляют новую платформу для совершенствования и модернизации учебного процесса подготовки специалистов медико-биологического профиля Разработанная комплексная методология преподавания нейроинформатики может использоваться при подготовке специалистов медико-биологического профиля