Введение к работе
Актуальность проблемы. С начала 60-х годов усилия исследователей в области искусственного интеллекта были сконцентрированы на поиске общих методов решения широкого класса задач и использовании их в универсальных программах. Считалось, что на этом пути моделируется процесс мышления.
Однако, оказалось, что чем шире класс задач, которые предполагалось решать с помощью одной программы, тем беднее ее возможности при решении конкретной задачи. Кроме того, большинство практически важных задач возникает в сложных контекстах социальных или физических явлений, не поддающихся строгому и точному описанию. Специалисты, решая эти задачи, достигают высоких'результатов благодаря своему опыту к знаниям. Знания и методы, используемые специалистами одной области, не! обязательно переносимы на все остальные.
В конце 70-х годов возникло понимание, что если программы писать таким образом, что они смогут обращаться к этим знаниям и применять их, то они тоже достигнут высокого качества работы.
Это понимание означало возникновение новой парадигмы
решения задач разделение 'программы решения задачи на
собственно алгоритм и модель предметной области, которую стали называть базой знаний.
В базу знаний помещаются описания устойчивых связен и зависимостей между объектами предметной области и их совокупностями, в частности, связи между элементами1 условия задачи, информация об их важности, сведения о том, каким об-' разом эти связи и зависимости могут быть использованы.
Эта информация может носить разнородный характер: среди связей и зависимостей могут оказаться аналитические, количественные и качественные; среди информации о том, как это использовать, могут оказаться логические''гусловия, правила и эвристики; иногда задачу требуется решать при неполных исходных
-4-данных.
Чем большее количество такой информации будет вынесено за пределы алгоритма, тем проще описание собственно алгоритма, тем большее число задач решает алгоритм и тем легче эту информацию использовать для решения других задач.
С конца семидесятых годов вопрос построения базы знаний становится центральным в исследованиях по искусственному интеллекту.
В работе рассматриваются методы и научные основы технологии построения баз знаний, что и свидетельствует о ее актуальности.
Цель работы. Целью работы является создание теории и новой технологии построения баз знаний на основе не использованной ранее идеи установления соответствия знаний из различных источников структуре модели предметной области, позволяющей интегрировать их в единое представление.
Методы исследования. Предложенный в работе способ представления знаний описан и исследован с помощью средств общей теории алгебраических систем. Для решения некоторых проблем, связанных с выявлением знаний, использованы идеи когнитивной психологии и лингвистической семантики. Для построения интегрированных стратегий выявления знаний и решения других проблем построения баз знаний использованы методы теории алгоритмов, теоретического программирования, распознавания образов и другие методы теоретической информатики.
Использованные в работе понятия и подходы когнитивной психологии и лингвистической 'емантики уточнялись так, чтобы исключить более одного понимания; вся существенная информация, связанная с их использованием вводилась явным образом.
Научная новизна.
Предложена и теоретически обоснована новая архитектура инструментальных средств построения систем, основанных на знаниях.
Предложены интегрированные стратегии приобретения знаний из различных источников, в которых впервые, благодаря взаимодействию методов, слабые стороны одних методов приобретения знаний компенсируются сильными сторонами других.
Предложен новый аппарат для описания моделей предметных областей - неоднородные семантические сети, исследованы его свойства и обоснована адекватность.
Установлено соответствие объектов неоднородной семантической сети типам экспертных знаний.
Предложен метод прямого приобретения знании системой от экспертов на основе человеко - машинного диалога, управляемого синтаксисом языка представления знаний.
Предложена стратегия поиска отображения из множества
высказываний о предметной, области в множество отношений
неоднородной семантической сети. Показана корректность
стратегии и полнота ее в классе отношений неоднородной
семантической сети. ,..
Исследована семантика связей, выявляемых в процессе приобретения знаний.
Сформулирован эмпирический принцип наименьшей сложности экспертизы, описывающий устройство достаточно большого класса высказываний о предметной области.
Предложен принцип интерактивной компиляции модели предметноії области.
Практическая значимость. На основе результатов работы создано семейство новых, инструментальных средств построения систем, основанных на знаниях: SIMER, SIMER+MIR, SIMER+MIR+KAD, SIMER+MIR+KAD+TEXT, явившихся основой новых технологий построения систем, основанных на знаниях и позволяющих строить такие системы в режиме прямого диалога с экспертом предметной области (SIMER, SIMER+MIR), в режиме взаимодействия обучения на примерах с приобретением знаний от эксперта (SIMER+MIR+KAD), в режиме взаимодействия выявления знаний из текстами обучения на
примерах с приобретением знаний от эксперта предметной области (SIMER+MIR+KAD+TEXT).
Научные результаты работы использованы при выполнении тем:
1. Плана работ, утвержденных распоряжением Президиума
РАН: - ,
1.1 Разработка программных средств представления знаний в базах знаний (номер государственной регистрации 01870018859).
2. Государственной . научно-технической программы
"Перспективные информационные технологии":
-
N 637. "Реализация экспертных систем диагностики и выработки рекомендаций по лечению в области медицины" (шифр "ДИАГНОЗ") 1990 -1991г.г.-научное руководство.
-
N 638. "Разработка и реализация технологии создания экспертных систем ( шифр ТЕХНОЛОГИЯ ЭС") 1990 - 1991 г.г.- научное руководство.
-
N 855. "Методы и программные средства приобретения и интеграции знаний из различных источников" (шифр "ЗНАНИЯ") 1992-1993г.г.-научное руководство.
2.4. N 929."Разработка и реализация технологии создания
интегрированных интеллектуальных систем" (шифр*
"ТЕХНОЛОГИЯ ЭС") 1991 - 1993 г.г.-научное руководство.
3. Плана фундаментальных и прикладных поисковых
научно - исследовательских работ (Решение Государственной
комиссии N 58 от 24.04.91):
3.1. "Исследование и разработка базового программного обеспечения систем с элементами искусственного интеллекта'^ (шифр "КИОТ-АН") 1990 - 1993 г.г.-научное руководство. 3.2. "Исследование и разработка систем извлечения и накопления знаний" ( шифр "КИНЕСКОП - АН") 1990 1993 г.г.-научное руководство.
4. Межотраслевой научно-технической программы создания
прикладных систем искусственного интеллекта (Решение Коллегии
Комитета Российской федерации по информатизации, N 13 от
28.09.93):
4.1. Экспертная система прогнозирования неотложных состояний у
детей ("Надежда").
4.2. Экспертная система дифференциальной диагностики
генетических'заболеваний у детей ("Диагноз").
Апробация работы. Основные результаты работы докладывались на международных конференциях и семинарах по Проблемам и применению искусственного интеллекта (Варна, ВНР. 1987), по искусственному интеллекту и управлению роботами (Смоленице, ЧССР, 1987), по развитым диалоговым системам и анализу естественного языка (Сувалкн, ПНР, 1987), по методам искусственного интеллекта и их применению (Пхеньян, КНДР, 1988), по теории и применению искусственного интеллекта (Созопол, ВНР,1989), по методологии, системам и приложениям искусственного интеллекта (Албена, ВНР,1990), по приобретению знаний для систем, основанных на знаниях (Банфф, Канада, .1990), на советско-итальянском семинаре по системам, основанным на (Знаниях (Рим, 1990), на международной конференции по рассуждениям, основанным на знаниях (Пасифик Гропз, Калифорния, США, 1991); на всесоюзных конференциях по искусственному интеллекту в Переславле-Залесском (1988), Минске (1990), конференции по искусственному интеллекту стран СНГ в Твери (1992), на постоянно действующем семинаре по искусственному интеллекту в Переславле-Залесском (1987), на общемосковском семинаре по искусственному интеллекту (1989), на семинарах в Московском доме научно-технической пропаганды (1989, 1992), на республиканской цжоле-семинаре з Кишиневе (1987) и других семинарах и конференциях.
По теме диссертации опубликовано свыше 40 печатных работ (5 из них-за рубежом).
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и 3-х приложений, содержит 33 таблицы и 6 рисунков; список литературы - из 78 наименований. Основной текст изложен на 200 страницах.