Содержание к диссертации
Введение
Глава 1. Экспертные системы - путь к решению прогнозных задач
1.1. Современные информационные технологии в геологии 14
1.2. Общая постановка проблемы разработки экспертных систем
1.3. Типы знаний при геологических исследованиях 21
1.4. Обоснование оптимальности выбора гибридных экспертных систем
1.5. Методы получения знаний для наполнения экспертных систем
1.6. Основные этапы процесса приобретения знаний 27
1.7. Типы задач, к которым могут быть сведены прогнозные задачи в процессе формализации
Задачи распознавания образов 29
Задачи выявления связей параметрических характеристик между собой и с запасами металла
Задачи информационно-аналитические 35
1.8. Возможности использования экспертных систем для решения геолого-прогнозных задач
1.9. Заключение 40
Глава 2. Технология проектирования экспертных систем 41
2.1. Методология построения экспертных систем 41
2.2. Понятие базы знаний 42
2.3. Этапы разработки экспертных систем 43
2.4. Способы представления знаний 47
2.5. Сравнение способов представления знаний 49
2.6. Функциональные компоненты экспертных систем
2.7. Классификация экспертных систем 51
2.8. Виды работ при создании программной реализации экспертных систем
2.9. Особенности построения экспертных систем для прогнозной экспресс-оценки перспективных площадей Технология АСТРА 59
Технология АНАЛОГ 64
2.10. Когнитивная графика при экспресс-оценке 76і
месторождений, наиболее сходных с эталонными объектами ,
2.11. Заключение 78
Глава 3. Логико-информационное моделирование при прогнозно-металлогеническом анализе перспективных площадей
3.1. Особенности задач геологического прогнозирования 79
3.2. Общая методология моделирования 80
3.3. Основные этапы моделирования 83
3.4. Особенности логико-информационных методов , 85
3.5. Объекты прогнозирования и система их описаниям 87
3.6. Построение кибернетической модели» 88
3;7. Обобщенные логико-информационные методы 91
Оценка-информативности признаков 91
Алгоритмы построения решающих правил 95
Оценка устойчивости системы информативных признаков, качества и надежности решающих правил
3.8. Особенность решения прогнозной задачи в системе прогнозирования АСТРА
Построение зависимостей прогнозируемых- 104
параметров от геологических факторов,
гарантирующих-точность локального прогноза
Построение зависимостей, отражающих степень 106
проявления у объектов целевого свойства
3.9. Заключение 109
Глава 4. Экспертная система для оценки перспективности золото-серебряных объектов Охотско-Чукотского вулканогенного пояса
4.1. Постановка задачи и общая структура экспертной системы
4.2. Оценка потенциальных рудных районов 113
4.3. Оценка потенциальных рудных узлов 113
4.4. Оценка потенциальных рудных полей 116
Методика исследований 116
Результаты исследований
Автоматизированное распознавание формационных типов
Автоматизированное распознавание масштабов объектов
О достоверности классификации объектов в связи с их изученностью
Сценарий автоматизированной экспертной системы
Программная реализация экспертной системы для уровня рудного поля
Сравнение разработанной экспертной системы с известными аналогами
4.5. Оценка потенциальных месторождений 150
4.6. Оценка потенциальных рудных тел 152
4.7. Заключение 154
Глава 5. Экспертная система для оценки перспективности объектов золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России
5.1. Геологические условия локализации месторождений 155
5.2. Закономерности локализации месторождений 158
5.3. Общая структура экспертной системы 165
5.4. База знаний экспертной системы 168
Стадия I. Составление прогнозных карт масштаба 174
1:1000 000 - 1: 500 000. Объект прогноза -потенциальные рудные районы
Стадия II. Составление прогнозных карт масштаба 175
1:200 000. Объект прогноза - потенциальные рудные узлы Стадия III. Поиски масштаба 1:50 000 - 1:25 000 178
(подстадия общих поисков). Объект прогноза -потенциальные рудные поля
Стадия IV. Поисковые работы масштаба1:25 000 - 180 1:10 ООО.Объект поисков - потенциальные месторождения
.5. Программная реализация экспертной системы 185
5.6. Заключение 226
Глава 6. Информационно-аналитическая экспертная система оценки золоторудных месторождений на основе выбора объекта-аналога (АНАЛОГ)
6.1. Макет системы выбора аналогов золоторудных есторождений
Фактографическая база данных как информационная основа системы для принятия решения о выборе объекта-аналога
Структура системы выбора аналогов золоторудных месторождений
Сценарий программной реализации элементов системы
6.2. Графическая база данных как информационная основа
системы для принятия решения на основе знаний о
выбранном объекте-аналоге
Принципы составления набора графических материалов для характеристики золоторудных месторождений
Схема использования графической базы данных
6.3. Апробация информационно-аналитической системы АНАЛОГ
6.4. Заключение
Заключение
Список литературы
- Типы знаний при геологических исследованиях
- Способы представления знаний
- Особенности логико-информационных методов
- Программная реализация экспертной системы для уровня рудного поля
Введение к работе
Анализируя тенденции развития информационных технологий в геологии, можно отметить следующее: сначала наиболее бурно шел процесс перевода всех геологических данных в цифровой вид, сейчас эта задача становится неотъемлемой и обязательной частью внедрения компьютерных технологий, и на передний план выходят задачи анализа имеющихся данных, решение которых напрямую связаны с использованием информационных технологий. Это потребовало значительных работ по структуризации и стандартизации исходных данных [Гвишиани, 1995; Арский и др., 1998, 2007; Чесалов, 2005; Чесалов и др., 2006; Лаверов и др., 2008 и др.]. Унификация систем описания позволяет проводить сопоставление исследуемых объектов.
Первые шаги информационных технологий в геологии были связаны с задачей автоматизации рутинных операций, которая в настоящее время практически решена. Широкое распространение получили ГИС-системы [Рундквист и др., 1996; Наумова, 2004; Черемисина, Никитин, 2006; Черемисина, Суханов, 2008 и др.], что позволило производить анализ пространственного размещения геологических объектов и изучать распределение пространственной изменчивости наблюдаемых величин путем построения карт.
Следующим кардинальным скачком стало использование систем извлечения знаний (Data mining), нацеленных на поиск закономерностей в огромном наборе фактических данных. Эти методы позволили перейти от данных (совокупности сведений) к знаниям (закономерностям, значимым для пользователя-геолога). Ряд исследователей разрабатывали специальные методы для решения геологических задач [Дмитриев и др., 1966; Куклин, 1967; Константинов, 1973; Дмитриев, Красавчиков, 1977; Лбов, 1981; Бекжанов и др., 1987; Гвишиани, Гурвич, 1992; Воронин и др., 1996; Агаян и др., 2005; Тюпкин и др., 2006; Гвишиани и др., 2008 и др.]. Применение полученных научных результатов способствовало повышению эффективности этих решений, ускоряя процесс их принятия, и достоверности выводов.
Актуальность темы
Изучение рудных месторождений является одним из стратегических направлений геологических исследований, обеспечивающих развитие наук о Земле. Проблема прогноза и оценки рудных месторождений является актуальной, поскольку напрямую связана с расширением минерально-сырьевой базы, обеспечивающей экономическое развитие страны. Для решения этой проблемы необходимо использование современных геоинформационных технологий для повышения эффективности, точности и достоверности прогноза и оценки.
В настоящее время актуален переход от систем, оперирующих с данными с целью получения знаний, к системам, использующим знания для решения геологических задач. Назрела необходимость создания идеологии и методологии разработки экспертных систем современного уровня, целями которых являются совершенствование процедур анализа геологических ситуаций и повышение эффективности принятия решения пользователями в условиях неопределенностей.
В этой связи актуальна и важна проблема разработки информационных технологий для прогноза и оценки рудных месторождений на базе экспертных систем. Применение в этой области компьютерных технологий позволяет значительно упростить задачу исследователя и ускорить ее выполнение.
Цель работы
Основной целью работы является создание теоретических основ разработки гибридных экспертных систем для прогноза и оценки рудных месторождений.
Задачи работы
Для достижения этой цели решались следующие основные задачи:
-
Исследование принципов и методов создания экспертных систем.
-
Обоснование оптимальности гибридных экспертных систем для решения прогнозных задач.
-
Разработка технологии создания гибридных экспертных систем для решения прогнозных задач.
-
Разработка методов анализа геологической информации с целью извлечения знаний и построения математических моделей изучаемых объектов, исследования и описания их свойств.
-
Разработка компонентов программного и информационного обеспечения для реализации предложенной технологии с дружественным интерфейсом по отношению к пользователю.
-
Апробация предложенной технологии при создании экспертных систем для прогноза и оценки рудных месторождений.
Защищаемые положения
1. Разработаны научно-методические основы использования гибридных экспертных систем для решения задач прогноза и оценки рудных месторождений, в которых предусмотрено сочетание различных способов представления научных знаний (знаний экспертов; закономерностей, получаемых в результате обработки имеющейся базы данных). Гибридные экспертные системы, основанные на
комплексных базах знаний, обеспечивают непосредственное использование научных знаний в решении поставленных задач и являются инновационной информационной технологией.
-
Гибридные экспертные системы для прогноза и оценки рудных месторождений основываются на методологии теории распознавания образов. В зависимости от выбранного подхода: принципа общности свойств или перечисления объектов - предложены алгоритмы представления имеющихся знаний об объекте исследования и системы принятия решений.
-
Разработаны обобщенные логико-информационные методы анализа рудных объектов для изучения их многофакторных моделей. Они обеспечивают получение надежных результатов при идентификации объектов на основе многомерной оценки информативности разнотипных признаков и автоматизируют процесс построения элементов комплексной базы знаний гибридной экспертной системы. Разработан программный комплекс АСТРА, реализующий данные методы.
-
На базе теоретических основ разработки гибридных экспертных систем созданы специализированные экспертные системы АСТРА для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса, месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России, и система АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди эталонных золоторудных месторождений мира.
Методы исследования
Для разработки гибридных экспертных систем использованы методы создания баз данных, баз знаний, методы углубленного анализа данных (data mining), линейного программирования, системный анализ, многомерные статистические методы, моделирование, методы создания программного обеспечения.
Личный вклад в разработку проблемы и фактический материал
Многолетний опыт автора в области формализации геологических данных, применения и разработки математических методов и компьютерных технологий позволил создать базовую основу для настоящей работы.
Диссертация основана на теоретических исследованиях и результатах математического анализа данных, выполненных автором. Соответствующее программное обеспечение разработано автором.
Для апробации технологии разработки гибридных экспертных систем использовались материалы высококвалифицированных экспертов-геологов, принимавших участие в создании баз знаний соответствующих специализированных экспертных систем. База данных по золото-серебряным полям Охотско-Чукотского вулканогенного пояса подготовлена д.г.-м.н. М.М.Константиновым и С.Ф.Стружковым. База данных по рудным объектам золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России составлена под руководством к.г.-м.н. Г.М.Курбанаева. База данных по золоторудным месторождениям мира подготовлена под руководством д.г.-м.н. М.М.Константинова.
Формализация, структуризация, и представление знаний в
разработанных гибридных экспертных системах проведены совместно с
экспертами-геологами. Программное обеспечение для
функционирования экспертных систем разработано совместно с Хмелевой Н.А., Поляковым Р.С., Покровским Д.А.
Научная новизна работы
Теоретически обоснована технология разработки гибридных экспертных систем для прогноза и оценки рудных месторождений.
Создана методика решения прогнозных задач на основе предложенной технологии разработки гибридных экспертных систем.
Впервые разработаны обобщенные логико-информационные методы анализа геологической информации, обеспечивающие извлечение знаний для решения прогнозных задач.
Предложены оптимальные процедуры хранения разнотипной геологической информации.
Созданы специализированные экспертные системы для прогноза и оценки рудных объектов.
В качестве информационной основы для характеристики эталонных объектов при выборе ближайшего аналога в экспертных системах предложено использовать помимо фактографической и графическую (включающую когнитивную графику) базы данных.
Практическая ценность
Теоретическое обоснование создания гибридных экспертных систем является научно-технической основой для разработки экспрессных технологий оценки прогнозных ресурсов и выявления перспективных площадей, позволяющих на самых ранних стадиях геоло-6
гических работ дать заключение о металлогенической специализации района, массива или месторождения и его перспективности.
Использование специализированных экспертных систем, разработанных на основе предложенной технологии, обеспечивает достоверность и надежность решения задач стратегической оценки территории России в отношении распределения площадей, перспективных на обнаружение различных генетических типов стратегических видов полезных ископаемых, и тем самым способствует минимизации финансовых затрат на проведение прогнозных и оценочных работ.
Полная апробация технологии проведена на материале по золоторудным объектам.
Созданы специализированные экспертные системы АСТРА для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса и месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России.
Создана информационно-аналитическая экспертная система АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди эталонных золоторудных месторождений мира, информационной основой которой являются две базы данных: фактографическая - позволяющая хранить и анализировать количественную и качественную информацию об эталонных и экспертируемых объектах, и графическая – содержащая визуализированную информацию об эталонных месторождениях.
Апробация работы
Основные положения и результаты исследований докладывались и обсуждались на следующих международных и отечественных симпозиумах, форумах, конференциях, семинарах, совещаниях: Научно-практические конференции “Научно-технические достижения ЦНИГРИ в 1991 г.”, “НТД-92-ЦНИГРИ”, “НТД-96-ЦНИГРИ” (Москва, ЦНИГРИ, 1991, 1993, 1997); IX Всесоюзное совещание по геологии россыпей (Бишкек, 1991); Всесоюзное совещание “Теоретические основы выявления новых источников рудного сырья” (Москва, 1991); Международный форум информатизации-93 (Москва, Международная Академия информатизации, 1993); Симпозиум “Рудноформационный анализ – состояние и перспективы” (Москва, 1996); Конференция “Мировая минерально-сырьевая база алмазов, благородных и цветных металлов на рубеже веков – перспективы использования и воспроизводства” (Москва, ЦНИГРИ, 1998); 3-я Всероссийская научно-практическая конференция “Геоинформатика в нефтегазовой и горной отраслях” (Москва, РАГС, 2000); Годичное собрание минералогического общества при РАН и Школе “Геологические и минералогические критерии крупных и уникальных месторождений” (Санкт-Петербург, 1994); Годичная сессия
МО ВМО “Минералогия на пороге XXI века” (Москва, 1996, 2005); IX
съезд ВМО “Минералогическое общество и минералогическая наука на
пороге XXI века” (Санкт-Петербург, 1999); ХII Международное
совещание “Природные и техногенные россыпи и месторождения кор
выветривания на рубеже тысячелетий” (Москва, ИГЕМ РАН, 2000);
Международный семинар по дискретной математике и ее приложениям
(Москва, МГУ, 1993, 1995, 2001); XIV международная конференция
“Проблемы теоретической кибернетики” (Пенза, 2005); IX
международной конференции "Интеллектуальные системы и
компьютерные науки". (Москва, МГУ, 2006); Конференция, посвященная
10-летию РФФИ (Москва, ИГЕМ РАН, 2002); Международный симпозиум,
посвященный 100-летию со дня рождения А.Г.Бетехтина “Основные
проблемы в учении о магматогенных рудных месторождениях“ (Москва,
1997); 4-я, 6-я, 9-я и 10-я Международные конференции “Физико-
химические и петрофизические исследования в науках о Земле”
(Москва, ИГЕМ РАН, ОИФЗ РАН, 2003, 2005, 2008, 2009); V
Международный конгресс по математическому моделированию (V
ICMM) (Дубна, JINR, 2002); 30-й – 33-й Международные геологические
конгрессы (Пекин, Китай, 1996; Рио де Жанеро, Бразилия, 2000;
Флоренция, Италия, 2004; Осло, Норвегия, 2008); 1-й, 3-й – 6-й
Европейские конгрессы по региональной геологической картографии и
информационным системам (Болонья, Италия, 1994; Мюнхен, Германия,
2000; Болонья, Италия, 2003, Барселона, Испания, 2006; Мюнхен,
Германия, 2009); Ежегодные конференции Международного общества
по математической геологии (Барселона, Испания, 1997; Неаполь,
Италия, 1998; Берлин, Германия, 2002; Портсмут, Великобритания, 2003;
Торонто, Канада, 2005; Льеж, Бельгия, 2006); Симпозиумы ассоциации
генезиса рудных месторождений (IAGOD) (Пекин, Китай, 1994; Москва,
2006); V и VI Международные Симпозиумы по применению
математических методов и компьютеров в геологии, горном деле и
металлургии (Дубна, Россия, ВНИИГеосистем, 1996; Прага, Чехия,
1997); Международная конференция “Computerized modeling of
sedimentary systems” (Густров, Германия, 1996); Генеральная ассамблея
Европейского геологического союза (Вена, Австрия, 2008); Совещание
“Компьютерные технологии ведения геологоразведочных, рудничных и
экологических работ” (Москва, ВНИИХТ, 1998); IX рабочее совещание по
созданию Государственного банка цифровой геологической информации
(ГБЦГИ) (Москва, ГлавНИВЦ, 1995); Рабочий семинар “Информационные
технологии при производстве геологоразведочных работ. Современное
состояние и перспективы развития” (Москва, Геоинформсистем, 2007);
Международная конференция, посвященная 250-летию
Государственного геологического музея имени В.И.Вернадского РАН «Геология: история, теория, практика» (Москва, 2009).
Публикации
По теме диссертации опубликовано 153 работы, 27 из которых – в реферируемых журналах, 2 – в международных журналах, 44 - в сборниках материалов международных конференций.
Структура и объем работы
Во введении автором обосновывается актуальность темы диссертации, определяются основные задачи и цели работы и приводится перечень фактических материалов, которые положены в основу разработанных гибридных экспертных систем.
ГЛАВА 1. Экспертные системы – путь к решению прогнозных задач
В Главе 1 дана общая постановка проблемы разработки
экспертных систем и их возможностей для решения задач при
прогнозно-металлогенических исследованиях. Обоснована
необходимость использования гибридных экспертных систем при решении задач прогноза и оценки рудных месторождений.
В настоящее время интенсивно разрабатываются и находят практическое применение для решения прикладных задач в области геологии экспертные системы (ЭС). Под экспертной системой понимается компьютерная программа, использующая знания и логику рассуждений эксперта с целью выработки рекомендаций или решения проблем. ЭС способствуют получению обоснованной оценки перспективных площадей и переоценки ранее открытых месторождений, обычно проводящейся при учете прироста запасов.
Использование ЭС весьма удобно для геолога. Пользователь работает с системой в режиме диалога и, в случае необходимости, может получить нужные ему пояснения о ходе логического вывода.
Наиболее эффективными в этом направлении являются гибридные экспертные системы, база знаний которых включает не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных.
Впервые понятие гибридных экспертных систем было введено Г.С.Поспеловым в 1977 г. []. Гибридные экспертные системы позволяют использовать преимущества традиционных средств и методов искусственного интеллекта, более эффективно соединять формализуемые и неформализуемые знания за счет интеграции традиционных средств искусственного интеллекта.
Использование знаний квалифицированных экспертов позволяет распространить их среди менее квалифицированных специалистов, обеспечивая получение обоснованных решений, рекомендуемых экспертной системой. Последовательность этапов процесса принятия решения может быть прослежена в ходе анализа работы блока принятия решения системы.
Прогнозная задача была первой среди геологических задач, для решения которой использовалась технология экспертных систем. В этом случае основой прогнозирующей системы являются многофакторные модели рудных объектов, в том виде, как они представляются геологам. Согласно принципу последовательной детализации в качестве основных пространственных прогнозно-металлогенических таксонов, как объектов исследования, выделяются металлогеническая зона, рудный район, рудный узел, рудное поле, месторождение.
Экспертная система позволяет на основе использования разнообразных методов и методик решать ряд разнообразных задач в процессе реализации общей технологической схемы решения прогнозных задач. В качестве основных задач прогноза и оценки рудных месторождений выделяются: определение рудно-формационного типа месторождений и оценка их масштабности. Правила проведения прогнозной оценки перспективной территории формулируются экспертом-геологом или рассчитываются по эталонным объектам базы данных, что повышает объективность результата.
В базу знаний ЭС помещается вся геологическая информация, характеризующая объекты исследования. ЭС имитирует процесс принятия прогнозных решений специалистом-геологом, давая по ходу решения необходимые пояснения.
Методика получения знаний от экспертов представляет собой совокупность следующих процедур:
сбор первичной информации, на основе данных диагностических методов, получивших положительную оценку эксперта в результате практической деятельности;
использование опыта и знаний экспертов для совместной разработки и создания ситуационной модели, а также определение правил исследования;
совместная оценка полученных результатов исследования и целесообразности развития и использования системы принятия решений.
Подход к построению системы на основе приобретения знаний от экспертов содержит такие этапы как идентификация, концептуализация, формализация, реализация, тестирование. Индивидуальность подхода заключается в принципах, которые реализуются на каждом из перечисленных этапов.
На этапе идентификации для разработки ситуационной модели определяются задачи, которые подлежат решению. Выявляются цели разработки, состоящие в получении системы принятия решений для анализа и оценки ситуаций в поставленной задаче. Определяются вычислительные ресурсы и группы экспертов по решаемой задаче.
На этапе концептуализации производится анализ проблемной области с участием экспертов, создается ситуационная модель; определяется метод решения задач, проектируется структура баз данных для хранения имеющейся информации.
На этапе формализации создается модель анализа и оценки ситуаций, база данных, алгоритмы, которые обеспечивают необходимые расчеты.
На этапе реализации выбирается программная среда для разработки приложения, происходит преобразование формальных знаний в работающие программы по анализу и оценке ситуаций, а также по работе с используемыми структурами данных. Осуществляется наполнение базы знаний системы.
На этапе тестирования проводится совместная с экспертом
проверка работы созданного варианта системы на конкретных задачах.
В процессе тестирования анализируются возможные источники ошибок.
В ходе сбора данных, предназначенных для решения задач,
происходит процесс их преобразования в знания, необходимые для
получения результата (рис. 1). От качества базы знаний целиком зависит успех в решении задач, поставленных перед экспертной системой.
Направление по созданию экспертных систем в геологии развивается сравнительно давно. Среди ЭС, успешно применяемых в геологии, следует отметить ЭС для решения прогнозных задач:
1. PROSPECTOR – для оценки
перспективности района на различ
ные виды полезных ископаемых [Duda
et al., 1979];
2. DRILLING ADVISOR - при
бурении геологических разведочных
скважин [Hollander, Iwasaki, 1983].
Рис. 1. Схема процесса преобразования «данные-информация-знания-решения» (по [Попов и др., 1996], с дополнениями)
3. ГЕНЕЗИС – для
автоматизации технологии построе
ния и использования прогнозно-
поисковых комплексов (ППК) [Бугаец и
др., 1986; Вострокнутов 1999, 2006];
4. SERGE – для классификации
геохимических аномалий при поисках
твердых полезных ископаемых
[Bonnefoy et al., 1989];
-
ГЕО – для регионального прогноза свинцово-цинковых месторождений Болгарии [Гитис и др., 1989];
-
ОЛОВО – для оценки оловянных месторождений [Родионов, Сыркин, 1995];
7. Экспертная система для статистического прогнозирования
средних и крупных месторождений [Zhao et al., 1996].
8. Прогнозный блок системы ГИС-INTEGRO [Черемисина,
Финкельштейн, 1999];
9. Экспертная система для оценки масштабов вольфрамового
оруденения [Митрофанов и др., 2008].
Все упомянутые выше экспертные системы опирались на базу знаний, построенную на основе получения знаний от эксперта и дальнейшего их структурирования, что является достаточно разработанной процедурой [Васильев и др., 2007; Арский, Финн, 2008 и др.].
В 1991 г. при создании автоматизированных прогнозно-поисковых комплексов автором впервые была применена технология построения гибридных экспертных систем, использующих базы знаний, включающие не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных по исследуемым геологическим объектам [Чижова, 1991; Чижова и др., 1991].
Использование экспертных систем достигло определенных результатов. Например, с помощью ЭС PROSPECTOR открыто месторождение молибдена, оцениваемое примерно в 100 млн. долл. Но некоторые исследователи отмечали и недостатки [Король, Сопель, 1988]. Например, большинство ЭС рассчитано на использование новичками, а если пользователь является квалифицированным специалистом, его знания играют пассивную роль или игнорируются.
В консультирующих и обучающих системах это оправдано, в других такая возможность активизации знаний специалистов используется. Например, в разработанной автором системе АНАЛОГ [Чижова и др., 2009] возможен поиск аналога по любому набору признаков, выбранному в ходе экспертизы, что позволяет пользователю проверять сформулированные им различные гипотезы и сравнивать эффективность различных критериев. Современные технологии обеспечивают построение дружелюбного интерфейса.
Таким образом, выбирая соответствующую технологию разработки экспертных систем, в каждом конкретном случае можно в итоге получить оптимальную систему.
Разработанные обобщенные логико-информационные методы для решения прогнозно-металлогенических задач [Чижова, 1991, 2010] обеспечивают построение процедуры получения методического (расчет разделяющих весов признаков, получение модели типов эталонных объектов) и теоретического (расчет информационного веса
экспертируемого объекта по рассчитанным весам признаков) знаний. Полученные знания дополняют имеющиеся интуитивные (эвристические) и фактические знания об объекте исследования. Интуитивное знание (и), систематизированные научные факты (ф), разработка методов создания, проверки и фиксации знания (м) и теоретические конструкции (т) учитывают множество элементов научного знания [Шарапов, 1995]. Поэтому с позиций системного анализа база знаний систем, включающая в себя все типы знаний, является наиболее развитой.
Учет знаний экспертов и закономерностей, полученных в результате математической обработки данных, обеспечивает построение надежных комплексных баз знаний об объекте исследования, способных решать сложные задачи прогноза и оценки.
Гибридные экспертные системы, основанные на комплексных базах знаний, могут быть рассмотрены как связующее инновационное звено между наукой и практикой, поскольку фундаментальные знания, содержащиеся в базах знаний ЭС, принимают непосредственное участие в процессе принятия решения. Поэтапность процесса принятия решения может быть прослежена в ходе анализа работы блока принятия решения системы.
Принципиальным преимуществом использования методологии ЭС является возможность представления «реальных» профессиональных знаний в виде многофакторных моделей. ЭС позволяют использовать всю сумму геологических знаний о размещении месторождений полезных ископаемых конкретного типа, накопленных в металлогенической теории, что позволяет существенно увеличить эффективность прогноза, повысить его точность и надежность.
Процесс актуализации (периодического обновления) баз данных, используемых для извлечения знаний, обеспечивает получение более полных и точных баз знаний.
Важнейшей чертой ЭС является переход от математических методов обработки информации к логическим.
Анализ имеющихся подходов к созданию методологических основ поиска и разведки месторождений с позиции выделения и типизации задач, решаемых на отдельных этапах и стадиях поисково-разведочного процесса, а также эффективного применения математических методов и ЭВМ показал, что наиболее конструктивен подход [Воронин, 1983], в котором основными теоретическими элементами являются схема разбиения на стадии и этапы, а также используемые на отдельных этапах и стадиях приемы описания геологических объектов, способы их классифицирования, районирования, сравнения, упорядочения. Именно этот подход и рекомендуется при создании дерева решений экспертных систем для прогноза и оценки рудных месторождений.
ГЛАВА 2. Технология проектирования экспертных систем
В Главе 2 сформулированы основные принципы построения экспертных систем, обосновано, что тип гибридных экспертных систем наилучшим образом соответствует решению прогнозных геологических задач, поскольку дают возможность использовать знания квалифицированных экспертов-геологов и объективные закономерности, полученные в результате математического анализа имеющегося фактического геологического материала по объектам исследования на различных иерархических уровнях. Предложены 2 пути построения гибридных экспертных систем: на принципе общности свойств (АСТРА) и перечислении объектов (АНАЛОГ).
Основными принципами для построения распознающих систем являются принцип общности свойств (тип 1) и принцип перечисления (тип 2) [Ту, Гонсалес, 1978; Уотерман, 1989]. В первом случае, опираясь на принцип общности свойств, основанный на предположении, что объекты, образующие один класс, обладают свойством подобия, отраженного в их характеристиках, необходимо выделить системы информативных признаков, описывающих группу объектов в целом (отождествляющие признаки) и каждый тип в отдельности (делящие признаки), и на их основе построить решающее правило для отнесения экспертируемого объекта к одному из выделенных типов объектов. Во втором случае используется некоторая мера сходства для определения степени близости экспертируемого объекта к одному из эталонов. При этом возможен выбор ближайшего аналога экспертируемого объекта из эталонных объектов, содержащихся в базе данных, по любому набору признаков, что дает возможность пользователю проверять различные гипотезы и сравнивать эффективность работы выбранных критериев.
Экспертная система предназначена для помощи эксперту в оценке потенциала перспективных площадей. Автором разработаны технологии построения экспертных систем, базирующиеся на принципе общности свойств (АСТРА) и принципе перечисления объектов (АНАЛОГ) [Чижова, 2009]. В первом случае используются расчетно-логические решающие правила, полученные обобщенными логико-информационными методами, во втором случае используется некоторая мера сходства [Чижова, 2004], с помощью которой выбирается объект-аналог для оценки свойств экспертируемого объекта.
Особенности построения баз знаний при использовании этих подходов представлены на рис. 2. Различия заключаются в выборе способов описания объектов исследования и их типов, вида расчетных функций и решающих правил.
Механизм вывода решений использует правила типа "И", "ИЛИ", "Байеса" и решающие правила на основе весовых коэффициентов.
Рис. 2. Особенности структуры базы знаний экспертной системы при использовании различных принципов ее построения
Любые сложные правила должны быть понятными – это позволяет избежать опасных ошибок. Правила формулируются экспертом или представляются в виде линейной функции.
Различие заключается лишь в том, что в первом случае все весовые характеристики (информативность признаков, истинность, логическая необходимость, логическая достаточность) задаются экспертом, а во втором - они рассчитываются исходя из анализа описаний эталонных объектов, имеющихся в базе данных.
При этом используется следующая технология:
1. Формируется конкретная цель (например, оценить масштабность
оруденения);
2. На основании схемы решения целевой задачи экспертом
формируется матрица переходов логических блоков, отражающих
последовательность решения задачи;
3. Для каждого блока формируется эталонная выборка объектов,
характеризующая все возможные их состояния (например,
рудопроявления, мелкие, средние, крупные месторождения);
4. Для каждого логического блока формируется устойчивая
система информативных признаков (полный и сокращенный вариант) с
оценкой их значимости и набор простых и надежных решающих правил
(обеспечивающих также и обработку ответов типа "не знаю") перехода системы в следующий логический блок.
В блок формирования результатов и оценки их достоверности целесообразно помимо результатов решения задачи ввести оценку степени изученности объекта исследования, а в случае его недоизученности дать рекомендации по рациональному комплексу методов проведения геологоразведочных работ.
С использованием технологии АСТРА создано несколько специализированных гибридных экспертных систем. Среди них специализированная экспертная система для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса (С.Ф.Стружков, М.М.Константинов, И.А.Чижова), специализированная экспертная система для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России (Г.М.Курбанаев, И.А.Чижова, Н.А.Бакшеев, Ю.И.Лебедев), описанные в главах 4 и 5 диссертационной работы, а также “Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Магаданской области" (Е.В.Матвеева, Ю.И.Гольдфарб, А.В.Стефанский, И.А.Чижова, Н.А.Хмелева), “Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Юго-Восточной части Алданского щита" (Е.В.Матвеева, И.А.Чижова, Н.А.Хмелева).
Технология АНАЛОГ апробирована при создании информационно-аналитической системы для поиска ближайшего аналога золоторудных объектов среди золоторудных месторождений мира и решения прогнозно-металлогенических задач по методу аналогий (М.М.Константинов, И.А.Чижова, С.Ф.Стружков, Д.А.Покровский). Система описана в главе 6 диссертационной работы.
ГЛАВА 3. Логико-информационное моделирование при прогнозно-металлогеническом анализе перспективных площадей
Глава 3 посвящена описанию обобщенных логико-информационных методов, специально разработанных для решения прогнозных задач. Результаты применения методов легко структурируются, что облегчает их использование в базах знаний.
Достоинством логико-информационных методов является то, что они специально разработаны для исследования сложных объектов со слабо формализованными признаками, имеющими неясную иерархию. Они позволяют получать определенные выводы даже при небольших объемах исходных данных, поскольку учитывают информацию, полученную не только по каждому признаку, но и по их сочетаниям, что является их преимуществом при обработке информации,
являющейся, в основном, бинарного типа (т.е. признаки принимают значения 0 (нет) или 1 (да)). Одна из важных задач, решаемых с их помощью, - определение комплекса существенных (связанных с поставленной задачей) признаков. Впервые решение такой задачи для случая бинарной информации при одинаковом числе эталонов в классах без оценки надежности предложенного способа было предложено Р.М.Константиновым [1973] и С.В.Сиротинской [1975]. Область применимости предложенных алгоритмов была ограничена: обучение проводилось на бинарной информации на таблицах, содержащих одинаковое число эталонных объектов в каждом классе.
Поэтому возник вопрос о дальнейшем развитии логико-информационных методов с целью возможности их использования при анализе не только бинарной, но и качественной (бальной) и количественной информации, описывающей объекты исследования, получением оценки надежности построенных решающих правил, простой интерпретируемости результатов, моделирования описаний еще не открытых объектов исследования с заданными целевыми свойствами. В настоящей работе предложено дальнейшее развитие в рамках комбинаторно-логического подхода способа выявления системы существенных признаков, отличительной особенностью которого является одновременный учет информации о максимальном различии объектов из разных классов, сходстве объектов в пределах класса, упорядоченности классов, взаимосвязи признаков, постоянстве их связи с изменением целевого свойства.
Логико-информационные методы специально разработаны для решения задач распознавания образов, в котором классы объектов упорядочены по некоторому монотонно-изменяющемуся целевому свойству. Они позволяют: (1) среди многих предполагаемых рудоконтролирующих факторов выбирать те, которые связаны с изучаемым свойством объектов; (2) количественно оценить степень влияния каждого из них на это свойство; (3) определять среди них постоянные и переменные факторы. Как методы исследования многофакторных геологических систем, логико-информационные методы позволяют по-новому подойти к изучению факторов, связанных с особенностями рудных месторождений.
Прогнозно-металлогенические исследования основываются на изучении геолого-структурных, магматических и иных металлогениче-ских факторов, физико-механических и химических свойств вмещающих пород, а также многих других особенностей рудной минерализации. Использование этих факторов при прогнозах требует систематизации и сопоставления огромного количества различных наблюдений, объем которых по мере развития геологических исследований и совершенствования их методов непрерывно увеличивается.
Смысл моделирования заключается в том, что по результатам опытов на модели судят о явлениях, происходящих в природе. Основные принципы моделирования, направленного на решение задач геологоразведочного производства, сводятся к следующему [Константинов, 2005]:
-
Моделирование имеет целевой характер. Иначе говоря, необходима четкая постановка задачи, под которую должна создаваться соответствующая модель.
-
Моделирование имеет многоуровневый характер. Необходимо создание системы моделей, отвечающей задачам прогнозирования, поисков и оценки. Система разноранговых или разноуровневых моделей работает не только как метод «последовательных приближений», но и от частного к общему.
-
Моделирование должно быть многофакторным, т.е. модель должна включать максимально возможное количество элементов, для того чтобы иметь возможность заменять те или иные методы, необходимые для опознания объекта исследования.
-
Месторождения моделируются не по элементам (золото, свинец и т.п.), а по конкретным рудно-формационным и геолого-промышленным типам. Общепринятое понятие рудной формации, как группы месторождений со сходными минеральными ассоциациями и близкими геологическими обстановками нахождения, позволяет с научной точки зрения корректно осуществлять анализ перспектив новых, слабоизученных территорий.
Несомненно, созданная система моделей должна постоянно адаптироваться как к возможностям новых аналитических и поисковых методов и технологий, так и к локализации и уточнению задач, возникающих в практической геологии.
Поскольку реальный механизм взаимодействия рудоконтролирую-щих факторов во многом неясен, поиски решения возникшей проблемы целесообразно проводить путем построения и исследования самых общих кибернетических моделей, в которых различается "вход", "преобразователь" ("черный ящик") и "выход". Такие модели позволяют перейти от тождества функций рассматриваемых объектов к тождеству определенных соотношений в структурах объектов и оценить роль отдельных элементов в этих структурах.
Кибернетическая модель предполагает, что признаки, входящие в систему описания объекта исследования, косвенно связаны с целевым свойством, и надо лишь выделить среди них существенные и оценить их важность для решения прогнозной задачи.
Для построения модели можно выделить следующую последовательность действий:
-
Составление шкалы признаков для описания объектов исследования. Шкала признаков разрабатывается в соответствии с существующими геологическими представлениями об объекте исследования и должна учесть все факторы, влияющие на изучаемое свойство объектов. Естественно, что эта шкала должна отвечать масштабу исследований, уровню изученности прогнозируемых объектов.
-
Cоставление основной таблицы типа “объект-свойство” для эталонных и контрольных объектов. В таблицу сводятся в соответствии с принятой шкалой характеристики исследуемых геологических объектов. Такие таблицы являются информационной базой для дальнейших исследований.
-
Выделение из таблицы эталонных объектов и изучение их вариационных рядов. Изучаются закономерности изменения значений признаков у разных классов эталонных объектов, выделенных по значениям целевого свойства.
-
Оценка значения моделируемого свойства экспертируемого объекта на основе полученных расчетов. Правильность решения поставленной задачи подтверждается, если информационный вес объектов (сумма разделяющих весов признаков для характеристики эталонных и контрольных объектов) изменяется в том же порядке, что и исследуемое целевое свойство. Если такая закономерность установлена, то найденные разделяющие веса признаков могут использоваться для прогнозной оценки соответствующих геологических объектов.
Кибернетическое моделирование позволяет выбрать такую геологическую информацию, которая действительно необходима для прогнозов, а затем дать ей содержательную и количественную оценку.
Анализ разработанных ранее способов оценки информативности признаков в задачах распознавания, предложенных разными авторами (А.Н.Дмитриевым, Ю.И.Журавлевым, Ф.П.Кренделевым, Р.М.Константиновым, С.В.Сиротинской, Ю.А.Васильевым, В.О.Красавчиковым и др.), позволил сформулировать основные предположения, на которых базируется предлагаемый способ оценки информативности признака относительно изменения степени проявления целевого свойства:
-
Если направленному изменению целевого свойства соответствует такое же направленное изменение геологических характеристик, то это свидетельствует об их связи, причем отсутствие признака несет не менее полезную информацию, чем его наличие. Впервые такое представление было использовано в методе вариационных рядов Р.М.Константиновым [1973].
-
Принцип общности свойств: образы, принадлежащие одному и тому же классу, обладают рядом общих свойств или признаков, отражающих подобие таких образов.
На основе вариационных рядов и принципа общности свойств предлагаются функции для оценки информативности признака, характеризующие степень его близости к признакам, описывающим соответственно однородность выборки (тип О), специфичность классов (тип К), степень изменения целевого свойства (тип М). Выделенные типы признаков представляют интерес для исследователей в процессе решения прогнозной задачи.
Выделение существенных (информативных) признаков (алгоритм
MYVES). Для выделения общих свойств классов (тип О) предлагается
следующая функция информативности признака:
м t м { —
АР]0 = у[ D} (і,
i=\ i=\
где (сг1,сг2,...,сгМ) = (l,l,...,l); a, - отрицание значения at.
Dj(i,
признака j, равное
Для выделения признаков, описывающих специфичность классов (тип К), используется функция:
АР.к = у[ Dj (і, o-J-Yl Dj (і,
z'=l i=\
где (o-1,
Dj(i,o-i) - доля объектов в классе /, принимающих значение
признака j, равное Gt;
APJk - характеризует информативность признака j для выделения
объектов класса К.
Для выделения признаков, описывающих изменение целевого свойства (тип М), используется функция:
і К м
^=0 1=2
C71,C72,...,C7l_1=K
(Т/,(Т/_2,...,СГМ =\-K
Dj(i,o-i) - доля объектов в классе /, принимающих значение признака j, равное <тг;
APjM - характеризует информативность признака j относительно
изменения целевого свойства.
Все указанные функции рассчитываются для бинарных признаков и имеют диапазон изменения [-l,+l], принимая экстремальные значения при проявлении соответственно О, К, М - свойств. Введенные функции
позволяют ранжировать признаки относительно проявления у них полезных свойств и выявлять тенденцию этой связи (положительную или отрицательную).
Минимизация системы информативных признаков проводится за счет выбора порога информативности. Используется следующее
правило выбора информативных признаков: если Р >є, то признак
информативен; если Р <є, то признак отбрасывается. Значение порога
є определяется априорно. Чем ближе значение функции к 1, тем сильнее у признака проявлены, соответственно, О, К, М - свойства.
Перекодировка количественной информации в бинарную (алгоритм VIBOR). Если имеется как количественная информация, так и качественная, то ее можно свести к одному типу - бинарному (со значениями 0 или 1) с минимальной потерей информации относительно решаемой задачи (отбора информативных признаков относительно О, К или М - свойств). Предлагается алгоритм перекодировки, который преследует цель: выделение из области изменения признака j некоторого характерного интервала (интервал-индикатор признака у). Этот интервал обладает свойством: при перекодировке значений из этого интервала в 1, а значений, не входящих в этот интервал, в О, получаем максимальное значение соответствующей информативной функции ДР-, по отношению к любым другим интервалам из области
изменения признака j.
Алгоритмы построения решающих правил. Вычисление разделяющих весов информативных признаков и информационных весов объектов (алгоритм GOLOS). Предлагается вид функции <рк,
характеризующей степень принадлежности объекта к одному из выделенных классов объектов: Т1,Т2,...,ТМ, к=1,2,...,М, N - число
информативных признаков:
N N
Фк ІХ) = Х^Д ' xj ~ Х^# ' (1 ~ xj )
7=1 7=1
Pjk>0 Pjk<0
где x = (x1,x2,...,xN); хг принимают значения 0 или 1, 0<<^(х)<1.
Построенные для каждого класса характеристические функции <Р1,<Р2,...,<рм используются для формирования решающего правила: объект относится к тому классу, для которого характеристическая функция <% принимает максимальное значение.
В качестве разделяющего веса признака для класса предлагается брать:
APik
PJk = —
где TV - число информативных признаков.
По величине PJk можно ранжировать все изучаемые признаки.
Признаки, получившие положительные веса PJk, следует интерпретировать как благоприятные для формирования объектов класса Тк. Признаки, получившие отрицательные веса Pjk, следует интерпретировать как неблагоприятные для формирования объектов класса Тк.
Чем большим количеством благоприятных или меньшим количеством неблагоприятных для класса Тк признаков обладает
объект, тем выше значение характеристической функции <рк.
Таким образом, алгоритм позволяет:
-
Выделять признаки, делящие объекты на классы;
-
Строить “центровые” объекты классов (модели типичного объекта класса и типичного объекта выборки);
-
Уточнять разбиение объектов на классы.
Алгоритм GOLOS позволяет оценить и отождествляющие способности признаков. Для этого в качестве отождествляющих весов признаков следует брать величины:
Pjo= ,
z'=1
а в качестве функции принадлежности объекта всему множеству рассматривать:
jO j jO
Pjo>0 Pjo<0
P0(I) = YjPjO " Xj ~ YjPjO " (1 _ Xj)
Алгоритм GOLOS позволяет оценивать коррелируемость признаков с изменением целевого свойства. Для этого в качестве разделяющих весов признаков следует брать величины:
bPJM
* jM = дг '
j=1
а в качестве функции принадлежности объекта множеству рассматривать:
N N
м() = PJMXj- PjM(1-Xj).
7=1 7=1
PjM >0 P}M <0
Алгоритм построения распознающих комплексов признаков и идентификации объектов (алгоритм МУ). Распознающим комплексом признаков Y = (уг ,у_ ,...,у- ) называется подсистема признаков Y, для
которой существуют такие величины Н >0,Pt(i = 1,k):
\Pt I = 1, signPj = sign Р м,
z'=1
и для любых объектов xи Zиз соседних классов / и (/ + 1):
(l)-(х)> И ; / = 1,2, ...,М-1;
X = (х1,х2,...,х„ ); Z = (z„ ,z„ ,...,z„ ),
\ 'к '1 '2 'к
N N
где (х) = у^ jc,.. - =1^- (1-хг);
i^ - называется комплексным весом признака rt;
М - число классов объектов.
Н - называется коэффициентом отделимости классов по комплексу Y.
Задача распознавания объектов с учетом упорядоченности классов Т1,Т2,...,ТМ, (к=1,2,…,МJ по исследуемому свойству сводится к
следующей. Требуется выделить распознающий комплекс признаков с максимальным коэффициентом отделимости. Построенная на его основе функция (х) позволяет наилучшим образом распознавать на обучающей (эталонной) выборке степень проявления исследуемого целевого свойства (масштабность оруденения и т.п.).
Величина (х) (вес объекта) изменяется в диапазоне [0,1], что позволяет быстро оценивать степень проявления целевого свойства для любого объекта: для этого лишь надо сравнить значение (х) с величинами, которые достигались у объектов эталонной выборки. Для объектов из класса Т1, обладающего низкими значениями целевого
признака, эта величина близка к 0; для объектов из класса Тм эта
величина близка к 1. Для каждого последующего класса веса объектов больше, чем у предыдущего класса объектов. Таким образом, распознающий комплекс признаков позволяет строить некоторую функцию (вес объекта), которая может служить индикатором для оценки значений целевого признака.
Задача поиска распознающего комплекса признаков может быть сведена к задаче линейного программирования, поскольку показатель качества разделения объектов по выделенному комплексу признаков представляет собой линейную функцию от элементов решения, ограничительные условия, налагаемые на выделенные решения, имеют вид линейных равенств или неравенств. Эта задача была решена с помощью симплексного метода.
Оценка устойчивости системы информативных признаков, качества и надежности решающих правил. Качество построенного решающего правила проверяется на таблице обучения из базы данных:
КРП = 100%,
где S - число эталонных объектов в таблице обучения;
К+ - число эталонных объектов, отнесенных к своему классу. Качество определения класса Tt:
К + КРП =—*-100%,
где К^ - число эталонных объектов класса Ti, отнесенных к своему
классу;
St - число объектов в классе Tt.
О формировании обучающих выборок при построении распознающих систем. При построении распознающих систем важную роль играют задачи выбора системы эталонов и системы информативных признаков. Для правильного их решения необходим анализ устойчивости системы информативных признаков при изменении системы эталонных объектов. Результаты этого анализа позволяют сформировать такую систему эталонов, которая порождала бы наиболее устойчивую систему информативных признаков.
Пусть v = {Zt} - множество эталонных объектов, описанных в
системе Л/ признаков; Z = [zi ,z, ,...,z, ) - система эталонов, полученная
\ 1 '2 'k
путем случайного отбора из множества V; Р - некоторое правило отбора системы информативных признаков по системе эталонов:
P(Z)=(J, где (Т = ((Т1,(Т2,...,(ТЖ),
0у=1, если признак отобран в систему информативных признаков;
jun0 - вектор относительных частот появления признаков в системе
информативных признаков при п0 испытаниях (различных систем эталонов):
Рассматривается задача оценки устойчивости системы информативных признаков, построенной по правилу Р, описанному выше, при изменении системы эталонных объектов. Она может быть сведена к оценке относительных частот появления признаков в системе информативных признаков при использовании правила Р.
Если определить событие А следующим образом: признак j
является информативным для цели исследования, то справедливы следующие утверждения:
Утверждение 1. Для любых s,r/,(o с вероятностью і-г/ можно утверждать, что на обучающей выборке длиной п,п >п0, где:
ІП^-ІП77
0 2є2 ,
относительные частоты появления признаков в системе информативных признаков jUj(j' = 1,2,...,n) будут уклоняться от вероятности Р(А-) на
величину меньше є.
Утверждение 2. В случае произвольного числа испытаний при изучении N признаков с вероятностью 1-77 (о ]< і)можно утверждать, что максимальное уклонение частоты от вероятности будет равно:
llnN-lnrj
є = J .
V In
Из утверждения 1 следует, что при решении практических задач можно оценивать количество испытаний, достаточное для получения устойчивой системы информативных признаков с заданной точностью.
Из утверждения 2 следует, что в случае произвольного числа испытаний при изучении N признаков можно оценивать точность полученных мер устойчивости jUj (относительных частот появления
признаков в системе информативных признаков).
Доказательство утверждений проводится аналогично тому, как это делалось в работе [Вапник, Червоненкис, 1974] при оценке точности решающих правил [Чижова, 1991, 2010].
Задача поиска достаточной системы эталонов, порождающей систему эталонных признаков Ja, обладающую максимальной
устойчивостью, сводится к нахождению бинарного вектора <ус
приводящего к минимуму функционал A(ja,n0):
a(j ,пп) = \(т -ц ;
a - случайное число на отрезке [0, 1];
(ja =[
входит в систему информативных признаков, порожденную эталонной выборкой, соответствующей случайному числу а; <уа = 0, в противном
случае.
Система эталонов Z, на которой этот минимум достигается, и будет искомой. В практических задачах она характеризует представительную выборку из полного объема информации V.
Все описанные выше алгоритмы составляют комплекс алгоритмов: систему прогнозирования АСТРА, реализующий обобщенные логико-информационные методы.
Многомерная оценка информативности признака при решении прогнозных задач. В системе прогнозирования АСТРА проводится двухступенчатый анализ системы информативности признаков. Сначала указываются первые по информативности (по выбранному порогу информативности) N признаков, а затем проводится их анализ с учетом взаимосвязи, что приводит к сокращенным вариантам систем информативных признаков (алгоритм my). Таким образом, разработана процедура многомерной оценки информативности признака при решении прогнозных задач.
Каждый признак характеризуется:
а) характером связи с целевым свойством (положительным,
способствующим накоплению свойства или отрицательным -
препятствующим накоплению свойства);
б) силой связи с исследуемым свойством;
в) устойчивостью связи с исследуемым свойством (постоянной или
переменной).
Кроме того, найденные распознающие комплексы признаков характеризуются коэффициентом отделимости, который показывает эффективность его использования при решении задач распознавания, а комплексные веса признаков показывают, какую долю информации о различии классов несет признак, входящий в распознающий комплекс.
Оценка надежности используемого решающего правила. В
качестве решающих правил обычно выбираются наиболее простые, поддающиеся логическому объяснению правила, позволяющие реализовывать несложные оптимизационные процедуры его поиска. Именно поэтому наиболее широкое применение получили линейные решающие правила.
Автору [Чижова, 1991, 2010] удалось теоретически доказать следующие результаты, позволяющие оценивать надежность решающих правил, построенных по распознающим комплексам признаков.
Справедливы следующие утверждения.
Утверждение 3. Пусть Z - множество эталонных объектов, содержащее S элементов, описанных в системе К бинарных признаков. R - решающее правило для распознавания м классов, построенн ое по расп ознаюему ком плексу признаков Y = (у,- , у,- ,..., у,- ) с
коэффициентом отделимости классов Я и функции <р(х). Тогда с вероятностью 1-77 (o<77є, если длина обучающей выборки S не менее:
1п(М-1) + ^2-ІП77/ N2
L = —- (М-1) .
2є2 V }
Утверждение 4. Пусть Z - множество эталонных объектов,
содержащее S элементов, описанных в системе бинарных признаков. R
- решающее правило, построенное по распознающему комплексу
признаков F = (y, ,у, ,...,у, ) с коэффициентом отделимости классов Я и
функции <р(х). Тогда с вероятностью l-rj (о<г/<\) можно утверждать, что доля ошибочно распознанных объектов не будет превосходить є, где:
є = (М - Щ(іп(М -1) + К2 - \nt])l2S .
Из утверждения 3 следует, что можно определить минимальную длину обучающей выборки, при которой доля ошибочно распознанных объектов не превышает заданной величины.
Из утверждения 4 следует, что можно определить максимальную величину доли неправильно распознанных объектов, если решающее правило построено по выборке фиксированной длины.
Например: при г\ = 0.1, є = 0.5, М = 3, К = 3, L = 95.
Из теоретических результатов следует, что ошибка распознавания (отнесения объекта из одного класса в другой) уменьшается при увеличении числа эталонов и уменьшении числа классов и числа информативных признаков. Результаты И.А.Мулагулова [1988] свидетельствуют, что эти тенденции прослеживаются и при использовании других решающих правил - использовании алгоритма суммы одномерных нелинейностей.
Особенности решения прогнозной задачи в системе прогнозирования АСТРА. Дальнейший способ решения прогнозной задачи зависит от того, какими сведениями относительно прогнозируемого параметра мы обладаем: знаем точно его значение или знаем только диапазон его изменения. В первом случае возможно построение уравнений, описывающих интересующую нас зависимость (задача количественного прогноза). Во втором случае эти зависимости
можно проследить на основе изучения вариационных рядов объектов (задача качественного прогноза).
Построение зависимостей прогнозируемых параметров от геологических факторов, гарантирующих точность локального прогноза. Если значение целевого свойства точно известно, то прогнозную задачу можно решить методом моделирования. Предположив, что целевое свойство 7 (масштаб оруденения) зависит от факторов xl,x2,...,xN, можно построить зависимость:
Y = F(xl,x2,...,xN).
Поскольку точный вид функции F неизвестен, можно построить некоторое ее приближение в классе многочленов т -го порядка от N переменных:
N N
F(x,,xn,...,xw) = А +У Ах, + +....
1 2 N оо ^^ ok к 4-^ к] к j
к=\ k,j=l
Задача сводится к вычислению значений Ak3(k,j = o,\,~,N) на основе
эталонной выборки объектов. Обычно ограничиваются многочленами первого (линейными) или второго (квадратными) порядка.
Общепринятым методом поиска зависимостей на основе таких моделей является линейный или нелинейный регрессионный анализ, основанный на методе наименьших квадратов. Качество приближения при этом определяется по значению среднего квадратичного отклонения:
m-rj
i=l
где Yi - расчетное значение;
Yt - наблюденное значение на объекте /;
п - число наблюдений.
Если полученные отклонения (Yj-Yj) подчиняются нормальному
закону распределения, ошибка определения будет в пределах ±за на основе построенной модели.
При оценке прогнозных ресурсов принят другой критерий качества построенной модели: удовлетворительной считается модель, в которой -100% <<у< 50% (завышение или занижение расчетных значений не более, чем в 2 раза),
7i -L где с>= - '100%
или -Я<1--<— 0<Н<1 (1)
Yt 2
Чем меньше H , тем лучше построенная модель. Была поставлена задача поиска коэффициентов Akj (k, j = 0,1,2,...) при условиях (1),
обеспечивающих минимальное значение H .
Она была сведена к задаче математического программирования, решение которой симплекс-методом [Вентцель, 1972] позволило построить требуемую модель.
Таким образом, разработан принципиально новый метод построения зависимостей прогнозируемых параметров от факторов, влияющих на них, гарантирующий точность локального прогноза в каждой точке наблюдений в заданном диапазоне. Для реализации предложенного метода разработана программа ZPN .
В отличие от регрессионного метода, дающего среднюю ошибку при моделировании, данный алгоритм обеспечивает результат приближения расчетных значений к фактическим в заданном диапазоне.
Построение зависимостей, отражающих степень проявления у объектов целевого свойства. Если точные значения целевого признака, описывающего степень проявления целевого свойства (масштабности оруденения и т.п.), неизвестны, то можно выделить классы объектов по степени проявления этого свойства, считая, что объекты в пределах одного класса обладают одним и тем же диапазоном изменения целевого признака, а классы упорядочены по степени проявления у объектов целевого свойства.
Анализ разработанных ранее способов оценки информативности признаков в задачах распознавания, предложенных разными авторами (вычисление тесторных весов признаков, предложенное А.Н.Дмитриевым, Ю.И.Журавлевым, Ф.П.Кренделевым [Дмитриев и др., 1966], разделяющих весов признаков на основе модифицированного треугольника Паскаля и тесторных весов, предложенное Р.М.Константиновым, С.В.Сиротинской [Константинов, 1973; Сиротинская, 1986], вычисление важности признаков в методе вычисления оценок, предложенном Ю.И.Журавлевым [Журавлев и др., 1971] и др.), показал, что:
а) необходимо проводить предварительную селекцию признаков;
б) необходимо проводить оценку важности выбранных признаков
для решения прогнозной задачи.
В этом случае используют алгоритм для выделения систем информативных признаков типа М (MYVES), для оценки коррелируемости признаков с изменением целевого свойства (GOLOS - M), алгоритмы построения распознающих комплексов признаков (достаточной системы признаков) и идентификации на их основе объектов (MY).
Система алгоритмов АСТРА разработана как реализация обобщенных логико-информационных методов для анализа
многофакторных моделей геологических объектов с целью решения прогнозных задач на базе теории распознавания образов. На их основе разработан программный комплекс АСТРА (Автоматизированная Система на основе Теории Распознавания). Система позволяет путем анализа эталонных объектов из базы данных:
а) выделять системы информативных признаков;
б) проводить идентификацию объектов (отнесение объектов к
одному из выделенных классов);
в) строить простейшие модели накопления целевого свойства, по
которому выделяются классы объектов;
г) оценивать качество полученных решающих правил.
В основе выделения информативных признаков лежит принцип
общности свойств и анализ вариационных рядов геологических объектов.
В качестве целевого свойства могут рассматриваться масштабность оруденения, соотношение полезных компонентов в рудах и т.п. Полученные закономерности можно использовать в качестве знаний об объектах исследования при разработке экспертных систем.
Схема функционирования программного комплекса АСТРА представлена на рис. 3.
В работе использовались разработанные автором обобщенные логико-информационные методы, преимуществом которых является возможность получать обоснованные выводы даже при небольших объемах исходных данных, поскольку в их основе лежит комбинаторно-логический подход к анализу изменчивости значений признаков, описывающих изучаемые объекты, учитывающий информацию, полученную не только по каждому признаку, но и по их сочетаниям, а также метод вариационных рядов и принцип общности свойств объектов, входящих в одну группу (класс). Методы позволяют получать системы информативных признаков для выделения объектов из разных групп (получать описание групп), оценивать их важность и проводить идентификацию любых объектов, описанных в данной системе признаков, с целью определения их сходства с объектами изученных групп. Для этого по интервалам-индикаторам и разделяющим весам признаков, полученным для каждой группы объектов, (модели группы), вычисляется значение функции принадлежности к каждой группе. Используется следующее решающее правило: объект относится к той группе, для которой функция принадлежности принимает максимальное значение. Чем ближе вычисленное значение к 1, тем больше сходство объекта с моделью группы. Если получено значение функции принадлежности, близкое к 0, то это свидетельствует о том, что объект не обладает свойствами изученной группы. Если получены значения функции
Рис. 3. Схема функционирования программного комплекса АСТРА
принадлежности, близкие к 0, для всех изученных групп, то возможно, это свидетельствует о том, что объект образует новую группу объектов.
Таким образом, обобщенные логико-информационные методы позволяют уточнять разбиение выборки на группы и определять представителей новых групп. Возможность обработки по единой схеме разнотипной информации без необходимости проверки соответствия законам распределения значений признаков по выборке, делает их универсальными в использовании.
Данный комплекс методов обеспечивает решение основных типов формализованных задач прогноза и оценки рудных месторождений:
построение модели типичных представителей групп объектов (различных рудно-формационных типов);
построение модели объектов с различными значениями монотонно-изменяющегося целевого свойства (масштабами оруденения).
Разработанные методы использовались при решении различных геологических задач, что отражено в публикациях автора. В работе приведены примеры их использования.
ГЛАВА 4. Экспертная система для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного
пояса
Глава 4 посвящена описанию разработанной на основе предложенной технологии АСТРА специализированной гибридной экспертной системы для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса.
Оценка рудных объектов наиболее сложна на ранних стадиях изучения (до бурения), когда отсутствует информация по главному прямому признаку (есть ли в пределах объекта промышленное месторождение?). Как правило, в этом случае не удается выявить даже и небольшое (1-2) количество косвенных признаков, которые были бы жестко пропорционально связаны с главным прямым признаком. Возникает необходимость учета большого количества косвенных признаков, то есть встает задача распознавания образов. Одним из подходов к подобной оценке может служить формирование автоматизированного прогнозно-поискового комплекса [Кривцов, Нарсеев, 1983] или компьютеризированной экспертной системы [Поспелов, 1988; Уотерман, 1989].
Совместно с д.г.-м.н. М.М.Константиновым и С.Ф.Стружковым была разработана экспертная система, позволяющая с помощью современного персонального компьютера провести экспрессную оценку
новых и переоценку известных перспективных площадей (по косвенным признакам и критериям на ранней стадии изучения). Система предназначена для оказания помощи экспертам в оценке перспективности рудоносных площадей различного ранга и определения методики работ на перспективных участках. Экспертная система состоит из следующих пяти уровней:
1. Региональное геологическое изучение масштабов 1:1000000 -
1:500000. Объектом оценки является потенциальный рудный район.
-
Геолого-геофизические и геолого-съемочные (ревизионно-поисковые) работы в масштабе 1:200000. Объектом оценки является потенциальный рудный узел.
-
Геолого-съемочные работы с общими поисками масштаба 1:50000. Объектом оценки является потенциальное рудное поле.
-
Поисковые работы масштаба 1:10000. Объектом оценки является рудоносный участок (потенциальное месторождение).
-
Поисково-оценочные работы масштаба 1:2000. Объектами оценки являются потенциальные рудные тела и рудные столбы.
Каждый уровень включает вопросы к эксперту, необходимые для оценки площади, и варианты заключения об объекте прогноза. На каждом уровне предусмотрена группа вопросов, позволяющая оценить степень изученности перспективной площади. В каждом вопросе возможны три варианта ответов («да», «нет», «не знаю»). Все варианты охарактеризованы различными положительными или отрицательными информационными весами.
После ввода информации по оцениваемому объекту вычисляется алгебраическая сумма информационных весов выбранных экспертом вариантов ответов. Затем эта сумма сравнивается с пороговым значением, позволяющим отнести объект прогноза к тому или иному типу и оценить его перспективность. Возможны три основных варианта заключения об объекте прогноза: положительное, отрицательное и вывод о недостаточной изученности. В случае положительного заключения указывается список рекомендуемых видов работ и перечень итоговых документов, согласно ранее разработанному прогнозно-поисковому комплексу ОЧВП [Константинов и др., 1989]. При отрицательном заключении рекомендуется прекращение работ. В случае недостаточной изученности приводится список материалов, которые необходимо получить дополнительно для проведения экспертной оценки.
Первый, второй, четвертый и пятый уровни экспертной системы были построены с учетом факторов оценки и локализации золото-серебряного оруденения, ранее предложенных Г.П.Воларовичем (1971), П.В.Бабкиным с соавторами (1973, 1977), А.И.Калининым (1991), Л.Н.Пляшкевич (1973), Н.Е.Саввой (1995), А.А.Сидоровым (1978, 1987) и
Рис. 4. Схема процесса принятия решений третьего уровня экспертной системы для прогноза и оценки золото-серебряных месторождений Охотско-Чукотского вулканогенного пояса
другими исследователями, а также прогнозных критериев и признаков, сформулированных М.М.Константиновым и С.Ф.Стружковым [Стружков, Константинов, 2005].
Третий уровень (оценка потенциальных рудных полей) (рис. 4) является наиболее важным на современном этапе, поскольку в условиях высокой степени изученности ОЧВП одним из апробированных алгоритмов новых открытий является переоценка формационных типов и масштабов известных рудопроявлений.
Например, Дукатское золото-серебряное месторождение в течение нескольких десятилетий, предшествовавших его открытию в 1967 году, ошибочно фигурировало в списках рудопроявлений как мелкое непромышленное проявление олова. В связи с этим для разработки третьего уровня экспертной системы была специально составлена обширная база данных по 129 золото- и сереброрудным полям ОЧВП, использован программный комплекс АСТРА, реализующий обобщенные логико-информационные методы для обоснования критериев прогнозной оценки, что позволило повысить распознаваемость формационных типов и геолого-экономической значимости рудных объектов по сравнению с ранее реализованной версией системы.
Экспертная система предназначена для оказания помощи в оценке перспективности рудоносных площадей различного ранга (от потенциальных рудных районов до рудных столбов). Система разработана в среде Delphi 7.0.
Созданная на примере ОЧВП специализированная гибридная экспертная система основана на широком комплексе взаимосвязанных критериев и признаков и представительной базе данных, что позволяет применять ее при изучении и оценке золото-серебряных месторождений в сходных рудоносных провинциях.
ГЛАВА 5. Экспертная система для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России
Глава 5 посвящена описанию разработанной на основе предложенной технологии АСТРА специализированной гибридной экспертной системы для прогноза и оценки золото-кварцевого и золото-редкометалльного оруденения в терригенных толщах и штоках гранодиоритов-диоритов, расположенного на территории Северо-Востока России.
Объектами прогнозирования являются следующие таксономические единицы: рудный район, рудный узел, рудное поле, месторождение. В основу базы знаний положены сведения, почерпнутые из опубликованных работ и фондовых отчетов, а также кадастров месторождений. Кроме того, были проанализированы геолого-геофизические, геологические признаки, полученные непосредственно из первичных геологических материалов, входящих в базу данных, включающую описания 47 месторождений в системе 95 разнотипных признаков.
Таким образом, предложенная экспертная система содержит сумму знаний, накопленных различными исследователями при изучении отмеченных месторождений. В разработке системы принимали участие Г.М.Курбанаев, Н.А.Бакшеев, Ю.И.Лебедев.
Экспертная система состоит из следующих 4 уровней (рис.5).
Стадия I. Составление прогнозных карт масштаба 1:1000 000 – 1:500 00. Объект прогноза - потенциальные рудные районы.
Стадия II. Составление прогнозных карт масштаба 1:200 000. Объект прогноза – потенциальные рудные узлы
Стадия III. Поиски масштаба 1:50 000 – 1:25 000 (подстадия общих поисков). Объект прогноза – потенциальные рудные поля.
Стадия IV. Поисковые работы масштаба 1:25 000 – 1:10 000. Объект поисков – потенциальные месторождения.
Рис. 5. Схема функционирования специализированной экспертной системы для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльной формации Северо-Востока России
Проводится оценка степени изученности. В случае недостаточной изученности объекта предлагается комплекс методов, необходимый для доизучения объекта. Предусмотрены сеансы экспертизы по сокращенному и полному вариантам.
Экспертная система разработана в среде Delphi 7.0, предназначенной для визуальной разработки приложений.
Экспертная система предназначена для оказания помощи в оценке перспективности рудоносных площадей различного ранга (от потенциальных рудных районов до рудных месторождений).
ГЛАВА 6. Информационно-аналитическая экспертная система
оценки золоторудных месторождений
на основе выбора объекта-аналога (АНАЛОГ)
Глава 6 посвящена описанию экспертной системы для оценки золоторудных объектов на основе выбора ближайшего аналога среди золоторудных месторождений мира, построенной по технологии АНАЛОГ.
Проблема поиска геологического объекта (месторождения), наиболее сходного с анализируемым по некоторым критериям, всегда интересовала исследователей. Пути ее решения различны. Но особенно интересен подход автоматизированного поиска по различным мерам сходства, дающим количественный показатель. По найденному среди хорошо изученных эталонных объектов ближайшему аналогу по методу аналогии возможна оценка неизвестных свойств экспертируемого объекта. Учитывая огромные возможности когнитивных (т.е. способствующих познанию) свойств графической информации, целесообразно ее использование при экспресс-оценке месторождений, поскольку на эталонном объекте обеспечивается наглядное представление признаков и геологических ситуаций, неизвестных на слабоизученном объекте.
Впервые система экспресс-оценки золоторудных месторождений на основе выбора объекта-аналога дополнена графической базой данных, содержащей геологические материалы, необходимые при анализе месторождений, но которые невозможно представить в текстовом или цифровом виде. Учитывая широкое развитие интернет-технологий, для системы управления была выбрана технология создания вложенных HTML-файлов, обеспечивающая хранение неограниченного числа растровых изображений.
Разработанная система состоит из трех основных взаимосвязанных блоков. Блок диалога обеспечивает ввод информации об экспертируемом объекте по системе описания, в зависимости от степени его изученности. Интеллектуальный блок обеспечивает работу системы принятия решения о выборе аналога на основе расчета мер сходства. Блок формирования результатов предназначен для отображения в табличной и графической форме коэффициентов сходства экспертируемого объекта и ближайших аналогов по каждой группе признаков. Аналогичные таблица и график строятся для оценки вкладов каждой группы признаков в общий коэффициент сходства.
Изначально система АНАЛОГ опиралась на фактографическую базу данных. На сегодняшний день она содержит описание 247 золоторудных месторождений мира в системе 894 признаков, объединенных в 26 групп. Основу ее составляет система признаков для описания месторождений, разработанная М.М.Константиновым.
Выбор способа вычисления меры сходства объектов (эталонов из базы данных и экспертируемого объекта) проводится в зависимости от вида используемой информации (логической, качественной, количественной). Методика сравнения экспертируемого объекта с объектами из базы данных в системе АНАЛОГ описана в работе [Чижова, 2004]. В качестве меры сходства между объектами используется модификация меры сходства Говера с учетом природы исходной информации. Сравнение экспертируемого объекта с объектами выборки проводится последовательно для каждой выбранной группы признаков.
В зависимости от формы представления исходной информации об объекте исследования меняются процедуры их анализа.
Основные задачи, решаемые экспертной системой – подбор аналогов экспертируемому объекту, с целью определения по принципу подобия его рудно-формационных характеристик и масштаба промышленных параметров.
Сведения об экспертируемом объекте (ЭО) система получает в результате диалога через заполнение пользователем экранных форм.
Разработаны диалоговые окна с заполнением числовой и текстовой информацией путем ручного набора (на клавиатуре) или выбора из классификатора.
Выбор аналога осуществляется в результате сравнения сведений об ЭО с объектами из базы данных по каждой группе свойств, характеризующих объект.
Результат экспертизы представляется в табличной и графической формах в двух видах:
отражается сходство объекта-аналога и ЭО по каждому свойству из системы описания, по которому получена информация по ЭО в результате диалога;
отражается вклад каждого свойства при подборе конкретного аналога.
Схема функционирования системы АНАЛОГ представлена на рис. 6. Получив в результате расчета мер сходства рекомендации системы по выбору объекта-аналога, проводится оценка рудно-формационного типа и масштаба оруденения ЭО по аналогии по значениям этих параметров у ближайшего эталонного объекта-аналога.
Рис. 6. Схема процесса принятия решений в экспертной системе АНАЛОГ для оценки золоторудных месторождений на основе выбора ближайшего аналога среди золоторудных месторождений мира
1 – используемая база данных; 2 – таблица оценки степени сходства экспертируемого месторождения с его аналогами по каждой группе признаков и в целом по всей системе описания; 3 – представление данных таблицы 2 в графической форме; 4 – таблица оценки вкладов групп признаков (элементов системы описания изучаемых месторождений) в общий коэффициент сходства экспертируемого месторождения с его аналогами; 5 – представление данных таблицы 4 в графической форме, способствующее оперативному выбору групп признаков, по которым экспертируемое месторождение наиболее похоже на выбранные аналоги; 6 – интеллектуальный блок, передающий данные об экспертируемом месторождении в систему и принимающий решение о выборе из базы данных его ближайших аналогов на основе рассчитанных коэффициентов сходства; 7 – экспертируемое месторождение (объект оценки); 8 – результирующее заключение (список ближайших аналогов); 9 – формирование выводов по аналогии (о рудноформационном типе и масштабности оруденения) экспертируемого объекта на основе значений этих параметров у ближайших объектов-аналогов.
Результаты апробации разработанной технологии поиска аналогов подтверждают ее эффективность при решении задач экспресс-оценки золоторудных объектов. В работе они рассмотрены на примере трех относительно новых объектов, для которых подобраны соответствующие по геолого-формационным и вещественным характеристикам аналоги, обладающие в одних случаях достаточно полным сходством, в других - как сходными, так и отличными особенностями оруденения. Последнее обстоятельство зачастую помогает составить более полное и глубокое представление об ЭО.
По результатам апробации элементов системы выбора аналогов следует отметить, что разработанная компьютерная технология обеспечивает решение поставленной задачи - подбор аналогов с целью ускоренной оценки экспертируемого объекта.
Программное обеспечение системы АНАЛОГ функционирует на базе .Net Framework 1.1, что позволят работать c ней в сетевом режиме.
Фактографическая база данных системы хранится в стандартном формате *.mdb, и возможен ее просмотр в системе MS Access. При наличии координат (широта, долгота) в базе данных у выбранных системой объектов-аналогов подключается блок визуализации и формируется карта с информацией о географическом положении выбранных аналогов.
Для удобства пользователя результаты экспертизы помещаются в файл формата .xlt, что делает возможным его просмотр в MS Excel (независимо от работы системы) и помещать результаты в отчет в привычном и удобном для пользователя виде.
Графическая информация позволяет визуализировать ту часть человеческих знаний об объекте, для которых пока нет возможности получить текстовые описания. Разработан блок графического банка данных системы, содержащих растровую информацию по объектам-эталонам (карты, схемы, геологические разрезы, фото образцов и т.п.).
Графический блок базы данных носит, прежде всего, иллюстративный характер и дает возможность компактно хранить и оперативно получать, передавать и использовать интересующую графическую информацию по объекту, являющемуся ближайшим аналогом по результатам расчета системы. Применяемая технология вложенных HTML-файлов и модульная иерархически-соподчиненная структуризация графического материала являются оптимальными для выполнения этих функций.
В настоящее время настоятельной необходимостью является применение инновационных информационных технологий. Сложность решаемой проблемы прогноза и оценки рудных месторождений обуславливает использование гибридных экспертных систем, в которых предусмотрено сочетание различных способов представления научных знаний (знания экспертов; закономерности, получаемые в результате обработки имеющейся базы данных).
При разработке автоматизированных прогнозно-поисковых комплексов автором [Чижова, 1991; Чижова и др., 1991] впервые была применена технология построения базы знаний, включающей не только знания экспертов, но и закономерности, получаемые в результате анализа имеющихся баз данных по исследуемым геологическим объектам. Гибридные экспертные системы для прогноза и оценки рудных месторождений основываются на методологии теории распознавания образов. В зависимости от выбранного подхода (принципа общности свойств или перечисления объектов) строятся алгоритмы представления имеющихся знаний об объекте исследования и системы принятия решений.
Основой баз данных для построения баз знаний гибридных экспертных систем для прогноза и оценки рудных месторождений являются многофакторные модели эталонных рудных месторождений, построенные с позиций системного анализа.
Разработаны обобщенные логико-информационные методы анализа рудных объектов на основе изучения их многофакторных моделей с целью получения многомерной оценки информативности входящих в нее признаков, используемой при идентификации объектов в процессе решения прогнозных задач. Эти методы обеспечивают выделение системы информативных признаков, оценку их значимости и построение надежных решающих правил для идентификации объектов на основе полученных оценок. Разработанные методы позволяют обрабатывать разнотипную информацию, оценивать достоверность результатов идентификации, определять объем используемой входной информации, необходимый для получения результатов с заданной точностью, и обеспечивают автоматизацию процесса построения элементов комплексной базы знаний гибридной экспертной системы. Разработан программный комплекс АСТРА, реализующий данные методы.
На базе разработанных теоретических основ получена технология создания гибридных экспертных систем для решения прогнозных задач, основными положениями которой являются:
Экспертная система должна быть гибридной (включать модели, предложенные экспертом и модели, получаемые на основе анализа эталонных объектов).
База знаний может быть построена на основе анализа эталонных
объектов двумя способами:
по технологии АСТРА (с использованием обобщенных логико-информационных методов при создании моделей объектов различных типов);
по технологии АНАЛОГ (на основе вычисления мер сходства).
Модели объектов должны быть представлены в виде, допускающем их автоматизированное использование, что может быть достигнуто применением обобщенных логико-информационных методов.
Для ускорения процесса принятия решения по методу ассоциативной аналогии целесообразно использование баз данных графической информации по эталонным месторождениям.
Программные модули формируются для каждой стадии геологоразведочных работ в соответствии с выделенными металлогеническими таксонами.
Таким образом, разработанные подходы к созданию баз знаний гибридных экспертных систем позволяют строить надежные специализированные системы для экспрессной оценки геологических объектов различного металлогенического ранга, что подтверждено примерами реализации предложенного метода для золоторудных месторождений.
Совместно с экспертами-геологами сформулированы, систематизированы и структурированы знания о рудных месторождениях различных рудно-формационных типов, что позволило построить надежные специализированные экспертные системы. Системы обеспечивают принятие решений также и в условиях неполной информации об экспертируемом объекте (возможен анализ ответов типа ”не знаю”). Проводится оценка степени изученности объектов.
Технология апробирована при разработке специализированных гибридных экспертных систем:
для прогноза и оценки золото-серебряных месторождений Охотско-чукотского вулканогенного пояса;
для прогноза и оценки месторождений золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока России;
для оценки золоторудных месторождений на основе выбора объекта-аналога среди золоторудных месторождений мира; а также
для оценки россыпных объектов золота Магаданской области;
для оценки россыпных объектов золота Юго-Восточной части
Алданского щита.
Результаты апробации системы выбора аналогов на примере трех относительно новых объектов подтвердили ее эффективность при решении задач экспрессной оценки золоторудных месторождений.
По теме диссертации опубликованы 153 работы, из них 27 опубликованы в журналах, входящих в Перечень ВАК.
-
Сиротинская С.В., Чижова И.А. Логические связи столбцов бинарных таблиц геологической информации // Логико-информационные решения геологических задач. М: Наука, 1975. С. 253-258.
-
Константинов М.М., Константинов Р.М., Чижова И.А. Геологические и минералого-геохимические факторы формирования золото-серебряных оруденений // Советская геология. 1979. № 3. С. 116-124.
-
Константинов Р.М., Чижова И.А., Кузнецов В.В., Филатов Е.И. Прогнозная оценка месторождений и рудопроявлений на основе дискретного анализа // Разведка и охрана недр. 1979. № 9. С. 10-14.
-
Константинов Р.М., Чижова И.А. Устойчивость геологических факторов образования рудных месторождений // Горнорудный Пржибрам в науке и технике. ЧССР, 1979. С. 265-280.
-
Константинов Р.М., Чижова И.А. Математический подход к анализу устойчивости геологических факторов при решении прогнозных задач // История геологии. Подготовка специалистов в области геологии. Математическая геология и геологическая информация. М.: Недра, 1980. С. 132-140.
-
Гоньшакова В.И., Осипов Б.В., Чижова И.А. О петрохимическом различии базальтов и долеритов нормальной щелочности // Советская геология. 1982. № 5. С. 77-86.
-
Смольянинова В.Н., Чижова И.А. Геохимические особенности железомарганцевых руд Джеказган-Улутауского района // Геология рудных месторождений. 1982. Т. 24. № 1. С. 67-75.
-
Демидова Н.Г., Чижова И.А., Шишкунов М.Г. Логико-информационное прогнозирование ртутного оруденения // Разведка и охрана недр. 1982. № 2. С. 23-28.
-
Константинов М.М., Чижова И.А. Способы оперативной оценки золото-серебряного оруденения // Разведка и охрана недр. 1983. № 11. С. 15-18.
10. Кузнецов В.В., Чижова И.А. Количественная оценка связей геологических и рудных формаций (на примере Рудного Алтая) // Формационный анализ как основа крупномасштабного прогноза и поисков месторождений цветных, редких и благородных металлов. Т. 1. М.: ЦНИГРИ, 1986. С. 73-74.
-
Чижова И.А. Алгоритм распознавания геологических объектов с корректировкой эталонной выборки // Теоретические проблемы кибернетики. Саратов: СГУ, 1987. Ч. 2.
-
Розанова Н.А., Чижова И.А., Шабаршов П.Я., Щепотьев Ю.М. , Остроменцкий В.Н., Харченков А.Г. Использование системного подхода и экономико-математических методов для прогнозирования развития минерально-сырьевой базы. М.: ВИЭМС, 1988. 45 с.
-
Иванов В.Н., Катанский М.Ю., Жидков С.Н., Чижова И.А., Оптимизация разведки золоторудных месторождений на основе многофакторного моделирования // Руды и металлы. 1992. № 1. С. 90-101.
-
Чижова И.А. Экспертная система "Астра": структура и технология разработки // Методы и системы технической диагностики: Саратов. Изд-во СГУ, 1993. Выпуск 18. С. 184-186.
-
Чижова И.А. О формировании обучающих выборок при построении распознающих систем // Методы и системы технической диагностики. Саратов: Изд-во СГУ, 1993. Выпуск 18. С. 186-188.
-
Чижова И.А., Эпштейн Ю.А., Матвеева Е.В., Горелов А.Г., Крупник Н.А. Экспертные системы для прогноза и поисков россыпных и коренных месторождений золота // Руды и металлы. 1993. № 1-2. С. 42-46.
-
Коваленко В.И., Бахтеев Р.Х., Ярмолюк В.В., Чижова И.А. Количественная оценка связи эндогенного оруденения с магматизмoм (на примере Монголии) // Геология рудных месторождений. 1993. Т. 35. № 2.
-
Гореликова Н.В., Давыдов П.С., Чижова И.А., Сперанский А.В. Минералого-геохимические особенности оловоносных россыпей Северо-Ляховского района (шельф моря Лаптевых) // Геология рудных месторождений. 1994. Т. 36. № 5. С. 428-442.
-
Николаева Л.А., Пыцкая Е.А., Чижова И.А., Яблокова С.В. Количественный анализ индикаторных признаков россыпного золота // Руды и металлы. 1995. № 3. С. 20-23.
-
Николаева Л.А., Некрасова А.Н., Чижова И.А., Яблокова С.В. Количественная оценка типоморфных признаков самородного золота различных золоторудных формаций // Руды и металлы. 1995. № 5. С. 20-25.
-
Кузнецов В.В., Сандомирский С.А., Чижова И.А., Катанский М.Ю., Жидков С.Н., Информационно-аналитические компьютерные системы (ИАКС) прогноза и поисков месторождений благородных и цветных металлов // Руды и металлы. 1995. № 2. С. 27-39.
-
Чижова И.А., Кузнецов В.В., Лебедева Е.А. Экспертная система "SPRING" прогноза и поисков месторождений цветных и благородных металлов // Отечественная геология. 1996. № 4. С. 80.
-
Чижова И.А., Кузнецов В.В., Лебедева Е.А. Основы технологии проектирования интеллектуально-графических экспертных систем (ИГС) // Руды и металлы. 1996. № 1. С. 48-56.
-
Чижова И.А., Кузнецов В.В. Интеллектуально-графическая экспертная система (ИГС) // V Международный Симпозиум по применению математических методов и компьютеров в геологии, горном деле и металлургии: Сборник трудов. Дубна (Россия), 4-7 июня 1996 г. М.: ВНИИГеосистем, 1996. С. 81-89.
-
Патык-Кара Н.Г., Гореликова Н.В., Плахт И., Нечелюстов Г.Н., Чижова И.А. Пустынный загар как индикатор возраста четвертичных образований (урочище Махтеш-Рамон в Центральном Негеве) // Докл. РАН. 1997. Т. 353. № 4. С. 523-526.
-
Патык-Кара Н.Г., Гореликова Н.В., Плахт И., Чижова И.А., Нечелюстов Г.Н., Куликов О.А. Пустынный загар на террасах и педиментах урочища Махтеш-Рамон (Центральный Негев) и его связь с возрастом поверхностей // Геоморфология. 1997. № 2. С. 72-82.
-
Кузнецов В.В., Чижова И.А. Интеллектуальные системы: теория, развитие, будущее // Труды VI Международного симпозиума по применению математических методов и компьютеров в геологии, горном деле и металлургии. Прага, 6-10 октября 1997.
-
Некрасова А.Н., Орешин В.Ю., Чижова И.А. Принципы систематики золото-серебряных месторождений на основе логико-информационного анализа // Руды и металлы. 1997. № 5. С. 33-43.
-
Лебедева Е.А., Чижова И.А. Использование графической информации при работе с экспертной системой прогноза и поисков месторождений // Руды и металлы. 1997. № 4. С. 42.
-
Чижова И.А. Экспертная система “Астра” // Сборник трудов семинара по дискретной математике и ее приложениям (2-4 февраля 1993 г.). М.: Изд-во механико-математического факультета МГУ, 1998. С. 220.
-
Стружков С.Ф., Чижова И.А., Константинов М.М. Опыт разработки автоматизированной экспертной системы прогноза золоторудных месторождений на примере Охотско-Чукотского вулканогенного пояса // Руды и металлы. 2000. № 2. С. 28-49.
-
Стружков С.Ф., Константинов М.М., Чижова И.А. Прогнозирование близповерхностных золото-серебряных месторождений (Северо-Восток России): от статистических закономерностей к компьютерной экспертной системе // Отечественная геология. 2000. № 8. С. 67.
-
Чижова И.А., Кузнецов В.В. Решение прогнозно-металлогенических задач на базе компьютерной технологии "SPRING-II"// Отечественная геология. 2000. № 8. С. 76.
-
Патык-Кара Н.Г., Чижова И.А., Лапшин А.М., Федоров О.П., Шиятый И.Н., Шевелев А.Г. Минералогическое обоснование нового района титано-циркониевых россыпей в Центральной части Западно-Сибирской плиты, Ханты-Мансийский АО // Отечественная геология. 2002. № 3. С. 15-21.
-
Чижова И.А. Технология создания информационно-аналитических систем для прогнозно-металлогенических исследований перспективных площадей // Проблемы рудной геологии, петрологии, минералогии и геохимии. М.: ИГЕМ РАН, 2004. С. 524-533.
-
Чижова И.А. Интеллектуальные системы для прогнозно-металлогенического анализа перспективных площадей // Материалы IX международной конференции "Интеллектуальные системы и компьютерные науки". М.: МГУ, 2006. Т. 2. С. 301-305.
-
Чижова И.А., Бардеева Е.Г. Современное состояние геоинформатики // Геоинформатика. 2006. № 2. С. 3-7.
-
Патык-Кара Н.Г., Левченко Е.И., Стехин А.И., Барсегян В.В., Бочнева А.А., Чижова И.А., Андрианова Е.А., Дубинчук В.Т. Минеральные ассоциации титано-циркониевых песков месторождения Центральное (Восточно-Европейская платформа) // Геология рудных месторождений. 2008. Т. 50. № 3. С. 246-270.
-
Чижова И.А. Особенности построения интеллектуальных экспертных систем для прогнозной экспресс-оценки перспективных площадей // Электронная Земля: использование информационных ресурсов и современных технологий для повышения достоверности научного прогноза на основе моделирования решений в интегральных информационных полях. М.: ВИНИТИ РАН, 2009. С. 323-331.
-
Чижова И.А., Константинов М.М., Стружков С.Ф., Покровский Д.А. Информационно-аналитическая система экспрессной оценки золоторудных месторождений: выбор объекта-аналога и когнитивная графика // Геоинформатика. 2009. № 2. С. 12-18.
-
Чижова И.А. Особенности современного этапа развития информационных технологий в геологии // Геология: история, теория, практика. Тезизы докладов Международной конференции, посвященной 250-летию Государственного геологического музея им. В.И.Вернадского. М., 2009. С. 269-272.
-
Чижова И.А., Константинов М.М., Стружков С.Ф. Опыт разработки графической базы данных для информационно-аналитической системы экспресс-оценки золоторудных месторождений на основе выбора объекта-аналога // Геология рудных месторождений. 2009. Т. 51. № 5. С. 461-469.
-
Чижова И.А. Логико-информационное моделирование при прогнозно-металлогеническом анализе перспективных площадей // Современные проблемы рудной геологии, петрологии, минералогии и геохимии М.: ИГЕМ РАН, 2010. С. 57-82.
-
Эпштейн Ю.А., Мальцев В.А., Чижова И.А. и др. Экспертная система "Близповерхностное золото-серебряное оруденение континентальных вулканогенных поясов Востока СССР". Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 60 с.
-
Aжгирей Д.Г., Чижова И.А. и др. Методическое руководство по созданию и ведению баз данных (баз многопризнаковых объектов разного ранга) по основным типам месторождений цветных и благородных металлов и алмазов. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 102 с.
-
Чижова И.А. Экспертная система "Астра". Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 72 с.
-
Курбанаев Г.М., Чижова И.А., Бакшеев Н.А., Лебедев Ю.И. Автоматизированный прогнозно-поисковый комплекс на объекты золото-кварцевой и золото-редкометалльно-кварцевой формации Северо-Востока. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 85 с.
-
Матвеева Е.В., Гольдфарб Ю.И., Стефанский А.В., Чижова И.А., Хмелева Н.А. Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Магаданской области. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 90 с.
-
Матвеева Е.В, Чижова И.А., Хмелева Н.А. Автоматизированный прогнозно-поисковый комплекс на россыпные объекты золота Юго-Восточной части Алданского щита. Методическое приложение к отчету по теме: "Разработать АС применения ППК при поисках месторождений коренного, россыпного золота, алмазов и цветных металлов". М.: ЦНИГРИ, 1991. 97 с.
-
Chizhova I., Kuznetsov V., Lebedeva E. «SPRING» Expert System for Prognostic Search and Assessment of Ore Deposits // Proceedings of the 30 th IGC. Beijing, China, 4-14 August, 1996.
-
Tchijova I. (Chizhova), Kuznetsov V. A design technology for intelligent-graphic expert system for forecasting and prospecting for base and precious metal deposits // IAMG-97 Proceedings of the third Annual Conference of the International Association for Mathematical Geology. Barcelona, Spain, 1997. Part 2. P. 1009-1014.
-
Gorelikova N., Tchijova I. (Chizhova) Application of mathematical methods in creating forecasting recognition model for tin deposits and placers // Proceedings of The Third Annual Conference of the IAMG. Barcelona (Spain), 1997. P. 997-1002.
-
Tchijova I. (Chizhova), Kuznetsov V., Pokrovsky D. Image analysis and intelligent systems in geology // IAMG-98 Proceedings of the fourth Annual conference of the International Association for Mathematical Geology. Naples, Italy, 1998. Part 2. P. 730-735.
-
Gorelikova N., Patyk-Kara N., Chizhova I. Computerized modeling of rock vanish dating // Computerized modeling of sedimentary systems / J.Harff, W.Lemke, K.Stattegger (Eds.). ISBN 3-540-64109-2. Springer-Verlag Berlin Heidelberg New York, 1999. P. 413-426.
-
Strujkov S.F., Konstantinov M.M., Chizhova I.A. Computer Expert System for Epithermal Gold-Silver Deposit Prognostication (Okhotsk-Chuckchee Volcanic Belt, Northeast Russia). Natural Resources Research. 1999. V. 8. № 4. P. 315-343.
-
Tchijova I. (Chizhova), Konstantinov M., Poliakov R. Computer-aided system for selection of analogs of the world gold deposits. Proceedings of 8th Annual Conference of the International Association for Mathematical Geology, 5-20 September 2002, Berlin, Germany. 2002. P. 345-350.
-
Lobanov K, Tchijova I. (Chizhova) Computer analysis of structural-petrophysical data for geodynamic simulation on example of the Kola superdeep borehole (Baltic shield, Russia) // Proceedings of 4 Europeann Congress on Regional geoscientific Cartography and information Systems, 15-23 June, 2003. Bologna, Italy, 2003. V.1. P. 36-38.
-
Tchijova I. (Chizhova), Polyakov R. Computer-Aided System of Analog Searching as Applied to the Gold Deposits // Proceedings of 9th Annual Conference of the International Association for Mathematical Geology, 7-15 September 2003. Portsmouth, UK, 2003. P. 769-774.
-
Tchijova I. (Chizhova) Logic-informative simulation at prospecting-metallogenic analysis of perspective areas // Abstracts of 32nd International Geological Congress. Florence, Italy, August 20-28, 2004. Part 1. P. 410.
-
Tchijova I. (Chizhova) Geological economic estimation of gold deposits by means of information-analitical system of analogue selection // Abstracts of 32nd International Geological Congress. Florence, Italy, August 20-28, 2004. Part 1. P. 411.
-
Chizhova I. Information-analytical System Design Technology for Forecasting and Prospecting for Base and Precious Metal Deposits // GIS and SpatialAnalysis. Proceedings of IAMG’05. Toronto, Canada, 2005. V. 2. P. 1046-1051.
-
Chizhova I.A., Konstantinov M.M., Strujkov S.F., Pokrovsky D.A. Economic-Geological Estimation of Gold and Ore Deposits Using Information-Analitical System for the Selection of Analogues // Natural Resources Research. 2005. V. 14. № 4. P. 325-332.
-
Chizhova I.A. Principles of construction of information-analytical intellectual systems for prospecting-metallogenic analysis of perspective areas // Ext. Abs. 12th Quadrennial IAGOD Symposium 2006 "Understanding the genesis of ore deposits to meet the demands of the 21st century". 21-24 august 2006. Moscow, 2006. CD-version.
-
Chizhova I.A. An integrated representation of geo-knowledge for description and comparison of ore deposits // Proceedings of 5 European Congress on Regional geoscientific Cartography and information Systems, 13-16 June, 2006. Barcelona, Spain. V. 1. Р. 215-218.
-
Chizhova I.A. Forecasting and prospecting for base and precious metal deposits: intelligence systems – as the real way to solve this problem // Proceedings of XIth Congress for International Assoc. for Mathematical Geology. Universit de Lige, Belgium, 2006. CD-version.
-
Chizhova I., Lobanov K. Logic-information methods in analisys of petrophysical diagrams of rock samples from Precambrian tectonic structures // General Assembly of the European Geosciences Union. Vienna, Austria, 2008. CD-version.
-
Chizhova I.A., Konstantinov M.M., Struzhkov S.F. Cognitive graphics in database for search of analogues of gold deposits // 33-rd International Geological Congress: Abstracts. Norway, Oslo, August 6-14, 2008. MAG-05. CD-version.
-
Chizhova I.A., Konstantinov M.M., Struzhkov S.F. Computer-aided system ANALOG for gold ore deposits over the world: the selection of closest analogues and cognitive graphics// Proceedings of 6 European Congress on Regional geoscientific Cartography and information Systems, 9-12 June, 2009. Munich, Germany. V. 2. P. 183-186.
Типы знаний при геологических исследованиях
В настоящее время интенсивно разрабатываются и находят практическое применение для решения прикладных задач в области геологии экспертные системы ОС).
Цель исследований по экспертным системам состоит в разработке программ, которые при решении задач, трудных для эксперта-человека, получают результаты, не уступающие по качеству и эффективности решениям, получаемым экспертом. В большинстве случаев экспертные системы решают трудно формализуемые задачи или задачи, не имеющие алгоритмического решения.
Существует несколько определений понятия экспертная система. Экспертная система - программно-техническое средство, позволяющее пользователю в диалоговом режиме получать от компьютера консультационную помощь в конкретной предметной области, где сконцентрированы опыт и знания людей-экспертов (специалистов в данной области) [Попов, 1987].
Экспертные системы - программы для компьютера, которые могут воспроизводить процесс решения проблемы человеком-экспертом [Марселлус, 1994]
Эспертная система - программа, которая использует знания специалистов (экспертов) о некоторой конкретной узко специализированной предметной области и в пределах этой области способна принимать решения на уровне эксперта-профессионала fwww.intuit.ru].
Экспертные системы - прикладные программы ИИ, в которых база знаний представляет собой формализованные эмпирические знания высококвалифицированных специалистов (экспертов) в какой-либо узкой предметной области fwww.ai.tsi.lv]. Экспертная система - программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем fwww.ai.tsi.lv]. Исходя из вышеперечисленных определений под экспертной системой будем понимать компьютерную программу, использующую знания и логику рассуждений эксперта с целью выработки рекомендаций или решения проблем. Под предметной областью понимается множество объектов, значений их характеристик и связывающих их отношений (т.е. сущностей, описывающих область экспертизы) [Попов и др., 1996]. Если в предметной области большая часть знаний является личным-опытом специалистов высокого уровня (экспертов), если эти знания по каким-либо причинам слабо структурированы, такая предметная область нуждается в экспертной системе.
В ходе сбора данных, предназначенных для решения задач, происходит процесс их преобразования в знания, необходимые для получения результата. От качества базы знаний целиком зависит успех в решении задач, поставленных перед экспертной системой.
Учитывая широкие возможности ЭС, целесообразно их использование при решении прогнозных задач в области геологии. Например, при решении основных задач, возникающих при формировании прогнозно-поисковых комплексов (ППК), а именно: 1. выделение критериев, характеризующих перспективность геологических объектов и оценка их взаимосвязи; 2. оценка на их основе перспективности любого объекта. ЭС незаменимы в тех случаях, когда пользователь должен принимать решение, выходящее за рамки его компетентности; когда пользователь должен получить квалифицированную помощь в сжатые сроки.
ЭС обеспечивают проектирование и управление сложными объектами, отличающимися разнородностью требуемых характеристик, сложностью оптимизации их совокупности, а также характеризующимися многообразием нештатных ситуаций в их работе, влиянием многочисленных объективных и субъективных факторов, в том числе человеческого, и в связи с этим сложностью и неоднозначностью принятия решения.
Целесообразность применения ЭС заключается и в том, что они позволяют обучать специалистов разной степени подготовленности, контролируя уровень квалификации при относительно низкой стоимости обучающих средств.
По степени участия геолога в процессе решения прогнозных задач все существующие прогнозные системы могут быть отнесены к одной из следующих технологий [Бугаец и др., 1986]:
1. Формализованная технология. Суть подхода состоит в максимальной формализации исходных понятий и построении строго формальных моделей на основе связь между рудоносностью территории и комплексом имеющихся геолого-геофизических данных, не рассматривая содержательных аспектов этой связи.
2. Человеко-машинная технология. При этом подходе широко используются методы математической статистики, теории распознавания образов и др., но при этом геологу представляется возможность, участвовать в процессе прогнозирования на всех его стадиях. На основе имеющейся информации об исследуемом районе, геолог формулирует различные статистические гипотезы, проверка которой автоматизированной системой дает ему возможность делать заключение о достоверности содержательных прогнозных предложений.
3. Технология экспертных систем. В этом случае основой прогнозирующей системы являются содержательные модели рудных месторождений в том виде, как они представляются геологам. В базу знаний ЭС помещается вся геологическая информация, характеризующая объекты исследования. ЭС имитирует процесс принятия прогнозных решений специалистом геологом, давая по ходу решения необходимые пояснения.
Принципиальным преимуществом- использования методологии ЭС является возможность реализации металлогенических моделей, т.е. возможность представления «реальных» профессиональных знаний. ЭС позволяют использовать всю сумму геологических знаний о размещении месторождений полезных ископаемых конкретного типа, накопленных в металлогенической теории, что позволяет существенно увеличить эффективность прогноза, повысить его точность и надежность.
Процесс актуализации (периодического обновления) баз данных, используемых для извлечения знаний, обеспечивает получение более полных и точных баз знаний.
ЭС предъявляют менее жесткие требования к используемым знаниям, чем четкие математические методы. Важнейшей чертой ЭС является переход от математических методов обработки информации к логическим.
Способы представления знаний
Основными принципами для построения распознающих систем являются принцип общности свойств (тип 1) и принцип перечисления (тип 2) [Ту, Гонсалес, 1978; Уотерман, 1989]. В первом случае, опираясь на принцип общности свойств, который основан на предположении, что объекты, образующие один класс, обладают свойством подобия, отраженного в их характеристиках, необходимо выделить системы информативных признаков, описывающих группу объектов в целом (отождествляющие признаки) и каждый тип в отдельности (делящие признаки), и на их основе построить решающее правило для отнесения экспертируемого объекта к одному из выделенных типов объектов. Во втором случае используется некоторая мера сходства для определения степени близости экспертируемого объекта к одному из эталонов. При этом возможен выбор аналога экспертируемого объекта среди эталонных объектов, содержащихся в базе данных, по любому набору признаков, что дает возможность пользователю проверять различные гипотезы и сравнивать эффективность работы выбранных критериев.
Особенности построения баз знаний при использовании этих подходов представлены на рис. 2.3. Различия заключаются в выборе способов описания объектов исследования и их типов, вида расчетных функций и решающих правил.
Необходимость в таких системах остро назрела в настоящее время. Особенно в связи с задачами переоценки формационных типов и масштабов известных рудопроявлений в условиях высокой их изученности. Например, ранее Дукатское золото-серебряное месторождение в течение нескольких десятилетий, предшествовавших его открытию в 1967 году, ошибочно фигурировало в списках рудопроявлений как мелкое непромышленное проявление олова, а в настоящее время известно, как гигантское серебряное [Константинов и др., 19986]. Такая переоценка наиболее сложна на ранних стадиях изучения объекта (до бурения), когда отсутствует информация по главному прямому признаку (относится ли объект к промышленному месторождению или непромышленному рудопроявлению?). Как правило, в этом случае не удается выявить даже небольшое (1-2) количество косвенных признаков, которые были бы жестко пропорционально связаны с главным
Особенности структуры базы знаний экспертной системы при использовании различных принципов ее построения прямым признаком. При этом возникает необходимость учета достаточно большого количества косвенных признаков. Одним из подходов к подобной переоценке может служить формирование интеллектуальной гибридной экспертной системы для экспресс-оценки анализируемой перспективной площади.
Блок 1 обеспечивает дружественный интерфейс с пользователем (ведение диалога) и визуализацию исходной информации по целевым параметрам из базы данных на основе ГИС-технологии (в графической форме). Блок 2 на основе технологии искусственного интеллекта обеспечивает работу системы принятия решений для получения заключений о формационном типе, Рис. 2.4 . Схема процесса функционирования экспертной системы для прогнозной экспресс-оценки перспективных площадей масштабности оруденения и выборе ближайшего аналога для экспертируемого объекта по имеющейся базе знаний, содержащей базу данных. Блок 3 на основе выбранных пользователем системы информативных признаков или меры близости проводит поиск ближайшего аналога. Блок 4 является блоком формирования результатов и оценки их достоверности и обеспечивает на основе ГИС-технологии визуализацию полученных заключений.
Экспертная система предназначена для помощи эксперту в оценке потенциала перспективных площадей. Опыт разработки экспертных систем показал, что наилучшим образом поставленным целям отвечают модели решающих правил. Они могут быть построены как на основе знаний экспертов, так и в результате математической обработки имеющейся базы данных по эталонным объектам (эвристические и расчетно-логические правила).
Технология проектирования таких систем базируется на методике создания многофакторных моделей геологических объектов [Многофакторные..., 1992] для разных металлогеничєских уровней (поле, месторождение), оригинальной методике построения базы знаний.
Технологическая цепочка построения экспертной системы сводится к выполнению следующих основных операций: Основной принцип создания баз данных для целей прогноза заключается в том, что объекты исследования образуют сложную систему, элементы которой имеют иерархическое соподчинение, а именно: провинция, металлогеническая зона, рудный район, рудное поле, месторождение. Металлогенический объект рассматривается на каждом уровне, как некоторая целостность, характеризующаяся своими, только ей присущими признаками. При этом значения признаков могут быть следующих типов:
Основой базы знаний для решения конкретной задачи является дерево ее решения, т.е. процесс решения задачи следует структурировать: разбить ее на подзадачи и указать последовательность их решения в зависимости от возможных состояний анализируемого объекта.
Механизм вывода решений использует правила типа "И", "ИЛИ", "Байеса" (1) и решающие правила на основе весовых коэффициентов (2). Любые сложные правила должны быть понятными - это позволяет избежать опасных ошибок. Правила формулируются экспертом. Различие заключается лишь в том, что в первом случае все весовые характеристики (информативность признаков, истинность, логическая необходимость, логическая достаточность) задаются экспертом, а во втором - они рассчитываются исходя из анализа описаний эталонных объектов, имеющихся в базе данных.
Особенности логико-информационных методов
В качестве решающих правил обычно выбираются наиболее простые, поддающиеся логическому объяснению правила, позволяющие реализовывать несложные оптимизационные процедуры его поиска. Именно поэтому наиболее широкое применение получили линейные решающие правила.
И.А.Мулагуловым [Мулагулов и др., 1988] проведен численный эксперимент оценки качества прогнозирования при использовании алгоритма суммы одномерных нелинейностей. Этот алгоритм относится к системе распознавания образов на основе принципа общности свойств. Под ошибкой понимается среднее стандартное отклонение разности между истинным и прогнозируемым значением.
Оказалось, что ошибка уменьшается при увеличении числа эталонов, числа прогнозирующих характеристик (признаков) и силе связи между целевой и прогнозирующими характеристиками.
Автору удалось теоретически доказать следующие результаты, позволяющие оценивать надежность решающих правил, построенных по распознающим комплексам признаков.
Утверждение 3. Пусть Z - множество эталонных объектов, содержащее S элементов, описанных в системе К бинарных признаков. R - решающее правило для распознавания М классов, построенное по распознающему комплексу признаков Y = {y ,у ,...,у ) с коэффициентом отделимости классов Н и функции р{х). Тогда с вероятностью l-rj (о 77 і) можно утверждать, что доля ошибочно распознанных объектов не будет превосходить є, если длина обучающей выборки S не менее =ln(M-lH -ln7(M_iy Утверждение 4. Пусть Z - множество эталонных объектов, содержащее S элементов, описанных в системе бинарных признаков. R - решающее правило, построенное по распознающему комплексу признаков Y = {y,i,yh,...,ylt) с коэффициентом отделимости классов Я и функции (р(х). Тогда с вероятностью 1-/7 (0 г] 1) можно утверждать, что доля ошибочно распознанных объектов не будет превосходить є, где є = (М - l)V(ln(M -1) + К2 - In TJ)/2S
Из утверждения 3 следует, что можно определить минимальную длину обучающей выборки, при которой доля ошибочно распознанных объектов не превышает заданной величины. Из утверждения 4 следует, что можно определить максимальную величину доли неправильно распознанных объектов, если решающее правило построено по выборке фиксированной длины. Например: при 77 = 0.1, s- = 0.5, М = 3, К = Ъ, Z = 95. Из теоретических результатов следует, что ошибка распознавания (отнесения объекта из одного класса в другой) уменьшается при увеличении числа эталонов и уменьшении числа классов и числа информативных признаков. Результаты Мулагулова [1988] свидетельствуют, что эти тенденции прослеживаются и при использовании других решающих правил.
Особенность решения прогнозной задачи в системе прогнозированияАСТРА Большинством авторов [Каждан, 1985; Давиденко, 1986] задача прогнозирования представляется в формализованном виде как задача распознавания перспективных объектов и сводится к поиску в пределах исследуемой территории геологических объектов (полей, районов, месторождений), сходных по системе информативных признаков с эталонными объектами. При выделении М классов эталонных объектов, различающихся по некоторому монотонно изменяющемуся целевому свойству (например, масштабности оруденения, соотношению полезных компонентов в рудах) решают задачу распознавания, предполагая, что каждый класс имеет свои специфические признаки, т.е. основным принципом становится-принцип общности свойств. А такая-важная информация, как упорядоченность, классов, при» этом не учитывается. Идея проанализировать вариационный ряд геологических1 объектов (ряд объектов с постепенным? изменением целевого признака) впервые была реализована Р.М.Константиновым [1973] в рудноформационном анализе. Для изучения причин, определяющих постепенное изменение целевого свойства, необходимо было выбрать те геологические факторы, которые влияли на эти изменения и сами менялись так же постепенно. Именно поэтому в качестве критериев информативности признаков целесообразней рассматривать, не только критерий различия описаний эталонных объектов из разных классов, но и» критерий связи анализируемых факторов с целевым свойством: Такой комплексный критерий был предложен в методе вариационных рядов [Константинов, 1973; Сиротинская, 1975, 1986].
Специфика решения-задачи прогнозирования как раз и должна учитываться при выборе метода анализа данных. При использовании классических методов распознавания процедуре распознавания подвергаются сами объекты, а не их свойства, как при геологических исследованиях. При-анализе вариационных рядов объектов селекция признаков проводится на основе их связи с исследуемым свойством. При этом понятие связи вводится на основе представления о том, что если направленному изменению целевого состава (масштабности оруденения, перспективности геологического объекта) соответствует такое же направленное изменение геологических характеристик, то это свидетельствует о их связи; причем отсутствие признака несет не менее полезную информацию, чем его наличие.
Только сочетание принципа вариационных рядов и принципа общности свойств, может дать возможность провести формирование системы информативных признаков (признаков, связанных с изменением целевого свойства).
Классические же методы распознавания (выделяющие признаки, специальные для классов объектов) можно использовать только для анализа 2 классов. Кроме того, если придерживаться гипотезы, что процесс накопления свойства (увеличение масштабов) оруденения можно представить как совокупность нескольких предпосылок (присутствие или отсутствие выделенного значения признака из диапазона его изменения), одновременное проявление которых ведет к реализации наилучшей ситуации (образованию крупного месторождения), то рассматриваемый подход дает возможность получить простейшую модель исследуемого процесса. Чем большее число классов будет выделено, тем точнее можно будет получить модель. Неуспех в выделении признаков, характеризующих средние классы (по масштабности оруденения) при анализе нескольких классов объектов, сформированных по степени проявления целевого свойства, как раз и можно объяснить несоответствие геологической задачи и метода ее решения.
Дальнейший способ решения прогнозной задачи зависит от того, какими сведениями относительно прогнозируемого параметра мы обладаем: знаем точно его значение или знаем только диапазон его изменения. В первом случае возможно построение уравнений, описывающих интересующую нас зависимость (задача количественного прогноза). Во втором случае эти зависимости можно проследить на основе изучения вариационных рядов объектов (задача качественного прогноза).
Программная реализация экспертной системы для уровня рудного поля
Золото-кварцевые месторождения имеют общие закономерности рудолокализации с объектами в «черносланцевых» толщах других регионов. Золото-редкометалльные месторождения, хотя и локализуются в штоках диоритов-гранодиоритов, тем не менее, до уровня рудного поля включительно, характеризуются одной с ними системой признаков. Другими словами, в потенциально рудоносном поле могут быть встречены как одни, так и другие формационные типы объектов.
При анализе карт масштаба 1:1000 000 - 1: 1500 000 А.А.Фельдманом [1984] установлено, что повышенная золотоносность в верхней части земной коры возникает над очагами гранитоидного магмаобразования, заложившимися в субстрате фемического типа, в протяженных базитовых трогах протоэвгеосинклиналей и рифтогенных структурах нижних структурных этажей. При анализе более крупномасштабных (1:500 000 - 1:200 000) металлогенических и геологогеофизических данных этим же автором [Фельдман, 1984] выяснены факты локализации золоторудных районов в узлах пересечения упомянутых выше рифтогенных структур основания с крупными магмаконтролирующими» разломами; к которым приурочены гранитоидные массивы. Границей золоторудного района, по А.А.Фельдману [1984], служит замкнутый контур, охватывающий гранитоидные массивы, которые имеют единый структурный контроль совместно с тектоническими блоками.
В.М.Яновский [1984, 1990] ввел понятие зон рудовмещающих дислокаций в терригенном этаже миогеосинклиналей, которое звучит следующим образом: «... это региональная структура, представленная сочетанием разрывных, блоковых и складчатых дислокационных элементов в терригенном этаже миогеосинклинали, контролирующая и вмещающая гидротермалиты и предрудные магматические образования». Зоны рудовмещающих дислокаций?проявлены в терригенных толщах в виде крупных зон трещиноватости, сочетающихся с разрывами и блоками.высоких порядков, систем- сближенных субпараллельных разрывов с разнообразными приразломными дислокационными формами, систем пересекающихся или сопряженных разрывов с блоками высоких порядков, а также систем блоков и асимметричных блокированных складок.
Часто в единой зоне рудовмещающих дислокаций сосуществует большинство названных сочетаний дислокационных элементов, чередующихся в поперечном или продольном сечении зоны [Яновский, 1990, стр. 92].
Особенности структурного контроля, по данным В.А.Нарсеева и В.М.Яновского [1984], заключаются в связи оруденения с региональными разломами первого и второго порядков, представленными в терригенных толщах системами разрывных нарушений с приразрывными дислокационными элементами, мощными зонами трещиноватости (типа регионального кливажа), а также зонами осложнения складчатости (резкими замыканиями, флексурообразными перегибами серий складок). В отмеченной работе подчеркивается связь рудоконтролирующих зон с элементами глубинного строения территорий: с крупными разломами и системами блоков в подстилающих комплексах. Общей структурной характеристикой подобных зон является сочетание разрывов различных порядков с разнообразными дислокационными формами - зонами рассланцевания, дробления, пластического течения. Распространены будинаж, разлинзование, приразрывные складки, линзовидные и торцовые сопряжения разрывов. Физико-механические свойства осадочных пород, характер переслаивания терригенных толщ и режимы формирования рудоконтролирующих зон обуславливают развитие прожилково-вкрапленной минерализации в значительных объемах дислоцированных проницаемых пород. Здесь же [Нарсеев, Яновский, 1984, с. 6-7] говорится о том, что рудные поля нередко располагаются на удалении от гранитоидных массивов. Характерно присутствие в рудоконтролирующих зонах даек и штоков среднего субщелочного состава, относящихся к поздне-послеорогенным формациям. По геофизическим данным зоны прожилково-вкрапленной минерализации и рассредоточенные мелкие интрузивные тела в терригенных толщах располагаются вблизи скрытых гранитоидных массивов, залегающих на глубинах 2-5 км.
По А.И.Калинину [1988], изучавшему объекты в детальных масштабах, закономерности рудолокализации золото-кварцевых месторождений во многом определяется режимом тангенциального сжатия, на котором происходил морфогенез рудных полей и месторождений, вызывающий последовательные перемещения вещества, различие для каждой из фаз деформирования: пластическое течение в замки складок, вертикальные и латеральные блоковые перемещения и, наконец, сложные комбинированные, в которых сочетаются все перечисленные выше. Указанные перемещения определяют локальную геодинамическую обстановку рудного этапа для каждой из фаз деформирования. Далее автор отмечает: «В пластическую фазу деформации режим сжатия... ...осложняется развитием зоны растяжения в сводовых частях складок, что вызывает образование отслоений, выполненных седловидными жилами. В фазы соскладчатых взбросо-надвигов и сдвигов отложение руды происходило в условиях сжатия... Локальный геодинамический режим рудного этапа конечной фазы деформирования был пульсирующий с чередованием в пространстве и во времени участков сжатия и растяжения, определивших большое разнообразие, рудоносного кварца». А.И.Калинин [1988] делает вывод о том, что масштабное оруденение контролируется структурами фаз соскладчатых разломов, представленными системами сближенных взбросово-надвиговых или сдвиговых разрывов. Автор придает большое значение процессам экранизирования рудоносных растворов. По его мнению, наиболее часто экранируют оруденение толщи и горизонты сланцев, дайки и силлы изверженных пород, в контактах которых локализуется рудоносные жилы, а пространственное положение рудных столбов определяется влиянием экранирующих и локализующих элементов, главным образом, трещинными структурами. Возможное положение рудных столбов можно определить после геологоструктурного изучения месторождения, выделения экранирующих и локализующих.элементов.
В пределах Тенькинского и Берелехского рудных районов [Курбанаев, Бакшеев, 1990] проводились тектонофациальные исследования масштаба 1:200.000. Первый из них характеризуется наличием месторождений золото-кварцевойг т золото-редкометалльной формаций, а также россыпями золота, второй - мелкими коренными объектами, но крупными россыпями. Закономерности рудолокализации,- с точки зрения тектонофациального анализа, заключаются в следующем. Рудные поля коренных месторождений располагаются- в ситуации сочетания швов высших« тектонофаций (здесь и везде далее - мезозоны) и низших тектонофаций. Первые представляют собой зоны изоклинальной линейной складчатости, являющиеся каналами миграции полезных.компонентов. Низшие тектонофаций представляют из себя слабодеформированные, с брахиформной и; куполовидной, складчатостью, слабопроницаемые участки, являющиеся своеобразными экранами для рудной минерализации. Если первый элемент (швы высших тектонофаций) содержит в себе линейные зоны согласных со складчатостью. и кливажом минерализованных зон и прожилков, то второй - разнообразные жильные, прожилковые зоны и штокверки, основная черта которых - секущие взаимоотношения прожилков и жил с вмещающими породами. Между, двумя типами могут быть многочисленные переходные разности, наличие которых определяется уровнем эрозионного среза, физико-механической и литологической контрастностью разреза. При отсутствии экранирования, т.е. на площадях сплошного развития высших и средних