Содержание к диссертации
Введение
ГЛАВА 1. Анализ алгоритмов автоматизированных систем обработки и интерпретации данных ГИС 16
1.1. Обзор методов ГИС 16
1.1.1. Электрический каротаж 17
1.1.2. Радиоактивный каротаж 20
1.1.3. Акустический каротаж 21
1.1.4. Кавернометрия 22
1.2. Интерпретация геофизической информации 23
1.2.1. Методы интерпретации, основанные на петрофизических данных 24
1.2.2. Алгоритмы статистической классификации 26
1.2.3. Алгоритм с использованием комплексных кодов 30
1.2.4. Литологическое расчленение с оценкой вероятности 31
1.3. Автоматизированные системы интерпретации ГИС 33
1.3.1. АСОИГИС 33
1.3.2. Gintel 36
1.3.3. КОСКАД 39
1.4. Базы данных и экспертные системы ГИС 39
1.4.1. Система управления данными Finder .41
1.4.2. Экспертные системы 42
1.5. Результаты анализа 43
1.6. Постановка цели и задач исследований 45
ГЛАВА 2. Математическое описание алгоритмов оперативной интерпретации 46
2.1. Постановка задачи 46
2.2. Предварительная обработка данных 48
2.2.1. Нормирование методов 48
2.2.2. Удаление тренда и сглаживание 49
2.2.3. Увязка по глубине 51
2.2.4. Устранение пропусков в данных 52
2.3. Литологическое расчленение разреза с использованием нечеткой классификации 54
2.3.1. Алгоритм нечеткой классификации 55
2.3.2. Определение весовых коэффициентов для методов ГИС 59
2.3.3. Генетический алгоритм 59
2.4. Алгоритмы классификации с использованием нейронных сетей 62
2.4.1. Основные понятия 62
2.4.2. Обучение без учителя 65
2.4.3. Гибридная нейронная сеть 68
2.5. Модель нечеткой логики 68
2.5.1. Основные понятия 68
2.5.2. Состав модели 71
2.5.3. Алгоритм нечеткого вывода 73
2.6. Оценка свойств коллекторов по неточным геофизическим данным 76
2.6.1. Нечеткие числа и операции над ними 76
2.6.2. Оценка коэффициента пористости 80
2.6.3. Оценка коэффициента глинистости 84
2.6.4. Оценка коэффициента нефтегазонасыщенности 84
ГЛАВА 3. Состав и структура программного комплекса 86
3.1. Разработка системы 86
3.1.1. Требования к системе 86
3.1.2. Назначение системы 87
3.1.3. Состав и структура системы 88
3.1.4. Требования к аппаратному и программному обеспечению 91
3.1.5. Применение системы 92
3.2. Разработка базы данных ГИС 96
3.2.1. Структурная схема базы данных 97
3.2.2. Организация обработки данных 99
3.3. Разработка модуля нечеткой классификации 102
3.3.1. Назначение модуля 102
3.3.2. Алгоритм функционирования 103
3.4. Разработка модуля НС с самообучением 105
3.4.1. Назначение модуля 105
3.4.2. Алгоритм функционирования 105
3.5. Разработка модуля нечеткой логики 107
3.5.1. Назначение модуля 107
3.5.2. Алгоритм функционирования 108
3.6. Разработка модуля оценки петрофизических параметров 108
3.6.1. Назначение модуля 108
3.6.2. Алгоритм функционирования 109
3.7. Выводы 110
ГЛАВА 4. Применение алгоритмов для интерпретации данных ГИС 112
4.1. Объект и цели исследования 112
4.2. Применение алгоритма нечеткой классификации 114
4.2.1. Определение необходимого количества классов 115
4.2.2. Определение весовых коэффициентов методов ГИС 118
4.3. Применение алгоритма обучения нейронных сетей без учителя 124
4.4. Определение коэффициента пористости 127
4.5. Результаты экспериментальных исследований 132
Заключение 133
Литература 135
- Методы интерпретации, основанные на петрофизических данных
- Базы данных и экспертные системы ГИС
- Алгоритм нечеткой классификации
- Применение алгоритма обучения нейронных сетей без учителя
Методы интерпретации, основанные на петрофизических данных
В практической работе геофизических предприятий определяется минимум геологических свойств, позволяющих дать представление о разрезе скважины, наличии и характере насыщения коллекторов в изучаемом разрезе [82]. Этот минимум определяется тремя свойствами: коэффициентом пористости кп, коэффициентом глинистости кгл, коэффициентом водонасыщенности кв, через который определяется коэффициент нефтегазонасыщенности кнг. Все геофизические методы в стандартном комплексе ГИС с этой точки зрения делятся на три группы: методы, содержащие информацию о кв и кн пород - это методы сопротивления; методы пористости (р{ кп); методы глинистости у{ кгя).
В общем виде, граф обработки данных ГИС [40] приведен на рис. 1.2, где ВК, IK, PZ, NGR, DT, GGR, MGZ, SP, GR - методы каротажа; рп - удельное сопротивление продуктивного пласта, р6П - сопротивление при заполнении пор пластовой водой, р„„ - сопротивление промытой зоны.
Диаграммы истинного удельного сопротивления неизменной части пласта преобразуются в параметр насыщения Р„ и коэффициент водонасыщения ke. Для нахождения параметра насыщения, кроме удельного сопротивления коллектора, необходимо знать его сопротивление при заполнении пор пластовой водой рт. Для этого используется вторая ветвь схемы - интерпретация данных методов пористости. По величине коэффициента пористости находится параметр пористости Рп, а по нему - величина рвп, которая в свою очередь используется для определения Рн. Во многих случаях для определения пористости требуется знание глинистости, что показано на третьей ветви схемы, предполагающей влияние глинистости на конечные параметры только через коэффициент пористости. В действительности петрофизические связи представляют собой более сложные уравнения, в каждое из которых входит не только перечисленные в схеме, но и другие параметры коллекторов.
Таким образом, определение искомых геофизических параметров с использованием петрофизических моделей сводится к решению систем петрофи-зических уравнений. Известен ряд зарубежных и отечественных программных продуктов, использующих подобный подход [60].
Ш.А. Губерман в начале 60-х годов предложил рассматривать процесс классификации геологических объектов как задачу распознавания образов. В 1960-70 годах и другие ученые-геофизики стали использовали алгоритмы распознавания образов для решения задач промысловой геофизики [107, 46,20].
Задачи классификации основаны на том, что в пространстве классы объектов с разными свойствами образуют контактные множества и поэтому могут быть определены границы между ними. Класс - это качественно однородная совокупность объектов. Каждый объект, относящийся к какому-либо классу, описывается несколькими параметрами {х}=(дгі, xj, ..., хп). Совокупность всех переменных-параметров называется пространством признаков. Число признаков, описывающих объект, определяет мерность пространства. Смысл классификации объектов заключается в построении критерия или решающего правила FKp {х} для отнесения объектов к разным классам. Данный подход позволяет решать задачи классификации пластов на водоносные и продуктивные, коллекторы и неколлекторы, разные литологические типы. В качестве параметров выступают различные геофизические характеристики, такие как диаметр скважины, радиоактивные характеристики, диэлектрическая проницаемость среды и т.д.
Классификация объектов с обучением [40]. Решение задачи классификации производится в три этапа: обучение, экзамен, распознавание.
На этапе обучения производится поиск границ между классами, на основании выборки классов, принадлежность которых к продуктивным или водоносным объектам достоверно известна. В результате обучения строится уравнение разделяющей гиперплоскости FKP{JC} таким образом, чтобы пласты, относящиеся к одному классу, удовлетворяли условию F{x} FKp{x}, а относящиеся к другому классу - F{x} FKp{x}. В [78] приводятся различные критерии для повышения точности интерпретации.
На этапе экзамена проверяется эффективность найденного решающего правила, на экзаменационной выборке, в которую входят пласты с известным характером насыщения, не участвовавшие в поиске решающего правила.
На этапе распознавания производится классификация объектов, характер насыщения которых неизвестен.
Недостатки описанного алгоритма связаны, в основном, с недостаточной статистической выборкой данных. Для проведения обучения требуется представительная выборка пластов с достоверными результатами опробования!
Применять данный алгоритм распознавания целесообразно на ранних стадиях разведки месторождений, пока еще не установлены четкие количественные критерии нефть-вода. Но на этом этапе нет достаточного числа опробований, чтобы сформировать представительные выборки по нефтеносным и особенно водоносным пластам. Достаточная информация может быть получена на поздней стадии разведки, но к этому моменту уже известно положение водоносных и нефтеносных пластов. Поэтому подключение программ распознавания, имеющих этап обучения, имеет смысл только при полной автоматизации процесса обработки геолого-геофизических данных по площади и при наличии хорошо развитых территориальных банков данных.
Базы данных и экспертные системы ГИС
Программный пакет Finder, разработанный фирмой Schlumberger, представляет собой систему управления и хранения геологических, геофизических, разведочных и промысловых данных, а также позволяет хранить и управлять любой информацией, которая используется в нефтяной и газовой промышленности [3].
В основе Finder лежит реляционная база данных Oracle, позволяющая управлять большими объемами векторной информации, такой как, например, каротаж, картографическая и сейсмическая информация. База данных Finder является ядром системы управления данными (СУБД Finder). Реляционная СУБД Oracle позволяет хранить и, при необходимости, выбирать геологические, геофизические, петрофизические, промысловые и другие типы геолого-промысловых атрибутов. Модель данных Finder базируется на стандартной модели земной поверхности.
Специально разработанная технология хранения данных в виде так называемых N-списков позволяет избежать проблем, связанных с обработкой больших списков данных (например, представление некоего геологического объекта в виде каротажных диаграмм), хранящихся в реляционной СУБД, Данные, содержащиеся в N-списках, связаны с реляционной базой данных специальными ссылками, обеспечивающими быструю и эффективную выборку и визуализацию данных, а также создание соответствующих реляционных атрибутов в базе данных.
Архитектура Finder позволяет обрабатывать наборы данных любого объема. Файловая система записи информации присваивает объектам произвольные номера, а пользовательский интерфейс поддерживает концепцию переменных значений номеров объектов.
Текущее состояние всей информации, содержащейся в базе данных, может быть представлено в виде карты всего месторождения, участка или региона. Данные карты могут состоять из неограниченного числа информационных слоев, каждый из которых отражает состояние участка или проекта на тот момент времени, когда данные были выбраны. Любой графический объект или атрибут, хранящийся в базе данных, может быть визуализирован на карте
Окно Finder, содержащее карту, напрямую связано с базой данных. Интерпретация графических объектов может проводиться с использованием пространственных, относительных и других методик выборки. Пространственные методики включают в себя выбор объекта с помощью мыши, возможность выбирать группы объектов, выделяя прямоугольником некую содержащую их область.
Поскольку выбор объектов для визуализации и нанесения на карту достаточно прост, пользователь может адаптировать механизм картирования к новым типам данных и методам их обработки без изменения программного кода. На карту может быть выведена вся имеющаяся информация по скважине, включая добавленные пользователем данные.
Экспертные системы позволяют использовать накопленные знания для решения множества задач из разных областей инженерной и научной деятельности. Не обошли стороной разработчики ЭС и область разработки и добычи полезных ископаемых. Среди зарубежных ЭС в области ГИС можно выделить следующие системы: Lobster ("A fuzzy logic enhancement from core analysis", Bonarini A. Corrao L, Giacommetti L. Tornado), Xero - система энергетических служб контроля воды, Geophysics Advisor - система исследования и мониторинга загрязненных месторождений, Spirit - система определения качества интерпретации данных исследования скважин, GeoCos 3D - система построения хро-ностратиграфических поверхностей и контроля интерпретации, Sismonaute — регистрирует и интерпретирует волновой фронт при сейсмическом воздействии [24].
Среди отечественных систем можно отметить системы "ГИС-эффект" и "ГДИ-эффект", разработанные ОАО "Центральная геофизическая экспедиция" и систему Logic Master, разработанную на кафедре геофизики Башкирского государственного университета [24, 19].
Система "ГИС-эффект" обеспечивает решение таких традиционных задач, как: создание базы стандартизованных данных ГИС; обоснование методики обработки данных ГИС на основе тестовых массивов "ГИС-эксперт"; выдача оперативного заключения по каротажу; выявление новых залежей; определение расчетных параметров, используемых при построении геологической модели; определение гидропроводности и дебета для проектируемого объекта эксплуатации [19].
Система Logic Master предназначена для: получения рекомендаций по определению методики проведения скважинных измерений; получения заключения по результатам исследования эксплуатационных скважин; обучения студентов, геофизиков-операторов, начальников партий и начинающих геофизиков [24]. ЭС благодаря своей способности эффективно и достоверно решать слабо формализованные задачи с учетом неопределенных данных могут занять значительное место среди современных геофизических программных продуктов, но в настоящее время, в России широкого практического применения эти программы пока не имеют [45].
В результате анализа существующих программных комплексов и методик интерпретации можно сказать, что в настоящее время проработаны алгоритмы и имеются программно-аппаратные комплексы для сбора, оцифровки, редактирования и интерпретации КД [84]. Однако из-за того, что не существует комплекса решающего все задачи обработки данных ГИС, а существующие программные комплексы, не интегрированы друг с другом и имеют разные форматы представления данных, комплексная автоматизация всех технологических процессов затрудняется, а иногда и вообще не представляется возможной. Проблема также усугубляется сложностью настройки и русифицированным интерфейсом некоторых программ.
Анализ методик и алгоритмов показал, что практически не автоматизированными остаются задачи контроля интерпретации ГИС на вновь разрабатываемых месторождениях и экспресс-анализа каротажной информации непосредственно на скважине; кроме того, необходимо развитие интегрированных средств хранения и анализа геофизических данных.
Алгоритм нечеткой классификации
Классические алгоритмы обучения нейронных сетей, например, алгоритм обратного распространения ошибки [102], основаны на наличии обучающей выборки. Как уже было сказано выше, на этапе разведки месторождений углеводородов исследователи еще не имеют такой возможности.
Процесс обучения, как и в случае обучения с учителем, заключается в под-страивании весов синапсов. Подстройка синапсов проводится на основании информации, доступной в нейроне, то есть его состояния и уже имеющихся весовых коэффициентов.
Сигнальный метод обучения Хебба заключается в изменении весов по следующему правилу [67]: где уі" 1 - выходное значение нейрона / слоя (п-1), yj-n) - выходное значение нейрона/ слоя n; Wi/t) и w t-І) — весовой коэффициент синапса, соединяющего эти нейроны, на итерациях t и t-І соответственно; а - коэффициент скорости обучения. Здесь и далее, для общности, под п подразумевается произвольный слой сети. Обучение сети данным методом усиливаются связи между возбужденными нейронами.
Другим методом является дифференциальный метод обучения Хебба. - выходное значение нейрона / слоя п-1 соответственно на итерациях t и t-l\ y}"\t) и y}"\t-l) — то же самое для нейрона/ слоя гг. Как видно из формулы (2), сильнее всего обучаются синапсы, соединяющие те нейроны, выходы которых наиболее динамично изменились в сторону увеличения.
Алгоритм обучения с применением вышеприведенных формул выглядит следующим образом: 1. На стадии инициализации всем весовым коэффициентам присваиваются небольшие случайные значения. 2. На входы сети подается входной образ, и сигналы возбуждения распространяются по всем слоям согласно принципам классических прямопоточных сетей, то есть для каждого нейрона рассчитывается взвешенная сумма его входов, к которой затем применяется активационная (передаточная) функция нейрона, в результате чего получается его выходное значение_у/л), i=Q...M,-l, где М[- число нейронов в слое /; n=0...N-l, a N— число слоев в сети. 3. На основании полученных выходных значений нейронов по формуле (2.22) или (2.23) производится изменение весовых коэффициентов. 4. Цикл с шага 2, пока выходные значения сети не перестанут изменяться с заданной точностью. Применение такого способа определения завершения обучения, отличного от использовавшегося для сети обратного распространения, обусловлено тем, что подстраиваемые значения синапсов фактически не ограничены. На втором шаге цикла попеременно предъявляются все образы из входного набора. Алгоритм Кохонена. Следующий алгоритм обучения без учителя - алгоритм Кохонена - предусматривает подстройку синапсов на основании их значений от предыдущей итерации. Обучение сводится к минимизации разницы между входными сигналами нейрона, поступающими с выходов нейронов предыдущего спояуп \ и весовыми коэффициентами его синапсов [67]. Полный алгоритм обучения имеет примерно такую же структуру, как в методах Хебба, но на шаге 3 из всего слоя выбирается нейрон, значения синапсов которого максимально походят на входной образ, и подстройка весов по формуле (2.24) проводится только для него. Эта, так называемая, аккредитация может сопровождаться затормаживанием всех остальных нейронов слоя и введением выбранного нейрона в насыщение. Выбор такого нейрона может осуществляться, например, расчетом скалярного произведения вектора весовых коэффициентов с вектором входных значений. Максимальное произведение дает выигравший нейрон. Другой вариант - расчет расстояния между этими векторами в р-мерном пространстве, где р — размер векторов. где У - индекс нейрона в слое п, і - индекс суммирования по нейронам слоя (п-1), Wjj - вес синапса, соединяющего нейроны; выходы нейронов слоя (п-1) являются входными значениями для слоя п. В данном случае, "побеждает" нейрон с наименьшим расстоянием. При использовании обучения по алгоритму Кохонена входные образы и начальные значения весовых коэффициентов нормируются. где X/ - /-ая компонента вектора входного образа или вектора весовых коэффициентов, an- его размерность. Это позволяет сократить длительность процесса обучения. Инициализация весовых коэффициентов случайными значениями может привести к тому, что различные классы, которым соответствуют плотно распределенные входные образы, сольются или, наоборот, раздробятся на допол 68 нительные подклассы в случае близких образов одного и того же класса. Для избежания такой ситуации используется метод выпуклой комбинации [70]. Суть его сводится к тому, что входные нормализованные образы подвергаются преобразованию:
Применение алгоритма обучения нейронных сетей без учителя
Обработка и интерпретация данных ГИС предусматривает проведение огромного количества вычислений и переработку значительного объема каротажных данных. Помочь интерпретатору выполнить эти работы должен создаваемый комплекс программ, состав и задачи которого описаны в данной главе.
Основной задачей разработчика любой автоматизированной системы является проектирование интерфейса "человек-машина". Интерактивный режим интерпретации предполагает решение тех задач, для которых в начальный момент не существует строгого алгоритма. При всех трудностях формализации тех логических ходов, которыми пользуется квалифицированный интерпретатор, этот режим является в настоящее время наиболее оптимальным. Интерактивный режим предусматривает возможность постоянного просмотра интерпретатором всей исходной вводимой информации, а также промежуточной, получаемой в процессе обработки и интерпретации данных ГИС.
Можно кратко сформулировать основные требования, которые предъявляются к АСОИ: предварительная обработка данных ГИС; расчленение разреза скважины с применением классификации без обучения, если нет предварительных знаний о составе пород; расчленение разреза скважины с применением нечеткой логики, при наличии заключений интерпретатора по другим скважинам месторождения; определение петрофизических параметров выделенных коллекторов; решение поставленных задач с минимальным участием оператора; надежность работы в реальном времени; графический интерфейс, легкость и интуитивность управления, oneрирование привычными для оператора понятиями; защита информации от несанкционированного доступа; возможность удаленного доступа к данным; обеспечение возможности решения задач как на станции ГТИ, так и в КРІП; возможность одновременной обработки данных по нескольким скважинам; возможность обмена данными с другими программами. Система предназначена для проведения оперативной интерпретации результатов ГИС в каротажной вычислительной станции и позволяет выполнять предварительную обработку КД, формирование или использование готового графа интерпретации, определение литологической структуры и ее визуализации с сохранением результатов интерпретации.
Организация вычислительного процесса имеет два аспекта: смысловой и технический. Смысловой аспект состоит в декомпозиции задач на подзадачи, полной модели на структурные блоки, реализации связей между объектами. Технический аспект организации заключается в управлении вычислительным процессом, программной реализации декомпозиции, организации информации и организации технологии вычислительных работ. Эти задачи обеспечиваются так называемой модульной структурой построения системы и организации библиотек алгоритмов и дополнительных программ.
Система не может создаваться ради решения одной конкретной задачи из-за большой трудоемкости ее проектирования и реализации, поэтому она должна быть ориентирована на решение достаточно широкого круга задач. С учетом этого система должна быть гибкой, предусматривать изменение модели и учитывать переменные информационные связи между блоками. Кроме того, система должна учитывать фактическую специализацию интерпретатора, знающего существо задачи, но не знакомого с тонкостями математического аппарата и строения системы. Используя данные принципы, была разработана система оперативной интерпретации ГИС. Принципы, заложенные в систему следующие: 1) универсальность программного обеспечения системы, т.е. возможность использования всей доступной информации; 2) гибкость методов решения, т.е. предоставление достаточно простых способов внесения изменений в процесс интерпретации; 3) возможность автоматического контроля и коррекции процесса классификации, оценки качества исходных данных и обеспечение помехоустойчивости. Система состоит из набора модулей, каждый из которых предназначен для проведения одного из этапов обработки, имеет стандартный интерфейс и способен функционировать независимо от остальных. Все модули оперируют следующими базовыми понятиями: константа, функция, каротажная диаграмма, метод и схема интерпретации. Константы задаются пользователем или берутся из параметров каротажной диаграммы и могут быть как строковыми, например рабочий каталог, так и целыми и вещественными значениями, например, глубина или номинальный диаметр скважины. Модули представляют собой динамически связанные библиотеки ( .dll). Благодаря этому и возможности динамического подключения дополнительных модулей система дает возможность преобразования КД, их анализа и построения интерпретационных моделей. Кроме этого в систему включен большой набор готовых модулей для предварительной обработки КД и формирования геофизических зависимостей. На модули, предназначенные для работы с каротажными кривыми, накладываются следующие ограничения: - входным параметром является имя таблицы с исходными данными; - выходным параметром является имя таблицы с преобразованными данными или временная таблица. Функциям предварительной обработки данных, в качестве входного параметра, передается имя подлежащего обработке набора данных (например, имя скважины), функция должна возвращать вещественное число. Метод интерпретации представляет собой определенную зависимость, сформированную на основании показаний КД, функций и констант и определяющую некоторые геофизические параметры или литологические типы (см. рис. 3.1).