Содержание к диссертации
Введение
1. Обзор методов сбора, обработки и интерпретации результатов ГИС 16
1.1. Роль ГИС при разведке месторождений с помощью скважин 16
1.2. Методы каротажа 19
1.2.1. Использование методов каротажа 19
1.2.2. Электрические методы каротажа 20
1.2.2.1 Индукционный каротаж 22
1.2.2.2 Боковой каротаж 22
1.2.2.3 Каротаж микро-зондами 24
1.2.3. Акустический каротажі 25
1.2.4. Радиоактивные методы каротажа 26
1.2.4.1 Гамма-каротаж 26
1.2.4.2 Нейтронный гамма-каротаж: . 28
1.2.5. Кавернометрия 29
1.3. Интерпретация данных ГИС 30
1.4. Алгоритмы интерпретации результатов ГИС 33
1.4.1. Методы классификации,, основанные на петрофизических данных 33
1.4.2. Метод нормализации 34
1.4.3. Статистические методы 35
1.4.4. Алгоритм с использованием комплексных кодов 38
1.4.5. Литологическое расчленение с оценкой вероятности 39
1.5. Анализ возможностей нейросетевых технологий 41
1.6. Подготовка данных при использовании нейронных сетей 46
1.7. Обзор программного обеспечения 48
1.7.1. Программы интерпретации 48
1.7.2. Нейросимуляторы 52
1.8- Выводы, постановка целей и задач исследований 57
2. Разработка системы подготовки данных для интерпретации данных ГИС 59
2Л. Исходные данные и постановка задачи 59
2.2. Формализация задачи 62
2.2.1. Формализация условия 62
2.2.2. Формализация решения 63
2.3. Общая схема подготовки данных 64
2.4. Применение общей схемы подготовки данных для задачи интерпретации данных ГИС 68
2.5- Методы подготовки данных 69
2.5.1. Этап 1, Преобразование исходных данных 69
2.5. 1.1 Увязка кривых по глубине , 69
2.5.1.2 Переход к равномерному масштабу по глубине 71
2.5J.3 Скользящее окно данных 72
2.5.1.4 Спектральный анализ 73
2.5.1.5 Вейвлет анализ 77
2.5.1.6 Выбеливание 84
2.5.2. Этап 1. Понижение размерности входных данных 87
2.5.2.1 Коэффициент корреляции 87
2.5.2.2 Анализ главных компонент 88
2.5.3. Этап 2. Нормализация : 93
2,5.4- Этап 2. Уменьшение объема ОВ 98
2.5.4.1 Группировка на основе расстояния Евклида 98
2.5.4.2 Алгоритм k-средних І00
2.5.5. ЭтапЗ. Оценка качества ОВ 101
2.5.5.1 Константа Липшица 101
2.5.5.2 Коэффициент повторяемости 103
2.5.5.3 Коэффициент противоречивости 104
2.6. Оценка качества интерпретации 104
2.6.1.1 Среднеквадратическое отклонение 104
2.6.1.2 Коэффициент взаимной корреляции 105
2.7. Полученные результаты и выводы 106
3. Создание и применение алгоритмов подготовки исходных данных для качественной интерпретации результатов ГИС 107
3.1. Исходные данные 107
3.2. Условия проведения эксперимента 108
3.3. Используемые правила формализации 109
3.4. Анализ применения методов подготовки данных 109
3.4.1. Результаты применения различных видов нормировки 109
3.4.2. Результаты применения метода скользящего окна данных 111
3.4.3. Результаты применения спектрального анализа ИЗ
3.4.4. Результаты использования вейвлет анализа 116
3.4.5. Результаты применения метода «выбеливания» входов 119
3.4.6. Результаты уменьшения входного вектора, с помощью абсолютного значения коэффициента корреляции 121
3.4.7. Результаты уменьшения входного вектора, с помощью метода анализа главных компонент 123
3.4.8. Результаты применения метода снижение количества входных примеров с помощью группировки на основе расстояния Евклида 126
3.4.9. Результаты применения метода снижение количества входных примеров методом к-средних : 130
3.5. Результаты применения схемы подготовки данных для решения задачи интерпретации ГИС 134
3.6. Полученные результаты и выводы 158
4, Разработка библиотеки подготовки данных 160
4Л. Основные мотивы разработки системы 160
4.2. Назначение библиотеки подготовки данных 161
4.3. Состав библиотеки подготовки данных 162
4.4. Пример использования библиотеки подготовки данных 168
4.5. Полученные результаты и выводы 174
Заключение 176
Литература 179
- Интерпретация данных ГИС
- Применение общей схемы подготовки данных для задачи интерпретации данных ГИС
- Результаты применения метода скользящего окна данных
- Назначение библиотеки подготовки данных
Введение к работе
Актуальность темы. Нефтегазодобывающая отрасль играет ведущую роль в экономике страны. Развитие данной отрасли на современном этапе неразрывно связано с разведкой, разработкой и освоением новых месторождений нефти и газа. Литологическая классификация и выделение коллекторов основаны на различии физических и геофизических параметров горных пород. Нахождение значений геологических параметров в некоторых диапазонах дает возможность прогнозирования литологии пласта. Так как диапазоны перекрываются для различных пород, то необходима идентификация литологии пород по набору коллекторских, физических и геофизических параметров.
Использование компьютерной техники при решении задач нефтегазодобывающей отрасли позволяет отойти от традиционных методов сбора и обработки информации, решать проблему переработки больших массивов информации, исключить субъективность интерпретации результатов исследований.
Для проведения экспресс-оценок продуктивности скважин при геологической разведке месторождений создаются автоматизированные интеллектуальные интерпретирующие системы. Они обеспечивают управление измерениями, регистрацию, первичную обработку, интерпретацию и хранение сква-жинных материалов. Хотя существует большое количество программных средств и аппаратно-программных комплексов, позволяющих автоматизировать все процессы сбора, обработки и хранения данных геофизических исследований скважин (ГИС), но даже при современном многообразии различных программных средств, производящих интерпретацию ГИС, системы, использующие возможности искусственного интеллекта, немногочисленны по своей номенклатуре и обладают достаточными интеллектуальными способностями.
Использование преимуществ искусственного интеллекта позволяет выйти на иной, более качественный уровень обработки результатов ГИС, поскольку он дает в значительной мере заменить геофизика-интерпретатора, занимающегося рутинной работой просмотра огромных массивов однотипной геолого геофизической информации, на автоматизированный программно-аппаратный комплекс, который может решать задачу интерпретации данных ГИС с высокой скоростью и точностью. Одним из направлений развития систем искусственного интеллекта является использование в них аппарата искусственных нейронных сетей. Несмотря на простоту их построения и функционирования, они позволяют накапливать уже известные закономерности ГИС, обобщать факты и давать вполне корректные оценки в ситуациях, когда на входе нейронной сети (НС) представлены зашумленныё данные. НС уже широко применяются за рубежом в различных системах, например, распознавания образов, аппроксимации прогнозирования, управления и др.
На практике, при проведении нейросетевого анализа данных, основное внимание уделяется этапам, связанным с обучением и функционированием собственно нейронных сетей, в то время как не менее важным является этап подготовки исходных данных. Хотя этот этап не связан непосредственно с нейронными сетями, он является одним из ключевых элементов этой информационной технологии. Успех обучения сети может решающим образом зависеть от того, в каком виде представлена информация для ее обучения.
В настоящее время создано множество программных продуктов, имитирующих работу НС. Но возможности их применения в геофизической области весьма ограничены. Это связано с тем, что данные программы не содержат в себе ни правил формализации исходных данных и заключений, применяемых для решения задач ГИС, ни специализированных НС, ни комплексных решений подготовки данных, используемых для решения задачи, ни средств импорта/экспорта геофизических данных.
Таким образом, правильная подготовка исходных данных при применении НС для интерпретации данных ГИС позволит повысить надежность результатов интерпретации и сократить время, затрачиваемое на решение данной задачи. Решению этих актуальных задач и посвящена настоящая диссертация.
Объектом исследования являются методы и алгоритмы подготовки исходных данных для решения задачи интерпретации результатов ГИС нейронной сетью, а также аппарат искусственных нейронных сетей, применяемый для обработки данных ГИС, и каротажные диаграммы, представленные в цифровом виде.
Предметом исследования является математическое описание алгоритмов и методик подготовки исходных данных для повышения скорости и качества литологического расчленения разреза скважины, многослойная нейронная сеть, программное и информационное обеспечение НС.
Цель работы - разработка и научное обоснование применения методов функционального преобразования каротажных диаграмм и подготовки обучающей выборки для повышения эффективности применения многослойной нейронной сети при осуществлении качественной интерпретации данных ГИС, внедрение которой имеет существенное значение в области обработки и экспресс-интерпретации геофизической информации непосредственно на скважине.
Для достижения поставленной цели требуется решить следующие задачи:
- формализация задачи качественной интерпретации данных ГИС для ее решения с помощью аппарата НС;
- выбор и обоснование путем теоретических и экспериментальных исследований методов функционального преобразования исходных данных и формирования обучающей выборки (ОВ) для задачи интерпретации ГИС;
- выбор на основе рассмотренных методов оптимальной последовательности подготовки исходных данных и обучающей выборки для задачи интерпретации ГИС;
- выбор оценок, позволяющих определять качество полученной ОВ, до проведения процесса обучения НС;
- выбор корректных оценок, позволяющих определять качество интерпретации с помощью НС;
- разработка инструментальных средств для проведения подготовки исходных данных.
Методы исследования. В работе применялись теоретические и экспериментальные методы исследования.
При решении задачи качественной интерпретации данных ГИС применялась многослойная нейронная сеть, обучаемая алгоритмом обратного распространения ошибки. В качестве функции активации сети использовалась сиг-моида (логистическая функция), В качестве методов функционального преобразования каротажных диаграмм используются методы скользящего окна данных, спектральный и вейвлет анализы, методы декорреляции исходных сигналов и несколько методов нормализации данных. Для понижения размерности входного вектора используются корреляционный анализ и метод анализа главных компонент. В качестве алгоритмов снижения объема ОВ рассмотрены метод группировки, основанный на расстоянии Евклида, и метод кластеризации (к-средних).
Каротажные кривые исследовались на предмет выделения в скважине пластов-коллекторов и пластов с различными видами насыщения. Исследования проводились по группе из пяти каротажных методов (BKt DS, DT, GR, NGR). Обработка исходных геофизических данных велась поточечно с тем же шагом дискретизации, что и оцифровка исходных данных, без предварительно-го расчленения разреза на пласты.
Инструментальные средства реализованы на алгоритмическом языке вы-сокого уровня Delphi (Borland Delphi 7).
Достоверность и обоснованность полученных в работе результатов и выводов подтверждена результатами экспериментальных исследований.
Математические модели, алгоритмы и прикладные программы, предложенные в работе, основаны на фундаментальных положениях функционального анализа, теории статистического анализа временных рядов, а также теории вероятностей и методологии построения экспертных систем.
Достоверность экспериментальных результатов обеспечена использованием большого объема экспериментального материала, статистическими мето дами обработки данных и хорошей воспроизводимостью результатов.
Достоверность эталонного материала для обучения НС обеспечена использованием утвержденных в ОАО «Башнефтегеофизика» экспертных заключений по обрабатываемым скважинам.
На защиту выносятся результаты исследования применения методов подготовки исходных данных для многослойной нейронной сети при качественной интерпретации данных ГИС, обеспечивающих повышение скорости и качества при получении заключения по наличию нефтенасыщенных коллекторов непосредственно после проведения каротажных работ на скважине, в том числе:
- выбор и обоснование правил формализации задачи литологического рас-членения разреза скважины с помощью многослойной НС;
- схема подготовки исходных данных, включающая в себя этапы сбора и предобработки данных, а также этап формирования ОВ? ее основные цели и задачи;
- применение схемы подготовки исходных данных, предложенной автором, для повышения эффективности интерпретации ГИС с помощью НС;
- выбор и обоснование методов подготовки исходных данных и формирования ОВ для повышения скорости и надежности распознавания данных ГИС;
- определение корректных оценок для анализа качества решения задачи качественной интерпретации данных ГИС с помощью НС;
- разработка и программная реализация инструментальных средств подготовки исходных данных;
Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в результате которых, вопреки классическому подходу, основанному на решении системы петрофизических уравнений мето-дами вычислительной математики, применен аппарат искусственных нейронных сетей. При этом .большое внимание было отведено этапу подготовки данных. Предложен комплекс методов, который позволяет повысить скорость и качество решения задачи. Все это позволяет использовать накопленный эмпи рический материал и знания опытных интерпретаторов, являющийся ядром базы знаний интеллектуальной системы для литологического расчленения разреза скважины, в ходе которых:
- получены зависимости литологической структуры разреза скважины от вида представления каротажных данных, что дает возможность применять аппарат искусственных НС в геолого-геофизической области;
- предложен комплексный подход к подготовке данных при использовании НС, который нашел свое отображение в разработанной автором схеме подготовки исходных данных, включающей в себя этапы сбора и предобработки информации, а также этап формирования ОВ, которые ставят своей задачей повышение качества исходных сигналов за счет функциональных преобразований исходных данных, понижение размерности задачи и формирование сокращенной ОВ, следствием чего является повышение качества и скорости работы НС;
- показано применение схемы подготовки исходных данных к задаче интерпретации результатов ГИС, при этом, в результате проведения эксперимента по подготовке НС для решения задачи интерпретации данных ГИС удалось повысить качество интерпретации и сократить время, необходимое на подготовку НС, в два раза;
- предложены методики, которые могут быть использованы при подготовке исходных данных для задачи интерпретации результатов ГИС, проведены эксперименты, позволяющие сделать выводы об эффективности применения этих методов, в результате чего, на основе наиболее подходящих методов построены последовательности подготовки данных, полностью реализующие предложенную автором схему, определена эффективность рассмотренных последовательностей;
- разработанный программный модуль подготовки исходных данных, который позволяет быстро создавать необходимые последовательности методов для улучшения эффективности применения НС, имеет открытый исходный код, вследствие чего может быть интегрирован в разрабатываемые и существующие программные комплексы.
Практическая полезность, Полученные в работе методики и алгоритмы подготовки исходных данных, совместно с применением аппарата искусственных нейронных сетей, для качественной экспресс-интерпретации данных ГИС позволяют существенно автоматизировать труд геофизика-интерпретатора за счет колоссальных вычислительных возможностей по обработке большого объема геофизической информации интеллектуальными системами на базе как отдельных компьютеров, так и компьютерных сетей, существенно использующих реляционные базы данных таких как «Finder» и др. НС, за счет заложенных в них эталонных данных, и методы подготовки данных позволяют сократить время, необходимое на проведение качественной экспресс-интерпретации скважин, в несколько раз, повысить качество интерпретации и сократить количество ошибок при принятии решений:
Использование предложенной схемы подготовки данных с применением рассмотренных методов позволяет быстрее и качественнее проводить обучение НС. Это повышает эффективность ГИС за счет резкого расширения возможностей проведения экспресс-интерпретации во время проведения каротажных исследований с достаточно высокой степенью достоверности.
Настоящая работа обеспечивает необходимую базу для дальнейшего развития и совершенствования методов подготовки исходных данных для НС5 в том числе и подготовки данных ГИС.
Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на российских и международных научно-технических конференциях и конгрессах: Международных НТК «Информационные технологии в инновационных проектах» (Ижевск, 2004); VI-м научном симпозиуме «Геоинформащионные технологии в нефтегазовом сервисе» (Уфа, 2005); Международном симпозиуме «Надежность и качество» (Пенза, 2006); 33 Международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2006); 34 Между народной конференции «Информационные технологии в науке, образовании, телекоммуникации и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2007); Международном симпозиуме «Надежность и качество» (Пенза, 2007).
Публикации. Результаты работы отражены в 14 научных публикациях, в том числе: 12 статей в журналах и сборниках, 1 тезис докладов на научно-технической конференции, 1 отчет о НИР (91с.). Автор имеет 8 научных трудов в изданиях, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций.
Структура и объем работы Диссертация содержит введение, 4 главы и заключение, изложенные на 189 с. машинописного текста, В работу включены 56 рис., 25 табл. и список литературы из 127.
СОДЕРЖАНИЕ РАБОТЫ
Введение содержит обоснование актуальности темы, формулировку целей работы, основные положения, выносимые на защиту, и определяет содержание и методы выполнения работы,
В первой главе рассмотрены физические основы методов каротажа, особенности их применения для различных литологических структур регионов и условий проведения бурильных работ, приведены параметры регистрации показаний. Рассмотрены существующие на данный момент методы сбора данных ГИС, алгоритмы интерпретации каротажных диаграмм в автоматизированных системах. Исследованы возможности нейросетевых технологий в области качественной интерпретации ГИС, а также проведен обзор применимости основных топологий НС. Выполнен сопоставительный анализ программ автоматизированной интерпретации данных ГИС и программ-нейросимуляторов.
Во второй главе дано математическое описание каротажных диаграмм, заключений интерпретатора, описана связь между каротажными диаграммами и результатами интерпретации. Описаны подходы к формализации задачи лито-логического расчленения разреза скважины. Приведена предлагаемая автором схема подготовки исходных данных. Предложены методы, которые могут быть использованы для подготовки исходных каротажных кривых при интерпретации данных ГИС, на каждом этапе схемы подготовки данных. Приведены оценки качества обучающей выборки. Предложены оценки качества распознавания литологических пластов с помощью НС.
Третья глава содержит описание экспериментальных исследований, проведенных на оцифрованном материале скважин Вятской площади, разработанные Арланским УГР ОАО «Баншенфтегеофизика».
В четвертой главе описывается программный модуль подготовки исходных данных, разработанный автором, который позволяет нормировать исходные данные, преобразовывать исходные данные с помощью метода скользящего окна данных, применять метод «выбеливания» входов, оценивать значимость входов, выделять наиболее значимые факторы, уменьшать объем обучающей выборки, рассчитывать коэффициенты качества обучающего множества и др.
Приведен полный список функций, реализованных в рамках модуля, и существенно облегчающих создание процедур подготовки исходных данных. Помимо этого приводиться пример использования модуля подготовки исходных данных.
Интерпретация данных ГИС
Геофизические исследования скважин по технологии работ можно разделить на геофизические измерения в скважинах и интерпретацию результатов измерения. Непосредственная цель геофизических исследований в скважине состоит в том, чтобы по измеренным параметрам полей, преобразованным в геофизические параметры, определить геологическую и пет-рофизическую характеристики пересеченных скважиной пород и установить наличие полезных ископаемых в них.
Результаты измерения, получаемые непосредственно в процессе скважинных исследований, подвержены-влиянию многих факторов, в связи с чем для извлечения информации эти результаты необходимо соответствующим образом проинтерпретировать. Интерпретация - завершающий этап геофизических исследований скважин, ставящая своей целью определение величины и характера возможной продуктивности пластов, вскрытых скважиной [10; 54].
Переход от результатов ГИС к геологическим данным заключается в решении совокупности задач, обратных по отношению к геофизическим измерениям в скважине. Такой переход называется решением обратных задач каротажа, или интерпретацией результатов геофизических исследований в скважине.
Сложность изучаемых природных процессов делают зачастую неоднозначными результаты интерпретации [55]. В связи с этим широкое применение при решении задач ГИС находят методы классификации и распознавания образов, позволяющие упростить и упорядочить полученную информацию, учесть имеющиеся априорные данные, а также, по возможности, устранить элементы субъективности [14],
В соответствии с технблогической схемой познания земных недр по данным геофизических исследований скважин этот процесс может быть подразделен на три этапа [17; 60].
Первый этап интерпретации - преобразование сигналов, поступающих из скважинных приборов и отмечаемых на диаграммной бумаге отклонениями подвижных систем регистрирующих механизмов в кривые геофизических параметров - кажущегося и эффективного сопротивлений, потенциалов собственной и вызванной поляризации, интенсивностей счета излучений и других величин. Этот этап осуществляется при записи исходных диаграмм в промыслово-геофизических партиях, В интерпретационную службу должны поступать только эталонированные кривые требуемого качества.
Второй этап интерпретации - геофизическая интерпретация - переход от перечисленных выше геофизических параметров к истинным физическим свойствам изучаемых пород электрическому удельному сопротивлению, электрохимической активности, магнитной восприимчивости, плотности, гамма-активности и другим. Такой переход часто требует выполнения дополнительных исследований скважин с зондами различных размеров и проведения большого объема трудоемких интерпретационных работ.
Геофизические параметры, измеряемые в скважинах, определяются не только физическими свойствами изучаемой породы, но и ее мощностью, физическими свойствами, а иногда и мощностями вмещающих отложений, диаметром скважины, физическими свойствами глинистого раствора, глубиной и физическими свойствами зоны проникновения фильтрата в породы, толщиной и физическими свойствами глинистой корки, размерами измерительных устройств, а при работах в обсаженных скважинах - числом и диаметром обсадных колонн, а также наличием цемента за колонной. Интерпретатор должен хорошо знать влияние перечисленных факторов, приемы их исключения и способы выделения пород, различающихся по физическим свойствам, уметь количественно оценить эти свойства.
Третий этап - геологическая интерпретация - состоит в определении геологических свойств пересеченных скважиной пород по совокупности данных, полученных при геофизической интерпретации, с использованием априорной геологической и петрофизической информации. Это позволяет однозначно диагностировать породы, вскрытые скважиной, и выявлять в них наличие нефти, газа, погребенных вод, угля, руд и других полезных ископаемых.
Литологическая характеристика пород оценивается по сумме признаков, выявленных на диаграммах различных методов. Чем большее количество признаков породы установлено, тем точнее может быть охарактеризована порода. Для построения разреза используют данные наиболее полного или рационального для данного типа отложений комплекса геофизических методов [74],
На этом же этапе используются методики определения по геофизическим данным коэффициентов пористости, проницаемости, глинистости, нефте-газонасыщения, угле- и рудосодержания горных пород в разрезах скважин и некоторые другие вопросы.
Объем информации, поступающей в результате геофизических исследований скважин, позволяет использовать ее с высокой эффективностью для изучения условий залегания пород не только в данной скважине, но и в совокупности скважин.
Полученные на определенном этапе интерпретации результаты могут быть недостаточно точными или даже находиться в противоречии с исходными представлениями об изучаемом разрезе, что указывает на несоответствие априорных данных и принятых моделей строения пласта действительному его строению. Это приводит к необходимости повторить интерпретацию с откорректированными по результатам предыдущих этапов исходными данными или моделями. В отдельных случаях может потребоваться изменение и расширение комплекса ГИС. Поэтому изучение разрезов скважин следует рассматривать как непрерывный процесс с обратной связью.
По характеру решаемых задач и используемых исходных геолого-геофизических данных интерпретацию геофизических исследований скважин разделяют на оперативную и сводную.
Под оперативной интерпретацией подразумевают выдачу заключений о наличии в разрезе пробуренной скважины пластов-коллекторов, характере их насыщения, а также рекомендаций по опробованию пластов. Отличительная особенность оперативной интерпретации заключается в том, что ее проводят на всех этапах разведки нефтяных и газовых месторождений, в том числе и в первых пробуренных на площади скважинах, когда еще нет надежных материалов для сопоставления геологических данных (керн, опробование пластов и др.) и результатов геофизических исследований скважин. По результатам оперативной интерпретации принимают решения о продолжении бурения, спуске колонны и интервале ее цементирования, проведении дополнительных исследований.
Сводную интерпретацию проводят по отдельным пластам или месторождениям с целью обобщения всех имеющихся по ним геологических и геофизических данных. При этом должна быть выполнена как можно более полная оценка пласта - его геометрических параметров, коллекторских свойств, характера насыщения. В результате сводной интерпретации обычно выдают исходные данные для подсчета запасов дефти и газа и для проектирования разработки и доразведки пласта, а также формируют соображения об усовершенствовании приемов интерпретации и уточнении критериев.
Таким образом, в результате интерпретации геофизических измерений скважины выдаются заключения о нефтегазоносности разреза скважин, о фильтрационно-емкостных свойствах пластов и других характеристиках, необходимых для определения запасов нефти и газа и разработки месторождения.
Применение общей схемы подготовки данных для задачи интерпретации данных ГИС
В предыдущем пункте была подробно изложена общая схема подготовки данных. Но при решении конкретных задач, в связи с особенностями исходных данных, некоторые фазы подготовки данных могут пропускаться. Так как при решении задачи интерпретации данных ГИС (в условиях данной работы) нет проблемы связанной с недостатком данных можно пропустить фазу восстановления пропущенных значений и фазу генерации примеров, также нет необходимости проводить фильтрацию сигналов. Таким образом, адаптированная схема, применяемая к задаче интерпретации данных ГИС, несколько отличается от общей схемы подготовки данных. Решение задач и методы реализации этих решений для адаптированной схемы подготовки данных приведены в таблице 2.2.
Этап L Преобразование исходных данных 2.5.1.1 Увязка кривых по глубине В результате возникающих погрешностей при копировании, размножении, оцифровки каротажных диаграмм возможно смещение диаграмм по глубинам относительно друг друга. Смещение также может возникнуть в процессе регистрации из-за неточности разметки кабеля и скважинных условий [51]. Величина смещения для различных методов и разных интервалов глубин может быть различна.
Смещение диаграмм увеличивает ошибку при автоматизированной интерпретации. Поэтому необходимо увязать оцифрованные кривые по глубине, т.е. определить величину смещения диаграммы каждого метода относи 70 тельно одной кривой, принятой за опорную.
Для решения данной задачи предлагается использовать алгоритм увязки кривых по этапам, разработанный в бывшем Управлении «ЗапСибНефте-геофизика» и применяемую в системе АСОИГИС/ОС-Тюмень [45].
Мерой близости увязываемых кривых принята абсолютная характеристика: " і=к где Р{5).. - мера близости кривых при разных сдвигах 6\ fr(xi) - значение производной в точке опорной кривой х.; / СУДІ+ІП) значение производной в точке у-и увязываемой yJ{l+S) кривой; i-L„(k + ri) -интервал увязки. Производные находятся численным дифференцированием по пяти точкам: где Д - шаг квантования.
Максимальная сходимость конфигураций кривых соответствует минимальным значениям P(S).
Для поиска сдвигов в разных интервалах кривых, имеющих разную величину и разный знак, и -обеспечения устойчивости решения при больших невязках работа алгоритма организована в три этапа. На первом этапе - осуществляется глобальная увязка кривых, для чего выбирается большое окно, гдея=201 отсчет. Наследующем этапе шаг уменьшается до 101 отсчета.
На третьем этапе осуществляется локальная увязка кривых в пределах одного кванта, при этом п-26. В качестве меры близости берется квадратич 71 ная характеристика:
Квадратичная мера дает более стабильные результаты, но точки с большой амплитудой показаний обладают очень большим весом. Использование абсолютной меры на первых двух этапах существенно уменьшает влияние на конечный результат аномальных показаний методов и не подавляет информацию об участках кривых с низкими и средними амплитудами.
Описанный алгоритм является полностью автоматическим и не требует вмешательства интерпретатора,
Переход к равномерному масштабу по глубине При анализе каротажных диаграмм, записанных с использованием неравномерного шага по глубине, необходим переход к равномерной дискретизации. Переход к равномерному шагу реализуется с помощью линейной интерполяции.
Предположим, что имеется последовательность значений сигнала у}у...9у19...9Ух последовательность значений глубины d[y..,dj9...,dM и последовательность номеров значений сигнала, соответствующих данным точкам глу-бины nlf...,nJ9.„,nM (N M).
Необходимо определить последовательность значений сигнала в заданном интервале глубин скважины [dh,dk] с заданным шагом дискретизации по глубине h с учетом сдвига по глубине z.
Будем считать, что между соседними значениями глубины измерения проводились с одинаковым шагом
Пусть n _, і n , тогда значение глубины, соответствующее значению
сигнала yt, определяется по формуле: dt = djA +z + h}{i-njA). Значение сигнала yk в некоторой точке: dk -dh +h{k-\) глубины с равномерным шагом находится с помощью линейной интерполяции следующим образом: если dk = dt+z, то yk-ylt i = 1,--, Л/, если diA -f z dk di+zt / = 2,...,JVfта =Л.1+(Л- _Д- 1-?.
Таким образом, получается последовательность значений сигнала ... на интервале глубин [dh,dk], вычисленных с равномерным шагом h с учетом сдвига по глубине на величину z.
Обработка данных методом скользящего окна применяется при предварительной обработки данных в задачах прогнозирования, когда на вход анализатора (например, нейронной сети) требуется подавать значения нескольких смежных отсчетов исходного набора данных. Термин «скользящее окно» отражает сущность обработки - выделяется некоторый непрерывный отрезок данных, называемый окном, а окно, в свою очередь, перемещается - «скользит» -по всему исходному набору данных.
При анализе сигналов при помощи нейронных сетей, в связи с особенностями механизма, НС не может принимать на вход весь сигнал. Так как входной вектор должен быть постоянной длины для всех используемых примеров. Поэтому применяются скользящие окна данных. Использование окон данных позволяет НС анализировать не только текущее значения сигнала, но и характер поведения кривой в окрестности оцениваемой точки.
Обработка методом скользящего окна имеет два параметра: глубина погружения - количество отсчетов в «прошлое» и горизонт прогнозирования - количество отсчетов в «будущее».
Результаты применения метода скользящего окна данных
Использование окон данных позволяет НС анализировать не только текущее значения каротажных диаграмм, но и характер поведения кривой в окрестности оцениваемой глубины. В ходе эксперимента применялась окна шириной в і, 3 и 5 отсчетов глубины. Следовательно, размерность входного вектора составляла 5, 15 и 25 обсчетов соответственно,
Ниже приводиться сравнительная таблица результатов эксперимента но выделению п ластов-кол лекторов с использованием окон данных.
Как видно из таблицы 3.2 качество распознавания пластов-коллекторов при использовании окна данных возрастает. Но одновременно с этим, возрастает размерность интерпретирующей НС и, как следствие, время ее обучения. В дальнейшем все методы сравниваются с методом, в котором применяется линейная нормировка и окно данных пять отсчетов.
Проанализируем влияние используемого взвешивающего окна. Для этого преобразуем исходные данные, получив их спектр без использования взвешивающего окна, а также используя окнаХэмминга и Блэкмана. Для этого на вход сети подаем спектральные плотности для каждого каротажа. На выходе сети получаем четыре значения: коллектор/не коллектор, тип флюида. Обучение длилось 1000 эпох.
Полученные данные приведены в таблице 3.3:
Полученные данные показывают, что применение взвешивающего окна улучшает работу сети. И рассматривая результаты в целом можно сказать, что применение окна Блэкмана дает лучшие результаты.
После того, как мы определили, что использование окна Блэкмана дает лучшие результаты. Сравним изложенный выше метод и метод, при котором на вход сети подаются значения каротажных кривых. Результаты в таблице 3.4.
Полученные данные показывают, что метод распознавания каротажных диаграмм с помощью спектральных плотностей, в общем, не дает улучшения качества распознавания по сравнению с методом, когда на вход нейронной сети подаются сами каротажные диаграммы (с окном данных 5 отсчетов). Также, при использовании спектральных плотностей увеличили размерность входных примеров. Однако при использовании спектрального анализа для подготовки исходных данных удалось значительно улучшить результаты для выделения воды.
Фрагменты интерпретации данных ГИС с применением спектрального анализа для подготовки данных и интерпретацию по исходному сигналу (с окном данных 5 отсчетов) приведены на рисунках 3.4 и 3.5. Рассматривая полученные графики видно, что при интерпретации по спектральным плотностям, более ючно определяются гранипы переходов коллектор/не коллектор (рис, 3.4 и рис. 3,5), Но и места, % которых НС не корректно определяет наличие коллектора, выделяются сильнее (рис. 3.5).
Назначение библиотеки подготовки данных
Применение компьютерной техники в геолого-геофизической области позволяет в значительной мере автоматизировать труд геофизика-интерпретатора, занимающегося рутинной работой просмотра и обработки огромных массивов однотипной геолого-геофизической информации. Кроме того, она позволяет отойти от традиционных методов сбора и обработки информации, исключить субъективность интерпретации результатов исследований.
Существует большое количество программных средств и аппаратно-программных комплексов, позволяющих автоматизировать все процессы сбора, обработки и хранения данных ГИС. Но даже при современном многообразии различных программных средств, производящих интерпретацию ГИС, системы, использующие возможности искусственного интеллекта, немногочисленны по своей номенклатуре и обладают достаточно невысокими интеллектуальными способностями.
Как показала практика, использование НС позволяет решать задачу интерпретации данных ГИС. Из результатов, полученных в работе, можно сделать вывод, что использование предложенной схемы и методов подготовки данных позволяют улучшить качество и скорость функционирования НС, что является важным фактором при решении задачи экспресс-интерпретации данных ГИС с помощью НС. Несмотря на простоту некоторых из предложенных методов, правильная подготовка исходных данных позволяет повысить информативность данных, а также оптимально сформировать обучающую выборку.
В настоящее время не существует программных продуктов, которые в полной мере используют подготовку данных. В основном в существующих продуктах подготовка данных сводиться к нормализации исходных данных. Также практически все программные продукты являются платными и с закрытым кодом, что не позволяет судить об используемых в них алгоритмах, в том числе и подготовки данных.
В связи с этим, библиотека подготовки исходных данных для интеллектуальной системы на базе НС, которая предназначена для интерпретации данных ГИС позволит повысить надежность результатов интерпретации и сократить время, затрачиваемое на решение данной задачи.
Библиотека подготовки данных представляет собой модуль ( .pas), разработанный в среде Borland Delphi 7 [13; 57; 94] и реализующий набор методов, которые могут быть использованы при подготовке обучающей выборки в задачах интерпретации данных с помощью НС.
Методы, описанные в библиотеке подготовки данных, позволяют проводить следующие преобразования данных:
1) нормировать исходные данные;
2) преобразовывать исходные данные с помощью метода скользящего окна данных;
3) применять метод «выбеливания» входов;
4) оценивать значимость входов на основе анализа коэффициента корреляции;
5) выделять наиболее значимые факторы на основе метода анализа главных компонент;
6) уменьшать объем обучающей выборки с помощью группировки на основе расстояния Евклида;
7) уменьшать объем . обучающей выборки на основе алгоритма Передних;
8) рассчитывать выборочную константу Липшица для обучающего множества;
9) рассчитывать коэффициенты повторяемости и противоречивости. А также производить другие операции с данными.
4.3. Состав библиотеки подготовки данных
При разработкебиблиотеки в нее были введены два типа данных:
1) вектор: TVector - array of Double;
2) матрица TMatrix = array of array of Double;
Они представляют собой одномерный (TVector) и двумерный (TMatrix) динамические массивы. В качестве типа элементов массива используется тип Double.
В связи с тем, что при создании программ необходимо выполнять различные действия с переменными этих типов, в модуль добавлены следующие вспомогательные процедуры и функции ввода/вывода данных:
1. function TextFileToArray (path; string): TMatrix; - функция, которая считывает матрицу из файла path и возвращает ее как значение, при этом первым индексов матрицы является столбец, вторым - строка;
2. procedure ArrayToSGrid (mas: TMatrix; SGrid: TStringGrid); - процедура, которая заполняет компонент SGrid (TStringGrid) значениями матрицы mas (TMatrix);
3. procedure Array VecToSGrid (mas: TVector; SGrid: TStringGrid); - процедура, которая заполняет компонент SGrid (TStringGrid) значениями вектора mas (TVector);
4. procedure SaveSGrid(SGrid: TStringGrid; SaveDialog: TSaveDialog ); -процедура, которая позволяет сохранить содержимое любого компонента типа TStringGrid в текстовый файл, используя при этом диалог сохранения SaveDialog (TSaveDialog);