Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Статистические алгоритмы прослеживания и классификации геофизических объектов Аржевикин, Юрий Анатольевич

Статистические алгоритмы прослеживания и классификации геофизических объектов
<
Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов Статистические алгоритмы прослеживания и классификации геофизических объектов
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Аржевикин, Юрий Анатольевич. Статистические алгоритмы прослеживания и классификации геофизических объектов : Дис. ... канд. физико-математические науки : 01.04.12.-

Содержание к диссертации

Введение

Глава I. Основные теоретические положения 2h

I.I. Основные определения

1.2. Прогнозирование ожидаемых значений признаков . 30

1.3. Определение функции отклика 35

1.4. Схема процедуры.прослеживания с известным числом Т объектов .

1.5. Схема процедуры классификаций (прослеживания) с неизвестным числом классов 46

1.6. Аппроксимация значений признаков 48

1.7. Основные результаты и выводы 53

Глава II. Статистические алгоритмы прослеживания и классификации 55

2.1. Алгоритм прослеживания заданного числа геофизических объектов по комплексу нестационарных числовых признаков (TRACE 2 ) 55

2.2. Алгоритм классификации (прослеживания) неизвестного числа геофизических объектов по комплексу нестационарных числовых признаков .62

2.3. Некоторые вспомогательные алгоритмы 69

2.4. Основные результаты и выводы 72

Глава III. Опробование статистических алгоритмов прослежива ния и классификации на модельном и экспериментальном материале 75

3.1. Структура пакета прикладных программ INTER 76

3.2. Прослеживание сейсмических волн и горизонтов по параметрам их структурных элементов 79

3.3. Прослеживание слоев термогалйнных экстремумов вод Мирового океана 97

3.4. Оконтуривание геофизических объектов 107

3.5. Другие возможные применения программ 128

3.6. Основные результаты и выводы 135

Заключение 137

Литература 141

Введение к работе

В последние годы значительно возросла роль исследований, направленных на решение поставленных ХХУІ съездом КПСС задач повышения качества и эффективности геофизических работ на нефть, газ и другие виды минерального сырья. При этом особенно актуальной становится проблема разработки алгоришов интерпретации геофизических данных, в том числе таких важных этапов интерпретации как прослеживание и классификация.

Различным аспектам интерпретации геофизических данных уделяли много внимания Г.А. Гамбурцев, А.С. Алексеев, Н.Н. Пу-зырев, И.И. Гурвич. Весомый вклад в развитие динамической теории интерпретации внес Г.И. Петрашень. Одним из развитых средств геофизической интерпретации является решение обратных геофизических задач [29, 49,106] , К обратным относятся и задачи прослеживания и классификации геофизических объектов, так как они позволяют изучать строение и свойства геофизических объектов по экспериментальным данным, осложненным различного рода неконтролируемыми влияниями. С определенной степенью условности можно выделить два основных подхода к решению обратных геофизических задач: детерминированный и статистический. В основе первого из них лежит предположение о том, что наблюденное поле является суммой полезного сигнала и помехи, при этом оба поля рассматриваются как детерминированные функции ["79, &2]. Основы решения обратных задач в такой постановке были заложены А.Н. Тихоновым [88 ,89] . Большая роль в развитии детерминированного подхода принадле-

- в -

жит исследованиям, выполненным В.Н. Страховым, В.И. Старосте-нко, В.Б. Гласко, Ю.В. Тимошиным, А.В. Цирульским и другими [2772, Т97 82,37J. Из большого числа существующих детерминированных алгоритмов прослеживания можно отметить алгоритм сопоставления границ выделенных на геофизических диаграммах пластов 44] , основанный на поиске функции минимальных рассогласований между соответствующими границами двух коррелируемых разрезов, алгоритмы корреляции сейсмических волн на временном разрезе, отсеивающие не сопостовляющиеся с другими элементы разреза при заданных правилах сопоставления [ЮЪ] и использующие методы динамического программирования для поиска оптимальных вариантов корреляции [101] . Из детерминированных алгоритмов классификации упомянем процедуру классификации геофизических данных Ъ8] , основанную на модифицированном методе эталонов 9b] , и адаптивный алгоритм классификации геологических объектов S4] , позволяющий с помощью приемов ортогонального проектирования на подпространство одновременно вычислять меры сходства и различия объектов в пространстве признаков.

Статистический подход к решению обратных геофизических задач начал развиваться в пятидесятых годах. Существенный вклад в идейное обоснование и разработку этого подхода внесли A.M. Яглом, Ф.М. Гольщан, Е.А. Козлов, С.А. Кац, СВ. Голь-дин, Д.А. Родионов, В.Ф. Писаренко, В.И. Кейлис-Борок, Н.Н. Боровко, А.А. Никитин и другие. В конце пятидесятых -начале шестидесятых годов в работах [36? 99] было впервые предложено использовать для целей геофизической интерпретации результаты теории информации, оптимальные статистические критерии максимального правдоподобия, Бейеса и д]$тие. В последующие годы эти идеи существенно развиваются: исследуются статистичес-

кие свойства геофизических полей [13 , 23, 51} , предлагаются алгоритмы оценивания неизвестных параметров [24,36] , обнаружения сигналов на фоне помех [39,112] , распознавания объектов [37, 74] , выбора рациональных схем наблюдения, комплек-сирования геофизических методов [26,35] , а также способы определения качества интерпретации [24]. Упомянутые работы, а также труды многих других исследователей, легли в основу современной статистической теории интерпретации в геофизике. Б данной диссертационной работе развивается один из актуальных и активно разрабатываемых [10, 16,4 8, 91 г 104,107и др.] разделов этой теории - статистическое прослеживание и классификация геофизических объектов.

В дальнейшем условимся называть геофизическим объектом или объектом прослеживания (классификации) совокупность элементов, физические и геометрические характеристики которых связаны с измеряемыми геофизическими признаками в пространстве наблюдений. Обзор методов прослеживания и классификации проведем раздельно.

В общем случае прослеживание сводится к отбору элементов при помощи некоторых критериев, ориентирующихся на сходство и другие априорные связи соответствующих значений признаков. Так, например, если под объектом прослеживания понимается сейсмическая граница, то элементами являются ее отдельные участки, а признаками - амплитуды отраженных сейсмических волн, наклоны и глубины участков границы, параметры временной формы сейсмических волн и др.

Характерным для задачи прослеживания является наличие дополнительного ограничения, запрещающего относить прослеживаемые элементы к одному и тому же объекту, если координаты точек измерений признаков для этих элементов частично совпадают. В этом

- a -

случае в точках измерений появляются конкурирующие совокупности значений признаков. Так, например, если прослеживаются границы многослойного сейсмического разреза, то в каждой точке */,, ук плоскости наблюдений У ,У существует множество совокупностей значений признаков для разных границ. Если какой-либо из элементов в точке х^ , ук отнесен к границе с номером t , то другие элементы в той же точке уже не могут быть отнесены к той же границе. При этом значения признаков для элементов разных границ в точке *ki Ук оказываются конкурирующими.

Важность разработки алгоритмов прослеживания определяется широким кругом решаемых с их помощью прикладных задач. Перечислим некоторые из них. Одна из первых решалась с помощью машинных алгоритмов прослеживания задача корреляции сейсмических волн и горизонтов (границ), являющаяся важным и ответственным этапом интерпретации сейсмических данных [ Ъ1, 77]. Еще одна важная задача - корреляция разрезов скважин. В этом случае корреляция пластов в осадочных толщах может преследовать две цели: а) установление в разрезах различных скважин точек, которые в процессе накопления осадков одновременно принадлежали поверхности осадконакопления (синхронных точек); б) выявление в разрезах скважин интервалов, принадлежащих одному геологическому телу [1&7 75] . Из нетрадиционных задач можно отметить задачу прослеживания с помощью машинного алгоритма слоев термогалинных экстремумов для имеющего большое научное и прикладное значение изучения стратификации и структуры вод Мирового океана [81] .

Большая часть существующих алгоритмов прослеживания разработана для решения задачи корреляции сейсмических волн и горизонтов (границ) для профильных (одномерных непрерывных) систем наблюдений. Наиболее ранний алгоритм прослеживания сейсми-

ческих границ в поле годографов или глубинного разреза был предложен в работе [42]. Для определения наклонов горизонтов по положению отдельных отражающих площадок в алгоритме использован метод регулируемого направленного приема (РНП) [86]. Учет углов наклона и степени отклонения центров отражающих площадок от истинного положения горизонтов при их прослеживании осуществляется в соответствии с принципом средневзвешенного. В алго-^ ритме производится автоматическая настройка на тип прослеживаемого горизонта (условный или опорный), сглаживание значений времен (глубин) и углов в пределах некоторого участка, прослеживание поведения сглаженных характеристик между участками.

В программе [46] прослеживание волн основано на суммировании трасс по различным направлениям в последовательно выделяемых окнах. Направления суммирования задаются с помощью входных параметров: кажущейся скорости и кривизны годографа и характеризуются каждое некоторой суммарной величиной Ь . Величина Ь рассчитывается по различным формулам в зависимости от априорных теоретических или опытных соображений о свойствах интерпретируемого материала и служит критерием существования или отсутствия волны в данном направлении. Часть значений Ь отсеивается с помощью критерия, вытекающего из предположения о распределении помех. Оставшиеся значения Ь разбиваются на отдельные совокупности, каждая из которых, предположительно, относится к одной волне, и затем рассчитываются параметры всех отобранных волн.

Прослеживание в программе "Дискор-2Ми [55] сводится к отбору вариантов корреляции и основано на использовании Т2 -статистики, вычисляемой по двум признакам (один из них обязательно - время регистрации сейсмического импульса). Программа может

-до-

вести одновременное прослеживание до четырех горизонтов, в ней предусмотрены режим прослеживания без регуляризации (при пост-

роении / -статистики используется полная ковариационная матрица) и режим с регуляризацией (используется только часть собственных векторов ковариационной матрицы) 21] . "Дискор-2Мм позволяет при повторной идентификации изменить число предшествующих наблюдений, по результатам которых ведется обработка каждого нового наблюдения.

В работах [11,12] предложен алгоритм и построен программный комплекс прослеживания (отбора и одновременного оценивания параметров) волн для обработки полученных с помощью метода отраженных волн (МОВ) наблюдений. В основу алгоритма положено решение задачи разделения смеси произвольного числа однотипных случайных величин с неизвестными объемами выборок, закон распределения которых задан с точностью до их математических ожиданий. Прослеживание ведется по кинематическим параметрам разрастаний, снимаемым с суммолент РНП.

Адаптивные алгоритмы прослеживания сейсмических волн предложены в работах 45, 95] . Для каждой прослеживаемой волны вводится плавно меняющийся эталон, с помощью которого волны на трассах выделяются по их подобию. Как только на очередной трассе выделена и прослежена нужная волна, она подсуммируется к эталону с некоторым весовым коэффициентом и, тем самым, эталон уточняется. Идентификация волн, выделенных на каждом наблюдении, осуществляется по максимуму функции взаимной корреляции cFmax сформированного эталона с апробируемым участком трассы в алгоритме 45] и на основе Т1 -статистики, вычисляемой по двум признакам: значению J- функции взаимной корреляции и времени прихода волны, в алгоритме [95]. Отметим, что эти алгоритмы

- н -

одновременно с прослеживанием волн оценивают их параметры. Кроме того, в алгоритме [95] предусмотрена возможность включения в прослеживание новых волн (по мере их появления на временных разрезах), так же как и отказа от прослеживания слабых волн.

В алгоритме прослеживания горизонтов на глубинном разрезе [^] используются элементы метода общей глубинной площадки [25] , представляющего результаты обработки полевых материалов сейсморазведки в виде совокупности отражающих площадок, и кусочно-параболическая аппроксимация границ. Для работы алгоритма требуется задание априорных (опорных) данных о прослеживаемой границе (математические ожидания параметров, априорная векторная область изменения этих параметров). Прослеживание границы основано на проверке двух условий: а) попадания найденных по предыдущей отражающей площадке оценок параметров границы в прогнозную область этих параметров (условие геометрической непрерывности границы), б) превышения коэффициента корреляции амплитуд апробируемой и предыдущей отражающей площадок порогового значения (условие сохранения формы записи). Результатом работы алгоритма является кусочно-сглаженная граница.

В работах [65, 66, 70] предложен и опробован алгоритм, разбивающий в целях ускорения вычислительного процесса процедуру прослеживания на три этапа: подготовительный этап, этапы начального перебора и окончательного прослеживания. На первом этапе осуществляется предварительный отбор материала, используемого при прослеживании, на основании априорных представлений о возможных свойствах искомой сейсмической границы. Назначаются исходные области, в которых на втором этапе прослеживается некоторый начальный участок границы и определяются начальные приближения ее неизвестных параметров. На последнем этапе про-

--/2-

водится окончательный отбор искомых элементов границы с одновременным определением всех ее параметров, основанный на максимизации функции правдоподобия для различных вариантов отбора элементов, причем при обработке каждого последующего наблюдения используются результаты всего предыдущего прослеживания границы.

Как упоминалось, большинство алгоритмов прослеживания разработаны для профильных (одномерных,непрерывных) систем наблюдений, что существенно сужает пределы их применимости. Необходимо отметить, однако, работы ["3,2 2], где с использованием теории графов построен алгоритм прослеживания на плоскости сейсмограмм. Алгоритм работает с упорядоченным (предварительно пронумерованным) набором сейсмограмм и предназначен для увязки вариантов корреляции отдельных подмассивов сейсмических наблюдений (сейсмограмм, групп сейсмограмм). На линейных участках графа системы наблюдений (профилях) применяется процедура динамического программирования [//01] . Вершины линейного участка сливаются в одну, размерность графа уменьшается. Поэтому алгоритм эффективен для систем наблюдений с преобладанием линейных участков и теряет свои преимущества для систем с другой пространственной структурой.

К настоящему времени предложен также ряд статистических алгоритмов, предназначенных для решения задачи корреляции геофизических разрезов скважин. В большинстве из существующих алгоритмов эта задача решается для случая двух разрезов. Так, например, корреляция нерасчлененных геофизических диаграмм в работе [4^] начинается с произвольного разбиения одной из диаграмм на ряд участков. Затем вычисляется функция корреляции между каждым из этих участков и всеми участками такой же длины второй диаграммы. Максимумы корреляционной функции дают варианты корре-

--/3-

ляции, из которых отбираются наиболее вероятные в смысле наилучшего удовлетворения принципам упорядоченности, похожести и перспективного соответствия. Наряду с поиском наиболее вероятных вариантов корреляции возможна оптимизация по длине участков, на которые разбиваются геофизические разрезы [111] . Упомянем еще работу [113] , где корреляцию разрезов предлагается вести по инклинометрическим кривым, характеризующимся последовательным набором особенностей (экстремумов, ступенек, выбросов и др.). Каждому такому набору можно поставить в соответствие вектор величин, описывающих указанные особенности. Решение о совпадении двух разрезов принимается по значениям разностей векторов, характеризующих соответствующие данным разрезам кривые.

Перейдем теперь к задаче классификации элементов по измеренным в точках наблюдений геофизическим признакам. Классификация таких элементов в общем случае сводится к разделению их на группы (классы) с помощью критериев, учитывающих сходство и другие априорные связи соответствующих значений признаков. Например, если требуется оконтурить месторождения песков на разбуренной площади, то объектами классификации являются интересующие нас месторождения, классифицируемыми элементами могут служить образцы песков, взятых в скважинах в различных местах площади, а признаками - размеры песчаных зерен, химический состав, глубина с которой взяты пробы и т.д. Бели необходимо разделить донные отложения по гранулометрическому составу на определенные литоло-гические типы на основании результатов акустических исследований, выполняемых при картировании донных отложений на акватории, то объекты классификации - искомые типы осадков, классифицируемыми элементами могут быть элементарные участки дна, а признаками - параметры локационных акустических сигналов (амплитуда,

- Ik -

временные и спектральные характеристики и др.). Важно подчеркнуть, что при классификации, в отличие от прослеживания, классифицируемые элементы могут объединяться в один класс даже при частично совпадающих координатах точек наблюдений. Это позволяет, в примере с месторождениями песка, произвести оконтурива-ние этих месторождений не только по площади, но и в пространстве.

Рассмотрим теперь ситуацию, когда у интерпретатора нет информации о принадлежности каких-либо элементов (точек наблюдений) каким-либо (эталонным) классам. Классификация в таких условиях (без эталонных классов) получила в литературе название автоматической [32,5G] и именно этот вариант классификации рассматривается в диссертации. Область применения алгоритмов автоматической классификации в геофизике очень широка. Например, они используются для решения задач стратиграфической сейсморазведки [107] , для прогноза месторождений [74, 90] , для поиска и классификации геофизических аномалий [77,52,53, 69] С их помощью осуществляется сейсмическое, тектоническое и металлоге-ническое районирование территорий [6*0 , анализ формы отраженных сейсмических сигналов [3] и скважинных геофизических наблюдений [757 62 ; 10 9] .

Алгоритмы автоматической классификации "Лебедь" и "Компакт" были предложены в работах [60,67] . Первый алгоритм выделяет заданное априори число классов и основан на максимизации средней по формируемым классам функции близости. Его можно разделить на два основных этапа - предварительной классификации и оптимизации границ между классами. На первом этапе происходит поиск и выделение заданного количества групп с повышенной плотностью точек наблюдений. Оптимизация границ между полученными на пер-

вом этапе группами осуществляется с помощью итеративной процедуры перегруппирования точек, такой, что после каждой итерации качество классификации увеличивается. Второй алгоритм также выделяет заранее заданное число классов и минимизирует средневзвешенную по всем классам дисперсию. Отличительной его особенностью является то, что кроме обычно применяемой процедуры перераспознавания, минимизирующей дисперсию при фиксированном первом приближении центров классов, в нем осуществляется также оптимизация разбиения по параметрам, определяющим выбор первого приближения. Алгоритм "Компакт" может работать и в режиме с неизвестным заранее числом классов. Б этом случае применяется процедура [61] , использующая в качестве критерия выбора числа классов величину градиента средней дисперсии классов.

Программа "След" [53J разработана для обнаружения геофизических аномалий на фоне некоррелированных помех и использована в [17] для классификации геолого-геофизического разреза. Программой осуществляется просмотр всего наблюденного поля с помощью скользящего "окна" заданных размеров. При каждом положении "окна" рассчитывается отношение аномалия/помеха, сравниваемое затем с некоторым пороговым значением. В зависимости от превышения (непревышения) порога принимается решение о наличии (отсутствии) аномалии в текущем "окне". Аномалией считается любой сигнал, прослеживаемый по нескольким профилям (площадная съемка) или по нескольким уровням разреза (при обработке разреза).

Классификация в алгоритме [ 7 6 ] , разработанном для решения задачи картирования донных отложений на акватории, основана на указанной в [9] возможности разделения отложений на отдельные литологические группы по результатам акустических измерений. На

первом этапе алгоритма выполняется процедура автоматической классификации, основанная на методах кластерного анализа (группирования)' 33,3^] . Эта процедура проверяет на однородность пространство наблюдений при помощи анализа признаков с фиксированным "окном" по всему массиву наблюдений - акустических характеристик. После разделения массива наблюдений на классы вычисляются параметры, характеризующие качество разделения, и, в зависимости от результатов их анализа, либо повторяется этап разделения с другим значением окна , либо полученное разделение считается удовлетворительным. Алгоритм, основанный на кластерных методах группирования, использовался также для выделения ли-тологических типов пластов в разрезах скважин по комплексу геофизических скважинных измерений (признаков) [15] . в этом алгоритме использовались две меры сходства векторов значений признаков - коэффициент корреляции и обобщенное евклидово расстояние. С помощью средневзвешенного попарного группирования строится дендрограмма [ 1 ] , на основе анализа которой и выделяются искомые литологические типы пластов.

Еще один алгоритм автоматической классификации [108,110] , базирующийся на кластерных методах и наиболее близкий к рассматриваемому в настоящей работе, использовался для анализа формы отраженных сейсмических сигналов 3] и скважинных наблюдений [10 9] Алгоритм представляет из себя иерархическую агломе-ративную процедуру [1] , в которой при апробации возможности объединения любых двух классов в один используются все наблюдения из этих классов. Разделение на классы будет тем эффективнее, чем сильнее разнесены в пространстве признаков центры рассеяния для разных классов и чем компактнее разбросаны значения признаков вокруг своих центров. Если "облака рассеяния" признаков

--/7-

имеют для разных классов сложную и вытянутую форму, то такой вариант классификации, как показано в [2S] , теряет эффективность.

Суммируя результаты обзора алгоритмов прослеживания и классификации, можно сделать следующие выводы.

1. До настоящего времени не существовало единого и достаточ
но общего подхода к построению алгоритмов прослеживания

и классификации, которые разрабатывались независимо, для решения не связанных друг с другом задач.

  1. Многие существующие алгоритмы прослеживания и классификации являются эвристическими, неоптимальными, что часто не обеспечивает реализацию большого количества информации, получаемой из эксперимента.

  2. Большинство ранее предложенных алгоритмов прослеживания разработано для профильных систем наблюдения и для однотипных признаков, в то время как многие актуальные задачи сводятся к прослеживанию объектов в трехмерном физическом пространстве по комплексу разнотипных признаков.

  3. Многие ранее предлагавшиеся алгоритмы классификации основаны на эвристическом допущении о постоянстве средних значений признаков в пределах отдельных классов. Между тем очень важны задачи, в которых нестационарность изменения значений признаков существенна.

  4. Результатом работы существующих алгоритмов прослеживания и классификации являются выделенные.геофизические объекты,

. характеризующиеся всем набором геофизических признаков. Но хранение: полного набора признаков малоэффективно с точки

зрения использования памяти вычислительной машины. Сокращение же размерности этого набора, например, при помощи аппроксимации значений признаков, наталкивается на определенные трудности из-за недостаточной обусловленности возникающих при аппроксимации матриц. 6. Разработанные ранее алгоритмы корреляции геофизических разрезов скважин решают задачу корреляции двух разрезов ...... без учета информации о соседних скважинах, ,

Так как перечисленные недостатки являются существенными, то в диссертационной работе была сделана попытка преодолеть их. Поэтому в работе поставлены следующие задачи:

  1. разработка статистической теории прослеживания и классификации геофизических объектов по комплексу числовых нестационарных признаков для произвольных систем наблюдений и для объектов сложной форш в пространстве признаков и трехмерном физическом пространстве;

  2. создание на основе разработанной теории субоптимальных статистических алгоритмов и программ прослеживания и классификации геофизических объектов, реализующих значительную долю поступающей из эксперимента информации;

  3. разработка вспомогательного статистического алгоритма и программы, предназначенных для сокращения числа характеризующих геофизический объект параметров и уточнения значений признаков объекта;

  4. проверка работоспособности созданных программ при помощи методов статистического моделирования;

  5. решение при помощи созданных программ некоторых актуальных практических задач, к которым ранее не применялись машинные алгоритмы.

Работа состоит из введения, трех глав и заключения. Б первой главе развивается статистическая теория прослеживания (классификации) геофизических.объектов по комплексу числовых нестационарных признаков, заданных в произвольных точках трехмерного физического пространства. Предлагаемая теория является обобщением и развитием корреляционных методов прослеживания [22, 37,702], кластерных методов классификации [ 73,33,34,56, 59] , схем прослеживания и классификации, предложенных в [28] . Теория позволяет строить множество различных модификаций алгоритмов прослеживания и классификации. В каждом таком алгоритме последовательно решаются задачи оценивания и распознавания, причем решения эти строятся по оптимальной схеме.

Основными элементами описываемой теории прослеживания (классификации) являются: выбор исходных опорных значений признаков для объектов (классов), прогнозирование ожидаемых значений признаков в апробируемых точках, определение значений функции "отклика" для решения вопроса о принадлежности апробируемых величин признаков к опорным совокупностям. Каждый из этих элементов в зависимости от дополнительных априорных данных о свойствах прослеживаемых (классифицируемых) объектов имеет множество модификаций. К этому добавляются различные варианты внешней организации алгоритмов, такие как последовательное или совместное прослеживание (классификация) групп объектов, число которых может быть известным или нет. Б главе анализируются типовые вычислительные схемы алгоритмов, реализующих два основных варианта внешней организации: совместное прослеживание (классификация) групп объектов, число которых известно либо неизвестно. И, наконец, в этой главе описывается процедура аппроксимации геофизических данных, используемая для сокращения числа пара-

метров, характеризующих геофизический объект, и уточнения признаков геофизического объекта. Данная процедура основана на пространственной полиномиальной интерполяции и сингулярном разложении матриц Г S3, 97] . Последнее позволяет учеоть точность измерения геофизических данных и конечную точность расчетов на конкретной вычислительной машине.

Вторая глава посвящена описанию статистических алгоритмов прослеживания и автоматической классификации геофизических объектов TRACE2 и CLASS! . Эти алгоритмы реализуют два основных варианта внешней организации алгоритмов: с заранее известным и с неизвестным числом объектов (классов). Алгоритмы позволяют решать следующие задачи: прослеживание заданного числа геофизических объектов {TRACE 2 ), прослеживание геофизических объектов при их неизвестном числе {CLASS2 ), автоматическая классификация (группирование) геофизических наблюдений { CLASS2. ). В главе подробно описывается структура алгоритмов TRACE2 и CLASS! , приводятся блок-схемы их отдельных частей. Здесь же описываются алгоритм аппроксимации значений признаков ( RED ист ), позволяющий сократить число характеризующих геофизический объект параметров, уточнить признаки объекта, и алгоритм статистического моделирования ( MODEL ), используемый в главе Ш для опробования алгоритмов TRACE 2 и CLASS 2 .

Третья глава посвящена исследованию эффективности работы предлагаемых алгоритмов прослеживания и классификации TRACE2 и CZ.ASS2 на модельном и экспериментальном материале. Описывается разработанный пакет прикладных программ IA/TE R. , включающий помимо упомянутых {TRACE 2 , CLASS2 , REDUCT .MODEL ) и следующие программы: IA/LET ,

предназначенную для преобразования исходных экспериментальных данных к внутрипакетному формату; OUTLET , позволяющую вывести результаты обработки на графопостроитель или алфавитно-цифровое печатающее устройство (АІДУ) в виде геофизического разреза, карты, сводных графиков параметров либо в виде таблиц. Опробование программ пакета проводится на нескольких реальных геофизических задачах. Подробно разбирается такой важный и ответственный этап интерпретации сейсмических данных, как прослеживание сейсмических волн и горизонтов по параметрам их структурных элементов; рассматриваются профильная и площадная системы наблюдений. Впервые в работе ставится и решается задача прослеживания слоев термогалинных экстремумов, имеющая важное значение для исследования структуры и стратификации вод Мирового океана. Рассматривается также часто возникающая при обработке данных в разведочной геофизике задача оконтуривания залежей полезных ископаемых - в плоскости и пространстве наблюдений. Решается важная задача выделения аномалий полей поверхностной температуры Мирового океана. Описывается подход к решению программами пакета IA/TER актуальных задач районирования Мирового океана по экстремумам вертикальных профилей гидрофизических параметров и прослеживания ритмов осадконакопления продуктивных толщ Земли при поиске залежей углеводородов в ловушках неантиклинального типа.

В Заключении в кратком виде излагаются результаты решения поставленных перед диссертационной работой задач.

В завершение обзора диссертационной работы отметим, что содержание 1.1 - 1.3 является дальнейшим развитием схем прослеживания и классификации, изложенных в работе [28] . Содержание 1.6 основано на результатах работы [93] .

Остальные параграфы главы I, а также главы П и Ш являются собственными результатами автора.

Разработанные машинные алгоритмы TRACE2 и CLASSZ переданы для внедрения в Вычислительный центр Грейфсвальдекого университета им. Э.-М. Арндта (ГДР), в Научно-производственное объединение "Нефтегеофизика" Министерства геологии СССР, в Институт океанологии им. П.П. Ширшова АН СССР.

Результаты диссертации использовались при работе по хозяйственному договору В 182, выполняемому по плану важнейших работ Ленинградского государственного университета им. А.А. Жданова. Работа неоднократно обсуждалась на научных семинарах Лаборатории динамики упругих сред Научно-исследовательского института физики Ленинградского университета, а также на семинарах Отдела физической океанографии Института океанологии АН СССР. Основные результаты работы были доложены и одобрены на Всесоюзной конференции "Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов" (1982, Нальчик) и на Ш конференции молодых ученых Наунно-исследовательского института физики Ленинградского университета (1983, Ленинград). По результатам выполненных исследований опубликовано четыре печатные работы.

В заключение автор выражает глубокую признательность и благодарность своему научному руководителю, доктору физико-математических наук, профессору Ф.М. Гольцману за выбор темы работы, ценные советы и помощь в процессе выполнения диссертации.

Автор благодарит старшего научного сотрудника ВНИИГеофизи-ки О.Г. Кутьину за полезные обсуждения ряда вопросов и любезно предоставленную возможность использовать полевой материал ВНЙЙГеофизики. Чрезвычайно важным и полезным было обсуждение

некоторых вопросов с сотрудниками Института океанологии АН СССР: профессором Б.Н. Степановым, старшим научным сотрудником Л.И. Галеркиным, младшим научным сотрудником И.М. Белкиным, которым автор признателен также за предоставленный в его рас- , поряжение реальный гидрофизический материал.

Автор благодарит также всех сотрудников Лаборатории динамики упругих сред Научно-исследовательского института физики Ленинградского университета ж Отдела физической океанографии Института океанологии АН СССР за постоянное внимание и поддержку,,; без крторых,_предлагаемая работа не могла бы быть выполнена.

Г І А В A I ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ

В настоящей главе развивается статистическая теория прослеживания (классификации) геофизических объектов по комплексу числовых нестационарных признаков, заданных в произвольных точках трехмерного физического пространства. Разрабатываемая теория является обобщением и развитием корреляционных методов прослеживания [22 ,37,102], кластерных методов классификации [1Ъ ,33,34, 56,59] 9 схем прослеживания и классификации, предложенных в [28]. В главе предлагаются вычислительные схемы алгоритмов, реализующих два основных варианта их внешней организации: совместное прослеживание (классификация) групп объектов, число которых может быть известным или неизвестным. Здесь же описывается основанная на пространственной полиномиальной интерполяции и сингулярном разложении матриц [53,93,97] процедура аппроксимации геофизических данных. Она предназначена для сокращения размерности массива значений признаков, характеризующего полученный в результате прослеживания (классификации) геофизический объект.

I.I. Основные определения

Пусть измерения значений признаков производятся в точках
хк ,Чк , Z/c {к = 1,2,...,Л) трехмерного физического пространст
ва наблюдений X , У ,2 .В каждой точке измеряются приз
наков с номерами д = /, 2,,, , &. Значение д -го признака в к
точке наблюдений обозначим через . Тогда под прослежива-

нием (классификацией) геофизических объектов (условимся нумеро-

вать их числами = /,2,..., 7 ) в самом общем случае будем понимать процедуру разделения структурных элементов, описываемых значениями признаков , на группы (классы). Заметим, что в число признаков 1L * (к) могут включаться также и координаты у t О »К » определяющие пространственное положение прослеживаемых (классифицируемых) элементов. Наложение связей на эти признаки позволяет учесть часто существующие у интерпретатора априорные представления о пространственных особенностях объекта (класса). Примером может служить сейсмический горизонт, состоящий из совокупности прослеживаемых площадок (рис. I). Глубины ^> отдельных площадок можно включить в число признаков, подчинив значения ^ для разных площадок требованию гладкости границы.

Будем рассматривать процедуру прослеживания (классификации) как разрывную процедуру интерпретации, состоящую из последовательности шагов. Каждый шаг процедуры состоит из двух интерпретационных задач: а) количественной задачи - прогнозирования значений признаков в заданную точку прогноза х^ , ук , z/< пространства X » У , 2 по значениям признаков в других, опорных точках х^, ^ , z^ ( (j,= 172,... ,Q(t)) того же пространства, в которых прослеживаемые (классифицируемые) элементы уже отнесены к t -му объекту (классу); б) качественной задачи - принятия решения о принадлежности измеренных (апробируемых) значений признаков в точке прогноза х^ , ук f zk тому или иному -классу по критерию максимального правдоподобия близости апробируемых и прогнозированных значений признаков.

При выполнении процедур прослеживания и классификации целесообразно учитывать различные дополнительные условия. Можно, как уже отмечалось во Введении, ввести ограничение запрещающее

X

Рис. I. Сейсмический горизонт:

х^ - координаты точек наблюдений, Кк ~ глубина прослеживаемых элементов

отражающих площадок

относить прослеживаемые элементы к одному и тому же объекту, если координаты х^ , ук , 2д точек измерений признаков для этих элементов частично совпадают. Б этом случае система наблюдений из пространственной превращается в площадную либо профильную и в точках этой системы наблюдений появляются конкурирующие совокупности значений признаков, что характерно для задачи прослеживания.

Другое возможное ограничение состоит в том, чтобы считать, что заданные априорные связи между значениями признаков прослеживаемых (классифицируемых) элементов действуют на конечных расстояниях в пространстве X , У ,2 , не превышающих некоторого интервала #(х,у,2) локальности прослеживания (классификации). Так как не все расстояния между апробируемыми и опорными точками могут удовлетворять условию локальности, то прогнозирование значений признаков производится по частичным совокупностям опорных элементов. Это позволяет производить прослеживание (классификацию) в тех случаях, когда средние значения признаков медленно меняются в пространстве X , У , 2 для данного t -объекта. Величина Я(х>у9г) обычно выбирается интуитивно, исходя из имеющихся представлений о максимальном расстоянии между к -точками в пространстве X , У , 2 , при котором еще допустима принятая аппроксимация прослеживаемого (классифицируемого) объекта (класса). Возможно численное определение R(x7y,2) путем расчета выборочных коэффициентов корреляции значений И(^(к) для типовых известных объектов (классов) в точках к , находящихся на разных расстояниях друг от друга. Заметим, что величина К(х,у?г) определяет степень гладкости поверхности, аппроксимирующей прослеживаемый (классифицируемый) объект (класс). Необходимость выбора ^х3у,2) исчезает в еле-

дующих двух случаях: когда ожидаемые значения признаков прослеживаемых (классифицируемых) объектов (классов) заведомо распределены по плоскости в пространстве наблюдений (в этом случае можно положить (х, у, a )^- о ); при аппроксимации ожидаемых значений признаков "гладкой" случайной поверхностью, введенной в 1.3.

Процедуры прослеживания и классификации могут работать только после назначения исходных опорных значений признаков. В случае прослеживания (классификации) с заранее заданным числом объектов (классов) возможны два основных варианта выбора исходных опорных значений:

а) интуитивный выбор опорных А'-точек и значений li(^{t,k') ,
исходя из неформализованных представлений интерпретатора

о поведении и о значениях некоторых признаков в отдельных точках пространства наблюдений или из достаточно надежных экспериментальных результатов (скважинных наблюдений, бурения - в геофизической разведке, глубинных высокоточных зондирований - в океанологии и др.);

б) автоматизированный выбор опорных значений к1 и U^(i^k') ,
например, по максимуму заранее заданной плотности нормаль
ного распределения вероятностей значений признаков с за
данными средними m(^[i) и дисперсиями D(9)H) для дан
ного t -объекта

p{U(1)(k),... , U(&)(k)) =

(I.I.I)

i2]

г1 3

Опорные значения к найдем максимизируя (I.I.I) для всех возмож-

ных к . Правила отбора исходных значений могут относиться лишь к определенным наиболее характерным признакам без учета остальных. В таком случае дисперсии D^ (і) нехарактерных д -признаков должны быть заданы существенно большими дисперсий остальных признаков. При отсутствии априорной информации о распределении значений признаков автоматизированный выбор опорных значений к' и IIе(t, к') может быть осуществлен на основе произвольного перебора точек к и поочередного прослеживания (классификации) t -объектов (классов) поодиночке, исключая из числа заданных величин 11 У (к) значения, принадлежащие уже прослеженным (классифицированным) объектам (классам).

Число Q(t) опорных к' -точек для того или иного і -объекта (класса) должно быть таким, чтобы обеспечить возможность прогнозирования значений признаков в апробируемых точках пространства. Так, например, при прослеживании пространственной границы раздела с кусочной аппроксимацией границы наклонными плоскостями ( 1.2) число Q(t) должно быть не менее трех, так как только в этом случае возможно проведение "опорной" плоскости, аппроксимирующей границу. При классификации, когда принимается допущение о постоянстве ожидаемых значений признаков в пределах отдельных классов и применяется ступенчатая аппроксимация значений признаков ( 1.2), число Q(l) может изменяться в широких пределах, начиная с единицы.

Если число объектов (классов) заранее неизвестно, то выбор исходных опорных значений в основном определяется организационной структурой алгоритма прослеживания (классификации). Так при иерархической дивизимной структуре [33,34] все имеющиеся значения VJ^(k) считаются исходными опорными значениями единственного класса (Т~1 ), при агломеративной структуре [33,3^]

- ЗО -

число Т классов полагается равным числу наблюдений ОС , в каждый t -класс включаются одиночные, но различные опорные значения

1.2. Прогнозирование ожидаемых значений признаков

Рассмотрим задачу прогнозирования ожидаемых значений признаков, относящуюся к количественным задачам статистической теории интерпретации [2^]. Б случае, когда число Т объектов (классов) задано, прогнозирование значений признаков в той или иной точке х^ , ук , z/< сводится к построению уравнения аппроксимирующей поверхности по опорным значениям 21 ^ (t, о,) признаков в точках х„ 7 у* , 2« , удовлетворяющих условию локальности прослеживания (классификации) и к вычислению значений j-(^(t?l<) аппроксимирующей функции в точке х^ , y/()zk. Тип аппроксимирующей функции назначается заранее в соответствии с ожидаемой гладкостью пространственного изменения средних значений признаков в интервале R ?у,2) . При малых Я(х, у,2) допустима линейная аппроксимация признаков и даже аппроксимация постоянными средними значениями. При очень малых (*,«/, 2) , однако, число опорных значений признаков, удовлетворяющих требования: локальности прослеживания (классификации), может оказаться недостаточным для эффективного прогнозирования признаков. Поэтому интервал ^х,у, 2.) и тип аппроксимирующей функции следует подбирать опытным путем для данной конкретной задачи про-

й Здесь и далее вместо значений номеров опорных точек к' используется порядковый номер у, ( (), = 1,2,,.., R(i)) опорного значения для t -объекта (класса).'

слеживания (классификации). Ниже рассматривается линейная аппроксимация признаков. Прогнозирование производится по ближайшим к апробируемой к -точке опорным точкам і -объекта (класса), число которых обозначим через Q (t) ^ Q (і). Для опорных значений признаков примем следующую модель

(*>

U^(t^)= А /*> + п*

(I.2.I)

А^= \1 *} Ч^ Ц

у*-

Я? Л*

> V*V/.

п - случайная компонента, нормальная, стационарная, центрированная, независимая в а, -точках наблюдений с дисперсией б'і , Уравнение

^(t^)=A^>

(1.2.2)

/<Р

определяет плоскость с неизвестным вектором коэффициентов р аппроксимирующую заданные опорные значения д -го признака в

—>

пространстве наблюдений. Оценку векторов j>rg> получим с помощью метода максимального правдоподобия [24,50,73] . Учитывая принятую модель для опорных значений (1.2.I) и свойства Случайной компоненты п* , можно написать выражение для функции достаточного приема

Qd)

**(/*)--& (иф(*>*)- А*/9)Г-

9 Ї

(1.2.3)

Определение векторов J>r^t обеспечивающих максимум функции

достаточного приема, сводится к решению системы из четырех уравнений правдоподобия

* Г - = 0 , ^=1,2,3,4 (1-2.4)

или, учитывая формулу (1.2.3):

Здесь 7" - знак транспонирования матрицы. После несложных преобразований получим максимальноправдоподобнуго оценку вектора

/«>= Z а; а^ j Z a; u(9)(t, t). (1.2.6)

Оценку і (t7k) прогнозируемого значения признака найдем как значение аппроксимирующей функции (1.2.2) в точке к

A^}/f и\ = А, 1Ї<8> (1.2.7)

Г'Ч*,*) - hkf» ,

где A, = /j 1 Ч yk i> Тогда

,QH) \-1 Qli)

nW-AJZ/^j X.ATfU's>(t,l). fl.2.8)

Дисперсия оценки (1.2.8) находится известными из теории вероятностей способами [100] . Учитывая принятую модель для опорных значений (1.2.I) и свойства случайной компоненты п(^ , можно написать

не п(Р Выполняя эту операцию, получим окончательное выраже-у

где надчерк обозначает операцию усреднения по случайной величине п(Р Выполняя эту операцию у

ние для дисперсии оценки (1.2.8)

*Е

Выделим частный, но практически важный случай, когда число опорных точек, используемых для прогнозирования, оказывается равным числу составляющих вектора о а коэффициентов аппроксимирующей плоскости. Очевидно, что это число равно четырем, трем или двум, если к -точки разбросаны соответственно в пространстве, по плоскости или вдоль прямой. В этом случае расчеты сильно упрощаются и вместо (1.2.8) и (1.2.10) будем иметь

(1.2.II)

Л,/<)= tf(AkC)(CTArk). Здесь

Q'(t)=4? U'%)=

lLc9)(t,l) U(S)(i,5)

C"'«

(1.2.12)

Если точки наблюдений разбросаны по плоскости, то вместо (1.2.12) будем иметь

д7()-3? U(8\t)=

. (1.2.ІЗ)

Наконец, если точки наблюдений лежат на одной прямой в плоскости X , У либо разбросаны по одной лишь X , найдем из (1.2.II)

i(g)(t9k)-U($)(t?2)

1- - U'»'(t,l)

*к~ *1 о,(9\, Х/с-*2

л г) — X,

х2 xY

(1.2.14)

а-х,)

3>^(t,jc)e—5z—a(xk-x02+ (Xfc.X)aj,

Если в локальной области прослеживания (классификации) применяется аппроксимация значений признаков постоянными средними, то

Р%>»

Ш^і71'*^'

(І.2.15)

D^» = <Г// Оі'СІЇ .

Формулы (1.2.15) можно применять для ступенчатой аппроксимации сложных распределений значений признаков в пространстве X , У , 2 .

Перейдем теперь к случаю, когда число Т объектов (классов) заранее неизвестно. Пусть на промежуточном шаге прослеживания (классификации) рассматриваются два класса с номерами Ь и і , причем в каждом классе выделена своя частичная совокупность опорных элементов, удовлетворяющих требованию локальности прослеживания. В качестве прогнозируемых значений признаков по опорным значениям і -го и і -го классов примем соответствующие выборочные средние и дисперсии [5,6]

. Qto ...

Q(t) »-' Ql) (I.2.I6)

Q'(l') ,

Заметим, что формулы (I.2.16) совпадают с формулами для ступенчатой аппроксимации (1.2.15). Поэтому значения -f(S)(i) можно трактовать как прогнозные оценки значений признаков в некоторой (например, средней) точке t -класса, а значения i(^(t') и і -класс - будем называть апробируемыми.

1.3. Определение функции отклика

Рассмотрим сначала случай известного числа Т объектов (классов). Будем исходить из следующей модели для измеренных значений признаков 7l(s)(k) :

U(*>(k) = ffl>(t,U) + n(s)(i,U) , (І.З.І)

- 36 *'"(-Ь9к) - не

Л,

где У^{Ьук) - неизвестные действительные значения признаков. Точность оценивания i(^(t>k) (см. формулу (1.2.10)) зависит от двух независимых факторов: правильности выбора типа аппроксимирующей поверхности и точности измерений значений признаков, принятых за опорные. Опшбка аппроксимации, связанная с неточным выбором типа аппроксимирующей поверхности, может быть малой по сравнению со среднеквадратичным отклонением n(s)(i,k) , сравнимой с ним и доминировать над ним. Рассмотрим два крайних случая. В первом из них, когда ошибка аппроксимации мала, будем считать случайную компоненту п(^(-к}к) нормальной, центрирован-ной, некоррелированной с дисперсией о^ ; в случае доминирующей ошибки аппроксимации она включается в п(^(-Ь7к) , при этом вследствие гладкости аппроксимирующей функции случайную компоненту n(P(iyk) необходимо считать коррелированной в точках наблюдений. Заметим, что второй случай эквивалентен аппроксимации 11 ^(к) "гладкой" случайной поверхностью, при этом поведение средних значений признаков в пространстве наблюдений может быть задано весьма ориентировочно.

Рассмотрим сначала случай малой ошибки аппроксимации. Модель (1.3.I) дополним равенством

где AJ^(t,k) - ошибка прогнозирования, порожденная случайной компонентой пТ (см. модель (I.2.D), нормальная (из-за линейности формул (1.2.8) и (1.2.10)), центрированная с дисперсией D $ [t ,к) . Вследствие независимости /г і в точках наблюдений величины пе^(-Ь?к) и д}*(1;}к) также независимы.

Для решения вопроса о возможности отнести значения признаков в к -ой точке наблюдений тому или иному t -объекту (классу) определим функцию отклика \(t}k) . Решения условимся принимать по значениям разностей о * (t}U) между измеренными И*(к) и прогнозированными T^(t,k) значениями признаков в точке

%'»а,к)-и<»(к) -Р»н,и). и-3-3)

Эти разности имеют по-прежнему нормальные распределения с нулевыми средними и дисперсиями 6"q + Ъ У (-b, к) . Зная законы распределения разностей о (Ь, к) и учитывая независимость случайных компонент измерений для разных а -признаков, легко построить совместную плотность распределения вероятностей для комплекса из G- признаков

I и k)- П ' «о/ №hzl^btf} (1.3.4)

L{t'k) j.\ тЩ + ъ'%,ф р{~2 [ff/ + в'»м j''

и выделить функцию достаточного приема (функцию отклика) для неизвестных і и к [^ ,68]

Максимум этой функции по и к определяет номер - і объекта (класса), к которому целесообразно отнести прослеживае-мый (классифицируемый) элемент с номером к - к

Рассмотрим теперь случай доминирующей ошибки аппроксимации. Введем выборку случайных величин У- (t71) ,..., Us(t, Q(t)), %i s(к) опорных и апробируемого значений g -го признака и их матрицу корреляции

^2(3 а

(1.3.6)

f№ d2 1

(Also Wtln I

d(9) d(p

Возможны две альтернативы. Первая ( \) = -/ ) состоит в том, что апробируемое значение Zi^(k) корреляционно связано с опорными значениями, вторая ( ^ = 2 ) - в том, что величина

(^(к) не зависит от опорных значений и, следовательно, не является представителем прослеживаемого (классифицируемого) объекта (класса). Альтернативам 0=7 и ^=2 соответствуют совместные плотности распределений:

p(U('\t9l)9..., U(9\t,Ql-t))9 U(t\k)) =

(1.3.7)

U(2y(k)

Ъ»1

У^^"^^Р{ип1.:%,т>

р ( U(8% 1),..., U(*\t3 Q (t))} р ( V!*>(k))

1-1 .

IsVl . / ,-*,

Здесь

1Ll» (V

9 Jkk

2 6-,

(1.3.8)

?'

а о

и {dq ) - элемент матрицы, обратной матрице cL (1.3.6). В качестве функций правдоподобия L ^ (t?k) [2і! ,28] для альтернатив \>=1,2 примем соответствующие плотности распределений (1.3.7). Функцию достаточного приема (функцию отклика) \(t,k) по комплексу признаков для максимально правдоподобного решающего правила определим, используя критерий логарифма отношения правдоподобия [50,71,75] . Очевидно, что требование максимального правдоподобия будет выполнено, если положить

L (і к) 0=,/

A(t,k) = In -' ' \ О . (I.3.I0)

L2(i9k) а

Подставляя (1.3.7) в (1.3.10) и учитывая (1.3.8) и (1.3.9), после преобразований найдем

W ,j-u

+ <

(I.3.II)

Элементы матрицы cL можно оценить по результатам измерений значений признаков для достаточно представительной совокупности типовых объектов (классов) \_Ц0710О] . Во многих практически

- ho -

важных случаях характер убывания корреляционных связей с увеличением расстояния Хкк' между точками наблюдений можно считать экспоненциальным

«С =ехР (-<.«'xAW, .з.І2)

где cL^ - некоторый коэффициент. Возможен также случай специальных марковских связей [ 2 */ 7 2 9, 4 О J

(0) lk-k'l

при котором обращение матрицы da существенно упрощается

Ыд )кк = JZ^l

( ^9 ^kq, Г "" Ув ' ' для точки ^ » ближайшей к точке к ( dn )кк I & » Для остальных о, .

Для расчета функции отклика А (і,1<) по формуле (1.3.II) необходимо знать величины безусловных средних і (i91) f У (t7 Q(~t)) » 6(^(t,k) . В качестве их оценок можно использовать соответствующие прогнозированные оценки (1.2.8 -- 1.2.15), что приводит, однако, к потере функцией отклика оптимальности, так как в ней не учитывается случайность упомянутых оценок. Тем не менее, применение субоптимальноЁ функции отклика

A(^)-EfM«Ow, - $*[и(»(к)-?Щ,к)

Ч/кк '<

& (d'u

- н

+ H -^4 ії*цЛ)~ P*>(t,t)tf +

Г< I ds }kk (I.3.I3)

*ч\

целесообразно, так как учет случайности оценок і (ty а,) , j^(t,l<) связан со значительным увеличением сложности вычислений.

Перейдем теперь к случаю, когда число Т объектов (классов) заранее неизвестно. Пусть на промежуточном шаге прослеживания (классификации) рассматриваются два класса с номерами t и і , причем для каждого класса по соответствующим частичным совокупностям опорных значений (их число обозначим через Q(t) Q(i) и Q ("О ^ Q(i) ) рассчитаны прогнозные и апробируемые значения признаков и их дисперсии (см. формулы (1.2.16))

Q'U) а

Функция отклика для принятия решения о целесообразности объединения Ї -го и і -го классов строится способами аналогичными вышеизложенным для разностей

Эта функция имеет вид [ 5, &2

ссе?

-LUx^i

- ЦІ

Максимум функции X(t,-k) по t и - определяет номера t=t z r="t классов, которые целесообразно объединить в один.

1.4. Схема процедуры прослеживания с известным числом Т объектов

Пусть в трехмерном X , У , И пространстве наблюдений задана совокупность точек *gf е , ze (=/,2,..., L ), в которых измеряются значения tL^(Q признаков с номерами q=/,..., & (рис. 2). Введем ограничение запрещающее относить прослеживаемые элементы к одному и тому же объекту, если координаты хее точек наблюдений совпадают. Это равносильно введению площадной (либо профильной) системы наблюдений на плоскости X , У и приводит к появлению в точках х^ , ук (к = і,... ,Х ^ L) этой системы конкурирующих элементов, которые будем нумеровать числами и = /, 2 ?... у м (к). Значения признаков, описывающих эти элементы, обозначим через 11^(^,/().

Рассмотрим схему процедуры одновременного прослеживания известного числа Т объектов, которые условимся нумеровать числами t = f,2,tl,7T . Прежде всего для каждого t -объекта необходимо отобрать опорные элементы с соответствующими опорными значениями признаков. Отбор опорных элементов может производиться либо интуитивно, исходя из априорных представлений интерпре-

Рис. 2. Схема наблюдений:

вертикали - шкала признаков,

точки на вертикалях - значения признаков,

- опорные значения признаков

- kk -

татора о характерных для данного t -объекта значениях некоторых признаков в отдельных точках х^, ук , либо формализованно, например, по максимуму заданной априорной плотности распределения вероятностей значений всех или части признаков для данного

t -объекта ( I.I).

В результате начального отбора для каждого t -объекта получим Q(~t) опорных элементов со своими значениями^- (,^,^) = = V,l^}(t7c0 признаков в точках х* fy* , где ^ = 1,2,..., Q(-t) - номера опорных элементов (порядковые номера пар к ,у'). Процедура прослеживания представляет собой последовательность шагов с номерами т ^1,2,..., М , на каждом из которых устанавливается принадлежность одного из конкурирующих прослеживаемых элементов той или иной совокупности опорных элементов. Рассмотрим подробнее некоторый промежуточный шаг процедуры. В первую очередь отбираются элементы, не совпадающие и не являющиеся конкурирующими ни с одним из опорных для всех Ї -объектов. В результате отбора получим совокупность апробируемых элементов с соответствующими номерами к и м . После этого для каждой і<-й апробируемой точки наблюдения выделяются частичные совокупности опорных элементов, удовлетворяющих условию локальности для соответствующе- ' го і -объекта, то есть отбираются такие опорные cl -точки

-объекта, расстояния от которых до апробируемой к -точки не превышают интервала (хРу) Частичные совокупности состоят из Q (i) (~t- 1,2.,.,, ,Т ) опорных элементов и используются затем для прогнозирования ожидаемых значений і ^(i, к) признаков в апробируемых к -точках ( 1.2). Далее прогнозированные

J * (iyk) и измеренные И У(k,fi) значения признаков в точках хк , у^ используются для решения вопроса о принадлежности измеренных значений к тому или иному t -объекту. Для этой цели

строится функция отклика A(t,/c,л<) (см. формулу (1.3.5)), которая позволяет для разных Ї , к ж р по значениям j$ (t,k) и У*^(к,м) для комплекса а -признаков (а=1,2?,,.,(г) найти

. А Л

значения к= к ж М=м , определяющие апробируемый элемент, который целесообразнее всего отнести к объекту с номером t=- на данном шаге прослеживания.

На каждом шаге процедуры проверяется условие надежности

выбора значений к , м и t : производится сравнение максимальной величины ^(t}k,h) с пороговым значением АПОг>, которое можно определить опытным путем для данной конкретной задачи прослеживания или же методом статистического моделирования для заданной модели экспериментального материала. Прослеживание прекращается, когда станет справедливым условие

nvax А(*Л/0< ХП0/О (1-4Л)

В противном случае отождествленный элемент с номерами к = к ж

Л . А

м ~м включается в число опорных элементов объекта т - г , после чего начинается следующий шаг прослеживания. На каждом шаге, несмотря на совместный перебор значений к , н и і , только один элемент исключается из дальнейшего апробирования, тем самым достигается необходимая гибкость прослеживания, обеспечивающая постепенное независимое прослеживание сразу всех Т объектов. Если условие (1.4.I) не выполняется ни на одном шаге m , то прослеживание прекратится, когда все апробируемые элементы будут разнесены по своим классам.

-/,6-

1.5. Схема процедуры классификации (прослеживания) с неизвестным числом классов

Пусть опять в трехмерном X , У , 2 пространстве наблюдений задана совокупность точек х^,У^ ,^/< { k ^ 1-,2.9,,, ,0С), в которых измеряются значения признаков 111^[к) с номерами о = /,2?.,., (рис. 2). Рассмотрим схему иерархической агломе-ративной процедуры классификации (прослеживания) с неизвестным заранее числом классов. Как и ранее будем считать, что прослеживание отличается от классификации наличием ограничения, запрещающего относить прослеживаемые элементы к одному и тому же объекту, если координаты ^, у^ соответствующих точек наблюдений совпадают. Примем исходное число Т классов равным числу % апробируемых элементов, при этом в каждый t -класс попадает по одному опорному элементу со своими значениями признаков. В ходе классификации (прослеживания) происходит последовательное объединение как первичных, так и уже частично объединенных классов.

Рассмотрим подробнее схему объединения на некотором проме
жуточном шаге классификации (прослеживания). Пусть в результате
предшествующих объединений образовалось 9^ Т классов, в каждом
из которых содержится Q(t) опорных элементов (i =/,2,,.,, О )
со своими значениями признаков b}P(t, q,) и координатами Хд, ,
уcf, ,2л в пространстве X , У , ^ ( ^,= j^i9,,. 9 Q (i) ). Вы
берем произвольно два класса с номерами " и і и определим вы
борочные средние значения ) признаков, а так
же дисперсии выборочных средних для опорных

элементов как і -го, так и -го классов . При расчете выборочных средних и дисперсий можно использовать не все опорные элементы -го и і -го классов, а лишь часть из них так, чтобы расстояния в пространстве X , У , 2f между соответствующими опорными точками і -го и і -го классов удовлетворяли условию локальности классификавди (прослеживания) ( 1.2). Это позволяет выполнять классификацию (прослеживание) элементов, несмотря на медленное изменение в пространстве X , У ,2 средних значений признаков. Если условие локальности не выполняется для всех опорных элементов і. -го и і -го классов, то происходит переход к другой паре значений t и і . Выборочные средние и дисперсии используются для вычисления функции отклика X (і}-і) , по значениям которой принимается решение об объединении t -го и і -го классов (см. формулу (І.З.І4)). На данном шаге процедуры перебираются все возможные пары t и 4. (t = 1,2?..., 0 и Iі = 1,2, > ., & ) и выделяется та пара і яt и i = ± ,для которой функция отклика Л{I,-к) максимальна. Если при этом значение \(і7-Ь) превышает пороговое значение Хпор » то соответст-

А А/ "

вующие і и і -классам элементы и значения признаков объединяются в новый укрупненный класс, число Q сокращается на единицу. В противном случае классификация (прослеживание) заканчивается. Пороговое значение \пор можно определить опытным путем для данной конкретной задачи или, используя статистическое моделирование для заданной модели экспериментального материала.

1.6. Аппроксимация значений признаков

В результате выполнения процедур прослеживания (классификации) вся совокупность структурных элементов (точек наблюдений) разбивается на группы (классы), принадлежащие выделяемым геофизическим объектам. В итоге каждому выделенному объекту ставится в соответствие определенная совокупность значений признаков. Но характеризовать геофизический объект большим массивом параметров - значений признаков неудобно для дальнейших вычислений и неэффективно при хранении данных в памяти вычислительной машины. Поэтому важной становится задача уменьшения размерности этого массива. Для ее решения в диссертации используется процедура аппроксимации значений признаков.

Пусть с помощью описанных в 1.4, 1.5 вычислительных схем выделен геофизический объект, которому присвоим номер і Это означает, что отобрано УС элементов со значениями признаков к) ( я= /,2, ..., (г ). Соответствующие точки наблюдений в трехмерном физическом пространстве X , У , It имеют координаты Х/<, ук , zk ( к = 1929...9УІ). Для отобранных значений признаков примем следующую модель

ІЇ9Ь,к) = Ак/а> +n/»(t9U),

(9>и , ч _ 7 Т(Я> . „WtJ. ,.х (I.6.I)

2. ,.2

А/, = 1 хк Чк *к хк % гк хкУк ... ||

'0>_

Ak p<» = Z Ak,fls),

J 4 = 1 J

J П

rt/^ - случайная компонента, нормальная, центрированная, независимая в к -точках с дисперсией 6^ .

Задача состоит в том, чтобы выбрать п коэффициентов О % таким образом, чтобы модель (I.6.I) максимально правдоподобно согласовывалась с данными 11^. Функция достаточного приема (функция отклика) для системы случайных величин 'И " (1,1),. . .,

11 (t9%) будет иметь вид с учетом принятой модели (1.6.1) и свойств случайных компонент п ^ :

(1.6.2)

Условия минимизации функции отклика (1.6.2) приводят к ли-нейной системе уравнений для нахождения оценки О д вида

Aj(v = V , (1.6.3)

%

А — Z_ AT, А. - матрица размера п х /г ,

к-1

V = ZL. A^ IIі1 (t7 к) - вектор-столбец длины /г .

к=1

Имеется много различных алгоритмов решения системы (1.6.3) [98] , но все они удовлетворительно работают лишь при условии, что матрица А достаточно хорошо обусловлена [96] .На

практике обусловленность матрицы часто бывает недостаточной, поэтому вследствие неточного задания данных и конечной точности работы реальных вычислительных машин естественно использовать для решения системы (1.6.3) метод сингулярного разложения мат-риц[33,33,97,106, Ш] . Для действительной /г*/г -матрицы А справедливо разложение

а = аїр7*, (1.6.4)

где XI - диагональная п*п -матрица с элементами

">ij =

О , при і Ф j и)i^ О , при і =j ,

называемыми сингулярными числами матрицы A , a Q. и Р - ортогональные ах/г -матрицы, QQ = I , РР =Г , I- единичная матрица. Тогда решение системы (1.6.3) записывается в виде

Jow - А+ V . (I.6.5)

Здесь матрица А размера я.хя. называется эффективной псевдообратной для матрицы А и равна [97]

At = Р 21* QT, (1-6-6)

где Z_ с - диагональная /г * а -матрица с элементами

' , при l=j и и). >

(1.6.7) , в противном случае.

Здесь сингулярные числа u)L сравниваются с границей , которая отражает точность исходных данных и точность машинных вычислений (пример выбора конкретного значения приводится в 2.3).

Подставляя (1.6.6) в (1.6.5), получим выражение для оценки

узу = р 22+ qt $ (1>6>8)

+

или, учитывая явный вид (1.6.7) матрицы И , будем иметь

>-21Мгг^}( (1-6,9)

где Pi и Qi - столбцы матриц Р и Q соответственно. Мерой качества решения системы (1.6.3) является ковариационная матрица оценок (1.6.9), на главной диагонали которой стоят дисперсии оценок ~рФ , а внедиагональные члены характеризуют корреляционные связи оценок. Используя правило переноса ошибок [100] для принятой модели экспериментального материала (I.6.I) и учитывая свойства случайной компоненты п(9\ получим

(1.6.ю)

п 2L -> _> р. от р., 7)7,

Выражение (1.6.10) дает возможность исследовать эффектив-ность оценивания коэффициентов р д в зависимости от свойств

случайной компоненты, системы наблюдений, точности используемой вычислительной машины. Если анализ K(f>(^) показывает, что оценки У определены с достаточной надежностью, то массив значений признаков анализируемого геофизического объекта длиной Ж* 0- можно заменить массивом, состоящим из п- G- значений j*jP (л «У,2,..., /г). Так как обычно /г « % , то аппроксимация значений признаков приводит к ощутимой экономии памяти вычислительной машины. Сохраняя в памяти лишь /г & значений коэффици-ентов jo^; и зная вид аппроксимирующего полинома, можно в любой момент рассчитать сглаженные значения любого а -признака в к -точках

i(9>(t,k) - Ак о'", t1'6-11'

причем качество сглаживания можно характеризовать выборочной дисперсией

В заключение отметим, что описанная процедура аппроксимации с помощью степенных полиномов используется в работе для иллюстрации выбранной в диссертации последовательной схемы прослеживания (классификации) и сокращения числа характеризующих выделенные геофизические объекты параметров. В дальнейшем эта ' процедура может быть развита с использованием сплайн-аппроксимации [92] и других методов.

1.7. Основные результаты и выводы

  1. На основе статистической теории интерпретации геофизических наблюдений проведена общая постановка задач прослеживания и классификации геофизических объектов по комплексу нестационарных числовых признаков в трехмерном физическом пространстве наблюдений.

  2. Формализованы математические модели экспериментального материала, лежащие в основе построения статистических алгоритмов прослеживания и классификации, предложены способы учета различных априорных дополнительных условий.

  3. Предлагаемые процедуры прослеживания и классификации являются разрывными интерпретационными процедурами, в которых последовательно и оптимально решаются количественная (прогнозирование) и качественная (распознавание) задачи. Для прогнозирования ожидаемых значений признаков используется кусочная линейная аппроксимация, что дает возможность разделять объекты (классы) со сложным распределением значений признаков в пространстве наблюдений. В качестве критерия принятия решений при распознавании использован метод максимального правдоподобия; выведены функции достаточного приема, предложены алгоритмы поиска максимумов этих функций.

  4. Описаны вычислительные схемы прослеживания и классификации заранее известного и неизвестного числа геофизических объектов по комплексу нестационарных числовых признаков, заданных в произвольных точках физического трехмерного про-

странства наблюдений. 5. Сокращение числа параметров, характеризующих выделенный в результате прослеживания (классификации) геофизический объект, и уточнение значений признаков объекта производится при помощи процедуры аппроксимации, основанной на степенной полиномиальной интерполяции и сингулярном разложении матриц.

Прогнозирование ожидаемых значений признаков

Рассмотрим задачу прогнозирования ожидаемых значений признаков, относящуюся к количественным задачам статистической теории интерпретации [2 ]. Б случае, когда число Т объектов (классов) задано, прогнозирование значений признаков в той или иной точке х , ук , z/ сводится к построению уравнения аппроксимирующей поверхности по опорным значениям 21 (t, о,) признаков в точках х„ 7 у , 2« , удовлетворяющих условию локальности прослеживания (классификации) и к вычислению значений j-( (t?l ) аппроксимирующей функции в точке х , y/()zk. Тип аппроксимирующей функции назначается заранее в соответствии с ожидаемой гладкостью пространственного изменения средних значений признаков в интервале R (х?у,2) . При малых Я(х, у,2) допустима линейная аппроксимация признаков и даже аппроксимация постоянными средними значениями. При очень малых ( ,«/, 2) , однако, число опорных значений признаков, удовлетворяющих требования: локальности прослеживания (классификации), может оказаться недостаточным для эффективного прогнозирования признаков. Поэтому интервал х,у, 2.) и тип аппроксимирующей функции следует подбирать опытным путем для данной конкретной задачи про й Здесь и далее вместо значений номеров опорных точек к используется порядковый номер у, ( (), = 1,2,,.., R(i)) опорного значения для t -объекта (класса). слеживания (классификации). Ниже рассматривается линейная аппроксимация признаков. Прогнозирование производится по ближайшим к апробируемой к -точке опорным точкам і -объекта (класса), число которых обозначим через Q (t) Q (і). Для опорных значений признаков примем следующую модель Ф /гп - случайная компонента, нормальная, стационарная, центрированная, независимая в а, -точках наблюдений с дисперсией б і , Уравнение / Р определяет плоскость с неизвестным вектором коэффициентов р аппроксимирующую заданные опорные значения д -го признака в — пространстве наблюдений. Оценку векто номер у, ( (), = 1,2,,.., R(i)) опорного значения для t -объекта (класса). слеживания (классификации). Ниже рассматривается линейная аппроксимация признаков. Прогнозирование производится по ближайшим к апробируемой к -точке опорным точкам і -объекта (класса), число которых обозначим через Q (t) Q (і). Для опорных значений признаков примем следующую модель Ф /гп - случайная компонента, нормальная, стационарная, центрированная, независимая в а, -точках наблюдений с дисперсией б і , Уравнение / Р определяет плоскость с неизвестным вектором коэффициентов р аппроксимирующую заданные опорные значения д -го признака в — пространстве наблюдений. Оценку векторов j rg получим с помощью метода максимального правдоподобия [24,50,73] . Учитывая принятую модель для опорных значений (1.2.I) и свойства Случайной компоненты п , можно написать выражение для функции достаточного приема достаточного приема, сводится к решению системы из четырех уравнений правдоподобия или, учитывая формулу (1.2.3): Здесь 7" - знак транспонирования матрицы. После несложных преобразований получим максимальноправдоподобнуго оценку вектора А Оценку і (t7k) прогнозируемого значения признака найдем как значение аппроксимирующей функции (1.2.2) в точке к Дисперсия оценки (1.2.8) находится известными из теории вероятностей способами [100] . Учитывая принятую модель для опорных значений (1.2.I) и свойства случайной компоненты п( , можно написать не п(Р Выполняя ров j rg получим с помощью метода максимального правдоподобия [24,50,73] .

Учитывая принятую модель для опорных значений (1.2.I) и свойства Случайной компоненты п , можно написать выражение для функции достаточного приема достаточного приема, сводится к решению системы из четырех уравнений правдоподобия или, учитывая формулу (1.2.3): Здесь 7" - знак транспонирования матрицы. После несложных преобразований получим максимальноправдоподобнуго оценку вектора А Оценку і (t7k) прогнозируемого значения признака найдем как значение аппроксимирующей функции (1.2.2) в точке к Дисперсия оценки (1.2.8) находится известными из теории вероятностей способами [100] . Учитывая принятую модель для опорных значений (1.2.I) и свойства случайной компоненты п( , можно написать не п(Р Выполняя эту операцию, получим окончательное выраже-у где надчерк обозначает операцию усреднения по случайной величине п(Р Выполняя эту операцию у ние для дисперсии оценки (1.2.8) Е Выделим частный, но практически важный случай, когда число опорных точек, используемых для прогнозирования, оказывается равным числу составляющих вектора о а коэффициентов аппроксимирующей плоскости. Очевидно, что это число равно четырем, трем или двум, если к -точки разбросаны соответственно в пространстве, по плоскости или вдоль прямой. В этом случае расчеты сильно упрощаются и вместо (1.2.8) и (1.2.10) будем иметь Здесь

Алгоритм классификации (прослеживания) неизвестного числа геофизических объектов по комплексу нестационарных числовых признаков

Алгоритм CLASS2. [5,6]построен на основе описанной в 1.5 схемы классификации (прослеживания) с неизвестным числом классов. Его входными данными являются значения измеренных признаков Ц( (к) и координаты xk,ykfzk (к = 1,,,,, УС) точек наблюдений в пространстве X , У , . Для работы алгоритма необходимо задание следующих параметров: порогового значения функции отклика (Апор )» точности измерений признаков ( &д ), интервала локальности прослеживания (классификации) ( ( .,1/,2.)), константы (Н ), определяющей режим (прослеживание, классификация) работы алгоритма. Описываемый алгоритм, как упоминалось в 1.5, представляет собою последовательность шагов, которые будем нумеровать числами пг = 1,29...9М. На каждом шаге ведется поиск таких двух классов, которые наиболее целесообразно объединить в один укрупненный класс. Для сокращения числа переборов пар классов предлагаемый алгоритм построен по следующей двухэтапной схеме (рис. 4). На каждом шаге выполняется один из этапов (I или П), заканчивающийся либо объединением очередных двух классов, либо завершением классификации (прослеживания). Рассмотрим схему работы алгоритма, начиная с первого шага {т.-і ). На первом шаге классификации (прослеживания) производится полный перебор всех классов (этап I) и находятся две пары классов с максимальными значениями функции отклика А1 и Аг (среди классов, составляющих эти пары, нет совпадающих). Классы первой пары (с большим значением функции отклика А1 ) объединяются в один класс, если, конечно, такое объединение достаточно надежно (Af ч АПОр). На втором шаге классификации (прослеживания) перебираются только пары классов, составленные из класса, сформированного на предыдущем шаге, и всех остальных классов (этап П). Из всех этих пар выбирается пара классов с максимальным значением функции отклика А . Рассмат-риваются вновь найденная пара классов ( л1 ) и вторая пара, найденная на этапе I ( А2 ). Структура этих пар классов, а также соотношение величин А и А2 определяют какой из этапов (I или П) будет выполняться на следующем шаге алгоритма. Если среди классов, составляющих анализируемые пары, нет совпадающих, то объединяются, при достаточной надежности, классы с большим значением функции отклика.

Если произойдет объединение классов, найденных на этапе П ( \ ), то на следующем, третьем, шаге опять выполняется этап П: перебираются пары, составленные из класса, сформированного последним, и всех остальных классов и так далее. Если же объединены будут классы, найденные на этапе I ( А ),ли-бо объединена пара классов, найденная на этапе П ( Х1 ) и имеющая общий класс с парой этапа I ( А2 ), то на следующем, третьем, шаге алгоритма будет выполняться этап I. Опять будет производиться полный перебор уже сокращенного, по сравнению с начальным, числа классов и так далее до тех пор пока надежность объединения очередных двух классов не станет низкой. Опишем алгоритм CLASS2 в виде последовательности операций. 1) Выбор исходных ОПОРНЫХ значений. Число Т классов полагаем равным числу наблюдений Ж . В каждый класс t включаем одиночные, но различные опорные значения к . Соответствую щие опорные значения признаков обозначим через U (t, ) , где = 1327t„,Q(t)- порядковый номер опорного значения для t -класса. В дальнейшем число Т классов будет убывать, а количество значений к в этих классах - возрастать. 2) Выбор режима работы алгоритма. Значение символического параметра Н задается равным CLASS для режима классификации и TRACE для режима прослеживания. 3) Цикл по т ( т.-1,,,,, М - номер шага классификации (прослеживания)). 4) Очистка ячеек хранения чисел U . t/ , iz . ±2 и засылка большого отрицательного значения в ячейки хранения чисел Л и Аг . В дальнейшем в ячейках А, и Л2 будут храниться текущие максимальные значения функции отклика, а в ячей ках t1 , і, ж t2 , t 2 - соответствующие значениям A и A2 (Af A2) текущие номера классов. 5) Циклы по і и { -Ь , і - номера классов). При выпол нении I этапа (i=V.., T-1;i! t; і = 2,..,,7) ведется перебор всех возможных пар классов. Всего таких пар будет —— — . При выполнении П этапа значение t равно номеру класса, сформированного на предыдущем (т-1)-м шаге алгоритма (t = 1,..., Г; v t ), и всего перебирается Т-/ пара. На m -м шаге классификации (прослеживания) число классов Т ЗС и классы могут содержать по нескольку значений к . 6) Обход операции 7 в режиме классификации. Если значение Н равно CLASS , то перейти к операции 8, если Н = TRACE , то выполнять следующую операцию 7. 7) Поиск в t и і - классах точек с совпадающими координатами . У . Б режиме прослеживания ( Н = Т А С є ) запрещается объединять классы, в которых обнаружены точки, находящиеся на одних и тех же "вертикалях" ( точки с совпадающими координатами х , у ). Таким образом, если такие точки есть, то нужно перейти к другой паре классов и снова начать с операции 6. 8) Поиск ближайших точек из " и t - классов. Поиск двух точек: к -точки из t -класса и к -точки из " -класса, расстояние і кк между которыми минимально.

Если точки к и к достаточно близки друг к другу» т.е. г / 4 &(х3у,г), где R(x,y?z) -интервал локальности классификации (прослеживания), то выполнять операцию 9; если г (х, /, ї) , то перейти к другой паре классов и начать выполнение операции 6. 9) Поиск точек t и -Ь - классов, попадающих в сферы радиуса R(x,y92) с центрами в к и к -точках, найденных при выполнении операции 8. Тем самым выделяются частичные опорные совокупности значений признаков, необходимые для выполнения операции 10. Число отобранных точек для і и -і -классов обозначим соответственно через Q(i) Q(t) ж Q.(t ) Q(iJ). 10) Расчет выборочных средних значений ± d) и f (t) признаков, а также дисперсий средних D tt) и D (t ) по отобранным в і и t -классах частичным совокупностям опорных значений. Расчет выполняется по формулам для выбо рочного среднего и дисперсии (1.2.16) A &{V

Прослеживание сейсмических волн и горизонтов по параметрам их структурных элементов

Одна из важных задач сейсморазведки - это задача построения сейсмических границ (горизонтов), являющихся, как известно, протяженныши весьма различными по форме. Применение на практике алгоритмов, осуществляющих это построение, затруднительно ввиду ряда обстоятельств: недостаточной информационной содержательности экспериментального материала, большого числа параметров, характеризующих совокупность сложных границ (горизонтов), неполноты априорных представлений о возможных особенностях сейсмических разрезов, сложности максимизации функции многих переменных, относительной маломощности вычислительной техники, большого объема сейсмической информации и др. В связи с этим в настоящее время разработаны, продолжают совершенствоваться и внедряться в практику комплексы программ, осуществляющие укрупнение первичного экспериментального материала и представляющие его в виде совокупности независимых отражающих площадок. В основу этих программ положены алгоритмы общей глубинной площадки (ОГП) [25] и статистического разреза (СТАР) [27] , разработанные на базе статистической теории интерпретации ["24J . Сейсмические разрезы, построенные с помощью таких комплексов и представляемые совокупностью площадок, не всегда удовлетворяют интерпретаторов. На таких разре зах имеется большое число "ложных" площадок, возникновение которых связано с методикой независимого поиска площадок, с несоответствием реальной среды принятым модельным представлениям, с выходом на неглавные максимумы функций достаточного приема и другими обстоятельствами. Кроме того, для дальнейшего использования и обработки сейсмических разрезов часто требуется, чтобы границы имели непрерывный вид, пригодный для учета преломления, использования пластовых скоростей и так далее. В связи с этим возникает задача отбора площадок, имеющих отношение к реальным непрерывным границам, и построения этих границ, то есть определение их параметров. Эта задача ставилась и решалась в работе [65] .

Более общей является задача прослеживания горизонтов -поверхностей в физическом пространстве. При этом также возникает необходимость отбора площадок реальных непрерывных горизонтов и построения этих горизонтов. В данном параграфе иллюстрируются возможности пакета программ IWTER для решения этих задач. Пусть наблюдения проводились на плоскости X , У в точках х/ , Ljk (k = 7, 2,...,X). в результате обработки сейсмических записей комплексами ОШ или СТАР выделяется совокупность отражающих площадок, каждая из которых задана следующим набором величин: 1L (к,/ ) = Яки - оценка глубины пло щадки с номером м , расположенной на "вертикали" с координатами х , у , либо 11 (к м) - т м оценка времени вертикального распространения волны до / -площадки ;U [к,н) у, - оценки у ки к осям X и У соответственно; U(li)(kfH) = А км - осред-ненный амплитудный параметр волны, отраженной от м -площад ки. В основу решения поставленной задачи положены следующие принципы [4 ] : 1) амплитуда волн, отраженных от некоторого горизонта, должна быть постоянной, близкой к оценкам амплитуд отбираемых площадок; 2) искомые горизонты в точках пересечения с "вертикалями" должны иметь глубину (времена) и наклоны близкие к заданным значениям этих величин для прослеживаемых площадок. Применим для решения задачи разработанный в работе пакет прикладных программ IN ТЕ R. . Для имитации результатов работы двумерных аналогов алгоритмов ОШ и СТАР представим эти результаты в виде Здесь А - постоянная амплитуда волн, отраженных от прослеживаемого горизонта; 1ъ(х9у) и т(х,у) -функции, аппроксимирующие горизонты в пространствах ( х7 у? И, ) и ( х, у, т ) соответственно; (х7у) и ( У) - функциональные зависимости наклона горизонта к осям X и У , определяемые выражениями компоненты, принимаемые нормальными, центрированными, некоррелированными, стационарными по к ил , с дисперсиями Од , бг » » р А соответственно. Дисперсии задаются достаточно малыми для моделируемых горизонтов и существенно большими для получения "ложных" площадок. Значения 71 (к н) или hi k/i , xk/i , cLk/t , pkp , Д рассчитываются программой MODEL , входящей в пакет ІА/ТЕЯ Модельные значения J- для разных горизонтов (рис. 6) рассчитываются по формулам

Другие возможные применения программ

Прикладные задачи, решаемые в предыдущих параграфах, не исчерпывают всех возможных применений программ пакета 1ЫТЕИ, Рассмотрим еще несколько актуальных задач, для решения которых в дальнейшем предполагается использовать разработанный пакет. Прослеживание ритмов осадконакопления. Известно, что большую роль в поиске залежей углеводородов в ловушках неантиклинального типа может играть исследование ритмичности геофи зических процессов, связанных с формированием месторождений. Такая ритмичность проявляется, в частности, в чередовании песчаных, алевролитовых и глинистых прослоек [5 7] , что может косвенно регистрироваться, например, на материалах каротажных наблюдений. Понятие ритма осадконакопления позволяет разделять глубинные разрезы на основные естественные части, а следовательно, облегчать дальнейший анализ, ограничивая его более узкими комплексами условий. Выделенные ритмы позволяют провести детальную корреляцию ряда фациально невыдержанных отложений в пределах изучаемой площади, где осадки не обладают надежными маркирующими горизонтами. Такая корреляция до настоящего времени проводится вручную и, вследствие больших объемов геофизических данных,является неэффективной. Разработка программ корреляции ритмов осадконакопления поэтому - практически важная и актуальная задача.

Пусть на изучаемой площади пробурено некоторое количество скважин и в каждой из них проведены каротажные наблюдения. Пусть далее на всех полученных каротажных кривых проведено выделение ритмов осадконакопления, каждый из которых описывается набором числовых признаков [5 7] : мощностью, глубиной залегания центра, количеством песчаных, алевролитовых, глинистых прослоек, суммарными мощностями этих прослоек, отнесенными к общей мощности ритма, средними мощностями прослоек, также отнесенными к общей мощности ритма, мощностью песчаных пород в подошве ритма. Вследствие независимости процедур поиска и выделения ритмов осадконакопления на отдельных каротажных кривых І важное значение приобретает задача идентификации ритмов, полученных по каротажным кривым соседних скважин. Эта задача является частью более общей задечи пространственного прослежи вания ритмов осадконакопления, ведущегося по простиранию (по площади) и по залеганию (по глубине). Задачу пространственного прослеживания ритмов осадконакопления можно решать с помощью разработанных в диссертации программ прослеживания TRACE 2 и С LASS 2 , используя в качестве исходных данных совокупность характеризующих ритмы наборов числовых признаков 1LJ и координаты скважин на изучаемой площади / Ук Применение той или иной из программ ( TRACE2 или CZ.ASS2 ) определяется конкретной постановкой рассматриваемой задачи прослеживания. Если интерпретатор рассматривает ритм осадконакопления, выделенный на каротажной кривой какой-либо скважины, либо группу ритмов, выделенных на каротажных кривых соседних скважин и отнесенных им к одному типу ритмов, и ставит перед собой задачу исследовать пределы распространения данного типа ритмов на изучаемой площади, то естественно использовать для решения этой задачи программу прослеживания заданного числа геофизических объектов TRACE 2. . При невозможности задать исходные опорные ритмы для их дальнейшего прослеживания полезную информацию о строении толщ изучаемой площади можно получить выделяя все достаточно протяженные области распространения ритмов различных типов с помощью программы прослеживания геофизических объектов при их заранее неизвестном числе CLAS S2 Программные параметры - среднеквадратичные отклонения значений признаков 6 , интервал локальности прослеживания ( 7 У) » пороговое число ПОр - задаются исходя из априорных неформализованных представлений опытного интерпретатора о пределах и гладкости изменения значений признаков для ритмов отдельных типов и об изменении этих значений при переходе

Похожие диссертации на Статистические алгоритмы прослеживания и классификации геофизических объектов