Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели информационной оценки признаков рудных объектов Вяткин Виктор Борисович

Математические модели информационной оценки признаков рудных объектов
<
Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов Математические модели информационной оценки признаков рудных объектов
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Вяткин Виктор Борисович. Математические модели информационной оценки признаков рудных объектов : Дис. ... канд. техн. наук : 05.13.18 : Екатеринбург, 2004 129 c. РГБ ОД, 61:05-5/414

Содержание к диссертации

Введение

1. Анализ традиционной математической модели информационной оценки признаков рудных объектов 12

1.1. Общая характеристика алгоритмической модели прогноза месторождений полезных ископаемых с помощью теории информации 12

1.2. Традиционная математическая модель информационной оценки признаков рудных объектов 16

1.3. Классификация прогнозно-геологических задач по способу задания рудных эталонов 22

1.4. Модельное решение прогнозно-геологических задач первого рода и его анализ 26

1.5. Модельное решение прогнозно-геологических задач второго рода и его анализ 33

1.6. Результаты анализа традиционной математической модели информационной оценки признаков рудных объектов 38

Выводы 41

2. Анализ традиционных подходов к количественному определению информации с позиций совершенствования математической модели информационной оценки признаков рудных объектов 43

2.1. Постановка задачи количественного определения информации, отражаемой относительно друг друга двумя системными объектами 43

2.2. Комбинаторный подход к количественному определению информации 50

2.3. Вероятностный подход к количественному определению информации 59

2.4. Алгоритмический подход к количественному определению информации 69

2.5. Результаты анализа традиционных подходов к количественному определению информации с позиций совершенствования математической модели информационной оценки признаков рудных объектов 73

Выводы 74

3. Синергетический подход к количественному определению информации 76

3.1. Самоотражение системных объектов 76

3.2. Негэнтропия отражения системных объектов 89

Выводы 96

4. Математическая модель информационной оценки признаков рудных объектов, основанная на синергетическом подходе к количественному определению информации 99

4.1. Общее описание модели 99

4.2. Модельное решение прогнозно-геологических задач первого рода 106

4.3. Модельное решение прогнозно-геологических задач второго рода 108

Выводы 110

Заключение 112

Список использованных источников 117

Приложения 125

Введение к работе

Состояние минерально-сырьевой базы Российской Федерации в течение последнего десятилетия характеризуется устойчивой тенденцией превышения объемов добычи полезных ископаемых над приростом их запасов в результате геологоразведочных работ [1, 26, 35, 52, 54]. В связи с этим Министерством природных ресурсов России особое внимание обращается на рассмотрение вопросов, связанных с повышением эффективности решения прогнозно-геологических задач с помощью компьютерных технологий [24,37].

Общеизвестно, что геологическая эффективность прогнозирования месторождений полезных ископаемых, осуществляемого с помощью компьютерных средств, зависит, главным образом, от того, какие алгоритмические модели прогноза реализуются в виде компьютерных программ. Подтверждением этому является тот факт, что при одном и том же исходном картографическом материале, в зависимости от того, по каким правилам осуществляется прогнозирование, один и тот же рудный объект может быть выявлен или пропущен, а какой-либо безрудный участок - выделен в качестве перспективного или забракован [4].

Стандартная алгоритмическая модель прогноза месторождений включает в себя два основных этапа работ. На первом этапе, на основе всей имеющейся по району работ информации (геологической, геофизической и т.п.) создается прогнозно-поисковая модель рудных объектов эталонного типа, представляющая собой классификатор поисковых признаков, для каждого из которых определена информативность, как количественная характеристика его прогнозно-поисковой значимости. На втором этапе, сначала для каждой элементарной ячейки исследуемой территории вычисляется аддитивный показатель перспективности, как сумма значений информативности, наблюдаемых в ячейке признаков, а затем те участки территории, у которых наблюдаются относительно высокие значения указанного показателя, выделяются в качестве перспективных на обнаружение новых рудных объектов. Достовер-

ность прогнозных заключений, получаемых с помощью данной модели, практически полностью определяется качеством работ первого этапа и во многом зависит от того, какая математическая модель используется для оценки информативности признаков, включенных в прогнозно-поисковую модель.

Актуальность работы. Любой признак рудного объекта, отражая ту или иную его особенность, содержит о нем определенное количество информации. Вследствие этого, в научной литературе по прогнозу месторождений полезных ископаемых, неоднократно рекомендовалось при определении информативности признаков использовать математический аппарат теории информации, а за значения информативности принимать, соответственно, количество информации о рудных объектах [4, 11, 21, 31, 33, 71, 72]. Предлагаемые при этом математические модели информационной оценки признаков основаны, как правило, на формуле частной информации «от события к событию» [8], которая с прогнозно-геологических позиций интерпретируется как логарифм отношения вероятности встречи признака на эталонных рудных объектах к вероятности его встречи на исследуемой территории в целом. Вместе с тем, анализ такой традиционной модели информационной оценки признаков показывает, что ее практическое использование может приводить к общей неустойчивости и даже противоречивости получаемых прогнозно-геологических заключений [12, 13, 15]. В соответствии с этим актуальной задачей, направленной на повышение эффективности прогноза месторождений полезных ископаемых с помощью теории информации, является совершенствование математической модели информационной оценки признаков рудных объектов.

Цель работы состоит в разработке новой математической модели информационной оценки признаков при прогнозном моделировании рудных объектов, отличительной чертой которой от традиционной модели является детерминированный, а не вероятностно-статистический характер получаемых значений информативности признаков.

Задачи исследования:

Традиционная математическая модель информационной оценки признаков рудных объектов

Математический аппарат существующей теории информации, основанный, главным образом, на работах американского исследователя К.Шеннона [74], традиционно привлекает к себе внимание специалистов прогнозно-геологического профиля с целью его использования при математическом моделировании информационной оценки признаков рудных объектов [4, 11,21, 31, 33, 40, 71, 72]. При этом, в качестве исходного начала, берется, как правило, вероятностно-логарифмическая мера частной информации "от события к событию", в оригинале имеющая вид [8]: где: J(B- A) - частная информация о событии At содержащаяся в событии В; р(А\В) - условная (апостериорная) вероятность появления события А при наступлении события В; р(А) - априорная вероятность наступления события А.

Так как в соответствии с теоремой умножения вероятностей вероятность р (АВ) совместного появления событий А и В равна: то условная вероятность р(А\ В) может быть записана как

После подстановки выражения (1.2) в формулу (1.1) получаем, что частная информация "от события к событию" является симметричной относительно обоих рассматриваемых событий А и В, то есть:

В соответствии с выражением (1.3) модель количества информации о рудных объектах (событие А), содержащейся в некотором поисковом признаке Pg (событие В), принято представлять в следующем виде:

Модель количества информации (1.4) в вышеприведенной литературе неоднократно рекомендовалась для практического использования (и использовалась) в качестве информационной оценки (информативности) признаков при прогнозном моделировании рудных объектов. При этом ее правомерность обосновывалась следующим образом; "Из формулы видно, что количество информации тем больше, чем выше вероятность обнаружения рудного объекта при наличии данного значения признака по сравнению с вероятностью его нахождения в целом по исследуемому району. J(B- A) - положительно, когда использование значения признака повышает вероятность обнаружения рудных объектов, и отрицательно - когда снижает эту вероятность ( то есть, когда на участках, где встречается данное значение признака, вероятность события А ниже, чем в среднем по всей исследуемой площади). Это вполне соответствует интуитивным представлениям о мере количественной оценки перспективности " [72, с. 31].

Анализ модели количества информации о рудных объектах (1.4) и процитированного ее комментария позволяет высказать ряд критических замечаний принципиального характера.

Первое. Не вызывает доверия утверждение об отрицательном количестве информации, содержащейся в признаке относительно пространственно взаимосвязанных с ним рудных объектов, на основании лишь их редкого совместного наблюдения и значительного площадного распространения признака.

Допустим, что какой-либо признак занимает 60% исследуемой территории, а в пределах его распространения находится 50% эталонных рудных объектов, поиск аналогов которых является целью проводимых прогнозно-геологических исследований. Используя в этом случае в качестве информативности признака модель (1.4), получаем отрицательное количество информации о рудных эталонах, по модулю равное 0,26 бит. (Бит - единица количества информации, применяемая при использовании двоичных логарифмов, В традиционной теории информации 1бит интерпретируется как количество информации, получаемой в результате выбора одной из двух равновероятных возможностей [74].) В то же самое время априорно известно, что данный признак для этих 50% эталонных объектов является рудоконтролирующим фактором и в пределах ареала его распространения с рудогенетических позиций могут быть выявлены новые рудные объекты. О каком отрицательном количестве информации мы можем вести речь в данном случае, не вступая в противоречие с основами теории поиска месторождений полезных ископаемых [2]?

Дело в том, что геологоразведочный процесс имеет стадийный характер, реализующий принцип последовательного приближения к рудному телу (месторождению) [2, 47]. То есть от ранних к поздним стадиям геологоразведочных работ осуществляется последовательная локализация перспективных площадей, которые в своей совокупности соответствуют иерархически упорядоченному рудному ряду: "рудная провинция - рудный район - рудное по ле - месторождение - рудное тело" [23]. Каждый член этого ряда обладает специфическим множеством поисковых признаков, наиболее адекватно соответствующих ему по масштабу своего проявления и, соответственно, содержащих о нем наибольшее количество информации в сравнении с информацией о других членах ряда. Иначе говоря, любой поисковый признак содержит определенную информацию о каждом члене рудного ряда, величина которой тем больше, чем больше соответствуют друг другу по размерам проявления признаков и члены ряда. Наглядной иллюстрацией сказанного служит рис. 1.2, на котором приведена модель соотношения количества информации, отражаемой признаком относительно рудных объектов различного иерархического уровня. При этом, очевидно, что количество информации о каждом члене ряда является положительной величиной.

С этих позиций признак, в рассматриваемом нами примере, является знаком рудного объекта более высокого иерархического уровня (т.е. соответствующего предыдущему масштабу исследований), а на данной стадии работ количество информации, содержащееся в нем относительно эталонных рудных объектов, является положительно небольшим, пусть даже весьма небольшим, но никак ни отрицательным. Признание же отрицательной информации (информативности) равносильно утверждению, что процесс или явление, фиксируемое данным признаком, имеет антирудную направленность, что противоречит здравому смыслу.

Комбинаторный подход к количественному определению информации

Комбинаторное измерение информации, исторически появившееся первым, характеризуется использованием математических функций, оперирующих с конечными множествами элементов, образующих какое-либо сообщение или систему. Основоположником данного направления в теории информации принято считать Р. Хартли, который в 1928 году, при сравнении пропускной способности различных технических систем связи, предложил ис 51

пользовать для количественного измерения информации логарифмическую функцию, связав при этом понятие информации с осуществлением выбора из множества возможностей [70]. Р.Хартли исходил из того, что при передаче сообщения с помощью -символьного алфавита каждому символу сообщения соответствует единичный выбор из S возможностей. Следовательно, для того, чтобы передать сообщение из и символов по техническому каналу связи, необходимо осуществить п таких выборов. При этом сообщение в целом, как единая к-символьная последовательность, является реализацией одной из S " возможных таких последовательностей.

Далее рассуждения выглядели следующим образом: "будем произвольно считать, что количество информации пропорционально числу выборов, а коэффициент пропорциональности выберем таким образом, чтобы равным числам возможных последовательностей соответствовали равные количества информации" [70, с. 11]. То есть, обозначая количество информации через Я, а коэффициент пропорциональности через К имеем:

Выдвигая условие: "если число выборов щ и пг в двух системах таковы, что возможных последовательностей в обеих системах одинаково, то одинаково и количество информации" [70, с. 11], Р.Хартли определил К следующим образом: если

Последнее выражение справедливо для всех значений S, если S и К связаны между собой соотношением: где Ко произвольно и одинаково для любых систем связи. Поскольку Кц произвольно, то опуская его и подставляя (2.3 ) в ( 2.2 ), Хартли получил, что

Основание логарифма в выражении ( 2.4 ) произвольно и определяется выбором единицы измерения информации. ( В теории информации принято использовать логарифм по основанию два, а соответствующую единицу называть битом.)

Наиболее широкую свою известность выражение ( 2.4 ) получило при п = 1 и двоичном основании логарифма:

Формула ( 2,5 ) в научной литературе часто именуется как "двоичный логарифм Хартли" и в настоящее время широко используется в различных областях знания для информационно-количественной характеристики произвольных конечных множеств. При этом первоначальное содержание S трансформировалось и приобрело универсальный характер. Например, как отмечает А.Д. Урсул, количество элементов в таких множествах "может быть и количеством случайных событий, и количеством возможностей, и наличным количеством каких-то предметов и т.д." [63,с.37].

Необходимо также отметить, что двоичный логарифм Хартли ( 2.5 ) весьма часто интерпретируется как энтропия множества равновероятных возможностей, которая снимается в виде информации при осуществлении одной из них. Более того, рассмотрение комбинаторного подхода к определению количества информации иногда начинается именно с определения Н как энтропии. ( Так, например, делал академик А.Н. Колмогоров [36], что будет показано ниже.)

Так как в дальнейшем изложении мы будем пытаться решать проблему негэнтропийной оценки отражения системных объектов с помощью различных определений количества информации, то целесообразно для повышения объективности общего заключения отметить соответствующие взгляды известного американского физика ЛБриллюэна, основанные на комбинаторном подходе.

Разрабатывая 1950-х годах одну из ветвей теории информации, ориентированную на анализ физических экспериментов, научных теорий, законов и т.п., ЛБриллюэн дал по его утверждению "точное научное определение слова "информация" [5, 6]. Рассуждения при этом сводились к следующему. -"Рассмотрим ситуацию, в которой могут произойти PQ различных событий, но при условии, что эти PQ возможных исходов считаются априори равновероятными. Это есть начальное условие, когда у нас нет специальной информации ... (IQ = 0 ). Но могут создаться такие обстоятельства, когда мы будем располагать более точными определениями ... и когда, таким образом, число равновероятных исходов уменьшится до Pi " [6, с. 31]. Тогда утверждается, что информация /] , полученная при данных обстоятельствах выражается формулой

Негэнтропия отражения системных объектов

Определив количество информации, самоотражаемой системным объектом, как величину средней длины интегративного кода его элементов, мы тем самым предвосхитили количественное определение негэнтропии отражения 1А +В как результат воспроизведения средней длины интегративного кода элементов одного системного объекта через непосредственно взаимосвязанный с ним другой системный объект. Ставя перед собой цель - получить расчетную формулу негэнтропии отражения 1А+ В ДОУ системных объектов А и В относительно друг друга, будем исходить из того, что системные объекты А, В, К в своей совокупности образуют простейшую систему информационной связи, в которой отражаемый (А) и отражающий (В) системные объекты являются, соответственно, источником и приемником информации / , а связующий системный объект К = А П В выступает в качестве передающей среды или канала связи (рис. 3.8). Очевидно, что процесс передачи информации Ід по такой системе связи соответствует процессу отражения системного объекта А, как единого целого, через взаимодействующий с ним системный объект В. Рассмотрим этот процесс.

Интегративный код любого элемента а є А представляет собой определенное сообщение о системном объекте А как о целостном образовании, а общее число таких сообщений равно т{А), Соответственно, суммарный объем информации VA, направляемый (отражаемый) системным объектом А в канал связи (системный объект К ), равен:

Рассматриваемый процесс отражения во временном отношении имеет мгновенный характер и, соответственно, в канал связи от объекта А поступает ограниченный объем информации VK, равный:

При этом отметим общеизвестный факт, что практически в любой системе информационной связи всегда присутствуют те или иные шумовые явления (помехи), препятствующие адекватности приема-передачи информации. В наиболее общем случае отражения двух системных объектов друг через друга (рис.2.1, б) такими шумами являются области ошибок первого («пропуск цели») и второго («ложная цель») рода в отражения системного объекта А системным объектом В. Ошибка первого рода Р(1) = т(А) - т{К) при этом выражает помеху, обусловленную ограниченной пропускной способностью канала связи ( VK VA ), а ошибка второго рода Р{2) = т(В) - т(К) является помехой, которую вызывает воспроизведение приемником информации большего числа сообщений, нежели чем может быть пропущено через канал связи ( т(В) т(К)). С учетом сделанного замечания из выражений (3.15) и (3.16) следует, что связующий системный объект К позволяет воспроизвести системный объект А в виде объекта АА_ К, средняя длина интегративного кода элементов которого равна:

В соответствии с выражением (3.17) суммарный объем информации VA _,, в , поступающий от системного объекта А в системный объект В, равен;

В наших рассуждениях системные объекты рассматриваются как единые целостные образования и, следовательно, все их элементы являются равноправными участниками процесса отражения. Отметим, что это согласуется с философскими представлениями об особенностях информационных процессов, протекающих вне связи с управлением [64], согласно которым взаимодействующие объекты участвуют во взаимном отражении всей совокупностью своих элементов. Отсюда следует (с учетом неоспоримого факта отсутствия управляющего воздействия системных объектов А и В друг на друга), что отражаемый объект А воспроизводится отражающим объектом В в виде объекта АА В, средняя длина интегративного кода элементов которого, исходя из выражения (3.18), равна:

Если теперь системные объекты А и В поменять ролями (А - отражающий объект, В - отражаемый объект) и снова повторить вышеприведенный ход рассуждений, то мы получим, что объект J?, как единое целое, воспроизводится через объект А точно в таком же виде, что и объект А через объект В. То есть ІВ_А 1А_+В.

Таким образом, мы пришли к тому, что формула негэнтропии отражения двух системных объектов А и В друг через друга имеет вид:

Формула негэнтропии отражения (3.20) получена нами для общего случая отражения системных объектов А и В друг через друга, то есть, когда Д1) 0 и Я(2) 0. В тех же случаях, когда Р(1) или (и) Р(2) равны нулю (рис. 2.1 в, г, д) негэнтропия отражения имеет вид:

В последнем случае мы имеем дело с идеальной системой связи, которой соответствует адекватное отражение системных объектов А и В друг через друга. Если, в противоположность этому, взаимодействие между объек тами А а В отсутствует (рис.2.1, а), то отсутствует и система информационной связи как таковая ( т(К) = 0) и, соответственно, отражения объектов А и В друг через друга не происходит, что согласно (3.20) выражается в равенстве нулю негэнтропии отражения іл +д

Особое место занимает несколько парадоксальная ситуация, когда т(К) = 1. Здесь, с одной стороны, в силу логарифмического характера информации, формула негэнтропии отражения показывает, что 1А в = 0, то есть случаи, когда т(К) = 0 и тп(К) — 1, в негэнтропийном отношении по формуле (3.20) неотличимы друг от друга. (Следует отметить, что к аналогичному заключению пришел в свое время философ А.Д. Урсул, рассматривая информацию как отраженное разнообразие: "Для того, чтобы происходила передача информации от системы М к системе N в процессе их взаимодействия, необходимо, чтобы система N обладала минимум двумя могущими отражать элементами" [62, с. 220].) С другой же стороны, при тп(К) = 1, в отличие от ситуации, когда m(K) = 0, между системными объектами А и В существует канал связи, через который потенциально может проходить некоторое количество информации и, соответственно, негэнтропия отражения I А++в потенциально может быть отличной от нуля.

Модельное решение прогнозно-геологических задач второго рода

Используя в качестве информативности признаков их рудоотражающий вес, проведем решение прогнозной задачи второго рода в условиях типичных геологических ситуаций, представленных на рис. 1.5 и охарактеризованных данными табл. 1.4. В табл. 4.2 приведены соответствующие значения рудоот-ражающего веса признаков, определенные согласно модели (4.4.). Из таблицы видно, что, независимо от того, в каком контуре работ проводятся прогнозные построения, значения информативности признаков остаются постоянными. Соответственно, решая задачу ранжирования геофизических аномалий, расположенных в различных комплексах пород, по степени перспективности относительно обнаружения новых рудных объектов, мы получаем в пределах каждого контура работ следующие значения показателя перспективности: геофизические аномалии в комплексе пород А - ПП = 0,52 + 0,38 -0,90 усл.ед; геофизические аномалии в комплексе пород В - ПП = 0,24 + 0,38 = 0,62 усл.ед.

То есть геофизические аномалии в комплексе пород А являются более перспективными на обнаружение новых рудных объектов, чем такие же аномалии в комплексе пород В и, соответственно, в их пределах необходимо в первую очередь проводить детальные поисковые работы.

Таким образом, также как и при решении прогнозной задачи первого рода, используя в качестве информативности признаков математическую модель их информационной оценки (4.4.), основанную на синергетическом под ходе к количественной определению информации, мы получили однозначные результаты решения прогнозно-геологической задачи второго рода. При этом следует отметить, что поскольку при заданном количестве рудных эталонов рудоотражающий вес признаков сохраняет свое постоянное значение вне зависимости от размеров исследуемой территории, то получаемые с его помощью решения прогнозных задач второго рода, как и в предыдущем случае решения прогнозных задач первого рода, являются детерминированными по своей сущности.

1. С позиций синергетического подхода к количественному определению информации при прогнозе месторождений полезных ископаемых в качестве информативности признаков наиболее оптимально использовать относительную величину отражаемого ими количества информации (негэнтропии отражения) о рудных объектах (прогнозная задача первого рода - информационный вес отражения - модель (4.2), прогнозная задача второго рода - рудоотражающий вес - модель (4.4)). Получаемые при этом решения прогнозно-геологических задач являются детерминированными, а не вероятностно-статистическими, которые имеют место при использовании традиционной методики информационной оценки признаков (1.5).

2. Значения информационного веса отражения и рудоотражающего веса признаков, выступающие в качестве их информативности при решении прогнозно-геологических задач, являются инвариантными как относительно общей площади проводимых прогнозных исследований, так и относительно площади тех проявлений признаков, которые не имеют непосредственной взаимосвязи с эталонными объектами прогноза. Это объективно позволяет использовать получаемые значения информативности признаков при оценке перспектив рудоносности новых геологически подобных территорий, в пре делах которых наличие рудных объектов эталонного типа пока не установлено. (Является очевидным, что прогнозная оценка таких территорий с помощью традиционной модели информационной оценки признаков принципиально невозможна.)

Похожие диссертации на Математические модели информационной оценки признаков рудных объектов