Содержание к диссертации
Введение
1. Анализ проблемы сжатия геофизических данных 13
1.1. Актуальность проблемы сжатия геофизических данных 13
1.2. Анализ существующих алгоритмов сжатия данных с потерями 17
1.3. Анализ возможности использования вейвлет-преобразования для сжатия геофизических данных
1.4. Анализ алгоритмов квантования 39
1.5. Анализ возможности применения нейронных сетей для сжатия коэффициентов вейвлет-преобразования
1.6. Цель и задачи исследования 49
Выводы но главе 1 50
2. Разработка алгоритма выбора параметров вейвлет-преобразования для сжатия геофизических данных
2.1. Формирование банка вейвлет-фильтров 55
2.2. Выбор вейвлета для конкретного типа геофизических данных 62
2.3. Переход к ненормализованному вейвлет-преобразованию 68
2.4. Расчет уровня вейвлет-преобразования 76
2.5. Выбор параметров квантования вейвлет-коэффициенте в 83
2.6. Алгоритм выбора параметров вейвлет-преобразования для сжатия геофизических данных
Выводы по главе 2 92
3. Разработка методики построения нейронных сетей для сжатия вейвлет-спектра геофизических данных
3.1. Разработка структуры нейронной сети 94
3.2. Выбор параметров нейронной сети минимальной сложности 106
3.3. Расчет ошибки обучения нейронной сети 113
3.4. Методика построения нейронных сетей для сжатия веивлет-спектра геофизических данных
Выводы по главе 3 121
4. Комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей и исследование его эффективности
4.1. Комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей
4.2. Разработка программного обеспечения для автоматизации процесса сжатия геофизических данных
4.3. Применение разработанного алгоритма для сжатия данных скважинной сейсмической разведки
4.4. Применение разработанного алгоритма для сжатия данных акустического каротажа
Выводы по главе 4 150
Заключение 152
Список литературы 154
Приложение 1. Акты внедрения результатов работы 164
- Актуальность проблемы сжатия геофизических данных
- Формирование банка вейвлет-фильтров
- Разработка структуры нейронной сети
- Комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей
Введение к работе
Актуальность темы
В последнее время на многих предприятиях геофизической отрасли все большее применение находят распределенные системы управления и обработки информации. При этом возникает необходимость передачи различного рода данных между элементами этой системы. Зачастую источник и приемник информации оказываются на очень большом расстоянии друг от друга, и единственной возможностью является использование спутниковых средств связи. При большом объеме передаваемой информации затраты составляют значительную сумму, и для сокращения расходов необходимо производить сжатие данных.
Анализ потоков информации, передаваемой по спутниковому каналу, показал, что по объему более 90% ее количества составляют данные геофизических исследований, и уменьшение объема этих данных позволит существенно сократить расходы на передачу. Поэтому особо актуальной является проблема сжатия геофизических данных.
Существует два класса алгоритмов компрессии: сжатие без потерь и сжатие с потерей некоторого количества информации. Применение первой группы алгоритмов при сжатии геофизических данных малоэффективно, поскольку коэффициент компрессии не превышает 2, и наиболее перспективным является использование алгоритмов сжатия с потерями. Эти алгоритмы основаны на применении линейных преобразований к исходным данным и последующей обработке полученных коэффициентов.
Исследование наиболее распространенных алгоритмов компрессии с потерями на основе быстрого преобразования Фурье и дискретного косинусного преобразования показывает, что они позволяют производить сжатие геофизических данных до 4-5 раз с заданным уровнем точности. Новые возможности увеличения степени компрессии открывает использование
*
'# «
дискретного вейвлет-преобразования, поскольку его применение на сегодняшний день позволяет добиться наилучшей компактности представления данных с возможностью использования быстрых алгоритмов, а также последующее применение нейронных сетей (НС), так как НС в отличии от традиционных алгоритмов скалярного и векторного квантования могут производить эффективное нелинейное сжатие полученных коэффициентов вейвлет-преобразования. Однако необходимо использовать НС такой структуры, которая снизит требования к аппаратным ресурсам и ускорит процесс обучения при большой размерности входных данных.
Таким образом, актуальной задачей является разработка метода сжатия геофизических данных на основе комплексного использования вейвлет-преобразования и нейронных сетей, обеспечивающего высокий коэффициент компрессии при заданном уровне искажений восстанавливаемых данных.
Цель работы
Разработка и исследование метода сжатия, обеспечивающего повышение эффективности компрессии геофизических данных.
Задачи исследования
Для достижения поставленной цели требуется решение следующих задач:
Разработать алгоритм выбора параметров вейвлет-преобразования для сжатия геофизических данных, который обеспечивает эффективную компрессию геофизических данных при заданной точности.
Разработать методику построения нейронных сетей для сжатия коэффициентов вейвлет-преобразования, применение которой позволит увеличить коэффициент компрессии, снизит требования к аппаратным ресурсам компьютера и обеспечит высокое .быстродействие процесса обучения при большой размерности входных данных.
Разработать комплексный алгоритм сжатия геофизических данных с применением всйвлст-прсобразования и нейронных сетей, обеспечивающий высокую степень компрессии при заданном уровне искажений.
Разработать программное обеспечение для автоматизации процесса сжатия геофизических данных и исследовать на его основе эффективность предложенного метода при компрессии данных скважиннои сейсмической разведки и акустического каротажа.
Методы исследования
Для решения поставленных в диссертационной работе задач были применены методы системного анализа, теории информации, теории сигналов, функционального анализа, теории искусственного интеллекта.
Основные положения, выносимые на защиту
1. Алгоритм выбора параметров вейвлет-преобразования для сжатия
геофизических данных, обеспечивающий эффективную компрессию с
необходимой точностью. На первом этапе алгоритма формируется банк вейвлет-
* фильтров, на втором производится выбор вейвлета, на третьем осуществляется
переход к ненормализованному вейвлет-преобразованию, на четвертом рассчитывается уровень декомпозиции и на пятом — выбор шага квантования вейвлет-коэффициентов.
2. Методика построения нейронных сетей минимальной сложности для
сжатия вейвлет-спектра геофизических данных, в соответствии с которой для
каждого класса геофизических данных производится декомпозиция входов и
первого слоя НС на несвязанные подмножества с учетом параметров вейвлет-
ф, преобразования, устанавливаются функции активации и смещения нейронов,
производится подготовка входных данных, формирование обучающих страниц, расчет ошибки обучения и непосредственно обучение НС.
Комплексный алгоритм сжатия геофизических данных с применением веивлет-преобразования и нейронных сетей, состоящий из трех этапов. На первом производятся подготовительные операции: выделение классов данных, выбор параметров веивлет-преобразования и построение нейронных сетей минимальной сложности. На втором этапе происходит компрессия геофизических данных, на третьем — декомпрессия.
Программное обеспечение, реализующее комплексный алгоритм сжатия геофизических данных, а также результаты исследований эффективности применения предложенного метода для сжатия данных скважинной сейсмической разведки и акустического каротажа с использованием разработанного ПО.
Научная новизна
В рамках диссертации были получены следующие новые научные результаты:
Предложен метод сжатия геофизических данных, основанный на комплексном применении веивлет-преобразования и нейронных сетей.
Разработан алгоритм выбора параметров веивлет-преобразования для сжатия геофизических данных, обеспечивающий повышение эффективности компрессии за счет выбора подходящего вейвлета по критерию максимальности коэффициента сжатия, применения ненормализованного веивлет-преобразования и расчета уровня вейвлет-декомпозшдии.
Разработана методика построения нейронных сетей минимальной сложности для сжатия коэффициентов веивлет-преобразования обеспечивающая уменьшение количества синаптических весов и ускорение процесса обучения за счет декомпозиции множества входов и входного слоя НС на несколько не связанных между собой подмножеств и повышающая степень компрессии геофизических данных за счет сжатия вейвлет-спектра. Предложена схема расчета ошибки обучения нейронной сети.
4. Разработан комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей, обеспечивающий эффективную компрессию геофизических данных при приемлемом уровне искажений за счет комплексного использования преимуществ вейвлет-преобразования и технологии нейронных сетей.
Практическая ценность и реализация результатов работы
Разработан программный комплекс, реализующий алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей (свидетельство об официальной регистрации программы для ЭВМ №2003610471, №2003610472, и ЭВМ №2005611758).
Проведен анализ эффективности предложенного метода сжатия на основе результатов применения разработанного программного обеспечения для компрессии геофизических данных двух типов: скважинной сейсмической разведки и волнового акустического каротажа.
Эффективность предложенного метода сжатия геофизических данных
подтверждена экспериментальными исследованиями, проведенными в ОАО
' «Башнефтегеофизика» и ОАО «Когалымнефтегеофизика». Разработанное ПО
зарегистрировано и внедрено в промышленную эксплуатацию, что
подтверждается 4 актами о внедрении.
Апробация работы
Основные положения и результаты работы докладывались на следующих
научно-технических конференциях:
Международная молодежная научно-техническая конференция
t «Интеллектуальные системы управления и обработки информации». Уфа,
УГАТУ,2001;
9
і VIII Всероссийская конференции «Нейрокомпьютеры и их
применение» НКП-2002 с международным участием. Москва, 2002;
Третья международная научно-техническая конференция «Проблемы техники и технологии телекоммуникаций». Уфа, 2002;
Научно-практическая конференция «Гальперинские чтения — 2004». Москва, 2004;
Региональная школа-конференция для студентов, аспирантов и молодых ученых по математике и физике. Уфа, БашГУ, 2004;
VII Международная конференция по компьютерным наукам и информационным технологиям CSIT' 2005. Уфа, 2005;
V Региональная школа-конференция для студентов, аспирантов и молодых ученых по математике и физике. Уфа, БашГУ, 2005;
Вторая Всероссийская научно-техническая конференция с международным участием «Мехатроника, автоматизация, управление» (МАУ 2005). Уфа, УГАТУ, 2005.
Публикации
По теме диссертации опубликовано 16 печатных работ, в том числе 3 свидетельства Роспатента об официальной регистрации программы для ЭВМ.
Объём и структура работы
Диссертационная работа состоит из 163 страниц машинописного текста, включающего в себя введение, четыре главы, заключение, список литературы из 110 наименований и приложения.
Содержание работы
Во введении обосновывается актуальность задач исследований, их цель, новизна и практическая ценность выносимых на защиту результатов.
В первой главе рассматривается актуальность проблемы сжатия геофизических данных. Показывается, что в последнее время во многих
геофизических предприятиях широкое распространение получают спутниковые системы связи. При этом затраты на передачу данных геофизических исследований составляют значительную сумму, и для снижения расходов необходимо производить сжатие информации.
Отмечается, что существующие алгоритмы сжатия без потерь не обеспечивают необходимой степени компрессии, поэтому особую актуальность приобретает проблема использования методов сжатия с потерями.
Анализ наиболее распространенных алгоритмов сжатия с потерями показывает, что они не применимы к геофизическим данным, поскольку не обеспечивают требуемой степени компрессии с приемлемым уровнем искажений. Значительное повышение эффективности сжатия можно ожидать от применения методов, использующих новые системы базисных функций -вейвлеты. Дискретное вей влет-преобразование на сегодняшний день обеспечивает наиболее компактное представление информации при возможности использования быстрого алгоритма вычислений.
Анализируется возможность дальнейшего увеличения степени компрессии за счет применения нейронных сетей для сжатия вейвлет-спектра, показаны достоинства такого подхода.
Во второй главе разрабатывается алгоритм выбора параметров вейвлет-преобразоваиия для сжатия геофизических данных.
Разработанный алгоритм состоит из пяти этапов: формирование банка вейвлет-фильтров, выбор подходящего типа вейвлета для каждого класса данных, переход к ненормализованному вейвлет-преобразованшо, расчет уровня вейвлст-декомпозиции и выбор параметров квантования.
Проведенный анализ показывает, что для сжатия разнотипных геофизических данных целесообразно использовать гладкие вейвлеты с компактным носителем с порядком нулевого момента не менее двух. Этим требованиям соответствуют вейвлеты Добеши, симлеты и койфлеты, а также биортогональные вейвлеты.
Предлагается проводить выбор вейвлета для конкретного типа геофизических данных из банка вейвлст-фнльтров на основе критерия максимальности коэффициента сжатия.
Для увеличения степени компрессии геофизических данных предлагается использовать ненормализованное вейвлет-преобразование, показано, что такое преобразование относится к классу биортогональных преобразований, продемонстрирована эффективность такого подхода по сравнению с традиционным вейвлет-разложением.
Для расчета уровня декомпозиции вейвлет-преобразования, соответствующего конкретному классу сигналов, приводится формула определения уровня разложения.
Для выбора параметра квантователя предлагается схема расчета шага квантования, при которой достигается эффективное сжатие при заданном уровне искажений.
В третьей главе разрабатывается методика построения нейронных сетей для сжатия вейвлет-спектра геофизических данных.
Для задачи сжатия данных предлагается нейронная сеть минимальной структуры, в которой множество входов, а также входной слой НС, декомпозируются на несколько подмножеств. Каждое подмножество входов соединяется с соответствующим подмножеством нейронов первого слоя, и не связано с другими нейронами из других подмножеств. Такая организация НС позволяет существенно уменьшить количество синаптических весов, ускорить обучение и снизить требования к аппаратным ресурсам. В результате экспериментальных исследований показывается эффективность предложенного подхода.
Разрабатывается методика построения нейронных сетей для сжатия вейвлет-спектра геофизических данных, которая состоит из следующих этапов: выбор данных необходимого класса, построение нейронной сети минимальной сложности, установка функций активаций и смещений нейронов, инициализация
сети, масштабирование обучающих образов, формирование обучающих страниц, расчет ошибки обучения и непосредственно обучение нейронной сети.
Показывается, что существует возможность сжатия квантованного вейвлет-спектра геофизических данных с помощью НС без потерь и приводится схема для расчета ошибки обучения.
В четвертой главе разрабатывается комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей, который состоит из трех этапов: подготовительный этап, компрессия и декомпрессия.
Разрабатывается программное обеспечение, реализующее комплексный алгоритм сжатия геофизических данных. Проводится исследование эффективности применения предложенного метода при сжатии данных скважинной сейсмической разведки и акустического каротажа с использованием разработанного ПО.
Актуальность проблемы сжатия геофизических данных
В связи с впечатляющими достижениями в области телекоммуникаций в различных геофизических предприятиях все большее распространение получают системы распределенной обработки данных [12]. Так, начиная с 2000 года в ОАО «Башнефтегеофизика» применяется автоматизированная система сбора и обработки данных геофизических и технологических исследований при строительстве, эксплуатации и работах на скважине [43]. В конечном виде система представляет собой единую информационную сеть, объединяющую Заказчиков - управления буровых работ (УБР) и нефтегазодобывающие учреждения (НГДУ), и Исполнителей - управления геофизических работ и экспедиции. Одним из важнейших элементов системы является компьютерная связь, которая может производиться как по сети Internet, так и по внутриведомственным сетям, которые физически представляют собой проводные, радиорелейные, волоконно-оптические и космические каналы связи.
В автоматизированной системе сбора и обработки геофизических данных обмен информацией происходит в соответствии с единым регламентом: 1) Заказчик передает исполнителю заказ на проведение геофизических исследований скважин; 2) Исполнитель производит необходимые исследования и передает по цифровым каналам связи в Центр обработки информации полученные геофизические данные для их оперативной обработки и интерпретации; 3) Результаты интерпретации также по цифровым каналам связи передаются Заказчику и регистрируются в базах данных. В соответствии с этим регламентом возникает необходимость передачи геофизической информации на очень далекие расстояния из труднодоступных районов. В частности, Центр обработки информации ОАО «Башнефтегеофизика» находится в г. Уфе, а геофизические исследования проводятся в Африке, Западной Сибири, Урало-Поволжском и других регионах. В таких случаях единственная возможность для передачи информации - использование космических систем связи. Таким образом, одним из ключевых элементов автоматизированной системы сбора и обработки геофизических данных являются спутниковые каналы связи.
В настоящее время в ОАО «Башнефтегеофизика» задействован 31 спутниковый терминал М4, которые работают в глобальной системе мобильной спутниковой связи «Inmarsat» (рис. 1.1). Круглосуточно через них передается большое количество геофизической, технологической и служебной информации от партий и экспедиций. При этом затраты на передачу информации составляют значительную сумму - порядка ста тысяч долларов США в месяц. Для сокращения расходов на передачу было предложено использовать сжатие данных [14].
Анализ потоков информации, передаваемой по спутниковому каналу, показал, что по объему около 90% ее количества составляют данные геофизических измерений: акустического каротажа, контроля качества цементирования, геолого-технологической информации, гамма-каротажа, вертикального сейсмического профилирования и т.д. Уменьшение объема этих данных позволит резко сократить расходы на передачу. Поэтому особо актуальной является проблема сжатия геофизических данных.
Существует два класса алгоритмов компрессии: сжатие без потерь и сжатие с потерей некоторого количества информации. Уменьшить объем данных, необходимых для представления геофизических сигналов можно, если использовать алгоритмы сжатия без потерь, например, методов Хаффмана, Лемпеля-Зива, арифметического кодирования и др. [б, 17, 75]. Эти алгоритмы позволяют в точности восстановить исходную информацию после декодирования. Однако для сжатия геофизических данных применение указанных алгоритмов крайне неэффективно, поскольку межэлементная зависимость данных в этих алгоритмах не учитывается. Например, при компрессии данных волнового акустического каротажа с помощью алгоритма LZW максимальный коэффициент сжатия не превышал величину 1,4. Второй класс алгоритмов основан на применении линейных преобразований к исходному сигналу [64]. Эти алгоритмы осуществляют сжатие с потерей информации, т.е. восстановленные после сжатия данные отличаются от исходных, однако величина погрешности может быть настолько мала, что ей можно пренебречь. При применении таких методов достигается сжатие в 4-8 раз. Таким образом, наиболее перспективными при сжатии геофизических сигналов являются методы компрессии с потерями.
Большинство методов сжатия с потерями состоят из трех этапов: 1) снижение межэлементной корреляции; 2) квантование элементов данных; 3) кодирование данных. 1) Снижение межэлсментной корреляции
Для снижения межэлсментных зависимостей наиболее широкое распространение получило использование дискретных преобразований [76]. Перевод изображения в спектральную область при помощи дискретного унитарного преобразования F может значительно снизить межэлементную корреляцию в матрице-трансформанте Y=F{X} по сравнению с корреляцией элементов в векторе исходного сигнала X. Можно также дать энергетическую трактовку цели использования преобразований, которая в таком понимании заключается в концентрации максимальной части энергии исходного дискретного сигнала X в минимальном количестве спектральных коэффициентов элементов матрицы Y. 2) Квантование
Под квантованием [64] в данном случае понимается процесс замены цифрового отсчета из одного счетного множества значением из другого счетного множества меньшей мощности. За счет этого достигается уменьшение числа требуемых бит для хранения информации, но возникает ошибка кодирования. Именно наличие этапа квантования обуславливает появление искажений при последующем восстановлении сигналов и является отличительной чертой методов сжатия данных с потерями. Применяется как скалярное, так и векторное квантование. В скалярном случае элементы обрабатываемого набора данных квантуются независимо друг от друга, при векторном квантовании могут быть учтены межкомпонентные зависимости обрабатываемого набора данных. 3) Кодирование
На этом этапе к полученным после квантования данным применяются стандартные методы сжатия без потери качества [75, 82].
Из теории связи известно, что оптимальным по критерию декорреляции входного сигнала является преобразование Карунена-Лоэва [100]. Базисными функциями являются собственные векторы ковариационной матрицы исходного сигнала, при этом энергия входного сигнала максимально распределяется в коэффициентах преобразования. Однако это преобразование требует большого количества вычислений, к тому же для расчета обратного преобразования декодеру необходимо передавать базисные функции, найденные кодером, поэтому данное преобразование на практике при сжатии сигналов не применяется. Рассмотрим наиболее распространенные на сегодняшний день алгоритмы сжатия.
Формирование банка вейвлет-фильтров
При использовании вейвлет-преобразования для сжатия геофизических данных необходимо применять только такие вейвлеты, которые гарантировали бы точное восстановление на этапе реконструкции. Для обеспечения такой возможности можно использовать ортогональные, полуортогональные или биортогональные вейвлеты. В общем случае базис функций не обязательно должен быть ортогональным, достаточно, чтобы он являлся базисом Рисса [86]. От базиса требуется не столько ортогональность, сколько, говоря корректнее, линейная независимость. Ортогональность лишь упрощает вычисление коэффициентов разложения: в случае неортогональности базиса для нахождения коэффициентов разложения необходимо решать систему линейных уравнений, в случае ортогонального базиса достаточно вычислить скалярные произведения анализируемой функции и функций базиса. Однако решение линейных уравнений - сложная и очень продолжительная по времени процедура, в то же время при использовании ортогональных вейвлетов можно использовать быстрые алгоритмы.
Поскольку при использовании вейвлет-преобразования для сжатия временные затраты являются существенным фактором, для возможности быстрых вычислений базис разложения должен быть ортонор мир о ванным. Этому требованию соответствуют вейвлеты Хаара и Добеши [27]. Однако существуют и другие свойства вейвлетов, которые необходимо учесть при решении задачи сжатия.
1) Компактный носитель скейлинг-функции и вейвлета Масштабирующие функции и вейвлеты с компактным носителем имеют конечное, причем относительно малое количество отличных от нуля коэффициентов своих масштабных соотношений. В терминах цифровых фильтров это означает, что низкочастотный и высокочастотный фильтры имеют конечную импульсную характеристику. Для таких базисов количество вычислений при выполнении преобразования невелико и возможна эффективная реализация БВП. 2) Симметрия Масштабирующие функции и веивлет-функции должны быть симметричны относительно своих центров. Для многих сигналов меньшая асимметрия приводит к большей степени компрессии при одинаковой ошибке кодирования. 3) Гладкость Гладкость скейлинг-функций и вейвлетов важна для задачи сжатия, поскольку большая степень гладкости вейвлета обеспечивает более точную реконструкцию сигналов. 4) Количество нулевых моментов Наличие у функции N нулевых моментов фактически означает ортогональность этой функции полиномам степени не выше N-1. Это значит, что у кусочно-полиномиальной функции степени не выше N-i разложения по вейвлетам с N нулевыми моментами будет иметь конечное число уровней разрешения, т.е. все вейвлет-коэффициенты, начиная с некоторого разрешения, будут равны нулю.
Проблема заключается в том, что невозможно построить ортонормированный базис гладких симметричных вейвлетов с компактным носителем. Веивлеты Хаара, например, ортогональны, симметричны и обладают компактным носителем, но, являясь кусочно-постоянными функциями, они имеют точки разрыва, т.е. не являются гладкими. Кроме того, у вейвлетов Хаара всего один нулевой момент, и это является ограничением в возможности применения их для сжатия. Большей гладкостью имеют веивлеты Добеши. Они непрерывны на всей области определения, имеют большое количество нулевых моментов, но не являются симметричными.
Таким образом, если необходимы гладкие симметричные веивлеты, локализованные в во временной и частотной областях, нужно отказаться от требования ортогональности (или ослабить его). Многие из новых систем вейвлетов, используемых при сжатии, удовлетворяют «слабым» свойствам ортогональности: полуортогональность или биортогональность [61, 70, 74].
Обобщая все вышесказанное, сформируем банк вейвлет-фильтров для последующего использования. Он состоит из следующих вейвлетов: 1) ортогональные веивлеты; 2) биортогональные веивлеты. 1) Ортогональные веивлеты Это подмножество состоит из вейвлетов Добеши dbN, симлетов symN и койфлетов coifN различных порядков. Добеши [27, 86] на основании уравнений и общих свойств с кейлинг-функций и вейвлетов рассчитала значения коэффициентов hk и gk..
Разработка структуры нейронной сети
После того, как к геофизическим данным о пред еденного класса будет применено вейвлет-преобразованис с выбранными параметрами, необходимо произвести дальнейшее сжатие полученных коэффициентов вейвлет-спектра. Для этого в данной работе предлагается использовать нейронные сети.
Выбор структуры ИНС - сложная проблема. Для решения некоторых отдельных типов задач уже существуют оптимальные на сегодняшний день конфигурации. Например, теорема Хехт-Нилъсена предлагает способ построения двухслойной нейронной сети для представления функции произвольного вида, а также дает приблизительную оценку количества нейронов в скрытом слое [45].
Однако когда необходимо решать задачу с помощью сети другой структуры, например трехслойной, универсальных рекомендаций для выбора топологии и количества весов связей при этом нет, поскольку строгая методика построения таких сетей пока отсутствует. Приходится решать сложную проблему синтеза новой конфигурации. В таких случаях руководствуются несколькими основополагающими принципами: возможности сети возрастают с увеличением числа слоев и числа нейронов в них; введение обратных связей наряду с увеличением возможностей сети поднимает вопрос о так называемой динамической устойчивости сети; сложность алгоритмов функционирования сети (в том числе, например, введение нескольких типов синапсов - возбуждающих, тормозящих и др.) также способствует усилению мощи НС. В большинстве случаев оптимальный вариант получается на основе интуитивного подбора. При этом следует учитывать следующие факторы. Если в сети слишком мало слоев и/или нейронов, то: 1) сеть плохо обучится или не обучится вообще и ошибка при работе такой НС будет большой; 2) на выходе сети не будут передаваться резкие колебания аппроксимируемой функции.
Если в сети слишком много слоев и/или нейронов, то: 1) сеть будет долго обучаться;
2) быстродействие будет низким, а памяти при реализации на стандартных ЭВМ будет требоваться много;
3) сеть может переобучиться - выходной вектор будет передавать незначительные и несущественные детали в изучаемых данных, например шум или случайные колебания;
4) зависимость выхода от входа может оказаться резко нелинейной -выходной вектор будет существенно и непредсказуемо меняться при малом изменении входного вектора;
5) сеть возможно будет неспособна к обобщению — в области, где нет или мало известных точек исследуемой функции выходной вектор будет случаен и непредсказуем и не будет адекватен решаемой задаче.
В работах [25, 95] предложено использовать для сжатия информации автоассоциативную нейронную сеть с узким горлом следующей структуры (рис. 3.1). Для преодоления ограничений, свойственных методу главных компонент, сеть состоит из четырех слоев. Количество выходных нейронов четвертого слоя равно количеству входов (размерности входного сигнала) л, количество нейронов первого и третьего слоя равно L, количество нейронов второго слоя равно т, причем т п. Во всех слоях используется нелинейная сигмоидальная функция активации.
Такая есть осуществляет два преобразования. Первое преобразование осуществляет переход от исходного пространства в сжатое, второе осуществляет возврат к исходному пространству. Значения, полученные после обучения во втором слое («узкое горло» сети), представляют сжатый образ исходных данных.
В работе [25] показано, что данная есть является универсальным средством для решения задачи редукции размерности, как для линейно структурированных, так и для варианта нелинейно структурированных данных. При этом показатели информативности и коррелированности данных, полученных на выходе «узкого горла», совпадают с аналогичными параметрами, полученными при использовании метода главных компонент, а степень сжатия с помощью НС даже выше, чем в МГК. Кроме того, было экспериментально доказано, что с помощью нейронной сети с узким горлом можно эффективно сжимать данные, в которых избыточность уже частично устранена. В частности Джордан Боян продемонстрировал возможность сжатия частотной спектральной информации, полученной путем преобразования Фурье исходного сигнала.
Для того, чтобы нейронная сеть могла должным образом осуществлять сжатие информации, в работе [25] показана методика конструирования структуры сети. Оптимальная структура НС подбирается исходя из условия достаточно точного воспроизведения входного набора данных на выходе сети в соответствии с критерием минимизации средиеквадратической ошибки при заданной размерности входного сигнала п и выбранном исходя из потребностей сжатия количестве нейронов в узком горле т. При таком подборе структуры для достижения необходимой точности варьироваться может лишь количество нейронов первого и третьего слоя L, причем на это значение оказывает влияние объем обучающей выборки N.
Комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразования и нейронных сетей
В результате исследований был разработан комплексный алгоритм сжатия геофизических данных с применением вейвлет-преобразовапия и нейронных сетей. 1. Подготовительный этап На этом этапе осуществляется: - разбиение входных данных на классы. В результате получаем упорядоченные геофизические данные; - выбор параметров вейвлет-преобразования. Для каждого класса исходных данных производится выбор параметров дискретного вейвлет-преобразования в соответствии с алгоритмом, приведенном в разделе 2.6 данной работы; - синтез НС для каждого класса. Каждому классу сопоставляется нейронная сеть, производящая сжатие вейв лет-коэффициенте в, построение которой ведется в соответствии с методикой, приведенной в разделе 3.4 данной работы. 2. Компрессия геофизических данных После осуществления подготовительного этапа система готова к работе. При компрессии данных осуществляется следующая последовательность действий (рис. 4.2): 1) поступление исходных данных на вход системы; 2) определение класса входных данных; 3) осуществление дискретного вейвлет-преобразования с параметрами, подобранными для того класса, которому принадлежит входной образ; 4) масштабирование вейвлет-спектра; 5) активизация соответствующей нейронной сети и подача данных на ее вход; 6) расчет выходных значений нейронов сжимающего слоя; 7) сохранение номера класса и значений «узкого горла» в выходной файл; 8) передача сжатых данных по линии связи. 3. Декомпрессия данных После получения сжатых данных для дальнейшей обработки и интерпретации их необходимо восстановить. При декомпрессии осуществляется следующая последовательность действий (рис. 4,3): 1) поступление сжатой версии исходных геофизических данных на вход системы; 2) считывание номера класса сжатых данных; 3) активизация соответствующей нейронной сети и подача данных на выход сжимающего слоя; 4) расчет значений нейронов выходного слоя, что соответствует получению масштабированного вейвлет-спектра; 5) обратное масштабирование вейвлет-спектра; 6) осуществление обратного дискретного вейвлет-преобразования с параметрами, подобранными для того класса, которому принадлежит полученный сжатый образ; 7) сохранение полученных геофизических данных.
Разработанная в ходе исследований методика была применена для сжатия геофизических данных двух типов: данных скважииной сейсмической разведки и данных волнового акустического каротажа.
В ходе исследования было разработано программное обеспечение, реализующее комплексный алгоритм сжатия геофизических данных с применением в ейвлет-преобразования и нейронных сетей. В качестве инструментального средства при создании ПО была использована объектно-ориентированная среда разработки Delphi 7.0. В качестве операционной системы для комплекса программ была выбрана многопользовательская многозадачная операционная система Windows ХР.
В основе разрабатываемого ПО лежат следующие объекты: 1) объект «Дискретное вейвлет-преобразование»; 2) объект «Нейронная сеть минимальной сложности»; Рассмотрим эти объекты подробнее. 4.2.1 Объекты, используемые в программном обеспечении 1) Объект «Дискретное вейвлет-преобразование» Этот объект включает в себя следующие поля: - входные данные; - выходные данные; 129 - номер класса геофизических данных; - используемый вейвлет-фильтр; - уровень декомпозиции всйвлст-прсобразования; -СКО; - шаг квантования равномерного скалярного квантователя. Объект имеет следующие методы: - расчет оптимального уровня декомпозиции вейвлет-преобразования; - расчет шага квантования равномерного скалярного квантователя; - выбор вейвлет-фильтра; - прямое быстрое ДВП входных данных; - обратное быстрое ДВП входных данных; - квантование входных значений. 2) Объект «нейронная сеть минимальной сложности» Этот объект включает в себя следующие поля: - входные данные; - выходные данные; - номер класса геофизических данных; - количество нейронов в слоях; - синаптические веса и смещения нейронов НС; - функции активации нейронов; - коэффициент сжатия (количество нейронов сжимающего слоя); -СКО. Объект имеет следующие методы: - инициализация; - масштабирование входных значений; - обучение сети; - работа сети (компрессия-декомпрессия). 130 4.2.2 Режимы работы программного обеспечения В соответствии с комплексным алгоритмом сжатия можно выделить три режима работы программного обеспечения: 1) подготовительный этап; 2) компрессия геофизических данных; 3) декомпрессия сжатых данных.
1) Подготовительный этап состоит из кластеризации исходного набора геофизических данных, выбора параметров вейв лет-преобразования для каждого класса и построения соответствующих нейронных сетей.
Для выбора параметров вейвлет-преобразования создаются объекты «дискретное вейвлет-преобразование» в количестве, равном общему количеству классов. Для каждого объекта «ДВП» выполняется следующая последовательность действий: записывается номер класса, на вход подаются геофизические данные соответствующего класса, производится расчет уровня декомпозиции всйвлет-прсобразования, расчет шага квантования и выбор подходящего вейвлет-фильтра и сохранение параметров. При выборе вейвлет-фильтра производится поочередное вейв лет-разложение входных данных с помощью всех вейвлетов из банка фильтров и выбирается тот, при использовании которого получается наименьшее значение энтропии коэффициентов разложения.