Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Жуков, Максим Валерьевич

Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей
<
Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Жуков, Максим Валерьевич. Моделирование систем с распределенными параметрами с помощью сетей радиальных базисных функций, обучаемых методом доверительных областей : диссертация ... кандидата технических наук : 05.13.18 / Жуков Максим Валерьевич; [Место защиты: Пенз. гос. ун-т].- Пенза, 2014.- 150 с.: ил. РГБ ОД,

Содержание к диссертации

Введение

ГЛАВА 1. Анализ численных методов решения краевых задач, используемых для математического моделирования систем с распределенными параметрами 12

1.1 Анализ численных методов решения краевых задач 12

1.2 Анализ процесса решения краевых задач с помощью РБФ-сетей 1.2.1 РБФ-сеть, виды РБФ-сетей 21

1.2.2 Процесс решения краевых задач с помощью РБФ-сетей, выбор начальных параметров РБФ-сетей 23

1.2.3 Методы минимизации функционала ошибки РБФ-сети 30

1.2.4 Решение нелинейных и нестационарных краевых задач с помощью РБФ-сетей 34

1.3 Анализ методов решения обратных краевых задач с помощью РБФ-сетей... 35

1.3.1 Граничные обратные задачи 36

1.3.2. Эволюционные обратные задачи 38

1.3.3. Коэффициентные обратные задачи 39

Выводы к главе 1 41

ГЛАВА 2. Исследование численного метода решения краевых задач с помощью рбф-сетей, обучаемых методом доверительных областей 42

2.1 Минимизация функционала ошибки РБФ-сети с помощью метода доверительных областей 42

2.1.1 Метод доверительных областей 42

2.1.2. Адаптация метода доверительных областей к задаче обучения РБФ-сетей 47

2.2 Решение краевых задач с помощью РБФ-сетей, обучаемых методом доверительных областей з

2.2.1 Решение стационарных краевых задач 50

2.2.2. Сравнение метода доверительных областей с другими методами обучения РБФ-сетей при решении линейных стационарных краевых задач 54

2.2.3. Сравнение метода доверительных областей с другими методами обучения РБФ-сетей при решении нелинейных стационарных краевых задач 56

2.2.4. Решение нестационарных краевых задач с помощью РБФ-сетей, обучаемых методом доверительных областей 59

2.2.5 Выбор начальных значений параметров РБФ-сетей, обучаемых методом доверительных областей 63

2.3. Решение обратных краевых задач с помощью РБФ-сетей, обучаемых методом доверительных областей 66

2.3.1. Решение эволюционных и граничных обратных задач с помощью РБФ-сетей, обучаемых методом доверительных областей 66

2.3.2. Метод решения коэффициентных обратных задач с помощью РБФ-сетей, обучаемых методом доверительных областей 66

2.3.3. Решение коэффициентных обратных задач для стационарных уравнений 69

2.3.4. Решение коэффициентных обратных задач для нестационарных уравнений 72

Выводы к главе 2 77

ГЛАВА 3. Разработка комплекса программ нейросетевого моделирования систем с распределенными параметрами 79

3.1 Проектирование комплекса программ 79

3.2 Разработка комплекса программ 85

3.3 Использование комплекса программ 92

Выводы к главе 3 99

ГЛАВА 4. Решение задачи электроимпеданснои томографии с помощью РБФ-сетей 100

4.1 Электроимпедансная томография: понятие, принципы 100

4.2 Постановка задачи ЭИТ 106

4.3 Анализ способов решения задачи ЭИТ ПО

4.4 Решение задачи ЭИТ с помощью РБФ-сетей 114

Выводы к главе 4 126

Основные результаты и выводы 127

Список принятых сокращений 130

Список литературы

Введение к работе

Актуальность темы исследования. Математическая модель системы с распределенными параметрами обычно формулируется в виде краевой задачи для дифференциального уравнения в частных производных, поэтому одним из этапов моделирования таких систем является решение краевых задач. Среди методов их решения наибольшее распространение получили метод конечных разностей и метод конечных элементов. Оба метода требуют построения расчетных сеток, что для двумерных и трехмерных областей со сложной конфигурацией является трудоемкой задачей. Альтернатива сеточным методам — бессеточные методы, т.е. методы, которые не требуют построения связанной сетки, по крайней мере, для построения функции формы. Большинство бессеточных методов относится к классу проекционных методов. При их применении аппроксимация решения представляется в виде взвешенной суммы базисных функций, веса которых выбираются таким образом, чтобы приближенное решение удовлетворяло краевой задаче в выбранных по определенному правилу узлах.

Среди бессеточных методов наибольший интерес вызывают методы на основе радиальных базисных функций (РБФ-методы), обладающие рядом достоинств: они позволяют работать со сложной геометрией расчетных областей; применимы для решения задач любой размерности; используют дифференциальную постановку задачи; универсальны. В роли базиса в РБФ-методах выступают радиальные базисные функции (РБФ), т.е. функции, значение которых зависит от расстояния между аргументом и некоторой фиксированной точкой пространства, называемой центром функции. Первый РБФ-метод решения краевых задач был разработан Е. J. Kansa и получил дальнейшее развитие в работах С. S. Chen, М. A. Golberg, G. Е. Fasshauer, Z. М. Wu, А. И. Толстых, Д. А. Широбокова и др. Вопросами выбора параметров и настройки весов РБФ занимались R. L. Hardy, R. Franke, Е. A. Galperin, S. Rippa.

В работах N. Mai-Duy, Т. Tran-Cong, Д. А. Тархова, А. Н. Васильева, В. И. Горбаченко и других авторов для решения краевых задач используются сети радиальных базисных функций (РБФ-сети). РБФ-сеть - это искусственная нейронная сеть, которая может рассматриваться как основа одного из РБФ-методов. В отличие от других РБФ-методов данный метод позволяет унифицированно подходить к решению различных краевых задач математической физики. Его главной особенностью является то, что при аппроксимации решения настраиваются не только веса РБФ, но и в общем случае их параметры. Настройка весов и параметров происходит в процессе обучения сети и сводится к минимизации нелинейного квадратичного функционала ошибки. Применяемые в работах Д. А. Тархова, А. Н. Васильева, В. И. Горбаченко, Д. Л. Ревизникова, И. С. Колбина, L. Jianyu, L. Siwei, Q. Yingjiana, H. Yapinga методы минимизации являются методами нулевого либо первого порядка и требуют больших временных затрат. В работах N. Mai-Duy, Т. Tran-Cong и ряда других авторов обучение РБФ-

сетей осуществляется с помощью метода на основе сингулярного разложения, однако для использования данного метода при решении нелинейных задач необходимо проводить линеаризацию исходной задачи, что приводит к резкому росту временной сложности метода. Таким образом, актуальной научной задачей является разработка метода обучения РБФ-сетей, позволяющего сократить время их обучения без увеличения погрешности модели.

Кроме того, моделирование систем с распределенными параметрами часто сопряжено с необходимостью идентификации неизвестных свойств среды (коэффициентная обратная задача) по результатам дискретных измерений. Для решения такого рода задач с помощью РБФ-сетей в известных нейросетевых методах требуются построение и решение сопряженных задач. Это нетривиальная задача, поэтому актуальной является разработка такого нейросетевого метода решения коэффициентных обратных задач, который не требует построения и решения сопряженных задач.

Целью диссертационной работы является развитие математического метода моделирования систем с распределенными параметрами на основе РБФ-сетей с настраиваемым функциональным базисом за счет разработки метода обучения сетей, позволяющего сократить время их обучения без увеличения погрешности модели, а также за счет разработки нейросетевого метода решения коэффициентных обратных задач, не требующего построения и решения сопряженных задач.

Для достижения поставленной цели необходимо решить следующие задачи:

  1. Разработать такой метод обучения РБФ-сетей, используемых для моделирования систем с распределенными параметрами, который позволит сократить время их обучения без увеличения погрешности модели.

  2. Адаптировать разработанный метод обучения РБФ-сетей к решению нелинейных и нестационарных краевых задач математической физики.

  3. Разработать нейросетевой метод решения коэффициентных обратных задач, не требующий построения и решения сопряженных задач.

  4. Реализовать разработанные методы в виде комплекса программ, предназначенного для нейросетевого моделирования систем с распределенными параметрами.

  5. Решить с помощью разработанного комплекса программ задачу электроимпедансной томографии, которая является коэффициентной обратной задачей.

Объектом исследования диссертационной работы являются численные методы решения краевых задач, используемые для математического моделирования систем с распределенными параметрами.

Предмет исследования - численный метод решения краевых задач на основе РБФ-сетей с настраиваемым функциональным базисом.

Методы исследования. Для решения поставленных задач использовались численные методы, теория оптимизации, теория искусственных нейронных сетей.

Соответствие паспорту специальности. Результаты исследования соответствуют пп. 3, 4, 5 паспорта научной специальности 05.13.18 — Математическое моделирование, численные методы и комплексы программ.

Научная новизна диссертационной работы состоит в следующем:

  1. Разработан новый метод обучения РБФ-сетей с настраиваемым функциональным базисом, используемых для математического моделирования систем с распределенными параметрами. Отличительной чертой метода является то, что минимизация функционала ошибки таких сетей осуществляется с помощью метода доверительных областей, причем для повышения его быстродействия используются приближенные значения матрицы Гессе и модифицированный предобуславливатель Якоби. Метод позволяет сократить время обучения сетей и уменьшить погрешность неиросетевых моделей.

  2. Предложен способ сокращения временных затрат на обучение РБФ-сетей, используемых для численного решения нелинейных нестационарных краевых задач. Особенность способа заключается в поиске решения с помощью РБФ-сети с асимметричными РБФ. Это дает возможность уменьшить размерность нейросетевого базиса, а следовательно, сократить время обучения сети.

  3. На основе метода параметрической оптимизации разработан итерационный нейросетевой метод идентификации свойств среды по результатам дискретных измерений. В отличие от известных неиросетевых методов предложенный метод не требует построения и решения сопряженных задач, что существенно упрощает процесс решения исходной задачи. Еще одной особенностью метода является применение условия Морозова для регуляризации решения, что позволяет избежать переобучения сети при использовании результатов измерений, заданных с погрешностью.

  4. Разработан способ численного решения задачи электроимпеданс-ной томографии, особенностью которого является использование предложенного в работе нейросетевого метода решения коэффициентных обратных задач, что при наличии априорной информации о структуре объекта дает возможность сократить количество измерений и, как следствие, время диагностики объекта. Кроме того, особенность способа заключается в использовании метода декомпозиции и специальной процедуры выбора начальных положений центров РБФ для уменьшения временных затрат на обучение комплекса РБФ-сетей, используемых для аппроксимации распределений потенциала и импеданса.

Практическая ценность работы. Разработанные метод обучения РБФ-сетей с настраиваемым функциональным базисом, способ сокращения временных затрат на обучение при численном решении нелинейных нестационарных краевых задач, нейросетевой метод идентификации свойств среды по результатам дискретных измерений, а также комплекс программ нейросетевого моделирования систем с распределенными параметрами могут быть использованы специалистами в области математического моделирования. Созданный комплекс программ позволяет проводить численные иссле-

дования математических моделей систем с распределенными параметрами, а также дальнейшие исследовательские работы, связанные с развитием нейро-сетевого метода моделирования таких систем. Кроме того, практическую ценность имеет предложенный в работе способ численного решения задачи элек-троимпедансной томографии, позволяющий при наличии априорной информации сократить время диагностики объекта. Результаты диссертационного исследования также могут быть использованы при составлении образовательных курсов по математическому моделированию и численным методам. На защиту выносятся:

  1. Метод обучения РБФ-сетей с настраиваемым функциональным базисом, используемых для моделирования систем с распределенными параметрами, в основу которого положен модифицированный метод доверительных областей.

  2. Способ сокращения временных затрат при численном решении нелинейных нестационарных краевых задач с помощью РБФ-сетей за счет использования асимметричных РБФ.

З.Нейросетевой метод идентификации свойств среды по результатам дискретных измерений, не требующий построения и решения сопряженных задач и использующий условие Морозова для регуляризации решения.

  1. Комплекс программ нейросетевого моделирования систем с распределенными параметрами, предназначенный для численного решения краевых задач, описывающих системы с распределенными параметрами, с помощью РБФ-сетей.

  2. Способ численного решения задачи электроимпедансной томографии на основе разработанного метода решения коэффициентных обратных задач.

Внедрение результатов работы и связь с научными программами.

Диссертационные исследования проводились на кафедре «Компьютерные технологии» ФГБОУ ВПО «Пензенский государственный университет».

Результаты работы используются в ООО Научно-производственная компания «Надежные системы», в учебном процессе при чтении курса «Нейронные сети и нечеткие системы» на кафедре «Компьютерные технологии» ФГБОУ ВПО «Пензенский государственный университет», а также применялись при выполнении фундаментальных НИР по грантам РФФИ 14-01-00660 «Методы построения нейросетевых и гибридных моделей процессов и явлений в сложных технических системах» и 14-01-00733 «Информационные модели на основе иерархических гетерогенных нейронных сетей в исследовании влияния объектов транспортной инфраструктуры на окружающую среду», что подтверждено актами о внедрении.

Апробация работы. Основные результаты работы докладывались и обсуждались на научно-технических конференциях, таких как: П Международная научно-техническая конференция «Computational Intelligence» (г. Черкассы, Украина, 2013); XI Всероссийская научная конференция «Нейрокомпьютеры и их применение» (г. Москва, 2013); XXI Всероссийский семинар «Нейроинформатика, ее приложения и анализ данных» (г. Красно-

ярск, 2013); ХНІ, XIV Международные научно-технические конференции «Проблемы информатики в образовании, управлении, экономике и технике» (г. Пенза, 2013, 2014); VIII Международная научно-техническая конференция, посвященная 70-летню образования Пензенского государственного университета «Аналитические и численные методы моделирования естественно-научных и социальных проблем» (г. Пенза, 2013); I Международная научно-практическая конференция, посвященная 70-летию образования Пензенского государственного университета «Современные проблемы компьютерных наук» (г. Пенза, 2013); VII, VIII Международные научно-технические конференции молодых специалистов, аспирантов и студентов «Математическое и компьютерное моделирование естественно-научных и социальных проблем» (г. Пенза, 2013, 2014). Результаты работы также докладывались на XVI Всероссийской научно-технической конференции «Нейроинформатика-2014» (г. Москва, 2014), проходившей в рамках научной сессии в Национальном исследовательском ядерном университете «МИФИ», где доклад «Применение метода параметрической идентификации и сетей радиальных базисных функций для решения коэффициентных обратных задач математической физики» занял первое место в конкурсе «Молодых специалистов».

Публикации. По теме диссертации опубликовано 15 печатных работ, в том числе 3 - в журналах, рекомендованных ВАК РФ для представления результатов диссертационных исследований. В ФГБУ «Федеральный институт промышленной собственности» направлен пакет документов на государственную регистрацию комплекса программ нейросетевого моделирования систем с распределенными параметрами RBFDiff Solver 1.0.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка принятых сокращений, списка литературы из 141 наименования и одного приложения. Общий объем работы составляет 150 страниц, из которых 129 страниц занимает основной текст диссертации, включающий 42 рисунка и 6 таблиц.

Анализ процесса решения краевых задач с помощью РБФ-сетей 1.2.1 РБФ-сеть, виды РБФ-сетей

Получить точное аналитическое решение краевых задач возможно лишь в весьма ограниченном количестве случаев при использовании целого ряда допущений, негативно отражающихся на адекватности полученных результатов [46, 48]. В общем же случае краевые задачи решаются с помощью численных методов.

Идеальный численный метод решения краевых задач для ДУЧП должен иметь высокий порядок точности, быть гибким по отношению к геометрии объекта, легко реализуемым и быть эффективным с вычислительной точки зрения [110]. Большинство широко используемых на сегодняшний день методов обычно удовлетворяют одному или нескольким приведенным критериям. С помощью метода конечных разностей [13, 39, 47] можно в узлах расчётной сетки получить решение высокой точности, но круг задач, решаемых с помощью данного метода, ограничен случаями сравнительно простых по геометрии расчетных областей, либо сводимым к таковым за счет преобразования координат. Спектральные методы [13] позволяют получить ещё более точный результат, но они накладывают серьезные ограничения на геометрию объекта. Особенно широкое распространение получили МКЭ [1, 13, 31] и метод конечных объемов [45]. Данные методы позволяют решать сложные инженерные задачи в реальных областях, но они более сложны в реализации по сравнению с методом конечных разностей. Самым главным недостатком всех рассмотренных выше методов является необходимость построения сеток, что для двухмерных и трехмерных областей со сложной геометрией является нетривиальной задачей [51, 105].

В последнее время интерес исследователей всё больше привлекают бессеточные методы [67, 115]. Несмотря на употребляемый термин, следует, тем не менее, понимать, что далеко не все методы, относящиеся к классу бессеточных, вообще не используют сетку при расчетах. Поскольку строгого устоявшегося определения бессеточных методов нет, будем следовать терминологии, используемой в [115] и определять бессеточные методы как методы, не требующие использования связной сетки, по крайней мере, для построения функций формы.

Если придерживаться классификации методов дискретизации краевых задач принятой в [1, 44], то большинство бессеточных методов относится к классу проекционных методов, т.е. методов, в которых аппроксимация решения ищется в виде взвешенной суммы базисных функций, а веса функций выбираются таким образом, чтобы приближенное решение удовлетворяло краевой задаче, заданной в вариационной или дифференциальной формах, в выбранных по определенному правилу узлах.

Классифицировать бесчисленное количество бессеточных методов можно по нескольким признакам, вот лишь некоторые из них [51]: 1. используемая форма (вариационная или дифференциальная) постановки краевой задачи; 2. вид базисной функции: полином, РБ-функция, РБ-функция с компактным носителем, сплайн и др.; 3. способ дискретизации исходной задачи (коллокационный метод, метод Галёркина, метод наименьших квадратов, метод граничных элементов и др.). Среди бессеточных методов распространение получили методы Element Free Galerkin Method [66], Meshless Local Petrov-Galerkin Method [64], Moving Least Squares Method [113], Point Interpolation Method [114], целые семейства методов Smoothed Particle Hydrodynamics [92], Multilayer Perceptron методы [98, 136], РБФ-методы [84, 126] и ряд других методов, детальный обзор которых можно найти в [84, 114]. Более того, как и для многих численных методов, обладающих определенными преимуществами и недостатками, для приведенных выше методов появился целый ряд комбинированных методов Radial Point Interpolation Method [116], Radial Basis Function Finite Difference Method [51], Smoothed Particle Hydrodynamics Level Set Method [111] и другие.

Если обратиться к статистике публикаций по бессеточным методам, то можно заметить устойчивую тенденцию роста интереса к РБФ-методам. Это и понятно, ведь РБФ-методы обладают рядом неоспоримых достоинств. В частности, в работах [105, 126] отмечаются следующие из них: имеют высокую сходимость (в некоторых случаях экспоненциальную), позволяют работать со сложной геометрией расчетных областей, применимы для решения задач любой размерности, используют дифференциальную постановку задачи. Но, пожалуй, самое главное преимущество данной группы методов — их универсальность [8, 9].

Отметим преимущества РБФ-методов перед другими сеточными и бессеточными методами. Результаты сравнения эффективности решения задач с простой геометрией с помощью МКЭ, метода конечных разностей и РБФ-методов можно найти в работах [34, 72, 86], где отмечается превосходство последних. При использовании методов Moving Least Squares Method, Point Interpolation Method, в которых в качестве базисных функций применяются полиномы, часто приходится сталкиваться с необходимостью обращения вырожденной матрицы. Это привело к появлению Radial Point Interpolation Method (один из РБФ-методов), в котором вместо полиномов используются РБ-функции. Методы Element Free Galerkin Method, Meshless Local Petrov-Galerkin Method требуют построения глобальных, либо локальных интеграционных схем и сложны в реализации, а методы семейства Smoothed Particle Hydrodynamics имеют специфичную область применения. Сравнительный анализ Multilayer Perceptron методов, т.е. методов, в которых аппроксимация решения находится с помощью многослойного персептрона, и РБФ-методов, проведенный в работах [78, 109] показал, что РБФ-методы позволяют получать более точное решение и требуют меньших вычислительных затрат на его поиск.

Как уже отмечалось выше, практически все численные методы помимо достоинств имеют и свои недостатки. РБФ-методы не исключение. Однако говорить о них нужно в контексте конкретного метода. Без притязаний на полноту рассмотрим основные из них.

Адаптация метода доверительных областей к задаче обучения РБФ-сетей

В данной работе для обучения РБФ-сетей предлагается использовать МДО [80]. Ключевыми особенностями метода являются возможность одновременной оптимизации большого количества параметров; высокие показатели эффективности и сходимости даже для плохо обусловленных задач; за счет использования аппроксимационных моделей метод позволяет преодолевать локальные минимумы; позволяет минимизировать выпуклые функции, т.е. функции с отрицательно определенной матрицей Гессе; и, наконец, при использовании в роли аппроксимирующей функции разложения в ряд Тейлора второго порядка, задача минимизации целевой функции сводится к задаче минимизации квадратичного функционала [80]. Все это делает МДО идеальным для решения задачи минимизации функционала (1.5), которая часто имеет и большое количество оптимизируемых параметров, и множество локальных минимумов, и плохо обусловленную матрицу Гессе.

Идею МДО рассмотрим на примере следующей задачи minimize/(х) (2.1) где /(х) — целевая функция, х є Q с: Ш", Q — область определения /. На каждой итерации для заданной области Вк, называемой доверительной областью и начальной точки хкє Вк, строится модель тк (х), аппроксимирующая функцию /(х), причем тк(хк) = /(хкУ Доверительная область Вк задается множеством точек Вк={хєП\\\х-хк\\ Ак}, где А — радиус доверительной области, » — произвольная норма вектора, наилучшим способом соответствующая решаемой задачи. Тогда задача (2.1) сводится к задаче минимизации тк в области Вк . Полученный в результате ее решения шаг s , такой, что lis J Ак и тк принимает минимальное значение в точке х + s для заданной области Вк, становится пробным шагом, минимизирующим / Если значение f(xk+sk}-f(xk} сопоставимо с тк(хк + sk )-тк(хк), т.е. уменьшение, предсказанное моделью, подтверждено целевой функцией, то пробная точка становится начальной точкой для следующей итерации. В противном случае точка х + s отклоняется, а доверительная область сужается в надежде на то, что модель будет точнее аппроксимировать целевую функцию в меньшей области. Ниже представлено формальное описание метода [80]:

Шаг 1. Инициализация. Задаются начальное положение х0, радиус доверительной области А0, параметры ц,15 i2, yl5 у2 такие, что 0 І1 І2 1 и 0 у1 у2 1. к = 0. Шаг 2. Построение модели. Выбирается норма, строится модель тк функции / в области Вк . Шаг 3. Минимизация модели. Вычисляется направление s , минимизирующее значение функции тк в области Вк . Шаг 4. Проверка точности модели. Вычисляется Если рк \і13 то х +1 =х + s , иначе xk+l =хк. Шаг 5. Изменение радиуса доверительной области. [А,; со), есшрк \і2 "2 [Y2A A] если є щ) [YA;Y2A ] если \+i = k = k + \. Перейти к шагу 2. Представленный алгоритм носит обобщенный характер, многие детали которого не описаны. В частности нет никаких указаний на то, как выбирать модель тк и норму ». На практике [80], в качестве нормы выбирают евклидову норму, а аппроксимацию целевой функции осуществляют с помощью квадратичного функционала: (х. + s) =/(х J + g,s) +-(s,Hs), где q — разложение функции f в ряд Тейлора второго порядка в окрестности точки хк, g = Vx/(x/t) — вектор градиента функции / в точке хк; Н — симметричная матрица, представляющая собой матрицу Гессе функции f, т.е. H = Vxx/(x );(») — скалярное произведение векторов. Тогда на каждой итерации необходимо решить задачу minimize (x +s) причем, s А, где А = Ал. Заметим, что при использовании МДО не обязательно вычислять точное решение (2.2), что требует определенных вычислительных затрат, но чем точнее решена задача (2.2), тем меньше итераций потребуется для решения задачи (2.1). Т.е. при выборе требуемой точности решения (2.2) нужно маневрировать между сложностью ее решения и сложностью вычисления У, g и Н .

На первый взгляд поиск решения задачи (2.2) не представляет никакой сложности, в частности его можно найти с помощью метода сопряженных градиентов (Conjugate Gradient Method) [32]. Однако для сходимости данного метода необходимо чтобы матрица Н была положительно определенной, другими словами, функция тк была вогнутой. К тому же, в (2.2) на решение наложено ограничение s A, т.е. решение не должно выходить за границу доверительной области. Одним из методов, учитывающих эти особенности, является метод Стайхауга [138]. В его основу положен метод сопряженных градиентов с предобусловливанием (Preconditioned Conjugate Gradient Method) [138], т.е. метод сопряженных градиентов, примененный не к системе Hx = g, а к ее предобусловленному аналогу Hx = g, где Н = С НС ; х = Сх; g = C_1g; а С — симметричная положительно определенная матрица, подобранная таким образом, чтобы Н оказалась хорошо обусловленной матрицей. Вычислительную сложность PCG-метода можно значительно уменьшить, правильно подобрав С и заменив предобусловливатель на М = (У, причем матрица М должна быть легко обратима.

Методу сопряженных градиентов с предобусловливанием свойственны те же ограничения, что и методу сопряженных градиентов, поэтому, в случае если Н 0, т.е. в процессе вычисления нового сопряженного направления р , получится, что р Нр 0, Стайхауг предложил в качестве шага s использовать вектор s + тр , где s — шаг, полученный на к -ой итерации, т является решением уравнения ІК+тр,м=А (2.3)

Заметим, что в (2.3) используется не евклидова норма как в (2.2), а М — норма (например, если в качестве » выбрана евклидова норма, то хм= /(х,Мх)). Это связано с тем, что при применении предобусловливателя М к (2.2) происходит преобразование доверительной области.

В случае если Н 0 ив результате применения метода сопряженных градиентов с предобусловливанием на к шаге получен вектор р , выходящий за границу доверительной области, то шаг s также вычисляется по формуле (2.3). В обоих случаях т является положительным корнем квадратного уравнения (2.3) и вычисляется по формуле:

Разработка комплекса программ

В ходе анализа методов решения обратных задач математической физики с помощью РБФ-сетей было установлено, что РБФ-сети позволяют эффективно решать эволюционные обратные задачи и граничные обратные задачи без использования аппарата сопряженных операторов. Для этого дополнительные данные об искомом решение рассматриваются как ограничения, накладываемые на сетевую аппроксимацию решения, что находит отражение в функционале ошибки, для минимизации которого используются итерационные методы оптимизации. Регуляризация решения осуществляется с помощью контроля количества итераций итерационного процесса. Поскольку главное отличие РБФ-сетей, обучаемых РБФС-МДО, от других РБФ-сетей — метод минимизации функционала ошибки, который, к слову, является итерационным, то для решения эволюционных и граничных обратных задач с помощью РБФС-МДО может использоваться аналогичный подход. Более того, благодаря тому, что МДО позволяет эффективно решать многокритериальные задачи, данный подход может быть распространен и на решение коэффициентных обратных задач.

РБФ-сетей, обучаемых методом доверительных областей Рассмотрим коэффициентную обратную задачу для дифференциального уравнения, заданного в операторной форме: Щ(х,и))и(х) = Дх),х є Q, (2.6) Ви(±) = р(х), хєШ, (2.7) где и — искомое решение; к — неизвестный коэффициент; L — дифференциальный оператор, зависящий от коэффициента к; оператор В задает граничные условия; Q — область решения; дО. — граница области; f и р — известные функции и дополнительных условий: где D — оператор; задающий дополнительные условия; Z a Q LJ dQ.; ц/ — известная функция.

В прикладных исследованиях типичной является ситуация, когда дополнительные условия заданы с погрешностью, поэтому вместо условий (2.8) будем использовать условия

Кроме того, будем считать, что точность задания функции ц/5 определяется величиной 8. При приближенном решении коэффициентных обратных задач особого внимания заслуживает метод параметрической идентификации [48]. Его идея заключается в том, что неизвестный коэффициент представляется в параметрическом виде, параметры которого необходимо найти. В качестве такого представления будем использовать РБФ-сеть: где М к — количество РБ-функций, wkm, -ркт — веса и параметры РБ-функций, фкт — РБ-функция, зависящая как от х, так и от и.

Неизвестные параметры ркт и веса РБ-функции wkm выбираются из условия минимизации невязки между левой и правой частями (2.9), которое можно записать в виде: J4w ,p ) = i;[Di/(Z,)- (Z,)]2 min (2.10) k с к к к л где S — количество контрольных точек из Z, w ={wl ,w2,..wM }, p ={pf,p ,..p }. Задача (2.10) имеет две особенности: во-первых, поскольку функция ц/5 задана с погрешностью, то существует множество решений задачи (2.10), которые с точностью 8 удовлетворяют (2.6), (2.7), (2.9); во-вторых, функция и в (2.10) неизвестна.

Чтобы из множества решений выделить наиболее приемлемое, можно воспользоваться регуляризацией, в частности, итерационным методом регуляризации [48], в котором в роли регуляризатора выступает число итераций: итерационный процесс минимизации (2.10) продолжается до тех пор, пока

Поскольку функция и неизвестна, то предлагается аппроксимировать решение и прямой задачи (2.6), (2.7), в которой к = kmF с помощью РБФ-сети где Ми — количество РБ-функций, wum, р — веса и параметры РБ-функций, (fm — РБ-функция. Неизвестные параметры \)ыт и веса РБ-функции wum можно найти, минимизировав функционал нарушение граничных условий (2.7). Объединяя функционалы (2.10), (2.11) приходим к задаче минимизации функционала дw p w\pV /гчw pг )+ Лw\p ), сп) где XD — штрафной множитель за нарушение дополнительных условий (2.9). Минимизация функционала J осуществляется с помощью МДО. Процесс продолжается до тех пор, пока J (w ,р ) SS .

Процесс решения коэффициентных обратных задач для стационарных уравнений с помощью описанного выше неиросетевого метода рассмотрим на примере задачи определения младшего коэффициента в эллиптическом уравнении второго порядка, рассматриваемой в [48].

В прямой задаче младший коэффициент с(у) предполагается зависящим только от переменной у. В обратной задаче коэффициент с(у) неизвестен. Он определяется по дополнительным данным, полученным в процессе измерений на границе области в виде:

Перед тем как приступить к решению обратной задачи, необходимо задать дополнительные условия. При решении практических задач это можно сделать, проведя, например, соответствующие измерения на границе ЗО.. В рассматриваемом случае их придется брать из решения прямой задачи (2.12),

Найдем его с помощью РБФ-сети и р состоящей из 14 нейронов, центры которых в начальный момент времени были случайным образом расположены в квадратной области ограниченной точками (0; 0) и (1; 1), ширина нейронов выбиралось случайным образом из интервала [0,25; 0,45], начальные значения весов РБ-функций так же выбирались случайным образом из интервала [-0,05; 0,05], минимизировав функционал:

Для обучения использовались 144 случайно выбранные контрольные точки, 100 из которых располагалось в области решения Q, 44 — в области 5Q. Значение штрафного множителя Я равнялось 1000. Обучение сети завершилось на 121 итерации, когда значение функционала ошибки равнялось 0,5. Решение прямой задачи представлено на рисунке 2.7. Для решения обратной задачи использовалась umF сеть, состоящая из 14 нейронов, имеющих такую же начальную конфигурацию, как и нейроны u F сети. Сеть kmF состояла из 3 нейронов, центры которых в начальный момент времени были случайным образом расположены на отрезке [0; 1], ширина нейронов выбиралась случайным образом из интервала [0,45; 0,55], начальные значения весов РБ-функций так же выбирались случайным образом из интервала [-0,05; 0,05]. Для обучения использовались 144 случайно выбранные контрольные точки, 100 из которых располагалось в области решения Q, 44 — в области дО.. Значения штрафных множителей Хв и XD равнялись 1000. В ходе экспериментальных исследований были решены две обратные задачи для 8 = 0 и (5 = 0,08. Для случая 5 = 0 на рисунке 2.8 представлен график относительной погрешности решения, при расчете которой в роли и выступала функция u F.

Графики восстановленных коэффициентов представлены на рисунках 2.9, 2.10 для 8 = 0 и 5 = 0,08 соответственно. При 8 = 0 обучение закончилось, когда погрешность восстановления начала увеличиваться (регуляризация не применялась, поскольку погрешность равна 0), во втором — когда невязка стала меньше SS2. Погрешность восстановления при 5 = 0 равнялась 0,031, при 8 = 0,08 — 0,041. Погрешность решения при 8 = 0 — 0,018, при 8 = 0,08 — 0,021. Для достижения указанных значений погрешностей восстановления и решения в первом случае потребовалось 51 итерация, во втором 34.

Решение задачи ЭИТ с помощью РБФ-сетей

ЭИТ [99], наряду с электроемкостной, электрополевой и магнитоиндукционной томографиями, относится к классу вычислительной томографии, базирующейся на явлении электромагнетизма. ЭИТ позволяет визуализировать пространственное распределение электрического импеданса внутри объекта, в частности, внутри тела человека, по результатам измерений на границе объекта (неинвазивных измерений). Обычно, для реконструкции изображения распределения импеданса используются значения напряжения, измеренные на границы объекта, при пропускании через него электрического тока [99, 128]. Обобщенная схема электроимпедансного томографа, представлена на рисунке 4.1. Он состоит из электродов, источников тока, вольтметров, электрической цепи управления, системы сбора данных и системы восстановления и визуализации изображения.

Метод ЭИТ основан на том, что под воздействием внешнего электрического поля материалы проявляют различные электрические свойства, такие как активная (о) и реактивная (т) проводимости. Следовательно, зная их значения для различных материалов и определив их значения в различных точках исследуемого объекта можно восстановить его внутреннюю структуру. В таблицах 4.1 представлены примеры значений активного сопротивления (величина, обратная активной проводимости) для различных горных пород и жидкостей (реактивной проводимостью у данных веществ равна нулю) [69]. Значения активного сопротивления и реактивной проводимости для биологических тканей представлены в таблице 4.2 [69]. Их величина определяется ионной концентрацией внешне- и внутриклеточной жидкостей, клеточной структурой, молекулярным составом, строением мембраны и др. структурными свойствами тканей. Значения электрических свойств в таблице 4.2 приведены для конкретной частоты переменного тока — 10 kHz. Это связано с тем, что для многих материалов электрические свойства меняются при изменении частоты: с ростом частоты растет реактивная проводимость [118, 128]. Следовательно, для таких материалов необходимо измерять не только амплитуду напряжения, но и его фазу.

Рассмотрим замкнутое множество Q zMd,d 2 с границей 5Q, представляющее исследуемый объект, частоту w и комплексную функцию 7(х) = т(х) + iwc{\), где х є Q, / — мнимая единица, т(х) — значение активной проводимости в точке х, г(х) — реактивная проводимость в х, у{\) — адмиттанс в х. Тогда задача ЭИТ заключается в построении отображения

В вычислительной томографии сложность восстановления изображения определяется степенью локальности возмущений [128]. В рентгеновской компьютерной томографии (или компьютерной томографии) используются коллимированные лучи, проходящие через объект вдоль прямой линии. В результате луч несет в себе информацию только о тех частях объекта, через которые он прошёл. Это приводит к тому, что любые изменения объекта на пути следования луча приводят лишь к локальным изменениям измерений. С этой точки зрения компьютерная томография имеет высокую степень локальности. При уменьшении частоты колебаний возникает эффект рассеивания и изменения в измерениях перестают быть локальными. Наименьшая степень локальности достигается при постоянном токе, когда любое возмущение приводит к изменению всех результатов измерений, поэтому, в ЭИТ, как правило, используется высокочастотный переменный ток [128]. Кроме того, переменный ток позволяет избежать эффекта поляризации [128, 135].

Поскольку частота колебаний тока, используемого в ЭИТ, значительно меньше частоты рентгеновских лучей задача ЭИТ нелокальна и именно нелокальность делает задачу ЭИТ столь сложной. Конечно, сама по себе нелокалокальность — это не проблема, проблема в том, что она приводит к плохой обусловленности задачи [128, 139], когда небольшие ошибки при измерении потенциала приводят к много большим ошибкам в решении.

Кроме того, данная задача некорректна по Адамару [99, 128, 139]. Прежде всего, нарушается третий критерий корректности: решение непрерывно зависит от данных. На практике это означает, что существуют произвольно большие изменения в распределении адмиттанса у, которые нельзя обнаружить по результатам измерении I,V с заданной точностью. Чтобы решить эту проблему необходимо использовать достаточное количество априорной информации. Два оставшихся критерия: для всех допустимых значений решение существует и оно единственно, также можно сформулировать в более практичной форме. Конечно, о существовании решения здесь речи не идет, поскольку априорно известно, что объект обладает проводимостью. Речь идет о достаточности данных для восстановления распределения проводимость. Известно, что обратная задача ЭИТ имеет единственное решение, но это имеет место быть, если есть измерения напряжения во всех точках множества дО. для всех возможных способов приложения тока I [71]. На практике же используется конечное число электродов, что приводит к ограниченному числу измерений. Поэтому, для корректного решения данной обратной задачи необходимо, чтобы число степеней свободы было согласовано с количеством и точностью измерений [128].

Сложности, связанные с процессом восстановления изображения с помощью ЭИТ приводят к низкой разрешающей способности, что часто признается одним из главных недостатков метода, по сравнению с другими видами томографии [99, 135]. Тем не менее, данный подход имеет ряд достоинств [99]:

Если говорить об электроники, то первые системы, появившиеся в начале 80-х годов, базировались на аналоговой схемотехнике. Одновременно с прогрессом в области цифровой обработки сигналов изменялись и системы ЭИТ, в которые все активнее внедрялись процессоры цифровой обработки. Это позволило значительно расширить частотный диапазон используемого тока, повысить точность измерений, сократить время сбора данных [99].

Первый алгоритм восстановления пространственного распределения импеданса, получивший широкое распространение в системах ЭИТ 80-х годов, был алгоритм обратного проецирования, разработанный Barber и Brown [65]. В его основу заложен тот же принцип, что используется при реконструкции изображений в рентгеновской компьютерной томографии [135]: через исследуемый объект под различными углами пропускаются лучи, по проекции которых, с помощью преобразования Радона, восстанавливается значение искомой величины в точке пересечения лучей. Особенность алгоритма заключается в том, что в отличие от компьютерной томографии в ЭИТ электрический ток распространяется не по прямой, его распространение характеризуют эквипотенциальные линии, распределение которых зависит от распределения импеданса.