Введение к работе
Актуальность темы. Развитие методов и технологий компьютерного моделирования стимулирует интерес исследователей к изучению так называемых сложных систем (complex systems)1. Под сложной системой подразумевается2 система, которая (а) состоит из большого числа компонентов; (б) допускает «дальние» связи между компонентами; (в) обладает многомасштабной (в том числе пространственно-временной) изменчивостью. Перечисленные свойства порождают ряд специфических проблем компьютерной реализации моделей сложных систем. Так, большое число компонентов отражается на ресурсоемкое вычислительных процедур и повышенных требованиях к объемам оперативной памяти для хранения структур данных. Применение параллельных вычислений требует учета дальних3 связей в системе и предварительного решения проблемы связности, затрудняющей или даже приводящей к невозможности распараллеливания формальными методами. Дополнительно, многомасштабность сложных систем требует использования для их описания параметрически связанных моделей, описывающих иерархию смежных диапазонов изменчивости .
В силу условности выделения границ диапазонов изменчивости, процедуры связывания или замыкания таких моделей традиционно используют эмпирические закономерности и коэффициенты, значения которых определяются посредством идентификации. Задача идентификации моделей заключается в определении их структуры и параметров по результатам наблюдений над входными и выходными переменными реальной системы, и решается методами оптимизации. Основные результаты в области идентификации систем общего вида заложены работами Я.З. Цыпкина, P. Eykhoff, L. Ljung, D. Graupe и'др.
Применительно к сложным многомасштабным системам проблема идентификации усложняется фрагментарностью наблюдений, обычно относящихся только к одному из диапазонов изменчивости, а также существенной ресурсоемкостыо вычислительной процедуры5. Потому практическая реализация задачи идентификации сложных систем, по-видимому, затруднительна без использования параллельных методов оптимизации. В этой области существенный задел сформирован работами Р.Г. Стронгина, В.П. Гергеля, А.Б. Барского, Y. Censor, GTalbi, Р.М. Pardalos, H.Adeli и др. Однако, применительно к данной области, распараллеливание самого алгоритма оптимизации, без учета свойств сложной системы и характерных особенностей
' Примерами сложных систем являются: мировая экосистема, звездная галактика, система государственных органов, нервная система человека, крупный технологический комплекс.
2 Boccara N., Modeling complex systems, Springer, 2004.
3 Когда каждый компонент системы потенциально может взаимодействовать с каждым.
4 Например, для гидрометеорологических сложных систем: мелкомасштабный,
синоптический, сезонный, межгодовой, межвековой
5 Процедура идентификации на несколько порядков превышает ресурсоемкость самой процедуры
моделирования в силу необходимости решения обратной задачи.
связей между описывающими ее моделями, далеко не всегда эффективно. Таким образом, это требует разработки специализированного информационного, алгоритмического и программного обеспечения, что и определяет актуальность темы диссертации.
Предметом исследования являются математические модели, численные методы, параллельные алгоритмы и программные комплексы идентификации параметрически связанных моделей сложных систем.
Целью работы является решение задачи, имеющей существенное значение для создания новых методов математического моделирования, а именно - исследование и обоснование подходов и методов (в том числе с использованием технологий параллельных вычислений), позволяющих идентифицировать структуру и параметры моделей сложных систем на основе фрагментарных данных наблюдений в различных диапазонах изменчивости.
Задачи исследования. Достижение поставленных целей подразумевает решение следующих задач:
Обоснование подхода к распараллеливанию алгоритмов идентификации моделей сложных систем, исследование проблемы их отображения на параллельные вычислительные архитектуры, а также разработка динамических механизмов оптимизации параллельной производительности, совокупно учитывающих специфику представления сложной системы, особенности метода оптимизации и специфику данных.
Разработка параллельного математического обеспечения идентификации сложных систем с явным заданием статических параметрических связей на примере задачи расчета полей приводного ветра.
Разработка параллельного математического обеспечения идентификации сложных систем с явным заданием динамических параметрических связей на примере задачи параметризации и оценивания климатических спектров морского волнения.
Разработка параллельного математического обеспечения идентификации сложных систем с неявным заданием параметрических связей на примере задачи моделирования эпидемиологической динамики ВИЧ6.
Методы исследования включают в себя аппарат теории вероятностей и математической статистики, теории оптимизации, теории графов, методы решения обыкновенных дифференциальных уравнений и методы анализа алгоритмов, методы вычислительной математики.
Научная новизна результатов работы состоит в том, что:
Обоснован общий подход к построению параллельного математического обеспечения идентификации моделей сложных систем с различными видами параметрических связей на основе метода адаптивного случайного поиска.
Предложены и апробированы эффективные параллельные алгоритмы идентификации на примере задач расчета климатических характеристик системы «океан-атмосфера» и эволюции популяционно-эпидемиологической системы.
6 ВИЧ - вирус иммунодефицита человека
На основе решения задач идентификации получены новые знания в
предметных областях, а именно:
-
информация о климатических характеристиках спектральной структуры морского волнения,
-
оценки характера эволюции эпидемии ВИЧ7 с детализацией по группам риска.
Практическую ценность работы составляют:
Комплекс прикладных программ и вычислительных библиотек для идентификации параметрически связанных моделей сложных систем.
Программные системы компьютерного моделирования сложных систем по указанным выше предметным областям.
Справочные гидрометеорологические данные - характеристики климатических спектров' для Азовского, Балтийского, Черного, Средиземного и Северного морей.
На защиту выносятся следующие положения:
Оптимальный способ распараллеливания процедуры идентификации сложных систем совокупно определяется особенностями модели сложной системы, спецификой предстаачения данных измерений и способом задания параметрической связи между масштабами изменчивости.
Построение процедуры идентификации параметрически связанных моделей сложных систем на основе метода случайного поиска с распараллеливанием целевой функции позволяет эффективно настраивать параметры и структуру моделей расчета полей ветра, климатических спектров волнения и эпидемиологической динамики ВИЧ.
Модель сложной системы с параметрами, настроенными на базе предложенного подхода, допустимо использовать как виртуальную измерительную систему, предоставляющую информацию о поведении сложной системы в целом.
Достоверность научных результатов и выводов подтверждается строгостью постановки задачи идентификации системы параметрически связанных моделей, обоснованностью применения математического аппарата, оценкой адекватности физических и математических моделей, результатами тестирования алгоритмов и программного обеспечения, а также сопоставлением с высокоточными данными инструментальных наблюдений.
Внедрение результатов работы. Результаты работы нашли свое применение при выполнении проектов направления 1.4 «Генерация знаний» ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы»: «Высокопроизводительный программный комплекс моделирования и прогноза экстремальных гидрометеорологических явлений и расчета воздействий на морские объекты и сооружения» (НИР 2007-4-1.4-00-06-108) и «Разработка инструментальной оболочки проектирования высокопроизводительных приложений для Грид-архитектур в целях создания прикладных сервисов
7 По данным США, с середины 1970х гг. до наших дней.
компьютерного моделирования и обработки данных» (НИР 2007-4-1.4-20-01-025), европроекта б-ой рамочной программы V1ROLAB (EU project, IST-027446). Разработанный высокопроизводительный программный комплекс опробован и внедрен в деятельность ГУ «Гидрометцентр России». В процессе работы получено два свидетельства о государственной регистрации программ для ЭВМ: «Ядро программного комплекса имитационного моделирования экстремальных гидрометеорологических явлений «ME2SIM» (свидетельство №2008614624), «Программная система оценивания климатических спектров морского волнения «ME2SPECTRA» (свидетельство №2008614609).
Апробация работы. Изложенные в диссертации результаты обсуждались на 13 международных и российских научных конференциях, семинарах и совещаниях, включая «Управление и информационные технологии» (2003 г., Санкт-Петербург), «Высокопроизводительные параллельные вычисления на кластерных системах» (2005 г., Нижний Новгород), ежегодные Всероссийские научные конференции «Научный сервис в сети Интернет» (2007 и 2008 гг., Новороссийск), ежегодную международную научную конференцию «Параллельные вычислительные технологии» (2008 г., Санкт-Петербург), Всероссийскую научно-методическую конференцию «Телематика» (2003, 2004, 2008 гг., Санкт-Петербург), V межвузовскую научную конференцию молодых ученых (2008 г., Санкт-Петербург), совещание по международному европейскому проекту ECO-NET «Meeting on ECO-NET program No 12599PJ on Wave and Current Interaction in Coastal Environment» (2006 г., Брест, Франция), международную конференцию и выставку по освоению ресурсов нефти и газа Российской Арктики и континентального шельфа СНГ «RAO/CIS Offshore» (2008 г., Санкт-Петербург), конференцию-конкурс «Технологии Microsoft в теории и практике программирования» (2008 г., Нижний Новгород).
Публикации. По теме диссертации опубликовано 30 печатных работ (из них 7 — в изданиях, соответствующих требованиям ВАК РФ к кандидатским диссертациям).
Личный вклад автора. Личный вклад автора в работах, выполненных в соавторстве, заключается в разработке алгоритмов идентификации, реализации соответствующих программных кодов, исследовании эффективности распараллеливания описанных моделей и интерпретации результатов вычислительных экспериментов. Вес результаты, составляющие основное содержание диссертации, получены автором самостоятельно.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы (75 наименований) и 2 приложений. Содержит 134 с. текста (из них 116 — основного текста и 18 — приложений), включая 33 рис. и 4 табл.