Введение к работе
Актуальность работы. Сетевое моделирование процессов различной природы является одним из наиболее эффективных и универсальных способов описания их структурно-функциональной организации (СФО). Визуальная сетевая реконструкция является разработкой компьютерной модели в виде ориентированного графа, семантически отражающего структурные и функциональные характеристики (СФХ) описываемого процесса или явления. Информативным и удобным для исследователей являются возможности визуального построения сетевых моделей. Они дают наглядное представление описываемого процесса или явления с возможностями модификации и дальнейшего анализа сети. Такие процессы могут включать в себя богатую терминологическую и семантическую составляющие, а также от сотен до десятков тысяч элементов, что также следует учитывать при дальнейшем анализе сети. Сетевое моделирование нашло широкое применение в таких областях, как проектирование программного обеспечения, схемотехника, планирование и оптимизация бизнес-процессов и др. Активные исследования, проводимые с применением современных информационных технологий, средств вычислительной техники и методов прикладной математики в области мо-лекулярно-биологических, биомедицинских, экологических и социальных исследований способствовали развитию информационной биологии. В данной работе сетевое моделирование рассматривается по отношению к трем направлениям информационной биологии: (1) молекулярно-генетические сети; (2) экологические сети и (3) социальные сети. Выбор направлений связан с потенциальными возможностями получения полезных прикладных и фундаментальных результатов от исследований в каждой из областей в организации, где проводилась работа. Для реконструкции различных сетевых моделей в мире разработан ряд программных средств (ПС), каждое из которых обладает своими преимуществами и недостатками (Pajek, Cytoscape, Cell-Designer, Vizster и др.). Их отличительной особенностью является ориентированность на конкретную прикладную область с заранее определенной терминологией и семантикой либо полным их отсутствием, что накладывает свои ограничения на проводимые исследования. Этот критерий наиболее важен в областях, где предметная область слабо определена либо не определена вовсе, а формируется и уточняется в процессе проведения исследования. При стандартном подходе к разработке программного обеспечения (ПО), где проводится полное исследование предметной области, проектирование архитектуры и ее программная реализация практически с нуля, страдает эффективность исследований, в виду отсутствия своевременной инструментальной поддержки. При этом IT-специалисты вынуждены тесно взаимодействовать с исследователями, занимаясь анализом их требований и формализацией исследуемых
систем, необходимых для программной реализации, на что тратится время, которое можно бы было эффективно использовать для наукоемких задач. С учетом проведения широкомасштабных исследований в области сетевого моделирования в организации, где проводилась работа, возникла необходимость в подходе к быстрой разработке таких программных сред моделирования. К настоящему моменту отсутствовали эффективные программные технологии, предназначенные для быстрой разработки ПС визуальной реконструкции и анализа сетевых моделей, с возможностью гибкой настройки на конкретную предметную область с помощью определения терминологии и семантики непосредственно исследователями в рамках поставленных задач.
Актуальность работы заключается в потребности создания математического и программного обеспечения, повышающего эффективность разработки предметно-ориентируемых ПС, предназначенных для реконструкции и анализа сетевых моделей.
Целью диссертационной работы является разработка подхода, методов и алгоритмов для повышения эффективности процесса создания предметно-ориентируемых средств визуального сетевого моделирования с функциями анализа данных.
Для достижения поставленной цели были поставлены следующие задачи:
Обзор направлений сетевого моделирования и средств инструментальной поддержки исследований в его рамках, а также выявление проблем разработки таких инструментов.
Разработка подхода и алгоритмов, описывающих процесс унификации создания предметно-ориентируемого средства визуального сетевого моделирования.
Создание методов и алгоритмов для универсального компьютерного описания, визуального представления и анализа сетевых моделей.
Проектирование и реализация средств инструментальной поддержки для разработки сред визуального сетевого моделирования.
Выявление состава и структуры исследуемых систем, описание их предметных областей для проведения исследований в области информационной биологии.
Применение подхода и средств инструментальной поддержки для разработки программного обеспечения, предназначенного для реконструкции молекулярно-генетических, экологических и социальных систем.
Объектом исследования в работе являются методы и средства визуального сетевого моделирования.
Предметом исследования в работе являются подходы к унификации разработки предметно-ориентированных сред визуальной сетевой реконструкции и анализа с гибкой настройкой на предметную область.
Методы исследования. Для достижения цели и решения поставленных задач в работе использовались методы теории графов, теории множеств, статистики, сетевого моделирования, теории языков программирования, онтологического описания, объектно-ориентированного анализа и проектирования, а также дизайна визуальных интерфейсов.
Научная новизна.
Предложены алгоритмы и программные инструменты разработки проблемно-ориентируемых ПС в области сетевого моделирования, основанные на использовании готового каркаса приложения и позволяющие осуществлять гибкую настройку на предметную область без участия Неспециалистов, тем самым значительно снижая сроки разработки ПО.
Предложен научно-обоснованный метод каркасной сборки программ и программных систем, обеспеченный разработанной базовой инструментальной поддержкой, позволяющий реализовать разработку программных сред визуальной реконструкции и анализа сетевых моделей.
Предложен и реализован декларативный язык для описания предметных областей, основанный на гибкой параметризуемой графической нотации, позволяющий осуществлять построение семантических сетей прикладных систем.
Разработаны и реализованы методы и алгоритмы, направленные на обработку структурно-функциональной организации сетевых моделей, позволяющие повысить эффективность анализа данных и прогнозирования поведения исследуемых систем.
Практическая ценность. Предложенный подход и средства инструментальной поддержки можно применять для сокращения сроков разработки предметно-ориентированных сред в различных областях, где можно применить метод сетевого моделирования. Созданные алгоритмы и программные средства официально внедрены и используются:
в научно-исследовательском процессе Института Цитологии и Генетики СО РАН (ИЦиГ СО РАН) для разработки предметно-ориентированных сред визуального сетевого моделирования в области информационной биологии («Araneus»);
в научно-исследовательском и образовательном процессах ИЦиГ СО РАН в области моделирования молекулярно-генетических и экологических систем («GeneNetStudio», «EcoNetStudio»);
в научно-исследовательском и образовательном процессах Новосибирского государственного университета (НГУ), в рамках применения для решения задач, связанных с моделированием экологических процессов («EcoNetStudio»);
в научно-исследовательском процессе ООО «Генные сети» (ГеС) с целью проведения комплексных работ в области идентификации конфликт-
ных ситуаций в организациях (конфликтологии) («SocioTomStudio»). Положения, выносимые на защиту:
Использование предложенных алгоритмов и программных инструментов позволяет значительно снизить сроки разработки сред сетевого моделирования.
Применение метода каркасной сборки сокращает сроки разработки и обеспечивает своевременную инструментальную поддержку при создании сред сетевого моделирования.
Использование языка описания предметной области, основанного на гибкой параметризируемой графической нотации, позволяет строить семантические сети прикладных систем.
Разработанные методы и алгоритмы для обработки структурно-функциональной организации сетевых моделей прикладных систем повышают эффективность их анализа.
Апробация работы. Материалы работы были представлены на отчетных сессиях ИЦиГ СО РАН с 2007 по 2009 год. Основные результаты работы докладывались и обсуждались: на конференции «Современная психотерапия и психологическое консультирование в контексте культуры» (2008, Новосибирск); на VI и VII международных конференциях по биоинформатике регуляции и структуры генома (2008, 2010, Новосибирск); на VII Всероссийской научно-практической конференция «Молодежь и современные информационные технологии» (2009, Томск); на VI съезде Вавиловского общества генетиков и селекционеров (2009, Москва); на XX юбилейной выставке SofTool (2009, Москва); на II международной конференции «Молекулярная филогенетика» (2010, Москва); на XIV международной конференции «Evolutionary Biology Meeting» (2010, Марсель, Франция); на конференции «Фундаментальные и прикладные аспекты современной биологии» (2010, Томск); на XIII Российской конференции с международным участием "Распределенные информационно-вычислительные ресурсы"(2010, Новосибирск).
Публикации. По теме диссертации опубликовано 16 работ, в их числе 3 работы [2, 3, 4] опубликованы в изданиях по списку ВАК РФ. Получены авторские свидетельства об официальной регистрации программ для ЭВМ [13-16].
Личный вклад автора. Постановка задач, основополагающие методы и решения, а также основные методические и инженерные результаты получены непосредственно автором либо с его участием и под его руководством.
В части практического применения разработок на модельных объектах автором лично построены описания предметных областей сетевых моделей молекулярно-генетических, экологических и социальных систем. Автором реконструированы сетевые модели жизненного цикла трематоды и СФО одного из содово-соленых озер Новосибирской области, а также проведена филоге-
нетическая декомпозиция генной сети клеточного цикла млекопитающих.
Объем и структура диссертации. Работа состоит из списка используемых обозначений, введения, пяти глав с выводами по каждой главе, заключения, списка литературы из 136 наименований и 11 приложений. Основная часть работы изложена на 122 машинописных страницах и содержит 36 рисунков.