Введение к работе
Актуальность темы. В последние несколько лет все острее становится проблема решения задач моделирования систем большой размерности (СБР). Главной отличительной чертой данных систем является необходимость работать с разными уровнями (масштабами) описания систем.
Данную проблему можно проиллюстрировать следующим примером. При исследовании какого-либо молекулярного процесса и проектировании соответствующей модели системы мы сталкиваемся с необходимостью создания нескольких уровней описаний. Т.е. на более высоком уровне мы имеем молекулярные процессы, а на более низком -межатомные взаимодействия. Данные уровни будут иметь как различные временные режимы, так и разные точности измерений отдельных переменных в физических системах. То есть масштабы относятся и к времени, и к самим физическим величинам, которые приходится измерять.
Основная задача описания СБР - связать эти уровни в единой модели и сделать возможным взаимодействие специалистов, работающих с разными уровнями описаний. Естественно, что каждый специалист в меру человеческих способностей не может охватить всю систему целиком, а может работать с частью системы и взаимодействовать со специалистами на других уровнях, и со специалистами на своем уровне.
В течение продолжительного периода времени в лаборатории языков и методов моделирования систем большой размерности при институте проблем управления РАН было выполнено множество работ, направленных на решение данной проблемы. Воронцов И.Н., Келдыш Н.В., Дыбо А.В. и Старостин С.А. в ряде публикаций рассматривают особенности данных задач и пути их решение. Также в работах Воронцова И.Н. и Грешилова М.М. описана спроектированная система моделирования систем большой размерности с собственным языком.
На сегодняшний день стоит задача организации хранения описаний разной общности, от конкретных феноменологических результатов, связанных с непосредственными измерениями, до сколь угодно общих описаний различных сфер знаний. Необходимо определить, каким образом располагать результаты измерений и хранить их в базах данных, каким образом должны взаимодействовать люди при использовании данных.
Поэтому возникла необходимость выбора архитектуры базы данных способной эффективно хранить описания систем на различных семантических уровнях, результаты экспериментов и статистических данных, предоставляющей удобные средства для работы с информацией специалистам в различных областях.
В диссертационной работе рассмотрены особенности проектирования баз данных, возможность создания новой архитектуры БД и языка запросов для работы с многоуровневой информацией.
Объектом исследования являются системы большой размерности.
Предметом исследования являются математические модели описания баз данных; принципы построения систем управления базами данных; технологии реализации баз данных и языков запросов к базам данных.
Целью диссертационной работы является проектирование и разработка эффективного средства хранения и обработки информации для систем большой размерности.
Для достижения поставленной цели были сформулированы следующие задачи:
Проанализировать задачи описания систем большой размерности, определить особенности данных, используемых для построения моделей сложных систем.
Рассмотреть способы организации хранения информации, особенности доступа к данным, возможность применения при
решении задач большой размерности.
Разработать архитектуру базы данных для работы с экспертами в определенной предметной области, разработать методы доступа к описаниям и экспериментальным данным, максимально доступные специалисту, не относящемуся к области ИТ.
На основе проведенных исследований реализовать компьютерное средство хранения и обработки данных, позволяющее использовать методы сжатия и интерполяции данных, а также осуществлять доступ к данным с использованием конструкций естественного языка.
Основными теоретическими результатами работы, выносимыми на защиту и определяющими научную новизну работы, являются:
Предложен новый метод обработки информации в объектно-характеристической базы данных (ОХБД), позволяющий на больших массивах экспериментальных данных сократить объем хранимой информации.
Предложен новый метод подбора коэффициентов для функций принадлежности на основе семантических отношений в базе данных.
Разработана архитектура локальной гибридной объектно-характеристической базы данных для решения задач большой размерности.
Спроектирован язык запросов для ОХБД, основанный на нечеткой логике.
Практическая значимость подтверждается возможностью работы специалистов с разными уровнями описания модели системы хранимой в ОХБД. Использование предложенного метода обработки информации в ОХБД позволяет интерпретировать результаты экспериментов в виде математических формул, и следовательно получать методом интерполяции/экстраполяции недостающие данные на уровне БД.
Получены результаты эксперимента, показывающего повышение
результативности тестирования знаний на 10% при использовании метода формирования тестов с использованием нечеткой логики. Разработанный метод подбора коэффициентов для функций принадлежности сократить до 13% временных затрат на ввод исходных данных о системе. Научная значимость результатов исследования:
разработан алгоритм для предложенного метода обработки информации в ОХБД и уменьшения объема хранимых данных;
разработан алгоритм для предложенного метода подбора коэффициентов функций принадлежности;
разработанный язык запросов для ОХБД с возможностью использования нечетких отношений позволяет облегчить и ускорить работу специалиста при формировании семантической основы базы данных, а также при работе с экспериментальными данными.
Апробация работы. Основные научные выводы и результаты работы докладывались на следующих конференциях: «Научно-техническая конференция МИРЭА» 56, 57 и 58 и Международной научно-технической конференции Intermatic-2009. Материалы работы были опубликованы в 5-ти печатных работах (тезисы и материалы международных и российских конференций), а так же в 3 журналах, входящих в перечень рекомендованных ВАК. Также имеется два акта внедрения результатов диссертационного исследования в учебный процесс кафедры МОВС МИРЭА и в работу ООО «Форинтранс».
Структура и объем работы: Диссертация, объемом в 131 страницу, состоит из введения, трех глав, заключения, списка использованной литературы из 109 наименования.