Введение к работе
Актуальность темы. В зависимости от характера многопараметрических систем используются различные виды моделирования, такие как детерминированные и стохастические, статические и динамические, дискретные, непрерывные и дискретно-непрерывные и т.д. В качестве многопараметрических систем могут рассматриваться как технические, биологические и экономические системы, так и производственные предприятия, и социологические объекты (город, район, регион и т.д.). Моделирование многопараметрических систем предполагает исследование объектов на их моделях.
Существуют различные подходы, направленные на формирование моделей, описывающих функционирование дискретных многопараметрических систем, поведение которых обуславливается большим числом внешних признаков. При всем существующем разнообразии методов Data Mining, ориентированных на исследование многопараметрических систем, практически все они сталкиваются с общей трудностью – вопросом отбора значимых для модели входных признаков. Особенно актуальна эта проблема при построении регрессионных моделей. Это связано с тем, что сформированные модели адекватны при интерполяции, в то время как на этапе экстраполяции эти модели уже не пригодны ввиду значительных ошибок прогноза.
Исследованию проблем создания методики определения оптимальных значений показателей системы и вопросам моделирования многопараметрических систем посвящены работы следующих ученых: Айвазян С.А., Бусленко Н.П., Глова В.И., Заде Л.А., Захаров В.М., Ивахненко А.Г., Сиразетдинов Т.К., Царев Р.Ю., Якимов И.М., Бастергян А.А., Larose D. T., Chipman H. A., Cantu-Paz E., Mu Zhu., Dash M., Miller A., Yang J., Ханк Д. Э., и т.д.
Однако, в этом направлении существуют недостаточно исследованные вопросы и нерешенные задачи, имеющие теоретическое и практическое значение. Например, использование параллельных генетических алгоритмов отбора значимых признаков и определения оптимальных значений показателей системы. Актуальной задачей является разработка адекватных многопараметрических моделей, эффективных алгоритмов и реализующих их программных комплексов. Решению этой задачи посвящена настоящая диссертация.
Объект исследования. Модели и методы моделирования многопараметрических систем.
Предмет исследования. Методы, модели, алгоритмы формирования нелинейной регрессионной модели многопараметрической системы.
Научная задача: разработка новых методов и алгоритмов построения нелинейных регрессионных уравнений для моделирования многопараметрической системы, многокритериального поиска решения и программного комплекса формирования нелинейной регрессионной модели для анализа многопараметрической системы и определения оптимальных показателей системы.
Цель работы: создание методов, моделей, алгоритмов и программных средств формирования нелинейной регрессионной модели при решении задачи отбора значимых признаков для повышения эффективности построения моделей многопараметрических систем и оценка их качества (эффективности).
В соответствии с поставленной целью в работе решались следующие задачи:
-
Анализ проблем, возникающих при применении методов формирования модели для многопараметрической системы.
-
Разработка методики формирования нелинейной регрессионной модели многопараметрической системы.
-
Разработка метода и алгоритма формирования модели многопараметрической системы на базе параллельного генетического алгоритма.
-
Разработка алгоритма определения оптимальных значений показателей системы при изменении входных признаков на основе нелинейной регрессионной модели.
-
Разработка комплекса методик и программ, реализующих предлагаемые методы и алгоритмы.
Методы исследований.
В работе использовались положения: теории систем, теории вероятности, теории математической статистики, нечеткой логики, теории эволюционного моделирования и теории оптимизации. Теоретические исследования сопровождались разработкой математических моделей, реализованных на ЭВМ и в виде программных средств.
Научная новизна работы:
-
Разработан метод формирования нелинейной регрессионной модели для исследования многопараметрической системы на основе сочетания многофакторной нелинейной регрессионной модели, метода группового учета аргументов, численного метода отбора значимых признаков и нечеткой логики.
-
Разработан численный метод отбора значимых признаков и формирования структуры регрессионных зависимостей на основе параллельного генетического алгоритма.
-
Разработан численный метод определения требуемого количества параллельных эволюционных путей для отбора значимых признаков.
-
Разработан модифицированный алгоритм определения оптимальных значений результативных показателей на основе полученной нелинейной регрессионной модели с использованием нечеткой логики и параллельных вычислений.
Достоверность полученных результатов. Предложенные в диссертационной работе модели и алгоритмы обоснованы теоретическими решениями и не противоречат известным положениям других авторов. Практическая апробация и внедрение на промышленном предприятии и предприятии почтовой связи результатов работы подтвердили эффективность формирования полиномиальной модели многопараметрической системы и определение наилучших значений показателей системы.
Практическая ценность результатов работы полученных научных результатов в диссертации состоит в том, что в ней дана методика моделирования многопараметрической системы. Разработанные алгоритмы позволяют тестировать разработанный метод на требуемое количество параллельных эволюционных путей, определять оптимальные параметры генетических алгоритмов отбора значимых признаков. Расширяется возможность определения оптимальных значений результативных показателей нелинейной регрессионной модели многопараметрической системы. Модели, алгоритмы и комплекс программ является инструментальным средством для моделирования многопараметрических систем и исследования свойств нелинейных регрессионных моделей с использованием генетического моделирования, нечеткой логики и параллельных вычислений.
Реализация результатов работы. Теоретические и практические результаты диссертационной работы, в том числе, их программная реализация, были внедрены на машиностроительном предприятии «СИЗ» (г. Елабуга) и Елабужском межрайонном почтамте (г. Елабуга). Отдельные результаты работы были также использованы в учебном процессе кафедры Автоматизированных систем обработки информации и управления КГТУ им. А.Н.Туполева. Разработанные в диссертационной работе модели и методы также могут быть использованы для повышения эффективности моделирования и в других организациях.
Апробация работы.
Основные положения диссертационной работы докладывались, обсуждались и получили положительную оценку на конференциях: Международная конференция «Туполевские чтения» (г. Казань, 2004, 2005, 2006, 2008, 2009); Всероссийская научная конференция «Робототехника, мехатроника и интеллектуальные системы» (г. Таганрог, 2005); Всероссийский конкурс-конференция «Технологии Microsoft в теории и практике программирования» (г. Санкт-Петербург, 2007, 2008); Всероссийский конкурс-конференция «Технологии Microsoft в теории и практике программирования» (г. Нижний Новгород, 2007); Всероссийская конференция студентов, аспирантов и молодых ученых «Технологии Microsoft в теории и практике программирования» (г. Новосибирск, 2008); Международная молодежная научная конференция «XXXIV Гагаринские чтения» (г. Москва, 2008); Всероссийская научно-практическая конференция «Наука и профессиональная деятельность» (г. Нижнекамск, 2008, 2009 ,2010); Международная конференция-семинар «Высокопроизводительные параллельные вычисления на кластерных системах» (г. Казань, 2008); Научно-практическая конференция студентов и аспирантов «Наука и инновации в решении актуальных проблем города» (г. Казань, 2008); Международная научно-практическая конференция «Инфокоммуникационные технологии глобального информационного общества» (г. Казань, 2008, 2009).
Публикации.
Основные результаты диссертационной работы опубликованы в 26 печатных работах, в том числе 5 статей, две из которых в печатных изданиях, рекомендованных ВАК и 21 тезиса докладов.
На защиту выносятся следующие результаты:
-
Метод формирования нелинейной регрессионной модели многопараметрической системы.
-
Численный метод отбора признаков и формирования структуры регрессионных зависимостей на основе параллельного генетического алгоритма.
-
Алгоритм поиска наилучшего количества параллельных эволюционных путей для отбора значимых признаков.
-
Модифицированный алгоритм поиска оптимальных значений результативных показателей методом упорядоченного предпочтения через сходство с идеальным решением.
-
Комплекс программ, реализующих предлагаемые методы и алгоритмы.
Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы, включающего 84 наименование, изложена на 189 страницах машинописного текста, содержит 64 рисунка и 41 таблиц, приложение на 25 страницах.