Введение к работе
Актуальность. На современном этапе развития общества, которое характеризуется возрастающей сложностью информационных процессов с одной стороны и увеличением их количества с другой, особую значимость приоретают симуляторы, которые нашли широкое применение в различных областях науки и техники: системах искусственного интеллекта и распознавания образов, представления знаний, математического моделирования в различных сферах, кибернетике. В основу построения симуляторов были положены методы математического програмирования, системного анализа, теории экстремальных задач, при этом математические модели, формализующие предметную область, строились на основе применения детерминированного или стохастического подходов с соответствующими системами допущений, что существенно ограничивало область эффективного применения.
Качественный скачок в области построения симуляторов произошел после введения в рассмотрения искусственных нейронных сетей (ИНС), впервые предложенных МакКалоком У. и Питсом У.
В настоящее время можно выделить ряд зарубежных (Хайкин С, Осов-ский С.) и российских ученых (Круглов В.В., Борисов В.В., Голушкин А.И.), которые внесли существенный вклад как в развитие теоретических методов построения и настройки нейросетевых структур, так и в расширение области их применения в различных сферах деятельности, включая и построение симуляторов. В связи с этим симуляторы, построенные на основе применения нейросетевых структур, целесообразно назвать неросе-тевыми симуляторами (НСС).
Однако, при построении и настройке НСС имеет место существенный недостаток, который может свести на нет все приемущества, которые обеспечивает применение нейросетевых структур, суть которого в сложности организации соответствующих информационных процессов, которая обуславливается количеством неоходимых вычислений.
В связи с этим особое значение приобретают вопросы, связанные с повышением эффективности организации информационных процессов и, как следствие, информационных структур, положенных в основу построения НСС.
Одним из наиболее перспективных подходов при решении данных вопросов является повышение эффективности информационных процессов связанных с обучением НСС и выбором его структуры.
В настоящее время развитию данного подхода не было уделено должного внимания. В связи с этим тема научного исследования направленная на повышение эффективности информационных процессов обучения и выбора структур при построении НСС является актуальной.
Целью данной работы является повышение эффективности функционирования неиросетевого симулятора за счет построеных моделей параллельных информационных процессов обучения и выбора структур.
Для достижения поставленной цели необходимо решить следующие задачи:
построить информационную модель выбора структур неиросетевого симулятора и параллельных процессов обучения;
построить аналитическую модель расчета эффективности информационных процессов обучения и выбора структур НСС;
поставить и решить оптимизационную задачу, направленную на определение оптимального числа элементов информационных ресурсов (ИР-элементов), используемых для обучения НСС;
- провести имитационное исследование, подтверждающее эффектив
ность разработанной модели и построенного НСС.
Область исследования. Работа соответствует паспорту специальности 05.13.17 «Теоретические основы информатики» в частности пункту 2.1 «исследование информационных структур, разработка и анализ моделей информационных процессов и структур».
Объект исследования - нейросетевые симуляторы.
Предмет исследования - модели выбора структур и повышения эффективности неиросетевого симулятора.
Научная новизна:
построены модели информационных процессов обучения и выбора структур неиросетевого симулятора, отличающаяся использованием новых способов реализации информационных процессов обучения НСС, адаптированных для использования большого числа информационных ресурсов;
построены аналитические модели расчета эффективности, отличающаяся наличием выявленной связи, между эффективностью (скоро-
стью) информационных процессов обучения и характеристиками используемых информационных ресурсов;
- поставлена и решена оптимизационная задача, направленная на опре
деление оптимального числа информационных ресурсов, используемых
для обучения НСС;
Практическая значимость работы состоит в следующем.
разработаны параллельные информационные процессы обучения и выбора структуры НСС, повышающие эффективность построения ИНС-моделей;
разработан нейросетевой комплекс для кластерных вычислительных систем, включающий НСС, сервер симуляторов и компонент сбора статистической информации, позволяющий эффективно использовать ресурсы кластерной вычислительной системы;
разработан язык конфигурации ИНС-моделей, базирующийся на XML и позволяющий эффективно формировать задания для обучения НСС;
разработано высокоуровневое средство межпроцессорной передачи данных, базирущееся на MPI, позволяющий эффективно использовать ИР-элементы.
Реализация и внедрение результатов работы. Результаты работы могут найти широкое применение при решении задач, требующих существенно снизить временные затраты на построение моделей. К таким задачам можно отнести моделирование объектов из различных сфер, прогнозирование временных рядов, распознавание образов и т.д.
Данная работа выполнена в соответствии с тематическим планом ТГУ им. Г.Р. Державина по теме «Разработка параллельных алгоритмов математического моделирования на основе нейросетевых методов и символьных вычислений» (регистрационный номер НИР 1.12.09 2009-2010 гг) и при поддержке программы Президента Российской Федерации (приказ Министерства от 03.08.2010 г. №832). Также эта работа поддержана фондом содействия развитию малых форм предприятий в научно-технической сфере «У.М.Н.И.К.» (проект «Программный комплекс для моделирования объектов социально-экономического назначения с использованием искусственных нейронных сетей на кластерных вычислительных системах») и выполнена в рамках совместного европейского проекта TEMPUS TACIS
«Join European Project on System Modernisation of University Management (SMOOTH, UM_JEP 24217-2003)».
Результаты работы внедрены в учебный процесс Тамбовского государственного университета им. Г.Р. Державина, производственный процесс компаний ООО «КреоВектор», 000 «КомпМарт» (г. Тамбов) и 000 «Служба Первая Компьютерная» (г. Котовск).
Апробация работы. Основные результаты диссертации обсуждались на конференциях и научных семинарах: XV международной конференции по нейрокибернетике «Интерфейс "Мозг-Компьютер"» (Ростов-на-дону, 2008), VIII-ой Всероссийской научно-практической конференции с международным участием «Информационные технологии и математическое моделирование (ИТММ-2009)» (Томск, 2009), II Всероссийской научно-практической конференция «Актуальные вопросы современной науки, техники и технологий» (Москва, 2010), VII Всероссийской научной конференции молодых ученых, аспирантов и студентов «Информационные технологии, системный анализ и управление» (Таганрог, 2009), Международном IX симпозиуме «Интеллектуальные системы» (Владимир 2010), II Всероссийской межвузовской научной конференции «Зворыкинские чтения» (Муром, 2010) и XV научной конференции преподавателей и аспирантов ТГУ им. Г.Р. Державина Державинские чтения» (Тамбов 2010).
Публикации. По результатам диссертации опубликовано 18 печатных работ, из них 11 статей (8 статей в издании из Перечня ВАК для публикации научных результатов диссертаций на соискание ученой степени доктора и кандидата наук), 6 тезисов докладов в материалах Международных, Всероссийских и внутривузовских конференций, 4 свидетельства государственной регистрации программы для ЭВМ.
Структура и объем работы. Диссертация включает в себя введение, 4 главы, заключение, список используемых источников из 91 наименования и приложения. Работа изложена на 175 страницах, содержит 42 рисунка и 13 таблиц.