Введение к работе
Актуальность проблемы. Одной из главных проблем многослойного персептрона и нейронных сетей вообще является проблема обучения для задач уровня сложности выше среднего. Одними из примеров таких задач являются распознавание изображений и прогнозирование. Задача обучения нейронной сети – сложный процесс, вначале необходимо определиться с типом сети, со структурой сети – слои и нейроны в них, входы и выходы, подготовить данные, далее необходимо обучить сеть, то есть подобрать коэффициенты связей между нейронами, проверить на валидационной выборке и в реальной работе. Одним из современных подходов к поиску структуры нейронной сети и ее обучению является применение генетических алгоритмов.
Генетические алгоритмы способны отыскивать решения при практически полном отсутствии предположений о характере исследуемой функции при решении целочисленных или комбинаторных оптимизационных задач. Генетические алгоритмы тесно связаны с биологическим процессом эволюции, который можно рассматривать, как процесс постоянной оптимизации биологических видов, с основной направляющей – естественным отбором. Достоинства генетических алгоритмов заключаются в следующем: генетические алгоритмы могут работать с данными большой размерности и без упорядоченности в них, могут применяться для широкого круга задач, в том числе для задач с изменяющейся средой. Главное достоинство генетических алгоритмов в том, что они могут применяться для сложных неформализованных задач, для которых не существует специальных методов. В то же время, если существует специальный метод решения задачи, то генетический алгоритм, скорее всего ему проиграет.
Целью работы является разработка генетической топологии поиска нейросетевых моделей, ее программная реализация в составе моделирующей системы и апробация топологии на актуальной задаче.
Программная реализация должна позволять создавать имитационную модель рассматриваемой задачи и проводить различные эксперименты с моделями. При работе с моделью исследователю должна предоставляться возможность устанавливать зависимости, соотношения и допущения, выражающие взаимосвязи различных элементов системы, возможность оценивать их влияние на функциональное состояние системы.
Задачи исследования:
исследовать существующие методы обучения нейронных сетей и провести их сравнительный анализ;
проанализировать методы совместного использования генетических алгоритмов и нейронных сетей, выявить сильные и слабые стороны взаимодействия;
разработать топологию и алгоритм генетического поиска адекватной нейросетевой модели;
программно реализовать разработанную топологию в составе моделирующего комплекса;
разработать модель прогнозирования котировок финансовых инструментов с помощью созданной топологии и программного обеспечения;
провести экспериментальные исследования найденных прогнозирующих моделей;
оценить эффективность предложенной топологии генетического поиска нейросетевых моделей.
Научная новизна:
- разработана топология генетического поиска нейросетевых моделей и алгоритм ее работы;
- предложены варианты разработанной топологии;
а) для поиска структуры нейронной сети;
б) для поиска коэффициентов связей нейронной сети;
в) с параллельным генетическим поиском;
- введено понятие прототипа особи;
- разработана топология генетического поиска нейросетевых моделей для прогнозирования котировок финансовых инструментов.
Практическая ценность работы заключается в разработке и адаптации метода создания генетической топологии генерации нейросетевых моделей, разработке моделирующей системы NGSoftware, исследования и применения генетических и нейросетевых моделей. Система NGSoftware используется для генерации нейронных сетей, работающих на финансовых рынках.
Апробация работы. Основные положения работы апробированы на восьмой международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (г. Санкт-Петербург, 2009), Международной научно-технической конференции «Современные информационные технологии» (г. Пенза, 2009), XXX, ХХХI Международных научно - технических конференциях «Математические методы и информационные технологии в экономике, социологии и образовании» (г. Пенза, 2013).
Реализация научно-технических результатов работы в промышленности. Разработанное программное обеспечение внедрено в «ВТБ 24 (ЗАО)» (филиал г.Краснодар), ООО «Смена», производственно-строительная компания, г. Анапа.
Публикации. По теме диссертации опубликовано 5 работ, из них 1 статья и 4 тезисов (в том числе 1 статья в изданиях, рекомендованных ВАК при Минобрнауки России). Подана заявка на патент на изобретение.
Основные положения, выносимые на защиту:
топология генетического поиска нейросетевых моделей;
алгоритм работы топологии генетического поиска нейросетевых моделей;
варианты разработанной топологии для поиска структуры нейронной сети и коэффициентов связей;
понятие прототипа особи в генетических алгоритмах;
применение разработанной топологии для работы на финансовых рынках;
результаты сравнительного анализа разработанной топологии.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников из 101 наименования и 1 приложения на 2 страницах. Объем основного текста составляет 130 страниц машинописного текста, в том числе 23 рисунка и 25 таблиц.