Введение к работе
Актуальность темы. Искусственный нейрон - устройство для переработки многомерной информации, использующее бионические принципы. Биологические нейроны для обмена сигналами используют пиковые импульсы напряжения - спайки. В искусственных нейронных сетях для передачи информации между элементами используются различные типы сигналов, которые с разной степенью детализации описывают потоки спайков. Наиболее широко распространено использование числового сигнала, описывающего частоту появления спайков (частотные нейронные сети), например, в сетях сигмоидальных нейронов с обратным распространением ошибки. Другим типом искусственных нейронных сетей являются спайковые нейронные сети. Нейроны в таких сетях общаются между собой с помощью точечных идентичных событий, называемых спайками по аналогии с биологическими нейронами. Все спайки одинаковы по амплитуде. Информация, получаемая нейроном из спайка, содержится в его времени прихода, а также номере входного канала.
Использование спайковых нейронных сетей в практических приложениях приобретает все большую популярность в связи со следующими их преимуществами:
Использование времен спайков как основной информационной составляющей сигнала позволяет естественным образом обрабатывать временную потоковую информацию в таких задачах, как прогнозирование, распознавание быстро движущихся объектов, управление. Изменение состояния спайкового нейрона описывается дифференциальными уравнениями. Это позволяет использовать кратковременную память отдельных нейронов без введения дополнительных структур (временных задержек, рекурсивных связей) для обработки временной составляющей в таких задачах.
Дальнейшее развитие вычислительной техники связывают с ростом параллелизма вычислений. Для передачи спайка между узлами высокопараллельной вычислительной машины (нейрокомпьютера) требуется передать всего 1 бит (в отличие от частотных нейронов, где требуется передавать непрерывные величины). Для функционирования спайковых нейронов не требуется синхронизация элементов вычислительной машины. Данные особенности значительно увеличивают эффективность и уменьшают сложность нейрокомпьютеров.
В работах [Rieke F., 1997, Maas W., 1997] ' показано, что спайковые нейроны способны решать задачи частотных и бинарных нейросетей, включая задачи интерполяции непрерывных функций, кластеризации. Однослойные спайковые нейронные сети способны решать некоторые задачи нелинейной классификации (типа "исключающего ИЛИ"). Обучение спайковых нейронов может происходить одновременно с их функционированием.
Большая близость спайковых моделей к биологическим нейронам позволяет напрямую использовать бионические принципы при решении практических задач и, наоборот, применять спайковые нейроны как инструмент развития знания о мозге.
Однако в настоящее время использование спайковых нейронных сетей ограничено в связи с недостаточно развитым математическим аппаратом их обучения. В основном используются разнообразные эвристические правила обучения спайковых нейронов, не гарантирующие решения поставленных задач. Построение методов обучения спайковых нейронов, унификация описания различных видов обучения нейронов в рамках единого математического аппарата - актуальная теоретическая задача. Ее решение позволит разработать новые и усовершенствовать существующие методы и средства анализа обработки информации и управления сложными системами, повышения эффективности, надежности и качества их работы. Построение самообучающихся спайковых нейронных сетей, способных детектировать и запоминать пространственно-временную информацию, управлять различными нестационарными объектами, в том числе, при возникновении неисправностей в активаторах и сенсорах объекта - актуальная практическая задача. Эта задача отвечает потребностям ряда связанных с информационными технологиями отраслей: робототехники, космической техники, разработки систем безопасности.
Объектом исследования являются модели отдельных спайковых нейронов и спайковых нейронных сетей. Предмет исследования составляют процессы обучения спайковых нейронов и спайковых нейронных сетей в рамках адаптивной обработки многомерной пространственно-временной информации.
Цель работы заключается в создании методов обучения спайковых нейронных сетей, использующихся для адаптивной обработки и запоминания
1 F. Rieke, et. al. Spikes: Exploring the Neural Code.: Computational Neurosciences series. MIT Press, 1997.
2 Maas, W. Networks of spiking neurons: the third generation of neural network models. Transactions of the
Society for Computer Simulation International. 1997 г., Т. 14, 4.
многомерной потоковой пространственно-временной информации и предназначенных для решения задач распознавания и управления различными объектами, в том числе, в меняющейся внешней среде.
Методы исследования. При выполнении диссертации использованы понятия и методы теории информации, теории вероятностей, линейной алгебры, теории марковских процессов принятия решений, информатики, теории искусственного интеллекта, а также аппарат градиентной минимизации.
Достоверность научных результатов подтверждена теоретическими выкладками, подробно изложенными в диссертации, данными компьютерного моделирования, а также сравнением полученных результатов с результатами, приведенными в научной литературе.
Научная новизна работы.
1. На базе известной модели спайкового нейрона Spike Response Model (SRM)
со стохастическим порогом создана оригинальная модель нейрона - SMRM,
позволяющая гибко реагировать на пространственную и временную структуру
входного спайкового потока. Построенная модель отличается специальным
набором функций отклика на единичный спайк ("альфа-функции"),
реализующих настраиваемый по амплитуде и задержке отклик нейрона на
входные спайки на каждом синапсе нейрона.
2. Для спайкового нейрона впервые формализован процесс обучения с
учителем как процесс снижения частной условной информационной энтропии,
при условии, что требуемый учителем паттерн представлен в виде набора
обучающих спайков. Практически значимая задача обучения с учителем по
обнаружению определенного пространственно-временного спайкового
паттерна впервые решена с помощью всего одного нейрона SMRM и метода
снижения частной информационной энтропии. Впервые получены графики
снижения частной энтропии.
3. Разработана оригинальная система временной автоассоциативной памяти,
состоящая из сети взаимодействующих спайковых нейронов. Эта система
использует полученные правила обучения с учителем и способна запомнить
несколько спайковых паттернов и в дальнейшем восстановить их, развернув
во времени, при предъявлении только начального участка паттерна.
4. Построен оригинальный метод самообучения спайкового нейрона,
позволяющий успешно решать в реальном времени задачу увеличения
устойчивости процесса генерации наиболее вероятного выходного паттерна
путем снижения полной собственной энтропии нейрона. Впервые проведены
опыты по самообучению с моделью нейрона SMRM, получены графики
снижения полной энтропии в процессе обучения. Показано, что после обучения процесс генерации наиболее вероятного выходного паттерна достигает большой степени устойчивости, а менее вероятные выходные паттерны перестают генерироваться практически полностью.
5. Впервые показано, что существующий метод обучения с подкреплением спайковых нейронов, основанный на прямой градиентной максимизации получаемого подкрепления, может быть реализован в рамках теоретико-информационного подхода к обучению. Впервые показано, что двухслойная спайковая нейронная сеть способна реализовывать поставленную задачу управления при недостатке пространственной информации, активно используя временную структуру сенсорных спайковых паттернов и внутреннюю активность сети. Произведены эксперименты с меняющейся внешней для сети средой, а также оригинальный эксперимент с подменой управляемого объекта. Показано, что одна и та же спайковая нейронная сеть способна управлять различными объектами, в том числе, при возникновении неисправностей в активаторах и сенсорах объекта и внезапных изменениях во внешней среде объекта.
Основные положения, выносимые на защиту
Созданная модель спайкового нейрона SMRM со стохастическим порогом и несколькими функциями отклика нейрона на входные спайки способна более гибко реагировать на пространственную и временную структуру входного спайкового потока, чем известная модель спайкового нейрона Spike Response Model.
Для обобщенного спайкового нейрона формализован процесс обучения с учителем как процесс снижения частной условной информационной энтропии, при условии, что требуемый учителем паттерн представлен в виде набора обучающих спайков.
Разработана система временной автоассоциативной памяти, состоящая из сети взаимодействующих спайковых нейронов и использующая полученные правила обучения с учителем. Эта система способна запомнить несколько спайковых паттернов и в дальнейшем восстановить их, развернув во времени, при предъявлении только начального участка паттерна.
Построен метод самообучения, увеличивающий устойчивость процесса генерации наиболее вероятного выходного паттерна спайкового нейрона. Метод основан на анализе распределения вероятностей на пространстве выходных паттернов нейрона и учете свойства иерархической аддитивности полной энтропии нейрона.
Получены правила обучения спайкового нейрона SMRM с подкреплением. Правила основаны на методе прямой градиентной максимизации получаемого подкрепления.
Показано, что одна и та же спайковая нейронная сеть, использующая полученные правила обучения с подкреплением, способна управлять объектами различного типа, в том числе, при возникновении неисправностей в активаторах и сенсорах объекта и внезапных изменениях во внешней среде объекта.
Практическая ценность работы. Результаты, полученные в диссертационной работе, способствуют дальнейшему развитию теоретических основ информатики, в частности, теории процессов обучения в искусственных динамических нейронных сетях, приближенных к реальным нейронным сетям живых организмов. Правила обучения нейронов - обработчиков спайковых паттернов, а также сетей временной автоассоциативной памяти, позволяют построить системы распознавания и запоминания потоковой многомерной информации (например, для систем видеонаблюдения и робототехники). Спайковые нейронные сети, использующие алгоритмы обучения с подкреплением, позволяют управлять различными динамическими объектами, в том числе, при изменяющейся внешней среде и поломках в сенсорах и активаторах объекта.
Реализация результатов. Основные результаты диссертации были использованы при выполнении работы по гранту Российского фонда фундаментальных исследований № 08-01-00498-а.
Результаты работы используются в учебном процессе на кафедре теоретической механики и мехатроники МЭИ (ТУ) в лекциях и практических занятиях по курсам: «Микропроцессорные устройства управления роботов и их программное обеспечение», «Информационные устройства в робототехнике», «Робототехнические системы и комплексы». Разработанный автором программный пакет с удобным графическим интерфейсом для работы с адаптивными спайковыми нейронными сетями используется при построении информационных систем для создаваемых на кафедре мобильных роботов.
Разработанные в диссертации модели обучения параллельных вычислительных структур для обработки потоковой информации были внедрены в ООО «Лаборатория Трехмерного Зрения» в системах по распознаванию автомобильных номеров.
Соответствующие акты о внедрении прилагаются к диссертации.
Апробация работы. Основные результаты диссертационной работы докладывались: на 11-ой национальной конференции по искусственному интеллекту с международным участием (КИИ-2008) (Дубна, 2008); на 2-ой
российской мультиконференции по проблемам управления: 5-ой научной конференции "Управление и информационные технологии" (Санкт-Петербург, 2008); на V-ой международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (Коломна, 2009); на XI и XII всероссийских научно-технических конференциях "Нейроинформатика" (Москва, 2009, 2010); на Тайваньско-Российском двухстороннем симпозиуме по проблемам современной механики 2010, МГУ им. М.В.Ломоносова (Москва, 2010); на 12-ом заседании Московского семинара под рук. академика А.Л. Микаэляна "Нейроинформатика и когнитивные исследования" (Москва, 2010); на 21-ом заседании семинара отдела программирования и объединенного семинара по робототехническим системам ИПМ им.М.В. Келдыша РАН, МГУ им. М.В.Ломоносова, МГТУ им.Н.Э. Баумана, ИНОТиИ РГГУ (Москва, 2010); на семинаре «Динамика относительного движения» МГУ им. М.В.Ломоносова (Москва, 2010).
Публикации. По теме диссертации опубликовано 10 печатных работ (в том числе, в 2 журналах, рекомендованных ВАК).
Структура и объём диссертации. Диссертация состоит из введения, четырех глав, заключения и трех приложений и содержит 149 страниц машинописного текста, включая 55 иллюстраций и список литературы из 115-х наименований.