Введение к работе
Актуальпость работы
В современных системах автоматизированного проектирования широко применяются методы математического моделирования, позволяющие на основе достаточно точных математических моделей проводить исследование свойств технических объектов, проводить их полный расчет и оптимизацию Процесс моделирования, начиная с ранних стадий разработки, позволяет накапливать информацию, уточнять модель и в результате разрабатывать проект изделия с заданными потребительскими свойствами
Технология нейронных вычислительных сетей показала свою эффективность при решении задач распознавания образов, кластеризации данных, ассоциативного поиска информации в базах данных и в ряде других применений
Традиционно нейронные сети реализуются в форме программ на универсальных компьютерах, или в форме электронных схем, выполненных на микропроцессорах или на специализированных нейронных процессорах (нейрочипах)
Нейроны (нейрочшты) сети выполняют операцию умножения входного сигнала на число (на вес входа), складывают сигналы и вычисляют выходной сигнал, на основе заложенной в нейрон функции активации Промышленность выпускает цифровые, аналоговые и гибридные нейро-чипы, которые работают соответственно с цифровыми, аналоговыми или одновременно аналоговыми и цифровыми сигналами
Нейрочип — специализированный микропроцессор, оптимизированный для массового выполнения нейронных операций- скалярного умножения и нелинейного преобразования сигналов, изготовленный по технологии микроэлектроники Для создания реально работающих нейронных сетей на основе существующих нейрочипов необходимы десятки и сотни
микросхем, что делает проекты достаточно дорогими и поэтому не находящими широкого спроса
Работы по исследованию и разработке нейронных сетей проводятся с середины прошлого века Теоретически показано, что наиболее универсальны многослойные нейронные сети с пространственной организацией, в которой входы и выходы каждого нейрочипа могут быть подключены к входам и выходам любого другого нейрочипа в сети. Аппаратная реализация таких сетей на кристалле в рамках традиционной планарной технологии микроэлектроники очень сложна, что не позволило до настоящего времени создать дешевые нейронные сети
Нейронная сеть содержит большое количество одинаковых элементов - нейронов, и относится к классу вычислительных сетей с распределенными ресурсами Повысить производительность нейронной сети можно, или уменьшая число каналов обмена информацией между нейронами, или увеличивая степень интеграции элементов в нейрочипе Наиболее перспективным направлением реализации нейрочипов для нейронных сетей следует признать развитие КМОП технологии, применяемой для изготовления современных программируемых логических интегральных микросхем (ПЛИС), например фирм Xilinx и Altera Архитектура ПЛИС содержит блоки элементов памяти и конфигурируемые логические блоки (КЛБ) Локальная связь между этими элементами осуществляется при помощи проводников трассировочных матриц, подключаемых при помощи двунаправленных транзисторных программируемых переключателей Связь с внешней платой осуществляется при помощи двунаправленных программируемых блоков ввода-вывода
Нейронная сеть может быть аппаратно реализована на системе ПЛИС Однако по своим функциональным возможностям и цене ПЛИС слишком сложны и дороги и плохо согласуются с алгоритмами работы нейронной сети.
Развитие КМОП технологии привело к созданию элементов энергонезависимой памяти на базе нанокристаллов Si, Ge, в пленке S1O2 (проект NEON, реализуемый совместно странами Евросоюза) Такой нанокристалл совместно с подведенными к нему электродами образует элемент, близкий по свойствам к униполярному МОП транзистору с плавающим затвором Комплементарные пары таких транзисторов служат элементной базой при создании гигабайтных микросхем «флэш-памяти»
Эти два технологических направления открывают перспективы создания гигабайтных нейронных сетей на одном кристалле Группа элементов памяти и логических элементов, созданных на базе нанокристаллов Si, Ge, образуют нейроны нейронной сети. Связь между нейронами осуществляется при помощи проводников трассировочных матриц В отличие от ПЛИС, структура нейронной сети достаточно проста и регулярна, что приводит к резкому уменьшению числа программируемых переключателей и объема предназначенной для управления ими теневой памяти
В результате на одном кристалле в рамках стандартной технологии можно разместить значительно больше нейронов, чем в ПЛИС Это технологическое направление перспективно для создания массовых и дешевых гигабайтных нейрочипов, позволяющих аппаратно реализовывать сложные нейронные сети
Проблемам моделирования и функционирования нейронных сетей на основе твердотельных объектов посвящены работы многих российских, советских и зарубежных ученых
Развитие технологии производства интегральных микросхем ставит задачу изучения алгоритмов обработки информации в нейронных сетях, оптимизации структуры нейронной сети и структуры нейрона, соответствующих возможностям технологии Это делает задачу разработки элементов информационной технологии моделирования и проектирования нейронных сетей актуальной и своевременной
Дель работы
Целью диссертационной работы является разработка элементной базы и алгоритмов работы нейронных сетей на основе твердотельных объектов Целью работы также является основ проектирования твердотельных нейрочипов на основе перспективных элементов и технологий Оптимизация архитектуры сети позволяет разрабатывать эффективные проекты ги-габайтных нейрочипов, позволяющих реализовать дешевые нейронные сети, работающие в реальном масштабе времени.
В соответствии с поставленной целью на защиту выносится-1. Архитектура и алгоритм функционирования нейронной сети, выполненной на базе твердотельных объектов,
-
Модель обучения нейронной сети решению ряда практических задач;
-
Модель твердотельного нейрона, предназначенного для реализации нейронной сети;
-
Структура и основные элементы системы автоматизированного проектирования и моделирования элементов нейронной сети
Основными методами исследования являются применение математических методов и моделей нейронных сетей, основанных на вычислении реакции сети на внешние воздействия, методов и алгоритмов обучения нейронных сетей решению поставленных задач Компьютерное моделирование выполнено на основе пакетов Matlab, Micro-Cap и оригинальных программ, разработанных автором диссертации
Достоверность полученных результатов обеспечивается строгим использованием адекватного математического аппарата, проверкой разработанных методов путем решения модельных задач, обширным численным экспериментом и сопоставлением полученных результатов с экспериментом и результатами работ других авторов.
Научная новизна заключается в следующих положениях, выносимых на защиту
-
Разработка двухслойной архитектуры плоской нейронной сети с регулярными связями между нейронами, согласованной с возможностями полупроводниковой технологии,
-
Разработка перспективной структуры нейрочипа на основе на-нокристаллов Si, Ge в пленке Si02 и моделирование работы элементов нейрочипа методами схемотехнического моделирования,
-
Разработка алгоритма и модели обучения нейронной сети,
-
Разработка структуры и алгоритма работы системы автоматизированного проектирования нейронной сети.
Практическая ценность состоит в разработке архитектуры и элементов нейронной сети, перспективной для реализации в виде гигабайтной интегральной микросхемы. Это открывает перспективу создания дешевых нейронных сетей, работающих в реальном масштабе времени
Реализация работы использованы при проведении научно-исследовательских работ в НИИ систем управления, волновых процессов и технологий Министерства образования и науки РФ (г Красноярск) и НИИ Микроэлектроники и информационно-измерительной техники (Москва), а также в учебном процессе в МГИЭМ
Апробация работы.
Основные результаты работы докладывались и обсуждались на научно-технической конференции «Датчики и преобразователи информации систем измерения, контроля и управления»; научно-технической конференции «Вакуумные технологии и нанотехнологии », IV Российском философском конгрессе «Философия и будущее цивилизации», Всероссийской междисциплинарной конференции «Философия искусственного интеллекта», научно-технической конференции «Нанотехнологии - 2005», научно-технической конференции «Прогрессивные машиностроительные
технологии», а также на конференциях МГИЭМ (ТУ) для молодых ученых и специалистов в 2004,2005,2006 гг
Публикации.
По теме диссертации опубликованы 24 печатные работы, в том числе получено 6 патентов РФ на полезные модели, написано 4 депонированных статьи, сделано 13 докладов на Всероссийских конференциях
Объем диссертации.
Диссертация состоит из введения, пяти глав, общих выводов, заключения, списка литературы и приложения
Работа изложена на 164 страницах, включая акты внедрения и приложение