Введение к работе
Актуальность темы. Исследования и результаты, представленные в диссертационной работе, являются актуальными в трех областях: железнодорожной отрасли, системах распознавания, вычислительных методах.
На сегодняшний день в хозяйстве автоматики и телемеханики ОАО «РЖД» внедрена система ведения электронного документооборота технической документации АРМ-ВТД. Основной проблемой для получения полного эффекта от использования АРМ-ВТД является наличие огромного количества технической документации, представленной на бумажных носителях. Значительная часть этой документации является «старой», созданной без применения компьютера. При этом основная часть новой технической документации хоть и выполняется средствами автоматизированного проектирования, но передается в группы технической документации дорог на бумажных носителях. Переводом в электронный вид на сегодняшний день занимаются сотни сотрудников групп технической документации дорог и сторонние бюро по переводу. Ввиду того, что документация переводится вручную, на перевод тратится большое количество времени, и этот процесс является экономически затратным.
Очевидным способом значительно ускорить и удешевить перевод технической документации является разработка автоматизированных средств распознавания. Анализ существующих средств показал, что во многих случаях они являются не вполне пригодными для практического применения при распознавании различных видов рукописной технической документации автоматики и телемеханики.
В настоящий момент на рынке представлено относительно небольшое количество готовых систем распознавания образов (Abby Fine Reader, Cuneiform и некоторые другие). Эти системы, в основном, направлены на распознавание текстов, созданных на компьютере. В хозяйстве автоматики и телемеханики существуют семь основных типов документов: схематический план станции, двухниточный план станции, принципиальная схема, монтажная схема, кабельный план, таблица взаимозависимостей, схема аппаратов управления. Существующие готовые системы не подходят для распознавания этих типов документов.
Также в свободном доступе представлено сравнительно немного объектных моделей, которые принципиально могли бы использоваться программистами, работающими в определенных отраслях, для решения задач распознавания образов. Но известные модели, как правило, являются слишком общими, и приходится тратить значительные усилия для их адаптации к решению задачи распознавания. Поэтому для решения задачи
распознавания всех видов железнодорожной технической документации автоматики и телемеханики целесообразным представляется создание модели, удовлетворяющей следующим требованиям:
независимость от классифицируемых образов;
минимальность предобработки образов;
инвариантность относительно «небольших» сдвигов, поворотов, масштабирования образов;
поддержка «online» версий алгоритмов обучения.
И наконец, актуальность темы диссертации в вычислительных методах обусловлена необходимостью существенной экономии ресурсов вычислительных систем. Большую популярность сегодня приобретают так называемые «online» версии алгоритмов обучения нейронных сетей (и методов оптимизации в целом), но теоретически эти методы до сих пор не вполне обоснованы.
Как для обучения персептронов, так и для обучения специальных архитектур нейронных сетей, применяемые алгоритмы обучения часто содержат параметры, выбираемые пользователем на основе опыта и известных рекомендаций других авторов ("вручную"). От выбора этих параметров существенно зависит скорость достижения алгоритмом результата. На сегодняшний день нет общей методики автоматизированного выбора таких параметров, что не позволяет повысить эффективность применяемых алгоритмов обучения нейронных сетей.
Вопросы распознавания образов широко представлены в трудах отечественных и зарубежных ученых. В работах ученых Yann Lecun, Steve Lawrence, С. Lee Giles, Ah Chung Tsoi , Andrew D., Leon Bottou, Patrick Haffher исследуются вопросы построения специальных архитектур нейронных сетей, предназначенных для решения задач распознавания образов. В работах В. Н. Вапника, А. Я. Червоненкис разрабатываются и анализируются методы применения технологии SVM для классификации образов. Работы Р. М. Грановской, И. Я. Березной, С. С. Садыкова, И. Р. Самандрова посвящены применению методов скелетизации изображений для решения задач распознавания. И. А. Борисова, М. Э. Питерцев исследуют комбинированные подходы к решению задач распознавания образов.
Существенный вклад в решение задачи распознавания образов для отрасли железнодорожной автоматики и телемеханики внесли В. А. Ходаковский, Е. Ю. Бурсиан, А. Б. Погребняк.
Значительное развитие теоретических методов и практических подходов, применяемых при решении задач распознавания образов, получено в работах М. Н. Василенко, А. А. Корниенко, В. Г. Трохова, А. Д. Хомоненко, В. В. Гарбарука, Е. А. Благовещенской, А. А. Флоринского, Д. А. Тархова, А. В. Никитина, Д. В. Ефанова.
Объектом исследования диссертационной работы является
нейронная сеть, предназначенная для решения задач распознавания документации железнодорожной автоматики и телемеханики.
Предмет исследования - методы и алгоритмы синтеза структур нейронных сетей для решения задач распознавания.
Целью диссертационной работы является создание адаптивного метода распознавания рукописной технической документации железнодорожной автоматики и телемеханики. Для достижения поставленной цели в работе решена научная задача: совершенствование методов синтеза нейросетевых объектных моделей и повышение эффективности работы алгоритмов их обучения.
Для достижения поставленной цели и решения научной задачи в работе осуществляется решение следующих подзадач исследования:
-
Разработка методов автоматизированного выбора параметров алгоритмов обучения нейронных сетей.
-
Постановка и доказательство теоремы сходимости «online» версии алгоритма обучения и его геометрическая интерпретация.
-
Синтез универсальной объектной модели распознавания образов.
-
Разработка программного обеспечения метода и экспериментальная проверка его эффективности в задачах распознавания технической документации железнодорожной автоматики и телемеханики.
На защиту выносятся:
-
Метод автоматизированного выбора параметров алгоритмов обучения нейронных сетей.
-
Геометрическая интерпретация процесса сходимости «online» версии алгоритма обучения и теорема о сходимости «online» версии.
-
Создание универсальной объектной модели распознавания монтажных карточек железнодорожной автоматики и телемеханики.
-
Программное обеспечение метода и результаты его экспериментальной проверки.
Методы исследования. Для решения задач, поставленных в диссертационной работе, использованы методы математического анализа и алгебры, многомерной геометрии, теории оптимизации и теории вероятностей.
При решении задачи распознавания таблиц и фильтрации шумов использованы готовые решения, представленные библиотекой AForge .NET.
Для создания программного обеспечения, реализующего разработанную объектную модель, использована среда разработки Microsoft Visual Studio 2010. Для написания программного кода выбран язык программирования С#.
Достоверность научных результатов, полученных в диссертационной работе, основана на строгом применении математических методов и сравнении результатов распознавания с данными натурного эксперимента.
Научная новизна:
-
Разработан метод автоматизированного выбора параметров алгоритмов обучения нейронных сетей.
-
Дано обоснование «online» версий алгоритмов обучения нейронных сетей и определены границы его использования.
-
Разработана нейросетевая объектная модель распознавания монтажных карточек с возможностью выбора специальной структуры сети и оптимального алгоритма обучения в зависимости от обучающей выборки.
Практическая значимость. Результаты исследования и разработанное программное обеспечение позволяют существенно ускорить процесс перевода монтажной технической документации железнодорожной автоматики и телемеханики с бумажных носителей в электронный вид при создании баз данных технической документации.
Апробация и реализация. Полученная в работе объектная модель реализована в виде программного модуля и является функциональным расширением системы ведения электронного документооборота АРМ-ВТД. Оформлен акт внедрения программного обеспечения в систему АРМ-
втд.
Результаты работы докладывались на:
-
8-й международной конференции по неравновесным процессам в соплах и струях, г. Алушта, 25-31 мая 2010 г.
-
1-й летней математической школе Балтийского института математики, Польша, г. Гдыня, 16-28 июля 2012 года (отмечена сертификатом).
-
2-й международной научно-практической конференции «Проблемы математической и естественно-научной подготовки в инженерном образовании», Санкт-Петербург, ПГУПС, 15-16 ноября 2012 г.
-
Семинарах Санкт-Петербургского государственного Университета 2010-2012 г.
-
Семинарах кафедры «Автоматика и Телемеханика», ПГУПС, 2011 г.
-
Заседаниях кафедры «Высшая математика» Санкт-Петербургского государственного Политехнического Университета, 2013 г.
-
VII международной конференции "International Cooperation in Engineering Education", Санкт-Петербургский государственный Политехнический Университет, 2-4 июля 2012 г.
-
Семинаре кафедры «Математика и моделирование», ПГУПС, 2013 г.
-
Сетевой школе по ведению технической документации в хозяйстве СЦБ, Ярославль, 2009 г.
Публикации. По результатам диссертационного исследования опубликовано 9 статей, в том числе 4 статьи в журналах, рекомендованных ВАК.
Структура и объем работы. Диссертационная работа представлена введением, 5 главами, списком литературы и приложениями, при этом имеет 122 страницы основного текста, содержит 36 рисунков, 3 приложения и 3 таблицы. Библиографический список составляют 83 наименования.