Введение к работе
Актуальность проблемы. В условиях современного развития компьютерной техники и возможностей программного обеспечения трудно представить создание технической документации (ТД) вручную на листах бумаги. Однако остаётся необходимость поддерживать и изменять принципиальные электрические схемы (ПЭС) эксплуатируемых систем, которые создавались с помощью линеек и карандашей, а типовые схемные решения перерисовывались вручную. Перенос одного проекта с бумаги в систему автоматизированного проектирования (САПР) занимает существенное количество человеко-часов и сопровождается внесением ошибок обусловленных человеческим фактором. Помочь в этом процессе могут современные методы на основе автоматизированного распознавания листов технической документации.
Представленное диссертационное исследование выполнено на актуальную тему и посвящено развитию методов распознавания образов применительно к задаче перевода схемной технической документации систем железнодорожной автоматики и телемеханики (ЖАТ) в электронный вид.
Степень разработанности темы исследования. Вопросам создания
систем распознавания графических образов посвящено множество
исследований. Существует несколько основных методов распознавания и
большое число их модификаций. Точные алгоритмические методы, основанные
на анализе контуров и поиске ключевых характеристик изображений, были
исследованы в работах следующих авторов: Ч. Бэббидж, Дж. Вейценбаум, Н.
Винер, В. Глушков, Дж. Маккарти, М. Мински, А. Ньюэлл, С. Пейперт, Д.
Перл, Г. Поспелов, Д. Поспелов, Ф. Розенблатт, Г. Саймон, П. Уинстон, В.
Финн, Н. Хомский, К. Шеннон. Совместно с алгоритмическими методами
развивались методы, основанные на использовании нейронных сетей,
основным отличием которых является процесс обучения классифицирующего
звена системы распознавания. При этом нет необходимости в описании точного
алгоритма определения принадлежности распознаваемого объекта к заданному классу. Методы, основанные на нейросетевых моделях, исследованы в научных работах следующих авторов: Ян Лекун, Йошуа Бенджио, Дж. Хинтон, А. Крижевский, И. Сатскевер, М. Цилер, Р. Фергюс, Э. Циссерман, К. Симонян, К. Сегеди, Кайминг Хи, А. Карпати. В области разработки методов распознавания ТД ЖАТ известны работы В.А. Ходаковского, Е.Ю. Бурсиан, А.Б. Погребняка, Д.В. Зуева. Однако применительно к распознаванию ПЭС ЖАТ описанные методы имеют существенные недостатки, а именно:
не решается задача выделения полюсов и взаимосвязей элементов ПЭС;
долгий и затратный процесс обучения или выделения ключевых характеристик распознаваемых объектов;
не предусмотрена возможность задания ключевых характеристик отдельным элементам ПЭС.
Тема диссертации соответствует специальности паспорта специальности 05.13.06 «Автоматизация и управление технологическими процессами и производствами (транспорт)» по пунктам:
п. 8. Формализованные методы анализа, синтеза, исследования и оптимизация модульных структур систем сбора и обработки данных в АСУТП, АСУП, АСПТП и др.
п. 10. Методы синтеза специального математического обеспечения, пакетов прикладных программ и типовых модулей функциональных и обеспечивающих подсистему АСУТП, АСУП, АСТПП и др;
п. 15. Теоретические основы, методы и алгоритмы интеллектуализации решения прикладных задач при построении АСУ широкого назначения (АСУТП, АСУП, АСТПП и др.)
Цели и задачи диссертации. Основной целью диссертации является разработка методов и алгоритмов распознавания ПЭС ЖАТ для создания интеллектуальной системы распознавания. Для достижения поставленной цели решаются следующие задачи:
-
Анализ объёмов работ при ручном переводе ТД в электронные редактируемые форматы и обоснование полезности автоматизации перевода.
-
Разработка алгоритма распознавания элементов ПЭС с выделением точек привязки.
-
Разработка алгоритма поиска текстовых выражений ПЭС для последующего применения систем распознавания символов.
-
Разработка алгоритма распознавания структуры соединителей ПЭС.
-
Создание структурной схемы системы распознавания ПЭС с применением разработанных алгоритмов.
-
Разработка программной реализации системы распознавания, имеющей возможность настройки и расширения для конкретных случаев распознавания элементов ПЭС без изменения программного кода системы.
7. Экспериментальная апробация разработанных методов и алгоритмов.
Объектом исследования является схемная ТД ЖАТ, а предметом –
процесс автоматизированного создания электронной модели схемной ТД ЖАТ. Научная новизна диссертационного исследования заключается в следующем:
-
Предложена новая модель шаблона распознавания, формализующая графическое описание элемента ПЭС, точек соединения с другими элементами ПЭС и расположение текстовых атрибутов, которая позволяет влиять на алгоритм распознавания без переобучения и изменения его описания.
-
Разработан метод поиска текстовых выражений ПЭС и их классификации в соответствии с атрибутами элементов ПЭС с применением методов кластерного анализа.
-
Спроектирована структурная схема системы распознавания ПЭС ЖАТ, описывающая полный цикл перевода ТД из исходного изображения растрового формата в электронную объектную модель, которая содержит данные о базисе элементов ПЭС распознаваемого изображения, их электрических связях, точках монтажа и прочих типовых параметрах.
Теоретическая значимость работы заключается в получении методов распознавания схемной документации ЖАТ, применение которых не требует создания больших обучающих выборок и позволяет не зависеть от предварительного выбора общих существенных признаков для распознаваемых объектов.
Практическую значимость работы составляет разработанная программная реализация системы распознавания ПЭС, увеличивающая эффективность перевода ТД в электронный формат.
Методология и методы исследования. Использованы методы теории распознавания образов, теории графов, теории вероятностей и математической статистики, методы обработки больших данных.
Положения, выносимые на защиту:
-
Алгоритм распознавания элементов ПЭС с выделением полюсов.
-
Модель шаблона распознавания, включающую описание ключевых графических характеристик элемента ПЭС и специальную метаинформацию, используемую для настройки случая распознавания.
-
Метод идентификации и выделения текстовых выражений ПЭС с возможностью применения систем распознавания символов.
-
Подход к распознаванию ПЭС ЖАТ с применением узкоспециализированных методов для блоков, точек пересечения проводов, структуры соединителей ПЭС (линий взаимосвязи).
5. Структурная схема системы распознавания ПЭС ЖАТ.
Степень достоверности подтверждается аналитическими
исследованиями и результатами применения программной реализации
разработанных алгоритмов в составе системы распознавания ПЭС ЖАТ – АРМ
– РПС.
Апробация результатов. Результаты работы докладывались на:
1. Международной конференции «Региональная информатика – 2016», г.
Санкт-Петербург, ПГУПС, 2016 г.
-
Международной научно-практической конференции «Транспортные интеллектуальные системы – 2017», г. Санкт-Петербург, ПГУПС, 2017 г.
-
Заседаниях кафедры «Автоматика и телемеханика на ж.д.», г. Санкт-Петербург, ПГУПС, 2014 г, 2018 г.
-
Рабочем совещании ЗАО «МГП «ИМСАТ» «Рассмотрение перспектив по применению методов генерации таблиц взаимозависимостей для анализа прочей ТД ЖАТ», г. Санкт-Петербург, ЗАО «МГП «ИМСАТ», 2014 г.
-
Совещании технического совета ООО «ИМСАТ» «Рассмотрение алгоритмов распознавания схемной ТД», г. Санкт-Петербург, ООО «ИМСАТ», 2016 г.
Основные результаты диссертационного исследования
опубликованы в 10 работах, в том числе 7 публикациях в изданиях, включенных в Перечень ВАК РФ.
Основные научные и практические результаты диссертационного исследования внедрены в составе программного обеспечения автоматизированного рабочего места распознавания технической документации АРМ-РПС, которое принято в эксплуатацию в отделе технической документации ШЧ-6 Санкт-Петербург – Сортировочный – Московская Октябрьской железной дороги.
Структура и объем диссертации. Работа содержит 120 страниц машинописного текста, включая 73 рисунка, 5 таблиц. Диссертация состоит из введения, пяти глав основного текста, заключения, списка используемых сокращений и четырех приложений. Библиографический список включает в себя 58 наименований.