Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и исследование речевого интерфейса для системы автоматического управления робота Изилов, Яков Юноевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Изилов, Яков Юноевич. Разработка и исследование речевого интерфейса для системы автоматического управления робота : автореферат дис. ... кандидата технических наук : 05.13.07 / Санкт-Петербург. гос. техн. ун-т.- Санкт-Петербург, 1998.- 19 с.: ил. РГБ ОД, 9 98-6/818-8

Введение к работе

Актуальность, При производстве деталей в цикле технологической подготовки работы оборудования возникает необходимость в разработке управляющих программ (УП). Общий недостаток процесса подготовки и контроля УП - большие затраты времени и наличие ручных операций.

На ряде крупных предприятий созданы вычислительные центры (ВЦ), которые позволяют автоматизировать разработку УП для технологического оборудования, в том числе - для робототехнических ячеек (РТЯ).

Однако, внедрение ВЦ возможно только на крупных предприятиях, так как это связано с большими капиталовложениями. В связи с этим, в диссертационной работе произведён анализ особенностей производсва деталей типа "вал" для делительных головок, который позволил заключить, что ВЦ не является достаточно гибким звеном в технологической подготовке работы РТЯ. Не менее остро стоит проблема ускорения технологической подготовки работы промышленных роботов, РТЯ и обмена информацией между человеком и ЭВМ. Одним из актуальных и перспективных направлений для решения этой задачи является более полное использование возможностей робота путём его модернизации на основе предложенного речевого интерфейса.

Применение систем распознавания речи при автоматизации технологических процессов и производств, позволяет реализовать удобное взаимодействие человека с системой управления технологического оборудования, в том числе с устройством подготовки данных при разработки УП, атакже с другими техническими системами. Применение систем программного управления с вводом данных голосом повышает производительность операций, так как уменьшается работа с клавишной панелью.

Актуальной остаётся проблема улучшения характеристик существующих и создание новых речевых систем. Особый интерес представляет разработка систем и методов распознавания слов, произнесенных без

специальных пауз, то есть слитной речи. Необходимость и своевременность проведения научно-исследовательских работ в данном направлении обуславливается объективными требованиями совершенствования человеко-машинного интерфейса в условиях расширения областей применения автоматизированных систем. Условием для широкого использования речевых технологий является повышение вероятности распознавания слов и увеличение быстродействия систем распознавания речи. Последнее особенно важно при работе с системами распознавания слитной речи, так как при традиционном подходе время анализа речевого сигнала (PC) пропорционально числу слов в высказывании.

Целью работы является разработка и исследование речевого интерфейса (РИ) для системы автоматического управления (САУ) робота, обеспечивающего ввод информации с помощью слитно произнесённых указаний на русском языке.

Основные задачи исследования.

Обоснование выбора числа точек измерения и количества контрольных испытаний параметров акустического состояния (АС).

Обоснование преимущества использования меры схожести текущего АС с эталоном.по п - параметрам одновременно по сравнению с отдельно взятыми параметрами.

Исследование изменения времени и вероятности распознавания речевого высказывания в зависимости от количества составляющих его слов при испытании разработанного РИ.

Методы исследования. В диссертационной работе использовались методы: теории распознавания образов, цифровой обработки акустических сигналов, акустической теории речеобразования, теории планирования и постановки эксперимента, теории вероятностей.

Достоверность предложенных в работе положений подтверждена экспериментальными исследованиями, выполненными на эксперимен-

-3-альном комплексе, имеющем в своём составе персональный компьютер, іудио - и специально разработанные программные средства.

Научная новизна.

Разработана методика распознавания слов в слитной речи при неиз-зестном законе распределения PC.

Предложены формулы представления акустических состояний n-мерной областью, свободной от типа распределения на основе неравенства Маркова.

Разработана методика лексической интерпретации слитной речи, которая позволяет формировать возможные варианты лексической гипотез произнесённого высказывания в пределах межфразовых пауз и выделить исчерпывающий набор вариантов последовательностей слов, акустически схожих с произнесённым высказыванием. Это позволяет повысить вероятность распознавания слитно произносимых указаний.

Разработана структура РИ, включая структуру системы распознавания слитной речи (СРСР). Последняя содержит построитель лексических гипотез с двумя типами блоков лексического анализа. Лексический анализ слитной речи реализован с использованием методики лексической интерпретации, основанной на обнаружении эталонов слов слитной речи в текущем PC, и методики распознавания слов в слитной речи - в части реализации математического представления АС n-мерной областью свободной от типа распределения. Все это позволяет реализовать понимание речевых сообщений через распознавание их лексических элементов.

Предложена методика экспериментального исследования PC на основе разработанного программного комплекса "Звукоинженер", предназначенного для интерактивной работы с речевыми базами данных на персональной ЭВМ для операционной системы Microsoft Windows 95, а также для визуализации, анализа и подготовки баз данных PC, позволяющая установить объём экспериментальных работ для достижения необходимой

-4-вероятности распознавания акустических состояний.

Практическая ценность заключается в создании дикгорозависимого речевого интерфейса с использованием специально созданного программного обеспечения - "Пойми Меня", которое предназначено для оперативного преобразования речевых указаний в команды управления и визуального отображения результатов распознавания.

Речевой интерфейс позволяет повысить функциональную возможность робота за счёт использования дополнительного режима речевого ввода информации. Ввод данных достигается слитным произнесением указаний на русском языке.

Разработанный речевой интерфейс может быть использован не только при создании новых интеллектуальных роботов и автоматизации технологических процессов производств, но и при модернизации существующих промышленных роботов, станков с ЧПУ, робототехнических ячеек и систем, устройств подготовки данных.

Модернизация заключается в повышении функциональных возможностей технологического оборудования, в том числе робота путём использования дополнительного канала ввода информации непосредственно с голоса. Это доступно практическому внедрению речевого интерфейса как на крупных, так и на малых предприятиях машино - и приборостроения. Капиталовложения на проведение этой модернизации не соизмеримо мало по сравнению с приобретением нового оборудования.

Результаты сравнительного анализа и экспериментального исследования, показали, что вероятность распознавания слитно произнесённых высказываний РИ достигает 97,4%. Кроме этого, использование РИ позволяет сократить трудоёмкость ручных операций и ускорить технологическую подготовку производства деталей типа "вал".

Результаты внедрения.

Результаты диссертационной работы внедрены на Станкостроитель-

- 5-ном заводе "Свердлов" при создании устройства подготовки данных для разработки УП с использованием РИ. Ожидаемый годовой экономический эффект от внедрения одной единицы устройства подготовки данных для разработки УП с использованием РИ составляет 7200 рублей в ценах 1998 года.

Основные положения диссертационной работы использованы в Ленинградском оптико-механическом объединении (ЛОМО) при проведении научно-исследовательских работ по совершенствованию процессов технологической подготовки работы робототехнических систем.

Предложенная структура дикторозависимого речевого интерфейса и организация его работы используются при проведении исследовательских работ по созданию роботов с голосовым управлением в Центральном Научно-исследовательском Институте Робототехники и Технической Кибернетики (ЦНИИ РТК).

Публикации.

По материалам диссертационной работы опубликовано 6 печатных работ, в том числе 2 патента РФ на изобретение.

Апробация работы.

Основные теоретические положения, результаты, выводы, рекомендации докладывались и обсуждались на:

- Российской научно-технической конференции "Инновационные нау
коёмкие технологии для России", г.Санкт-Петербург, 25-27 апреля 1995г.;

научной военно-технической конференции "Автоматизация проце-сов управления соединениями и частями ПВО, информационные технологии. Состояние и перспективы создания единой автоматизированной радиолокационной системы", г. Санкт-Петербург, 15-16 мая 1996 г.;

международной научно-технической конференции "Информационные технологии в моделировании и управлении", г. Санкт - Петербург,

25 -27 июня 1996 г.

Структура и объём работы.

Диссертационная работа состоит из 5 разделов, заключения, списка литературы и приложения. Общий объём диссертации состоит из 167 страниц машинописного текста, в том числе 146 страниц составляет основной текст, который поясняется 35 рисунками и 9 таблицами. Список литературы насчитывает 100 наименований.