Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Речевые технологии в автоматизированных системах массового обслуживания Фархадов, Маис Паша оглы

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Фархадов, Маис Паша оглы. Речевые технологии в автоматизированных системах массового обслуживания : диссертация ... доктора технических наук : 05.13.15 / Фархадов Маис Паша оглы; [Место защиты: Институт проблем управления РАН].- Москва, 2012.- 331 с.: ил. РГБ ОД, 71 13-5/61

Введение к работе

Актуальность темы. Диссертационная работа посвящена разработке теоретических основ и выработке практических решений проблемы применения речевых технологий в автоматизированных системах массового обслуживания (АСМО) с целью повышения открытости этих систем и облегчения доступа населения к информации и услугам. Актуальность проблемы доступа людей к информации на переходном этапе продвижения страны и мира к информационному обществу не вызывает сомнений. Быстро развивающиеся информационные и телекоммуникационные технологии проникают во все сектора экономики: в производство, в сферу услуг, в образование, в государственное управление, банковскую сферу, в частный бизнес и др. Наблюдается тенденция к социализации информации – нарастанию количества информации, которая необходима людям в их повседневной жизни. Помимо наличия знаний и информации, для развития информационного общества необходимо создание условий для того, чтобы члены общества имели доступ к информации и могли ее использовать. Бурное развитие технологий обостряет существующую во всем мире проблему информационного неравенства. Для России сложилась ситуация, когда темпы роста информатизации оказались выше, чем темпы развития компьютеризации и коммуникаций. Это привело к обострению проблемы неравного доступа граждан к информации, особенно малообеспеченных людей и населения отдаленных регионов. В качестве одного из средств смягчения этой трудной проблемы в диссертации рассматриваются речевые технологии, достигшие за последние годы достаточно высокого уровня качества и способные обеспечить гражданам дополнительный, а иногда и единственный, канал доступа к информационным и сервисным системам. Создание телефонных сервисов самообслуживания, речевых порталов и речевых браузеров повышает эффективность и открытость АСМО и решает актуальную народнохозяйственную и социальную задачу облегчения доступа населения к информации и услугам и обуславливает важность и необходимость выполнения исследований в данной области.

Цель работы состоит в разработке теоретических основ и практически значимых решений фундаментальных проблем использования речевых технологий в сетевых и телефонных системах массового обслуживания.

Были поставлены и решены следующие задачи:

- анализ современного состояния и тенденций развития автоматизированных систем массового обслуживания населения;

- анализ качества функционирования существующих распознавателей речи для создания речевого доступа к АСМО и экспериментальное исследование их свойств;

- разработка эффективного по затратам времени и по результативности речевого человеко-машинного интерфейса к АСМО как разновидности человеко-машинного взаимодействия;

- разработка и реализация метода автоматизированного накопления статистических данных об ошибках распознавания и методов и алгоритмов коррекции результатов распознавания на основе накопленных данных и знаний об ошибках;

- разработка системы оценок и аналитических моделей для сравнительного анализа и оптимизации сценариев речевого диалога с различными процедурами обнаружения и коррекции ошибок;

- разработка математических моделей для расчета вероятностно-временных характеристик обслуживания вызовов и оптимизации функционирования контакт центров с сервисами самообслуживания на базе речевых технологий;

- внедрение полученных результатов в практических системах с речевым интерфейсом.

Методы исследования. В диссертационной работе применены методы теории систем массового обслуживания, теории вероятностей, математической статистики, математического моделирования, теории цепей Маркова, теории управления.

Научная новизна. Новизна диссертации состоит в том, что впервые разносторонне исследованы русскоязычные речевые технологии, пригодные для организации интерактивного речевого взаимодействия клиентов с системами массового обслуживания, и разработаны теоретические основы и практические решения проблем, относящихся к использованию речевых технологий в АСМО с целью повышения доступности информации и услуг этих систем населению.

К основным научным результатам, полученным в диссертационной работе, относятся:

- выполнен теоретический анализ и экспериментальное исследование характеристик дикторонезависимых распознавателей русской речи с целью определения свойств машинной стороны интерактивного речевого интерфейса. Разработан аппаратно-программный комплекс для автоматизации исследований характеристик распознавателей речи и диалоговых взаимодействий в многоканальном режиме;

- исследован относительно малоизученный и трудный для реализации речевой человеко-машинный интерфейс, разработаны новые методы повышения эффективности диалогового взаимодействия и созданы практические рекомендации для разработчиков речевых приложений АСМО;

- разработаны новые методы и алгоритмы повышения устойчивости и надежности систем массового обслуживания с речевым интерфейсом;

- разработан и программно реализован метод автоматизированного накопления статистических данных об ошибках распознавания речи;

- разработан метод и алгоритм коррекции результатов распознавания на основе использования накопленных данных и знаний об ошибках;

- решена задача определения оптимальной величины порога показателя уверенности распознавателя в предлагаемой гипотезе для вызова процедуры подтверждения, позволяющая своевременно обнаруживать ошибки распознавания и сокращать среднюю продолжительность диалогов;

- разработана классификация сценариев речевого диалога и система вероятностных и временных оценок и аналитических моделей для сравнительного анализа сценариев с различными процедурами обнаружения и коррекции ошибок. Решена задача выбора оптимального сценария диалога на основе минимизации оценок продолжительности диалога с обеспечением заданной вероятности его успешного завершения;

- разработан комплекс математических моделей для расчета вероятностно-временных характеристик обслуживания заявок и оптимизации функционирования центров обработки вызовов с сервисами самообслуживания на базе речевых технологий.

Практическая ценность. Показана возможность и целесообразность применения речевых технологий в системах массового обслуживания. Разработаны практические рекомендации по речевому человеко-машинному интерфейсу и создана методология проектирования систем с речевыми технологиями. Разработанные принципы, модели и методы применены в первых в России прикладных системах телефонного самообслуживания различного профиля и в системах с нетрадиционным применением речевых технологий: веб приложение «Звуковой тренажер» и система речевого управления электронной картой г. Баку, для которой разработана методика адаптации турецкого языкового пакета для распознавания азербайджанского языка. Созданы универсальные блоки распознавания русской и азербайджанской речи, включающие словари и грамматики, и соответствующая им база аудио-файлов.

Применение результатов работы позволяет существенно расширить круг пользователей систем массового обслуживания, предоставив им удобный дополнительный, а иногда и единственный, канал доступа к услугам этих систем. Это обеспечит новый уровень информационных услуг, предоставляемых населению и организациям в режиме самообслуживания, а также повысит эффективность использования систем массового обслуживания.

Разработанные математические модели, алгоритмы и программы могут быть использованы для дальнейшего развития и совершенствования автоматизированных систем массового обслуживания.

Достоверность. Научные положения, выводы диссертации обоснованы с использованием теории массового обслуживания, теории вероятностей и математической статистики, теоретических основ программирования, а также проверены в процессе вычислительного эксперимента и подтверждены испытаниями на научно-исследовательском полигоне ИПУ РАН, актами внедрений, практическим применением в нескольких компаниях.

Связь с планом. Исследования по теме диссертационной работы проводились в соответствии с плановой тематикой работ Учреждения Российской академии наук Института проблем управления им. В.А. Трапезникова РАН, а также при поддержке РФФИ (гранты 05-08-18075-а, 08-08-01022-а, 09-08-01168-а).

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на Международной конференции «Distributed Computer Communication Networks. Theory and Application» (Тель-Авив, 1999 г., София, 2009 г., Москва, 2010 г.); Международной конференции «Математические методы исследования систем и сетей массового обслуживания» (Минск, 1998 г.); XIV международном симпозиуме по управлению большими системами «CONTROL’2000» (Тбилиси, 2000 г.); 8-ой Международной конференции «Проблемы управления безопасностью сложных систем» (Москва, 2000 г.); 16-ой Белорусской школе по теории массового обслуживания (Минск, 2001 г.); 9-ой Международной конференции «Речь и компьютер» (SPECOM’2004) (Санкт-Петербург, 2004 г.); Научной сессии Отделения информационных технологий и вычислительных систем РАН «Распознавание речи» (Москва, 2003 г.); II, III, IV Конференциях «Интеллектуальные услуги в телефонных сетях. Мобильный контент. Технологии и бизнес» (Виноградово, 2005 г., 2006 г., 2007 г.); IV, V, VIII, IX, X Международных форумах «Высокие технологии XXI века» (Москва, 2004 г., 2005 г., 2007 г., 2008 г., 2010 г.); Международной научной конференции «Проблемы кибернетики и информатики» (Баку, 2006 г.); Научно-практической конференции «Современные технические и программные средства обеспечения АСУ и АСУ ТП» (Москва, 2005 г.); Конференции «Перспективы развития робототехники для экстремальных ситуаций» (Москва, 2006 г.); Конференции «ИНФОТЕХ-2007» (Севастополь. 2007 г.); XII International Conference Speech and Computer (SPECOM'2007) (2007, Москва); International Workshop on Multiple Access and Queuing Systems MACOM-2008 (Saint-Petersburg, 2008); International Conference «Problems of Cybernetics and Informatics», 2008, 2010 Baku; I, II и III Международных конференциях «Управление развитием крупномасштабных систем MLSD», (Москва, 2007 г., 2008 г., 2010 г.); Российской конференции с международным участием «Технические и программные средства систем управления, контроля и измерения» (Москва, 2008 г., 2010 г.); IV Международной конференции по проблемам управления (МКПУ-IV) (Москва, 2009 г.); Международной конференции «Современные математические методы анализа и оптимизации информационно-телекоммуникационных сетей» BWWQT-2009 (Минск, 2009 г.), IX Международной конференции по финансово-актуарной математике и эвентоконвергенции технологий, Красноярск, 2010.

Результаты работы демонстрировались на 12 выставках (2003-2011 гг.) и неоднократно награждались медалями и дипломами.

Публикации. Результаты проведенных автором научных исследований опубликованы в 53 работах, среди которых 19 статей в ведущих рецензируемых журналах из списка ВАК России и 4 монографии.

Структура и объем работы. Диссертационная работа состоит из введения, 6 глав, заключения и приложения и содержит 324 страниц машинописного текста, включая 65 рисунков, 17 таблиц, а также список литературы (238 наименований).

Похожие диссертации на Речевые технологии в автоматизированных системах массового обслуживания