Введение к работе
Актуальность работы. Эффектирность использования современных быстродействующих ЭВМ . существенно сдерживается ограниченности средств ввода-вывода и может быть преодолена только путем создания систем как непосредственного чтения текстов а изображений, так и восприятия, человеческой речи, т.е. за счет решения соответствующих задач распознавания. Решение задач распознавания ситуаций также необходимо для создания интеллектуальных систем самого разного назначения Сробототехника, медицина и техническая диагностика, метеорология и т. д.).
.Теория распознавания как теоретическая основа проектирования, создания и эксплуатации различных опознающих устройств к сложных комплексов имеет такхе непосредственное отношение к наукам о человеке - к нейрофизиологии, психофизиологии, психологии И Др. , Важной стыковкой проблем исследования систем естептвенного я искусственного интеллекта становится сравнительный анализ процессов опознавания в естественных и искусственных системах. Это не только имеет прямое отношение к бионическим разработкам, но и позволяет глубже и детальнее раскрыть' механизмы опознавания в хивых системах.
Цель работы состоит в разработке и обоснавании новых детермкиистких методов классификаций, что невозможно без изучения теории отделимости множеств, и приложении этих методов к построению систем автоматического распознавания речи ССАРР).
К основным задачам исследования относятся:
отделимость ограниченных необязательно выпуклых и связанных множеств;;
разработка и верификация метода классификации, использующего решение предыдущей задачи, для первой стадии распознавания и стыковка его с процессом.сегментации речевого сигнала;
оценка метода по времени, используемым ресурсам и кадежости; . быстрая идентификация ошибочных кодовых последовательностей в больших словарях.
Научная новизна работы заключается в следующем:
-для сегментации, нормализации сигнала по времени и выделения
информативных частей используется измерение длительности переходных
участков; . .
-доказаны теоремы, лехащіе в оскове предлагаемых алгоритмов
обучения двух типов;
-разработан ковы?, процесс классификации и даны его оценки по используемой памяти и времени работы, не зависящие от длины обучающей последовательности;
-дан критерий представительности, оценки длины обучавшей последовательности к надежности распознавания для классов, представленных ограниченным-/ множествами;
-решена задача выбора системы признаков: исключение неинформэ.тизных, нахождение избыточных и их качественной оценки;
-разработан алгоритм идентификации ошибочных кодовых последовательностей в словаре.
Теоретическая ценность работы состоит:
-в развитии теории отделимости множеств: доказана новая георема об отделимости ограниченных множеств по одной координате при разбиении пространства R" на полуоткрытые дйзьвнктные ячейки, дана количественная оценка числа этих ячеек;
-в развитии детерминистской теории распознавания принципиально новым механизмом классификации, обеспечивавшим стопроцентную надежность на обучающей последовательности!
Практическая ценность состоит в простоте предлагаемых методов, а значит в уменьшении стоимости обслухиваваей аппаратуры , и программного обеспечения, решавших задачу распознавания речи в реальном масштабе времени для больших словарей.
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на: 15 Всесоюзном семинаре "Автоматическое распознавание слуховых образов" САРСО-15, Таллинн, 1989), 4-ой 'Всесоюзной конференции "Математические методы распознавания образов". СММРО-4, Рига, 1989), 1-ой Международной конференции "Информационные технологии для анализа изображений и распознавания образов" CITIAPR-1, Львов, 1990), 5-ой Всесовзной школе-семинаре "Бионика -интеллекта" (Харьков, 1991), 1-ой Всесовзной конферешля "Распознавание образов и анализ изображений: новые информационные технологии" СРОАИ-1, Минск, 1991), на семинаре в НС по комплексной проблеме "Кибернетика" АН СССР (1991).
По результатам вьшолненных исследований опубликовано 7 работ.
Диссертационная работа состоит из введения, пяти разделов, заклпчония и списка литературы (89 назв.) и содержит 87 страниц с 6 рисунками и 1 таблицей.