Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Муравский Александр Викторович

Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений
<
Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Муравский Александр Викторович. Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений : Дис. ... канд. техн. наук : 05.13.18, 05.13.17 : Ростов н/Д, 2003 223 c. РГБ ОД, 61:04-5/1429

Содержание к диссертации

Введение

Глава 1

1. Методы моделирования слабо формализованных процессов в системах речевой коммуникации и их применение на ж.д. транспорте 13

1.1 Предпосылки использования речевых технологий на ж.д. транспорте 13

1.2 Использование композиционно динамического программирования в системах анализа СВП 23

1.3 Использование искусственных нейронных сетей в системах анализа СВП 27

1.4 Использование Скрытых Марковских моделей при анализе СВП 41

1.5 Структурно-логические методы в системах анализа СВП 50

1.6 Выводы 62

Глава 2

2. Методы формирования вторичных временных признаков на основе нечетких временных отношений 64

2.1. Значение временной информации и способы ее извлечения из необработанных данных 65

2.2. Представление спектрально-временной информации в речевых сигналах на основе структур нечетких временных отношений 75

2.3. Формирование оптимальных наборов нечетких временных признаков для баз знаний интеллектуальных систем анализа СВП... 90

2.4. Выводы 101

Глава 3.

3. Методы представления и обработки нечеткой динамической информации в базах знаний интеллектуальных систем 104

3.1 Организация базы знаний интеллектуальной системы на основе структур нечетких временных отношений 104

3.2. Методы обработки информации в моделях интеллектуальных систем на основе алгоритмов нечетко-логического вывода 111

3.3 Методы формирования и оптимизации баз знаний ИС на основе алгоритмов обучения 128

3.4. Выводы 146

Глава 4

4. Структурно - программные аспекты реализации интеллектуальных моделей анализа СВП в системах речевого распознавания 148

4.1 Состав и специфика речевого корпуса оператора технологического процесса сортировочной горки 148

4.2 Структура и принципы построения интегрированной системы автоматической классификации СВП 156

4.3 Программная реализация автоматизированного рабочего места для исследования СВП 166

4.4 Выводы 190

Заключение 191

Список литератуы 193

Введение к работе

В последнее десятилетие наблюдается возрастание требований общества к уровню автоматизации решения новых классов задач, увеличивающегося уровня сложности. К их числу, в первую очередь, относятся так называемые слабо формализованные или информационно сложные задачи, связанные с анализом, контролем и диагностированием сложных технических объектов, явлений и процессов. Такие задачи возникают при разработке автоматизированных управляющих или контролирующих систем, а также прикладных интеллектуальных систем, способных обеспечить эффективную экспертную поддержку принятия решений в сложных технических и информационно-технологических ситуациях.

Особый класс информационно сложных задач представляют собой задачи, связанные с качественным анализом и обработкой экспериментальных данных, характеризующих течение процессов различной природы и, в частности, задачи анализа и идентификации слабо формализованных временных процессов (СВП) - процессов, законы поведения которых неизвестны или недостаточно изучены. Характерными примерами таких задач являются задачи, связанные с визуальным анализом электрореограмм и динамограмм изменения контролируемых параметров в системах технической диагностики, задачи визуального анализа электрофизиологических процессов в системах медицинской диагностики, задачи идентификации и распознавания сложных акустических процессов в системах автоматического распознавания и синтеза речи и др.

Математическая модель СВП в общем случае должна описывать последовательность нескольких случайных или нечетких внутренне скрытых событий, явлений и подпроцессов, которые в результате взаимодействия приводят к достаточно сложной картине пересекающихся во времени внешне наблюдаемых признаков. Большое число практически важных задач, связанных с анализом и идентификацией СВП, сводятся к построению таких моделей, на основании которых можно было бы правильно восстановить последовательность внутренних состояний и подпроцессов СВП, обуславливающих его внешнее проявление, с целью идентификации самого СВП либо его отдельных фрагментов и принятия на этой основе управляющих либо контролирующих решений.

Характерными примерами СВП являются сложные акустические процессы и, в частности, речевые сигналы. Ключевой проблемой, возникающей при разработке моделей речевых сигналов в системах речевого распознавания является вариабельность речевых сигналов и, как следствие, отсутствие четкого соответствия между фонетическими единицами речи и реализации СВП, характеризующими эти единицы. Наличие множества "НЕ" - факторов, обусловленных неполнотой, неточностью и нечеткостью исходной информации об исследуемом процессе является отличительной особенностью слабо формализованных задач, которую необходимо учитывать при разработке математических моделей СВП.

Исследования специалистов показали, что практический успех а решении слабо формализованных задач и, в частности, задач анализа СВП может быть достигнут при использовании новых информационных технологий, основанных на взаимодействии точных аналитических методов теории принятия решений с нечетко-логическими моделями, основанными на представлении и обработки знаний. В частности, общепризнано, что совершенствование существующих систем автоматического распознавания речи (АРР) и создание новых систем АРР, удовлетворяющих повышенным требованиям по надежности распознавания, требует использования подходов, основанных на моделях представления и обработки всесторонних знаний о речевом сигнале, включая нечеткие экспертные знания о речевом сигнале и процессах речевосприятия. При этом нечетко-логические модели СВП могут быть использованы для поддержки решений, выработанных на основе аналитических, нейро-сетевых либо скрытых марковских моделях.

Для решения слабо формализованных задач, связанных с качественным анализом и моделированием сложных процессов и систем в настоящее время разрабатываются методы, основанные на алгебраических, логико-лингвистических и нечетко-логических моделях принятия решения. Большой вклад в становление и развитие теории построения алгебраических и логико-лингвистических моделей принятия решений внесли российские ученые Вагин В.Н., Горбатов В.А., Журавлев Ю.И., Кузнецов О.П., Нариньяни А.С., Осипов Г.С., Поспелов Д.А., Попов Э.В., Стефанюк В.Л., Финн В.К. и др. Большой вклад в развитие теории и практики построения интеллектуальных моделей анализа динамических систем и процессов, включая нечетко-логические модели, внесли ученые Аверкин А.Н., Берштейн Л.С., Вагин В.Н., Емельянов В.В, Еремеев А.П., Ковалев СМ., Мелихов А.Н., Потапова Р.К., Цемель Г.И., Ярушкина Н.Г. и др.

Однако, применение алгебраических и нечетко-логических методов для решения задач, связанных с качественным анализом и моделированием СВП, требует их определенного развития с учетом конкретных особенностей приложений. В частности, разработка интеллектуальных моделей СВП для класса речевых сигналов требует выбора семейства релевантных признаков, наиболее устойчивых к различного рода искажениям и одновременно допускающих возможность интеграции в них нечеткой экспертной информации о структуре речевого сигнала и особенностях речевосприятия. Также требуется разработка специального класса нечетко-логических моделей, способных оперировать данными прзнаками при выработке решений и допускающих возможность интеграции с существующими моделями анализа речевых сигналов, например, моделями, основанными на искусственных нейронных сетях. И наконец, поскольку модели нечетко-логического анализа являются качественными моделями, опирающимися на достаточно грубую исходную информацию об исследуемом "СВП, требуется разработка методов оптимизации параметров нечетких моделей с целью повышения их эффективности и адаптируемости в соответствии с вновь поступающими данными.

В рамках поставленных задач в первой главе диссертации проодится анализ известных методов моделирования речевых сигналов, на основании которого формируется вывод о том, что наиболее учстойчивой к различного рода искажениям является информация, характеризующая временные и нечетко-временные свойства речевого сигнала. Следовательно, при разработке системы АРР перспективным представляется подход, в основе которого лежит предположение о том, что речевой сигнал реализует процесс передачи нечетких временных зависимостей, в структуре которых содержится необходимая, которую можно использовать для поддержки процессов распознавания.

Исходя из сказанного, и с учетом выше перечисленных общих задач, возникающих при разработке методов анализа и идентификации СВП, в качестве объекта исследования диссертации выбран новый класс интеллектуальных моделей, основанный на структурах временных и нечетко-временных отношений. В соответствии с выбранным направлением исследования сформулирована основная цель работы.

Цель исследования. Целью исследования является развитие методов моделирования слабо формализованных временных процессов на основе использования структур нечетко-временных отношений и их применение в системах поддержки принятия решений на примере систем речевого распознавания.

В соответствии с поставленной целью в диссертации решаются следующие задачи.

1. Разработка методов представления и формализации обобщенных временных признаков слабо формализованных процессов в классе нечетко временных отношений с целью использования их в качестве вторичных признаков речевых сигналов в интеллектуальных поддерживающих системах речевого распознавания.

2. Разработка методов оценки информативности нечетко-временных признаков СВП и на их основе методов формирования оптимальных наборов вторичных спектрально-временнных параметров речевых сигналов для интеллектуальных поддерживающих систем речевого распознавания.

3. Разработка интеллектуальных моделей анализа слабо формализованных временных процессов с использованием нечетко-временных отношений в качестве единиц структурных знаний о моделируемом объекте.

4. Для предложенного класса моделей - разработка методов нечетко-логического вывода в качестве основного механизма принятия решений.

5. Для предложенного класса нечетко-логических моделей - разработка методов оптимизации и адаптации их параметров на основе механизмов обучения.

7. На основе предложенного класса нечетко-логических моделей разработка и программная реализация подсистем поддержки процессов речевого распознавания с целью экспериментальной проверки эффективности их использования в системах АРР.

Методы исследования. Для решения поставленных задач использовались методы теории распознавания образов, методы теории нечетких множеств и нечеткой логики, аппарат дискретной математики и теории графов, а также методы анализа и обработки дискретных сигналов.

Практическая проверка разработанных моделей осуществлялась путем программной эмуляции и проведения имитационных экспериментов на модельных и реальных задачах в области речевого распознавания.

Научная новизна работы заключается в решении важной научной задачи качественного анализа слабо формализованных временных процессов, имеющее существенное значение для развития методов математического моделирования сложных динамических объектов и систем.

К наиболее существенным научным результатам работы относятся следующие:

1. На примере речевых сигналов проведено исследование характеристик СВП с целью выявления новых классов релевантных вторичных признаков для систем принятия решений. Обоснована возможность использования нечетко-временных отношений в качестве релевантных и наиболее устойчивых к различного рода искажениям вторичных признаков СВП.

2. Предложена система и методы формализации вторичных признаков СВП на основе структур нечетко-временных отношений, допускающих возможность их использования в системах принятия решений как самостоятельно, так и в объединении с другими моделями представления информации о СВП, в частности с нейро-сетевыми моделями.

3. Разработан новый способ оценки информативности и формирования наборов вторичных нечетко-временных признаков СВП по критерию их дискриминативной способности, основанный на использовании линейных нейро-сетевых классификаторов во взаимодействии с генетическими оптимизационными алгоритмами.

4. На примере моделирования речевых сигналов предложена новая нечетко-временная модель СВП, предназначенная для использования в поддерживающих системах речевого распознавания.

5. Разработан комплекс программного обеспечения (ПО), для анализа акустических СВП. Программные модули, входящие в состав ПО, могут быть использованы при решении инженерной задачи построения системы АРР, предназначенной для интеграции в существующие системы управления технологическими процессами.

Практическая ценность. Практическая ценность работы определяется возможностью использования предложенных моделей в качестве поддерживающих модулей для интегрированных систем речевого распознавания. В частности разработаны:

1. ПО автоматизированного рабочего места, позволяющее проводить детальное исследование временной структуры акустических СВП, накопление, хранение и статистический анализ полученной информации.

2. Программная оболочка, позволяющая моделировать работу нейросетевых модулей систем АРР, на различных фонемных базах.

3. Подсистема поддержки распознавания на основе укрупненных спектрально-временных образов PC для системы АРР, позволяющая , повысить надежность распознавания на 5-7 %

Достоверность и обоснованность научных положений, выводов и результатов, сформулированных в диссертации, подтверждается доказательством утверждений и теорем, результатами вычислительных экспериментов на практических и модельных задачах, публикациями и апробацией работы на региональных, отраслевых и внутревузовских научно-технических конференциях, а также актами внедрения результатов работы.

Реализация результатов работы. Работа выполнялась в рамках хозяйственного договора при НИС РГУПС по разработке АРМа оператора технологических процессов на железнодорожном транспорте. Результаты работы прошли успешную апробацию в качестве модуля поддержки принятия решений в системе АРР, на примере АРМа ДСПГ и, также, применяются в учебном процессе.

Апробация работы.. Основные положения и результаты диссертационной работы докладывались и обсуждались на межвузовской конференции студентов, аспирантов и молодых специалистов .

Публикации. Полученные в диссертации теоретические и практические результаты нашли свое отражение в 8 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения общим объемом 190 страницы, а также списка литературы и приложений.

Использование композиционно динамического программирования в системах анализа СВП

Методы анализа акустических процессов (АП), основанные на принципах композиционно-динамического программирования (КДП-анализа), изначально использовались для целей временной нормализации PC [9]. Несколько PC, соответствующих одному и тому же речевому сообщению (слову) и имеющие разную продолжительность, путем соответствующей сегментации временных шкал приводятся к единой цепочки эталонных речевых единиц (ЭРЕ) - речевому эталону слова

При этом ЭРЕ подбираются исходя из минимизации накопленной меры различия между всеми ЭРЕ речевого эталона и соответствующими им речевыми сегментами PC. В результате, для каждого слова формируется речевой эталон в виде цепочки ЭРЕ вместе с соответствующими темпоральными транскрипциями - числом повторений эталонной единицы в PC.

Алгоритмы распознавания, основанные на КДП-анализе, сводятся к сопоставлению PC, представленного в виде дискретной последовательности элементов речи = ( (/,),5(/2),...,, ( )), со всеми речевыми эталонами словаря. В процессе сопоставления для каждого эталона осуществляется сегментация последовательности S, в результате которой максимизируется интегральная мера сходства (иногда минимизируется интегральная мера различия) между полученными сегментами PC и соответствующими ЭРЕ исходного речевого эталона. То слово, для которого соответствующий речевой эталон имеет наибольшую меру сходства с речевым сигналом S, выбирается в качестве кандидата на распознавание. Рассмотрим одну из возможных реализаций метода КДП-анализа в терминах нечетко-множественной модели, ориентируясь при этом на самый широкий круг приложений распознавания речи. і Пусть 5 = (?(/,),5"(/2),...,5(/д)) - речевой сигнал, представленный в виде дискретной последовательности элементов речи, а Е = (ёрё2,...,ёк)-речевой эталон некоторого, подлежащего идентификации в S, слова. Пусть для каждой эталонной единицы ё Є Е задана ее темпоральная транскрипция в виде нечеткой оценки числа возможных повторений Ate(n) (п = 1,2,...Л ) элемента ё в последовательности S. Предположим также, что задан некоторый способ вычисления интегральной меры сходства (различия) группы речевых элементов S. с эталонной единицей ё для любых S cz S и ё є Е, которую обозначим через б (S , ё). При сделанных предположениях, задача КДП-анализа сводится к нахождению в S такой подпоследовательности, следующих друг за другом сегментов, S =(Se],Se2,...,Sek), которая доставляет максимум (минимум) нечетко-числовому критерию Кпш (S\ Е) (ATniin (S \Е)) : 3. В полученном композиционном графе GE выберем пару вершин (s.,Sj) с наибольшим значением gft.(5/,5y) = д: Подпоследовательность S =(s.,sM,...,s.)(S ciS) является искомым сегментом в речевом сигнале S, наилучшим образом соответствующим речевому эталону Е. Значение х при этом характеризует нечеткую меру соответствия S и Е. Операция композиции графов в (а) должна быть конкретизирована под вид нечетко-числового критерия K(S ,Е). В рассмотренном алгоритме используется нечетко-мультипликативный критерий, которому соответствует "мини-минная" композиция графов, определяемая на основании формулы gg\sl,Sj) = Sc(g(sl,st)&g (si,sJ)). Следует заметить, что приведенный метод ориентирован на самый широкий класс критериев, выражаемых посредством аддитивно-мультипликативной нечеткой свертки. В частности, в случае использования аддитивного критерия, композиция нечетких графов сводится к классическому максиминному произведению матриц смежности g og (snsJ)-v(g(s!,sk)&g (sk,sJ)). Алгоритмическая оценка сложности рассмотренного метода - 0(N3) (N - число элементов в S) при том, что границы, подлежащего идентификации в S сегмента, заранее неизвестны. Если же, в исходном речевом сигнале, каким-либо образом, заранее задано начало сообщения, то сложность реализации алгоритма оценивается величиной 0(N2). При всех успехах в развитие методов КДП-анализа, в современных системах АРР алгоритмы пословного распознавания, основанные на "чистом" КДП-анализе, практически не используются, главным образом, из-за необходимости хранения большого числа контекстно-зависимых эталонов речевых сообщений. Тем не менее, методология, лежащая в основе КДП-анализа широко используется при решении многих важных частных задач, связанных с оптимальным сопоставлением дискретных временных последовательностей. В частности, к ним относятся задачи кластеризации речевых последовательностей, поиск оптимальных траекторий марковских цепей в СММ, оптимальное сопоставление символьных цепочек в задачах языкового моделирования. Суммируя все вышесказанное можно сделать следующие выводы: 1. Алгоритмы распознавания, основанные на КДП-анализе, широко применялись в устройствах АРР "первого поколения", которые в основном были ориентированы на адаптивное распознавание дискретной речи (изолированных слов) с небольшим словарем речевых эталонов . 2. При тщательном подборе речевых эталонов надежность распознавания таких систем достигает 93-96%, что является вполне удовлетворительным для несложных систем АРР, рассчитанных на речевой ввод изолированных команд, произносимых одним диктором.

Представление спектрально-временной информации в речевых сигналах на основе структур нечетких временных отношений

В рассматриваемом на рисунке случае сигма - пи ячейка настроена на последовательность фонетических элементов. При совпадении с пиками в спектро-временном представлении PC два окна фиксируют спектро-временную модуляцию частоты, соответствующую расстоянию между окнами. Таким образом, приведенная на рис. 5 сигма-пи ячейка является детектором комбинации гласных /и/ и /і/ (или низкой и высокой форманты) в слове "Вуди". Наличие такой комбинации фиксируется большими показаниями вторичных признаков вблизи точки 0.4 s на временной шкале.

Методы выявления спеткрально-темпоральных модуляций на основе функций Габора и сигма-пи ячеек ориентированы на использование в системах АРР во взаимодействии с традиционными методами обработки PC, основанными на ИНС и СММ. При этом в зависимости от особенностей организации системы АРР они могут входить в нее как часть основного модуля обработки как, например, в гибридной системе АРР [49], либо как часть извлечения вторичных параметров, как например, в системе Тандем [50].

Экспериментальные исследования, проведенные со спектрально-темпоральными параметрами PC основанными на сигма-пи ячейках и функциях Габора, показали их достаточно высокую эффективность, как при распознавании дикторонезависимой речи, так и при распознавании в условиях помех [60]. И, тем не менее, рассмотренные классы вторичных признаков не позволяют в полной мере раскрыть весь потенциал, заложенный в классе темпоральных признаков и эффективно его реализовать в современных системах АРР [107].

В первую очередь это связано с тем, что сигма-пи ячейки и Габор-функции не имеют осмысленной интерпретации в качестве элементов структурно-временного знания о PC, Это затрудняет интеграцию в них априорной экспертной информации о динамических особенностях PC и не позволяет использовать данные классы параметров в интеллектуальных моделях АРР, основанных на знаниях. Второй недостаток связан с большим числом всевозможных комбинаций спектрально-темпоральных параметров. При выборе 15 частотных каналов (/ є [1,15], f0 є [-14,14]) и окне анализа в 300 мс (/0 є [0,30]) число таких комбинаций составляет приблизительно 2-Ю6.

Такое большое число параметров, с одной стороны, ставит проблему выбора из них оптимального подмножества для использования в системах АРР, а с другой стороны, приводит к большим вычислительным затратам при их обработке в системе АРР.

Указанные недостатки обуславливают необходимость в поиске новых классов темпоральных параметров PC, опираясь на которые можно было бы формировать интеллектуальные модели АРР, в которые можно было бы интегрировать априорные экспертные знания о PC и которые допускают возможность объединения с традиционными моделями обработки PC, в частности - с моделями на основе стандартных ИНС. Такое объединение может быть реализовано в рамках гибридной подсистемы АРР, основанной на многоуровневых знаниях о PC и процессах речевосприятия.

Суммируя все выше сказанное, можно сделать следующие выводы: 1. Многочисленные экспериментальные исследования в области психоакустики, экспериментальной фонетики и физиологии подтверждают большую роль временных и спектро-временных модуляций в PC в слуховом восприятии речи. 2. Существующие способы представления спектрально-темпоральной информации о PC в виде параметрических функций Габора и сигма-пи ячеек имеют существенные ограничения на их использования в современных системах АРР, связанные с невозможностью интерпретации данных параметров в качестве единиц структурно- временного знания и трудностей интеграции в них априорной экспертной информации о динамических особенностях PC. 3. При поиске нового класса темпоральных параметров PC следует рассматривать в качестве слабо формализованного временного процесса, а сам процесс извлечения параметров в качестве процесса интеллектуального анализа динамических данных с привлечением знаний экспертов-фонетистов, а также знаний, выведенных на основе механизмов обучения. Ранее было установлено, что спектрально-темпоральные признаки являются наиболее надежными и устойчивыми к различного рода искажениям признаками PC. В настоящем параграфе исследуется возможность использования данного класса признаков в интеллектуальных системах АРР, основанных на знаниях. Процесс создания интеллектуальной АРР базируется на применении статистических, логических и нечетких методов для извлечения знаний из массивов экспериментальных данных и формирования на этой основе продукционных баз знаний (БЗ). Построение БЗ сводятся в основном к поиску отношений между объектами в источниках данных и формирования на этой основе продукционных правил БЗ.

Для динамических объектов важнейшими отношениями являются временные, а учитывая, что процесс анализа слабо структурированных PC принципиально связан с проблемой нечеткости принятия решений, БЗ интеллектуальных АРР должны образовывать нечеткие продукционные правила, опирающиеся на структуры нечетких темпоральных отношений. Следовательно выбрав нечетко-темпоральные отношения в качестве вторичных признаков PC можно сформировать эффективные модели PC, обеспечивающие, с одной стороны, возможность динамизации информационного процесса распознавания в интеллектуальных системах АРР, а с другой стороны, возможность адекватного моделирования творческого механизма человеческого мышления [129], имеющего нечетко множественный и континуальный характер из-за размытости границ лингвистических объектов, характерных для естественного языка:

Таким образом, выбор нечетких темпоральных отношений в качестве вторичных признаков PC является вполне обоснованным. Во-первых, тем, что временные отношения наименее подвержены различного рода искажениям, а следовательно могут выступать в качестве устойчивых признаков распознавания. Во-вторых, тем, что появляется возможность естественной интерпретации темпоральных отношений в качестве динамических единиц структурных знаний, что облегчает возможность интеграции экспертных знаний и знаний выведенных на основе механизмов обучения в БЗ интеллектуальных систем. В-третьих, тем, что для темпоральных отношений в рамках темпоральных логик разработаны эффективные правила вывода, обеспечивающие возможность автоматизации процессов формирования БЗ интеллектуальных АРР на основе структур темпоральных отношений, а также возможность адаптации и пополнения БЗ на основе механизмов обучения.

Методы обработки информации в моделях интеллектуальных систем на основе алгоритмов нечетко-логического вывода

Если рассматривать введенную выше модель нечеткого динамического высказывания (1) безотносительно конкретных особенностей всех, входящих в нее нечетко-темпоральных событий, интерпретируя последние в качестве элементарных логических переменных, то полученное выражение приобретает вид обычной темпоральной формулы. С учетом этого обстоятельства определение корректности нечетко-динамического высказывания можно сформулировать следующим образом.

Определение 4. Нечетко-динамическое высказывание Т называется семантически корректным, если соответствующая ему формула (множество формул) является выполнимой формулой темпоральной логики.

Для решения задач, связанных с анализом нечетко-динамических описаний на корректность, выявления логических противоречий,определения областей истинности и др. используется аппарат темпоральных логик [52]. Все методы решения выше названных задач, разработанные в рамках этого аппарата, естественно, подходят в данном случае и к моделям временных описаний на основе нечетких динамических высказываний.

Нечетко-динамические описания, являясь основными единицами представления знаний в исследуемом классе интеллектуальных моделей, входят предусловиями в нечеткие правила продукционной БЗ. Формальным представлением БЗ является тройка: НечеткоВремеинаяМоделъ= Ъ., ДТ,Т1 , (2) где Z - множество базовых элементов; DT - система нечетко-динамических правил, описывающих процессы принятия решений; П -система правил вывода. Уточним содержание составляющих приведенной модели представления БЗ. Множество базовых элементов Е, как это часто делается при определении формальных систем, будем считать многосортным и состоящим из следующих элементов: Е = {Et} - множество нечетких признаков (нечетко-темпоральных событий) с соответствующим множеством нечетких функционалов Ф = {F .}; R = {г } - множество подлежащих распознаванию речевых единиц; RT - семейство темпоральных отношений; О = {&,v,, —,} . множество нечетко-логических операций, определенных в одном из стандартных классов Т-норм и конорм. Множество ДТ в БЗ образует система нечетко-динамических правил ДТ = {dst : Т г= г } U {ds : г = Т }, имитирующих процессы принятия решений. Система правил вывода в рамках рассматриваемой модели БЗ включает два основных типа правил: формальные синтаксические правила вывода темпоральной логики ПЛ. и специализированные семантические правила нечетко-темпорального вывода П,. Семейство ПЛ., помимо общих правил вывода modus ponens и правила подстановки, включает проблемно-независимые правила вывода темпоральной логики Аллена. Они используются для пополнения БЗ новыми знаниями на основе стандартных процедур формально-логического вывода, а также для защиты БЗ от необоснованного включения в нее семантически некорректных описаний, полученных от экспертов на этапах начального формирования БЗ или сформированных автоматически в результате обучения. Семейство П, включает семантические правила нечетко-логического вывода, основанные на методах интерпретации PC, представленных в виде реализаций дискретного временного процесса S, нечетко-динамическими высказываниями продукционных правил БЗ. Процедура нечетко-логического вывода по нечетким правилам сводится к интерпретации антецедентов нечетких правил входными реализациями PC S. Полученные в результате нечетко-истинностные оценки антецедентов применяются к заключениям правил и затем используются в интеллектуальной АРР для верификации либо для корректировки решений (гипотез распознавания), принятых другими компонентами интеллектуальной АРР, основанными на нейро-сетевых или скрытых марковских моделях. Детально схемы нечетко-логического вывода для нечетких динамических правил будут рассмотрены в последующем параграфе. Следует отметить, что предложенная модель: БЗ принципиально отличается от известных моделей организации информации в реляционных БД тем, что, во-первых, она сформирована в виде совокупности независимых нечетко-динамических правил DT, которые могут автономно добавляться в БЗ или исключаться из нее, и, во-вторых, тем, что в нее включены процедуры пополнения знаний вместе с правилами нечетко-логического вывода, что позволяет реализовать механизм поддержки принятия решений непосредственно в БЗ, упростив тем самым основной механизм распознавания, реализованный в подсистеме верхнего уровня.Таким образом, на основании выше изложенного можно сделать следующие выводы. 1. Предложена новая нечетко-динамическая модель представления качественной временной информации в БЗ интеллектуальных систем, основанная на использовании нечетких темпоральных отношений в качестве элементарных единиц знаний. Являясь обобщением известных моделей формализации временной информации на случай нечетких временных событий, она служит основой для формирования нечетких темпоральных правил БЗ интеллектуальных моделей АРР, обеспечивающих поддержку процессов распознавания с опорой на структурно-временные свойства PC. 2. Разработана формальная модель БЗ интеллектуальной системы АРР, основанная на системе нечетко-динамических продукционных правил. Благодаря тому, что в предложенной структуре БЗ процедуры пополнения знаний совмещены с правилами нечетко-логического вывода обеспечивается возможность автономной реализации механизма поддержки принятия решений непосредственно в БЗ, что упрощает основной механизм распознавания, реализованный в подсистемах верхнего уровня АРР.

Структура и принципы построения интегрированной системы автоматической классификации СВП

При формировании БЗ на основе механизмов обучения основным источником знаний являются результаты экспериментальных данных,. представляющие собой множества реализаций PC или отрезков "речи, классификация которых заранее известна, то есть для каждой из реализаций обучающей выборки априори известно решение о принадлежности данной реализации или ее фрагмента тому или иному классу речевых сообщений или лексических и/или фонетических единиц.

Формирование БЗ сводится к поиску для каждого класса примеров реализаций PC обобщенных описаний, представленных в виде семантически корректных нечетко-динамических высказываний, на основе которых формируются нечеткие правила БЗ интеллектуальной АРР. Конечной целью при этом является формирование таких наборов нечетко-динамических правил, которые обеспечивают верный вывод решений для как можно большего числа примеров из множества обучающих данных. "Верный" вывод для реализации st на основе набора правил ГТ означает следующее. В случае, если s, принадлежит в обучающей выборке классу решений гк, то в наборе нечетких правил П должно существовать как минимум одно правило, предусловие которого принимает истинное значение (в нечетком смысле) на данной реализации, а в случае, если sf не принадлежит классу решений rk, то предусловия всех правил, входящих в набор П , принимают ложные (в нечетком смысле) значения на sr В приведенной постановке задача формирования БЗ сводится к известному в теории искусственного интеллекта классу задач обобщения [83]. В нашем случае адекватной моделью представления нечетко- динамического высказывания является граф, поэтому задача обобщения в исследуемом классе моделей сводится к задаче обобщению на графах. Для поиска обобщенных описаний на графах, в принципе, можно использовать алгебраические методы, основанные на поиске изоморфных наложений формируемых структур темпоральных отношений в структуры обучающих данных [85] . Однако эти методы в нашем случае эти методы не совсем подходят по ряду причин. Во-первых, они отличаются высокой вычислительной сложностью, что не позволяет их использовать для обучения и адаптации ИС непосредственно в процессе их функционирования в режиме реального времени. Во-вторых, сформированные обобщенные модели нечетко-динамических высказываний должны быть интерпретированы в БЗ в качестве осмысленных единиц знаний, то есть быть семантически корректными описаниями, а это накладывает дополнительные ограничения на процесс формирования обобщенных описаний. И тем не менее, исследуемый класс нечетко-динамических описаний имеет ряд особенностей, обуславливающих возможность разработки вполне эффективных методов обучения, пригодных для их практического использования в режиме реального времени. Главной особенностью является то, что исследуемые модели нечетко-динамических высказываний сформированы из элементарных пар временных отношений, которые можно интерпретировать в процедурах обучения в качестве независимых признаков. Это дает возможность упростить постановочную модель задачи обобщения, оперируя при этом не с теоретико-графовыми моделями описаний, традиционно используемыми в задачах структурного обобщения [93], а с более простыми теоретико-множественными моделями, используемыми в нечетком моделировании. Рассмотрим наиболее общую постановку задачи обучения, в схему которой укладываются большинство конкретных задач обучения для рассматриваемого класса моделей [54]. Пусть задано некоторое конечное множество классов решений (подлежащих распознаванию гипотез - речевых, лексических или фонетических единиц) R - { ,г2,...,/;} и соответствующее ему семейство обучающих примеров 97 = S \JS2 LJ...KJS , состоящее из объединения к множеств, элементами которых являются конкретные реализации PC sj є SJ (j — 1,2,...,к), принадлежащие соответствующим классам решений г. Пусть задано соответствие между обучающим семейством 97 и множеством решений R так, что каждому элементу s\ класса реализаций SJ однозначно сопоставлено некоторое решение rj из множества гипотез R.

Требуется на основании множества R и соответствующей ему обучающей выборки 97 реконструировать семейство В = Т1 иТ2 и...иҐ, состоящее из объединения к классов семантически корректных нечетко-динамических высказываний таким образом, чтобы для как можно большего числа примеров из 97 система нечетких правил П = П1 иП2 и...иП , образованная на основе реконструированных классов нечетко-динамических высказываний, обеспечивала верный вывод решений при минимальном числе правил в П.

Похожие диссертации на Интеллектуальные модели качественного анализа слабо формализованных временных процессов в системах поддержки принятия решений