Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Хроматиди Александра Феодосиевна

Исследование психофизиологического состояния человека на основе эмоциональных признаков речи
<
Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи Исследование психофизиологического состояния человека на основе эмоциональных признаков речи
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Хроматиди Александра Феодосиевна. Исследование психофизиологического состояния человека на основе эмоциональных признаков речи : Дис. ... канд. техн. наук : 05.11.17, 05.13.01 : Таганрог, 2005 154 c. РГБ ОД, 61:05-5/3659

Содержание к диссертации

Введение

1. Обзор литературы по параметрам речи и методам ее анализа 9

1.1. Технические и лингвистические характеристики речи 9

1.2. Методы анализа речевых сигналов 16

1.3. Эмоция как классификационный признак психофизиологического состояния человека 28

1.4. Выводы по главе 1 42

2. Моделирование речевого тракта и речевого сигнала .44

2.1. Математическая модель речевого тракта и речевого сигнала 44

2.2 Акустическая модель речевого тракта 66

2.3. Математическое описание эмоции 75

2.5. Выводы по главе 2 77

3. Экспериментальное исследование эмоциональной речи 79

3.1. Методика и схема эксперимента 79

3.2. Результаты экспериментальных исследований и их обработка классическими методами 86

3.3. Выводы по главе 3 100

4. Нелинейный анализ речи 101

4.1. Анализ речевого сигнала методами нелинейной динамики. Построение фазовых аттракторов 101

4.2. Определение характерных показателей динамики речи

4.3. Выводы по главе 4 115

5. Использование методов анализа речи для определения психофизиологического состояния человека-оператора 116

5.1. Обобщенная схема анализа речевого сигнала 116

5.2. Результаты анализа речевых сигналов диспетчеров СКЖД 119

5.3. Выводы по главе 5 123

Заключение 124

Библиографический список 127

Приложения 137

Введение к работе

С древних времен речь служила людям средством связи и общения друг с другом.

Попытки понять и изучить ее природу предпринимались давно, еще до нашей эры. Известно, что греческий ученый Пифагор, живший 2,5 тысячи лет тому назад, ставил различные опыты со звуками.

Акустическая информация, используемая при речевой коммуникации, характеризуется двойственной природой: с одной стороны, она материальна, так как распространяется в форме звуковых волн, с другой стороны, она является инструментом, с помощью которого передаются и понимаются мысли партнерами по коммуникации. В этом случае акустическая информация имеет знаковую функцию.

Речевые знаки обладают исключительной силой выражения. Они могут адекватно передавать даже сложнейшие нюансы мышления при условии, что они правильно и хорошо сформулированы и что слушатель обладает способностью воспринимать их [9,25,28-29,96]. Эта форма передачи внутренних состояний мыслительного сознания одного партнера другому называется рациональной функцией речи. Кроме того, у речи есть еще вторая, эмоциональная функция. Ей и будет посвящена эта диссертация. Когда речь используется в целях коммуникации, то между говорящим и слушающим как будто бы строится мост, с помощью которого выражается сиюминутное эмоциональное состояние говорящего.

Коммуникативная природа речи должна предполагать инвариантное выражение эмоциональных состояний говорящего. Выделяют следующие характерные признаки эмоциональных высказываний: особая контрастность по высоте основного тона, причём максимум контрастности при выражении изумления, динамичность произнесения, увеличение времени высказывания. Существуют преимущественно логические, эмоциональные и волевые интонации [5,11,17,18,79,95]. Акустический анализ речи позволяет выделить

5 формантные параметры и слоговые изменения. Эксперименты показали, что,

несмотря на широкий диапазон изменений интонации, в ней сохраняются

постоянные структуры-интонемы - как элементы коммуникации: вопрос,

повеление, угроза, совет, сожаление и другие. Отмечена важность изучения

именно "живой речи", а не отдельно произнесённых слов вне всякого контекста

и ситуации. Одним из методов такого исследования является обращение к

актёрской речи.

В данной диссертации также большая роль отводится нелинейному анализу экспериментальных данных. Интерес к такому подходу в решении задач речевой акустики имеет всевозрастающее значение. В данной работе ставится вопрос о возможности определения эмоций методами нелинейной динамики. Окружающий нас мир полон нелинейных явления и процессов, правильное представление о которых немыслимо без понимания возможности хаоса, а так же связанных с этим принципиальных ограничений на предсказуемость поведения сложных систем. Одно из направлений применения методов нелинейной динамики связано с проблемой обработки сигналов. За последние годы были предложны методики, позволяющие выяснить, произведен ли сигнал динамической системой, а так же получить информацию о свойствах и характеристиках этой системы. Таким образом, аппарат нелинейной динамики является инструментом исследования, позволяющим сделать заключение или предположение о структуре объекта, сконструировать его динамическую модель и т.д. Разработку методов и алгоритмов анализа сигналов можно считать важным направлением нелинейной динамики, непосредственно связанным с возможными приложениями.

Изучение речевых сигналов проводились многими исследователями и организациями. Наибольший вклад в теорию внесли Фант Г., Витт Н.В., Вилюнас В.К., Сорокин В.Н., Симонов П.В., и др. Экспериментальные исследования были выполнены Фроловым М.В., Таубкиным В.Л., Рейковским Я. и др. Разработаны множество приборов для анализа речи, например, анализатор эмоциональной речи, измеритель интенсивности речевых

высказываний и др. В том числе в ОКБ «Ритм» и на кафедре электрогидроакустической и медицинской техники ТРТУ в настоящее время проводятся совместные исследования по выявлению возможности анализа психофизиологического состояния человека-оператора с помощью его речи. Результаты исследований вошли составной частью в данную диссертационную работу.

Диссертация состоит из 5 глав, введения, заключения, библиографического списка и приложений.

В первой главе был проведен обзор литературы по параметрам речи и методам ее анализа. Рассматривались технические и лингвистические характеристики речи. Описывались психодиагностические типы голоса: голос как непосредственная данность, голос как объективация речи на акустическом уровне и опосредованная им устная речь. Поскольку разделить их довольно сложно, то проводилось поэлементное, признаковое описание. Это описание содержит габитусные, процессуальные, формальные и дополнительные характеристики. Так же большое внимание в первой главе уделялось изучению методов анализа речевых сигналов. Рассмотрены виды речевой диагностики, такие как непосредственный анализ речи (непосредственный контакт с испытуемым), слепой анализ речи (прослушивается «живая речь», без наблюдения испытуемого) и косвенный анализ (исследование записи речи). Поскольку в данной диссертации акцент делается на эмоциональную речь, то в обзоре литературы также внимательно изучалась связь акустических параметров речи с ее эмоциональной выразительностью.

Во второй главе рассматриваются математические и акустические модели речевого тракта и речевого сигнала. На основе методов физической акустики и электромеханических аналогий рассмотрены и проанализированы свойства акустических процессов в речевом тракте. Теория процесса была разработана применительно к динамике речи, которая учитывает податливость стенок речевого тракта, переменные граничные условия со стороны как губ, так и голосовых складок, изменения во времени площади поперечного сечения

7 речевого тракта, взаимодействие голосового источника с речевым трактом и

т.д. Детально изучались механизмы возбуждения акустических колебаний,

рассматривались источники акустической энергии, интенсивность звуковых

колебаний, частотная фильтрация в речевом тракте. Проведено математическое

описание речевого сигнала. Построена модель речевого сигнала, позволяющая

имитировать различные звуки.

Третья глава отражает экспериментальную часть данной диссертации. Она включает в себя методику и схему эксперимента, результаты исследований и их последующий анализ с выдачей рекомендаций по распознаванию эмоциональных состояний человека. В данной главе затронуты вопросы возможности стимулирования эмоциональных состояний у студентов. Для подобного рода исследований, в качестве эмоциональных стимулов применяются самые разные воздействия, важно, чтобы они были достаточно значительными для испытуемых. Также, глава 3 рассматривает пути, по которым можно проследить связь речевых параметров с индивидуальными и эмоциональными характеристиками. Первый путь - от анализа состояний и изменений в организме, вызываемых изменениями в состоянии к речевому сигналу. Второй - поиск связи между характеристиками речевого сигнала и состоянием говорящего. Анализ полученных экспериментальных данных состоял из нескольких этапов и включал в себя спектральный, фонетический и статистический виды анализа.

В четвертой главе описываются методы нелинейного анализа речевых сигналов. Применение методов нелинейной динамики было связано с недостаточной информативностью «классического» анализа. Поэтому введение дополнительных критериев позволило с большей точностью оценивать результаты экспериментальных исследований. Критерии, по которым происходила оценка эмоциональной речи, включают в себя, Ляпуновский спектр, размерность Каплана-Иорка, а так же построение фазовых портретов.

В пятой главе рассматривались возможности использования методов анализа речи для определения психофизиологического состояния человека-

8 оператора. В частности, исследовалась возможность построения

автоматизированной системы анализа. С помощью методик, разработанных в

главе 3, проанализирована речь диспетчеров СКЖД.

Библиографический список данной диссертации состоит из 122 наименований.

Приложения представляют собой: тест-опросник, выдававшийся студентам перед проведением эксперимента, уровнеграммы полученных речевых сигналов, восстановленные фазовые пространства речевых сигналов, а также справки о внедрении основных результатов диссертационной работы.

Таким образом, в диссертации защищаются следующие научные положения:

  1. Модели речевого тракта и речевого сигнала человека, учитывающие эмоциональную составляющую речи.

  2. Классификационные признаки эмоций, полученные при обработке результатов экспериментальных исследований эмоциональной речи.

  3. Результаты анализа речевого сигнала методами нелинейной динамики, хаотическая природа эмоциональной речи, основные нелинейные показатели (размерности, спектр Ляпунова).

  4. Функциональная схема анализатора психофизиологического состояния человека-оператора на основе его речевых высказываний.

Эмоция как классификационный признак психофизиологического состояния человека

В этом разделе будет уделено пристальное внимание такой проблеме как определение информативных признаков эмоций в речи человека. Это внимание обусловлено тем, что в настоящее время, в условиях постоянного роста требований, предъявляемых человеку современным производством, задача поиска путей диагностики состояния человека-оператора и оценки его надежности в сложных условиях деятельности приобретает большое научно-практическое значение.

Особенно ценным, для целей контроля за состоянием человека, представляется использование речевого канала, поскольку он легко доступен для наблюдения. В процессе эволюции животного мира появилась особая форма проявления отражательной функции мозга - эмоция [4]. Она отражает личную значимость внешних и внутренних стимулов, ситуаций, событий для человека, то есть то, что его волнует, и выражается в форме переживаний. Понятие «эмоция» используется так же и в широком смысле, как целостная эмоциональная реакция личности, включающая не только психический компонент - переживание, но и специфические физиологические изменения в организме, сопутствующие этому переживанию. Эмоции делят на положительные и отрицательные, то есть приятные и неприятные. Более сложными являются другие положительные (радость, восторг) и отрицательные (гнев, горе, страх) эмоции. П. В. Симонов [68,69,70] выделяет смешанные эмоции, когда в одном и том же переживании сочетаются и положительные, и отрицательные оттенки (например, получение удовольствия от страха в «комнате ужасов»).

В зависимости от личностных (вкусов, интересов, нравственных установок, опыта) и темпераментных особенностей людей, а также от ситуации, в которой они находятся, одна и та же причина может вызывать у них разные эмоции. Эмоции различаются по интенсивности и длительности, а также по степени осознанности причины их появления. В связи с этим выделяют настроения, собственно эмоции и аффекты.

Речевой сигнал предназначен, прежде всего, для передачи смысловой (то есть вербальной, словесной) информации, разработанные методы его субъективной и объективной оценки ориентированы в основном на определение именно этой функции, то есть разборчивости. Звуковая речь передает слушателю очень значительную невербальную (неречевую) информацию. Термин "невербальная коммуникация", можно определить как систему неязыковых (несловесных) форм и средств передачи информации. Учитывая, что человек обладает не только слуховыми, но и другими каналами восприятия и передачи информации: зрительными, двигательными (мимика, жесты), обонятельными и др., то существуют и различные виды невербальной информации: эмоциональная, эстетическая, личностная, социальная, медицинская и др.

Исследование различных видов и способов передачи невербальной информации имеет огромное значение для понимания процессов человеческого общения и общения в системе "человек-ЭВМ" [62,72]. Невербальная коммуникация обладает целым рядом особенностей, принципиально отличающих ее от вербальной коммуникации. Основные из них следующие: реализация одновременно через разные органы чувств (слух, зрение, обоняние и др.); эволюционная "древность" по сравнению с вербальной речью; независимость от смысла речи (слова могут значить одно, а интонация голоса - другое); значительная непроизвольность и подсознательность; независимость от языковых барьеров; выбор особых акустических средств кодирования и др.

В данной диссертации будет рассмотрен один из видов невербальной коммуникации - передача эмоций в речи, и связь ее с акустическими характеристиками. Действительно, воспринимая слухом речь или пение, мы получаем информацию, как о смысле речи, так и об ее эмоциональном содержании из анализа акустических характеристик, а иногда только из одних акустических характеристик, например, при прослушивании звукозаписей или речи по телефону. Следовательно, эмоции кодируются определенными акустическими параметрами в речевом сигнале.

Прежде всего, было установлено, что слушатели правильно идентифицируют эмоции в речи и пении независимо от понимания языка, текста и национально-культурной среды (в Азии, Америке, Африке и др.). Как показали эксперименты [8,13,21], когда слушателей просили опознать эмоции в голосах актеров, в качестве примера был воспроизведен текст на незнакомом языке, прочитанный двадцатью тремя актерами с различными эмоциями (радость, ирония, печаль, страх и т.д.). Был получен достаточно высокий процент правильных оценок независимо от культурного уровня слушателей и их национальности. Это совпадает с проведенными ранее экспериментами, когда предъявлялись фотографии с различными выражениями лица актеров, при этом зрители достаточно точно идентифицировали различные эмоции по выражению лиц. Таким образом, способы выражения эмоций являются общечеловеческими, то есть можно предположить, что существует некий единый код. Поскольку при речевом общении основной задачей является передача смыслового содержания, то эмоциональный аккомпанемент является как бы вторым планом, воспринимаемым нашим подсознанием. Это связано с тем, что невербальные способы общения имеют более древнее эволюционное происхождение. При пении (вокальной речи) акустический сигнал несет больше эмоциональной информации, чем обычная речь, для этого он и создается. Изучение вокальной речи, выполненное в работах многих исследователей (Морозова, Сандберга, Титце и др.), позволило получить дополнительную информацию о количественной связи выражения эмоций в различных акустических характеристиках сигнала, выделить наиболее характерные признаки для каждого вида эмоций, оценить восприятие слушателями этих признаков, установить физиологические механизмы создания этих акустических средств и т.д.

Акустическая модель речевого тракта

При акустическом моделировании каждый участок речевого тракта (полость, сужение) представляется в виде секции, параметры в которой можно считать распределенными равномерно [91]. Акустические параметры полостей речевого тракта неравномерно распределены вдоль его оси. На рис. 2.11 изображён схематический разрез речевого тракта при произнесении диктором гласных (и, о, у). Хотя конфигурация его полостей отличается сложной формой, можно выделить ротовую, глоточную и носовую полости. При образовании русских гласных проход из полости глотки в носовую полость закрыт нёбной занавеской. Полости рта и глотки разделены сужением, образуемым спинкой языка и нёбом. Второе сужение образуется с участием губ и двух рядов зубов.

Введем ряд упрощений, которые, с некоторым приближением позволят получить достаточно наглядное описание процессов происходящих в речевом тракте. По измерениям, площадь голосовой щели во время фонации не превышает 0,2-0,4 см ; площадь же поперечного сечения глотки имеет величину в 10-20 раз большую [72]. Поэтому голосовую щель можно рассматривать как источник с большим внутренним сопротивлением, т.е. как источник объемной скорости. При длине волны Л = с//0, значительно превышающей длину РА (/«1000Гц), допустима замена распределенных параметров на сосредоточенные. Составим электрический аналог акустической модели. Путем замены каждой полости Т-образной эквивалентной схемой получим схему, изображенную на рис. 2.11, в. Генератор ег является аналогом голосовой щели и представляет собой источник тока i0 с внутренним сопротивлением zr. Ток "і, проходящий через активное RH и индуктивное Z# сопротивления, представляют собой аналог объемной скорости в ротовом отверстии. Величины RH и LH -представляют собой сопротивление излучения и массу воздуха в ротовом отверстии.

Действие отражающего экрана учитывается коэффициентом KS(G ) входящим в формулу для сопротивления излучения. На низких частотах Ks(co)=l, на частотах около 2 кГц Ks(at)=l,7, а на более высоких частотах коэффициент Ks(co) опять уменьшается. В формулах выше коэффициент Ks(co) =2, что соответствует отражению от бесконечно большого экрана. Введем в схему рис. 2.11,в следующие упрощения: пусть хц соединено последовательно с большим внутренним сопротивлением генератора гг и им можно пренебречь. Сопротивления упругости х22 и х24 представляют соответственно небольшие области сжатия в ротовой полости между спинкой языка и нёбом и в ротовом отверстии. Их величина велика и поэтому ими также можно пренебречь. В диапазоне интересующих нас частот сопротивление нагрузки RH влияет на мощность излучения незначительно по сравнению с a LH.

Электрический аналог модели, составленной из двух полостей, можно рассматривать как систему связанных контуров с взаимным влиянием полостей на частотные положения формант. Собственные частоты F0 полостей определены графическим методом (см. рис. 2.9) по точкам пересечения кривых Ы — Xcj И Хи — Хс2- При ЭТОМ ИМееМ ОЧеВИДНЫе равенства Хц = XQI, Ы = XQ2 Оказалось, что F0i =400 Гц и F02 =1750 Гц. Так как отличия собственных частот полостей и формантных частот не велики, то можно сделать вывод: для звука [і] частота первой форманты определяется главным образом задней полостью, а второй - передней. Однако эта зависимость для других звуков может быть иной. Так, для [у] частота Fi определяется скорее ротовой полостью, a F2 - глоточной, т.е. порядок формант (первая, вторая) определяется не порядком полостей, а их размерами. Это и приводит к казалось бы необоснованному объединению губных и заднеязычных по дифференциальному признаку низкий.

Итак, формантная модель учитывает место сужения в ротовой полости, площадь поперечного течения полостей и степень огубленности. Для описания способа образования используются сигналы основного тона и тон-шум, а интенсивности - значение амплитуд первых двух-трех формант. Таким образом, формантная модель может быть описана пятью-семью параметрами, полоса частот каждого из которых составляет 8...14 Гц. Частота формант обратно пропорциональна общей длине тракта. Из-за распределенного характера постоянных РА каждая полость оказывает влияние на значения всех формант, формантное распределение для звуков является точным отражением конфигурации РА. Обратный переход от распределения формант к форме РА из-за компенсаторных явлений неоднозначен. Такое представление хорошо согласуется с моделью образования гласных.

Итак, ранее было приведено математическое описание речевого сигнала. Однако так же были проведены экспериментальные исследования, направленные на получение моделей сигналов близких к реальным. Полученные модели для проверки их адекватности были сопоставлены с реальными сигналами. Моделирование осуществлялось с помощью программы MathCAD. Полученные данные приведены ниже.

Результаты экспериментальных исследований и их обработка классическими методами

Перед тем как перейти к результатам экспериментальных исследований рассмотрим два пути анализа связи речевых параметров с индивидуальными и эмоциональными характеристиками.

Первый путь — от анализа состояний и изменений в организме, вызываемых изменениями в состоянии к речевому сигналу [51,64,78]. Обсуждая проблемы физиологического контроля состояния, довольно трудно описать изменение биофизических характеристик при сдвигах состояния. Это в значительной мере затрудняет анализ возможных изменений в речевом сигнале. Однако можно перечислить ряд довольно очевидных факторов, которые могут повлиять на процесс речеобразования. Прежде всего, в случае отклонения эмоционального состояния от нормы можно ожидать дестабилизации процесса порождения речевых сообщений. На психолингвистическом уровне это должно приводить к определенному упрощению структуры высказывания, использованию простых, привычных, автоматизированных структур [53,61,63]. Крайним проявлением дестабилизации может быть проявление сбоев, ошибок в грамматико-синтаксическом оформлении высказывания. На биофизическом уровне дестабилизация механизма управления речеобразованием проявляется в увеличении разброса значений характеристических параметров отдельных звуков [65,76,77]. Сдвиг средних значений тех же параметров в принципе может быть связан с наличием той или иной эмоции у говорящего, но вероятно при любом уходе состояния от нормы можно ожидать увеличения разброса. Можно рассмотреть и более тонкие процессы, влияющие на характеристики речевого сигнала и позволяющие указать в качестве подозрительных такие параметры, как значения ширины формант, значения частот основного тона и характеристик кривой мелодии основного тона, соотношение высокочастотных и низкочастотных частей интегрального спектра [66].

Второй путь поиска связи между характеристиками речевого сигнала и состоянием говорящего направлен от анализа вариативности параметров речевого сигнала к выявлению эмоциональных факторов, определяющих появление вариативности [69,73-75]. То есть на первом этапе прослеживаются пределы изменчивости отдельных речевых параметров и только потом выявляется, не связана ли эта изменчивость с колебаниями в состоянии. В данной работе анализ будет проводиться на основе вариативности параметров речи. Как уже было сказано в пункте 3.1, анализ акустических характеристик речи начинается с записи речевого сигнала. По методике описанной в том же пункте, была выполнена регистрация эмоциональной речи. Для профессиональных актеров она состояла в моделировании следующих состояний: спокойствие, гнев, радость. Для группы студентов были выбраны следующие состояния - спокойствие, радость, гнев, отвращение, раздражение, печаль, сомнение. Регистрация сигналов осуществлялась в программе Cool Edit Pro. Она заключалась в следующем: при компьютерной обработке, на первом этапе, происходит запись усредненного за некоторый отрезок времени уровня звукового давления от времени - уровнеграммы.

Представляя сигнал в подобном виде можно оценить распределение формант, показатели которых являются основными для оценки эмоциональных состояний. К сожалению, с помощью программы Cool Edit Pro численные значения формант определяются «на глаз», поэтому для точного определения значений использовалась программа Praat. Она позволяет производить фонетический анализ сигналов, который представлен на рисунке 3.7. Данный вид анализа позволяет отслеживать распределение интенсивности произношения того или иного слова, распределение высоты звука, а так же рассматривать треки формант. Помимо распределения формант, в программе Praat вычислялись значения частоты основного тона, интенсивности, высоты и длительности речевого сигнала. Полученные данные были сведены в виде таблицы в программе Excel. Фрагмент таблицы приведен ниже.

Картон сомнение 0,060 53,93 297,71 747,67 1244,3 Подобного рода таблицы были созданы для всех испытуемых, а так же для актеров. Были произнесены слова (картон, тихо, посуда, молоко) с определенными эмоциями (спокойствие, радость, гнев, отвращение, раздражение, печаль, сомнение). На основе полученных данных был проведен статистический анализ.

Определение характерных показателей динамики речи

Поскольку критерием хаотической динамики служит присутствие положительного старшего ляпуновского показателя, представляет большой интерес возможность его оценки на основании обработки записи реализаций (временных рядов) [120]. Предложенная для этой цели процедура (Wolf и др., 1985; Eckmann и др., 1986) состоит в следующем.

Сначала производится реконструкция аттрактора в фазовом пространстве методом запаздываний и определяется размерность вложения т. Дальнейшая последовательность действий похожа на алгоритм Бенеттина .

Отслеживаем теперь траектории, стартующие из точек х\ и xi, пока через некоторый следующий период времени Т2 расстояние не превысит тах, и вычисляем отношение є\ I -,. Поэтому, вычисляя сумму Sm =2 1 Я,, последовательно для т=1,2,..., получим в результате сначала положительные, а потом отрицательные величины Sm (рис.4.5). Найдем такое т, что Sm 0, но Sm+i 0. Если рассмотреть подпространство, образованное векторами возмущений, которые отвечают первым m ляпуновским показателям, то в этом пространстве объем облака изображающих точек будет возрастать в процессе динамики. С другой стороны, в подпространстве, ассоциирующемся с количеством ляпуновских показателей на единицу большим, объем будет уже сжиматься. По остальным измерениям фазового пространства, которым отвечают ляпуновские показатели Лт+2, ... л N, сжатие происходит ещё быстрее, и эти измерения игнорируются. В частности S] есть старший Ляпуновский показатель Я\, максимальное значение Sm отвечает КС-энтропии h, SN есть отрицательная величина d, характеризующая сжатие фазового объема при конденсации облака изображающих точек на аттрактор. Точка пересечения графика, образованного отрезками прямых, с осью абсцисс дает ляпуновскую размерность по формуле Каплана-Иорка (12.32) В соответствии с рассмотренными формулами был рассчитан спектр Ляпунова, т.е. параметры {Лі, Л2....Л }. Если все Л 0, то это говорит об асимптотической стабильности траекторий. Если главный показатель Я=0, то это отражает неэффективный линейный анализ для определения стабильности/нестабильности траекторий по Ляпунову. Если одна из экспонент Л 0, то это говорит о наличии хаоса в системе. В таблице 4.2. представлены рассчитанные показатели Ляпунова (Ляпуновский спектр) в зависимости от эмоционального состояния говорящего [116].

Соотношение (12.32) называют формулой Каплана-Иорка по именам исследователей, предложивших ее в 1979г [4,118]. Первоначальная гипотеза состояла в том, что эта формула позволяет вычислять информационную размерность аттракторов. Для хаотических аттракторов двумерных обратимых отображений, у которых Л1 0 и Л2 0, это утверждение доказано строго. Однако в общем случае доказать предположение Каплана-Иорка не удается, и, по-видимому оно не справедливо. В то же время, численно оценка размерности по формуле (4.7) получается хорошей. Соломоново решение, принятое научным сообществом в отношении формулы Каплана-Иорка, состоит в том, чтобы рассматривать ее как определение новой фрактальной размерности, которую называют ляпуновской размерностью. Большое практическое преимущество этой размерности состоит в простоте ее вычисления, поскольку для этого требуется только спектр ляпуновских показателей. Формулу (4.7) можно иллюстрировать графически, если изобразить зависимость сумм ляпуновских показателей от числа слагаемых и соединить точки ломаной линией (рис.4.5). Точка пересечения графика с осью абсцисс как раз соответствует размерности DL, подсчитанной по формуле Каплана-Иорка. График позволяет также рассмотреть взаимное соотношение между несколькими существенными для нелинейной динамики характеристиками аттрактора. В частности, максимальное значение Sm отвечает сумме положительных ляпуновских показателей, так называемой энтропии Колмогорова-Синая аттрактора h.

В данной главе, как уже упоминалось выше, анализ речевых сигналов был выполнен методами нелинейной динамики, позволившими выявить параметры, характеризующие эмоциональную речь. На основании проведенных исследований можно сделать следующие выводы: первый показатель спектра Ляпунова всегда положителен, что свидетельствует о хаотической природе речи; рассчитанные значения внедренной размерности и времени задержки позволили восстановить фазовые портреты речевых высказываний; анализ геометрии полученных фазовых портретов (аттракторов) показал, что каждому эмоциональному состоянию человека соответствует определенная геометрия аттрактора. Причем она не зависит от индивидуальности голоса, поэтому может служить классификационным признаком психофизиологического состояния испытуемого; максимальное значение размерности Каплана-Иорка находится в пределах от 2,8 до 3,1 и соответствует эмоции "гнев", а минимальное значение от 1,3 до 1,6 соответствует состоянию "спокойствие". Таким образом, размерность Каплана-Йорка может служить количественной мерой эмоционального состояния человека. В общем можно сказать, что исследование речи с помощью методов нелинейной динамики является дополнением к традиционным исследованиям и позволяет провести уточнение оценок психофизиологического состояния человека.

Похожие диссертации на Исследование психофизиологического состояния человека на основе эмоциональных признаков речи