Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Меркулова Анастасия Геннадьевна

Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом
<
Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Меркулова Анастасия Геннадьевна. Физиолого-эргономическое обоснование требований оптимизации взаимодействия пилота с системой речевого управления летательным аппаратом: диссертация ... кандидата Биологических наук: 14.02.04 / Меркулова Анастасия Геннадьевна;[Место защиты: Научно-исследовательский институт медицины труда Российской академии медицинских наук].- Москва, 2016

Содержание к диссертации

Введение

ГЛАВА 1 Литературный обзор 13

1.1 Связь профессиональной речи специалистов авиационной области с надежностью работы эргономической системы «человек-машина» 13

1.2 Современные системы автоматического распознавания речи 25

1.3 Профессиональная нст как актуальная проблема современной медицины труда и авиационной медицины 40

ГЛАВА 2 Материалы и методы исследований 52

2.1 Цель и схемы эмпирического исследования 52

2.2 Эмпирическое исследование 1: изучение влияния профессиональной нст на характеристики речи 53

2.3 Эмпирическое исследование 2: изучение влияния шумового фактора и сиз органа слуха на характеристики речи 66

ГЛАВА 3 Анализ и обсуждение результатов исследования влияния профессиональной нст на характеристики речи 69

3.1 Сравнение экспериментальных данных группы пилотов ГА по фактору степени профессиональной НСТ 69

3.2 Сравнение экспериментальных данных групп с диагнозом «профессиональная НСТ» и без нарушений слуха 71

ГЛАВА 4 Анализ и обсуждение результатов исследования влияния фактора шума и сиз органа слуха на характеристики речи 76

4.1 Сравнение длительностей произносимых слов группы с профессиональной НСТ и группами без нарушений слуха 76

4.2 Результаты сравнения полученных характеристик речи в зависимости от заданных экспериментальных условий 78

Заключение 100

Выводы 109

Список использованных источников 112

Введение к работе

Актуальность. Постоянное усложнение авиационной техники с переходом
на современные типы воздушных судов сопровождается сокращением числа
членов экипажа с одной стороны, а с другой – увеличением продолжительности,
дальности и высоты полетов. Обеспечение безопасности таких полетов
существенно повышает уровень интенсивности нервно-психических

и эмоциональных нагрузок, а также приводит к возрастанию продолжительности их воздействия на функциональное состояние различных систем организма пилотов в течение всего рабочего времени и, особенно, в период полетного времени.

Из-за недостаточного учета психологических, психофизиологических, антропометрических и других возможностей человека в конструкции систем управления происходит примерно 30-40 % всех ошибок человека в авиации. По данным Международной организации гражданской авиации (ГА), за последние годы число авиационных катастроф, вызванных неполадками в бортовом оборудовании, снижается, но при этом возрастает число аварий, произошедших вследствие ошибок экипажа самолета (Мунипов В.М., Зинченко В.П., 2001; Авиационные происшествия, инциденты и авиакатастрофы в СССР и России, 2016). Причинами аварий называют: отвлечение внимания, забывчивость, нарушение инструкций, самонадеянность пилотов.

В связи с этим в настоящее время нельзя эффективно разрабатывать
и применять авиационную технику и системы управления воздушным
движением без учета эргономики, гигиены и физиологии труда. Авиационная
эргономика реально содействует предупреждению утомления,

профессиональных заболеваний и сохранению здоровья летного состава. Поэтому при конструировании современных воздушных средств необходимо разрабатывать наиболее эргономически эффективную систему взаимодействия пилота с бортовым оборудованием как человеко-машинной системы (пилота как человека-оператора и бортового оборудования как машины).

Одной из таких систем являются системы распознавания речевых команд (СРРК). Они рассматриваются как альтернативное средство, снижающее рабочую нагрузку на операторов критичных по безопасности систем управления. К таким системам можно отнести практически все виды

транспорта и, в особенности, военные и гражданские летательные аппараты. В настоящее время научное сообщество вкладывает огромные средства в разработки, призванные для решения проблем автоматического распознавания и понимания речи (Котомин А.В., 2012; Лютова Д.А., 2010; Al-Alaoui et al., 2008).

Одной из проблем при создании СРРК является изменчивость характеристик речи человека, а также воздействие факторов внешней среды, которые мешают надежному распознаванию. Изучение вероятностных характеристик вариативности речи в зависимости от функционального состояния говорящего и под влиянием внешних факторов необходимо для повышения эффективности существующих и создания новых речевых интерфейсов. Актуальность задачи обеспечения высокой вероятности правильного распознавания речевых команд обусловлена требованиями по обеспечению безопасности полетов.

Одним из профессиональных факторов, отрицательно влияющих как на здоровье летного состава, так и на произнесение слов, является шум. На некоторых летательных аппаратах, особенно вертолетах и устаревших моделях самолетов, уровни этого физического фактора могут существенно превышать предельно допустимые значения. Большим количеством исследований показано, что длительное воздействие интенсивного шума приводит к закономерному развитию профессионального заболевания органа слуха – двусторонней нейросенсорной тугоухости (НСТ), изучение которой является одной из старейших и разработанных проблем в медицине труда (Аденинская Е.Е., 2003; Измеров Н.Ф., Суворов Г.А., 2001; Илькаева Е.Н., 2009; Денисов Э.И., 2007, 2009; Gopal K.V., 2008; Boccalon P. et al., 2008; Shibi H., Davies H.W., 2008).

Уровень профессиональной заболеваемости, связанной с нарушением
слуховой функции, наглядно подтверждает неблагоприятное влияние шума
на состояние здоровья пилотов, на которых приходится основная доля
выявленных случаев НСТ. Поэтому в связи с комплексным подходом
в авиационной эргономике для разработки наиболее надежно

функционирующей системы «человек-машина» необходимо изучить все факторы, которые могут влиять на качество взаимодействия ее составляющих.

Цель исследования: изучить особенности изменения характеристик речи у испытуемых (здоровых, лиц с «профессиональной нейросенсорной тугоухостью») в условиях авиационного шума, шумоподавляющего эффекта авиагарнитур (средств индивидуальной защиты) и без воздействия фактора шума для совершенствования автоматизированной системы речевого управления летательным аппаратом.

Задачи исследования: 1) Разработать программу поэтапного изучения в экспериментальных условиях изменения характеристик речи у испытуемых и возможность ее распознавания существующей автоматизированной системой речевого управления летательным аппаратом.

  1. Выявить значимые различия в характеристиках речи в группе пилотов с нарушением слуха в зависимости от установленной степени профессиональной нейро-сенсорной тугоухости с учетом их психологических особенностей.

  2. Определить значимые различия характеристик речи между группой испытуемых без нарушений слуха и группой с диагнозом «профессиональная нейро-сенсорная тугоухость».

  3. Исследовать возможность существующей автоматизированной системы управления осуществлять распознаваемость речи у испытуемых с

профессиональной нейро-сенсорной тугоухостью.

  1. Выявить статистически значимые различия характеристик речи в зависимости от наличия воздействия шумового фактора и использования средств индивидуальной защиты (СИЗ) органа слуха в группе испытуемых без нарушений слуха с учетом их психологических особенностей.

  2. Исследовать автоматическую распознаваемость речи испытуемых без нарушений слуха в зависимости от наличия воздействия шумового фактора и средства индивидуальной защиты органа слуха.

Научная и теоретическая значимость работы. В работе показано, что снижение слуха по типу профессиональной НСТ оказывает существенное влияние на длительность и интенсивность произнесения слов, а также на качество их автоматического распознавания, вследствие чего целесообразно создание дикторозависимых СРРК для бортового оборудования летательных аппаратов.

Полученные результаты восполняют недостаточность изученности

влияния шума на характеристики речи и СИЗ органа слуха. Условия с подачей
шумового сигнала отрицательно влияют на произнесение слов: их скорость
произнесения уменьшается. Шумоподавляющие наушники позволяют

произносить слова с большей скоростью, чем без них. При распознавании в различных условиях применение спектральной и мел-спектральной параметризации речевого сигнала обеспечивает высокое качество распознавания речи даже в условиях шумового воздействия, а наименьшей надежностью и стабильностью обладает применение мел-кепстрального преобразования.

Практическая значимость и внедрения в практику. Материалы диссертационной работы были использованы для создания:

– Базы речевых данных «Тугоухость-МТ» (Свидетельство о регистрации электронных ресурсов № 19507 от 23.09.2013г.);

– Базы речевых данных «Шумозащита-МТ» (Свидетельство

о регистрации электронных ресурсов № 20415 от 21.10.2014 г.);

– Аудиобазы «Слух-Речь МТ». (Свидетельство о регистрации

электронного ресурса № 211955 от 25.09.2015 г.);

Получен патент на изобретение «Способ определения функционального напряжения организма человека при умственном труде» № 2546089 от 27.02.2015 г.

В ходе выполнения диссертационной работы разработаны и внедрены:

– Методические рекомендации «По оценке физиологических норм
напряжения организма человека, с учетом гендерных различий, при различных
видах трудовой деятельности (умственной, зрительно-напряженной,

физической)», утверждено решением Пленума Научного Совета №45 по «Медико-экологическим проблемам здоровья работающих» от 26.02.2015 г.;

– Информационное письмо «Нормативные уровни общей физической работоспособности для работников умственного, зрительно-напряженного и физического труда с учетом гендерных различий», утверждено решением Пленума Научного Совета №45 по «Медико-экологическим проблемам здоровья работающих» от 25.11.2015 г.

Результаты работы применены ФГУП «ГосНИИАС» при выполнении
плановых научно-исследовательских работ по теме «Исследования

по разработке помехоустойчивых алгоритмов речевого интерфейса комплекса бортового оборудования перспективных самолетов» (акт внедрения от 25.04.2016 г.). Полученные результаты используются в процессе преподавания на кафедре «Медицины труда ИПО» ГБОУ ВПО Первого МГМУ им. И.М. Сеченова Минздрава России (акт внедрения от 04.04.2016 г.).

Основные положения, выносимые на защиту:

  1. Длительно текущая патология слухового анализатора у пилотов в форме НСТ приводит к существенному изменению временных и спектрально-энергетических характеристик их речи.

  2. Изменение характеристик речи пилотов, страдающих НСТ, снижает надежность ее распознавания в системах речевого управления, что связано с высокой вариабельностью ее характеристик по сравнению с характеристиками речи нормально слышащих. Для повышения распознаваемости речи пилотов с нарушением слуха целесообразно использование индивидуальных эталонов их речи в системах речевого управления (дикторозависимый тип).

  3. Надежность распознавания речи в системах речевого управления зависит от типа параметризации речевого сигнала. В условиях воздействия моделируемого авиационного шума в пределах авиационных предельно-допустимых уровней и использовании пилотом СИЗ органа слуха оптимальные результаты обеспечивает использование спектрального и мел-спектрального типов параметризации речевых сигналов.

Апробация работы. Материалы исследования были представлены
на Всероссийской научно-практической конференции с международным участием
«Инновационные технологии в медицине труда и реабилитации» (Белокуриха,
2013), конкурсе молодых ученых XII Всероссийского Конгресса «Профессия
и здоровье» (Москва, 2013), V Всероссийской научно-практической

конференции молодых ученых и специалистов с международным участием «Окружающая среда и здоровье. Здоровая среда – здоровое население» (Москва, 2014).

Личный вклад автора. Автором осуществлено планирование, организация и проведение исследований, сформулированы цель и задачи, сформированы базы данных и проведена их статистическая обработка,

выполнены анализ и обобщение полученных результатов. Клинико-физиологическое обследование испытуемых выполнено при участии врачей-оториноларингологов на базе ЛОР-отделения клиники ФГБНУ «НИИ медицины труда». Процедура автоматического распознавания речи выполнена с участием ФГУП «ГосНИИАС». Личное участие автора в сборе и обработке материала – до 85%, в обобщении материала – 90%.

Структура и объем работы. Диссертация состоит из введения; четырех глав; заключения; выводов и списка литературы, включающего 241 наименование, из них 92 на иностранных языках; 7 приложений. Работа содержит 15 таблиц, 13 рисунков, 10 формул. Общий объем диссертационной работы 168 страниц.

Профессиональная нст как актуальная проблема современной медицины труда и авиационной медицины

Система распознавания речевых команд (СРРК) представляет собой такую информационную систему, применение которой связано со следующими ограничениями, обусловленными требованиями к безопасности полета: устойчивость работы системы, низкий уровень ошибок как при отсутствии акустических помех, так и при их наличии (шум оборудования в кабине пилота, шум двигателей и фоновая речь других членов экипажа).

При этом создание эффективной и надежной СЧМ заключается в поиске оптимального сочетания возможностей машины и человека. Необходимо не только грамотно спроектировать техническую часть, но и изучить свойства самого человека-оператора, его недостатки и преимущества.

Речь специалистов авиационной области также требует отдельного изучения, т. к. она является особой функциональной разновидностью речи, обслуживающей профессиональную сферу общения авиаторов, и напрямую влияет на управление летательным аппаратом с помощью СРРК.

Для понимания особенностей речевой функции необходимо рассмотреть особенности взаимодействия человека с окружающим миром с позиций психофизиологии и информационной теории.

Человек-оператор в СЧМ выполняет следующие функции: сначала он принимает и первично обрабатывает информацию, затем перерабатывает и сохраняет ее и на заключительном этапе переходит к процессу принятия решений.

С точки зрения теории распознавания информации главной функцией человеческой психики является восприятие изменений во внешней среде и адаптация внутреннего состояния организма и его поведения в соответствии с этими изменениями для получения максимального приспособительного эффекта, позволяющего обеспечить физиологическую целостность человека и получить резервы для существования на возможно большую временную перспективу.

Связь с внешним миром осуществляется посредством анализаторных систем, которые действуют всегда интегрированно и в постоянной взаимосвязи. Любой анализатор представляет собой сложную систему регулирования, состоит из рецептора, проводящих нервных путей и коркового центра в головном мозге.

Деятельность рецепторов, их свойства (чувствительность, избирательность и т.д.) изменяются в зависимости от оценки соответствующими областями головного мозга значения и качества полученной информации и регулируются в широких пределах. Знания о работе перцептивных систем организма человека в количественной форме позволяют с приемлемой для практики точностью решить вопросы проектирования рабочих мест операторов и их элементов, организовать информационные модели, выбрать диапазоны и ограничения условий взаимодействия человека с технической средой [129].

Нарушение синхронного взаимодействия перцептивных систем вызывает изменения в нормальном функционировании психики, ее отражательных и регуляторных механизмах. Особенно отчетливо эти эффекты проявляются в профессиях, связанных с необычными сенсорными стимуляциями: например, в деятельности летчиков отмечаются эффекты нарушения пространственной ориентации.

Самым главным анализатором человека является зрительная система. Но в свете рассматриваемой темы стоит обратить внимание на вторую по значимости систему – слуховой анализатор, с помощью которого осуществляется гомеостаз и связь с окружающим миром. На его основе формируется речевой способ передачи информации, являющийся одним из самых эффективных методов человеческой коммуникации.

В процессе функционирования слухового анализатора в сознании человека формируется ощущение звука [94, 97, 137]. Чувствительность слухового анализатора близка к абсолютной и позволяет в условиях абсолютной тишины слышать механические колебания, вызываемые трением молекул при броуновском движении. Парное взаимодействие ушей реализует «бинау-ральный эффект» или стереоэффект, позволяющий локализовать в пространстве точечный источник звука и выделить направление его перемещения.

Наибольшая острота слуха наблюдается у 15-20-летних, а затем она постепенно падает. При нормальном слухе величина порога слухового ощущения равна 0 дБ [95]. Зона наибольшей чувствительности до 40-летнего возраста находится в области 3000 Гц, от 40 до 60 лет — в области 2000 Гц, а старше 60 лет — в области 1000 Гц. С возрастом слуховая чувствительность на высоких частотах обычно падает на 20 и более дБ.

Для полноценного различения на слух всех звуков речи необходима сохранность всей или почти всей области слухового восприятия как в отношении частоты, так и в отношении интенсивности звука.

Общей теорией звука занимается акустический раздел физики. С точки зрения данной науки, звук представляет собой результат колебательных движений в какой-либо среде, осуществляемый действием какой-либо движущей силы и доступный для слухового восприятия. Акустика различает в звуке следующие признаки [22]: 1) высота, которая зависит от частоты колебаний; 2) сила, зависящая от амплитуды колебаний; 3) длительность – продолжительность звука с его количеством колебаний во времени; 4) тембр и спектр звука – индивидуальные качества акустических признаков звука [72]. При колебании голосовых связок как единого целого возникает основной тон звука. Он характеризуется наибольшей силой и самой низкой частотой. Но одновременно с колебанием всего аппарата связок колеблются и его части. При этом возникают тоны, которые выше основного тона – обертона. У звука с частотой основного тона 100 Гц обертоны будут в 200, 300, 400 Гц и т.д. Из сочетания основного тона и обертонов создаются сложные звуки, которые порождаются речевым аппаратом.

Также на возникновение сложных звуков влияет явление резонанса, т. е. способность полых тел (резонаторов), в силу того, что они имеют собственную частоту колебаний, реагировать на частоты, порождаемые источником звука (голосовыми связками). В основном резонаторы усиливают обертоны, но могут и избирательно ослаблять их. Поэтому у звука с частотой основного тона в 100 Гц могут оказаться усиленными и одновременно ослабленными разные обертоны. В итоге возникают сложные звуки, характеризующиеся различным тембром. Соотношение относительной силы основного тона и накладывающихся на него обертонов создает гармоническую структуру звука, которая определяет его тембр. При этом тембр звука отличается от тембра голоса.

Сложный звук, возникший в гортани в процессе артикулирования вследствие постоянного изменения конфигурации надгортанных резонаторных полостей, видоизменяется определенным образом: одни его составляющие усиливаются, другие ослабляются. Полость носа также является резонатором, но она свою конфигурацию не меняет. В силу особенностей устройства речевых резонаторов они реагируют не на конкретные частоты, а на их области, например, от 1000 до 2000 Гц. Области усиления в гармонически связанных диапазонах частот называются формантами.

Эмпирическое исследование 1: изучение влияния профессиональной нст на характеристики речи

Для обработки данных была выбрана вторая запись с предъявлениями трех слов: «масштаб» (44 раза), «пилотаж» (53 раза) и «навигация» (53 раза). Данная последовательность была взята с целью нивелирования фактора влияния других близкорасположенных слов на произнесение тестовых стимулов. Порядок следования слов – произвольный, конкретная последовательность вычисляется до начала эксперимента при помощи генератора равномерно распределенных случайных чисел, паузы между словами составляют 10–15 с. Эти меры принимались в целях исключения взаимного влияния слов. Остальные записи формировались для создания аудиобазы.

Первичная обработка проводилась с помощью средств универсальной программы работы с аудиоданными «Audacity». Каждое слово выделялось в виде спектрограммы, преобразованной из звуковой волны автоматическим быстрым преобразованием Фурье, в отдельный файл в звуковом формате «wav» – метод выделения звука, разработанный Jeremy R. Brown [227]. Полученный в результате первичной обработки набор файлов, содержащих по одной реализации слова, использовался далее для определения длительностей и интенсивностей произнесения слов. Эти же файлы подавались в программу автоматического распознавания путем сравнения с эталоном.

По звуковым файлам, содержащим отдельные реализации слов, был выполнен расчет длительностей всех реализаций и по известным формулам для оценки выборочного среднего и дисперсии вычислялись средние значения и среднеквадратичные отклонение (с. к. о.) длительности и интенсивности произнесения слов отдельно по каждому испытуемому.

Эталоны, применяемые для распознавания, формировались следующим образом. Среди данных какого-либо одного испытуемого выбирались для каждого из слов «пилотаж», «масштаб» и «навигация» по 15 реализаций каждого слова, наиболее близких по длительности к средней длительности соответствующего слова для данного испытуемого. Для получения эталона для каждой из 15 реализаций вычислялся параметрический портрет тремя типами параметризации (спектральный, мел-спектральный и мел-кепстральный). Параметризация представляет собой выделение из речевого сигнала параметров, которые несут в себе информацию, полезную для распознавания. Сначала из исходного речевого сигнала выделяются параметры, сжато описывающие сигнал с точки зрения дальнейшего процесса распознавания, после этого на основании полученных данных строится поиск нужного слова в словаре.

Полученный в результате параметризации эталон формировался как среднее параметрических портретов каждого слова по 15 реализациям. Такой подход позволяет заменять испытуемого, выбираемого в качестве эталона.

Таким образом, входными данными для программы автоматического распознавания являются распознаваемые записи отдельных реализаций слов и эталон, а выходными – число ошибок распознавания для каждого из трех методов параметризации (спектр, мел-спектр и мел-кепстр).

В качестве контролируемых признаков (параметров) речи рассматривались наиболее значимые признаки для создания СРРК: – длительность произнесения тестовых слов (средние значения каждого испытуемого) и ее среднеквадратичное отклонение (вариативность длительности произнесения) – спектрально-временные признаки речи; – интенсивность (громкость) произнесения тестовых слов и ее вариативность – амплитудно-частотные признаки речи; – количество ошибок автоматического распознавания тестовых слов путем сравнения их параметрических портретов с эталонными значениями – кепстральные признаки. Полученные оценки средних и среднеквадратичных отклонений (с. к. о.) рассматривались как случайные величины, имеющие собственные математические ожидания, дисперсии и стандартные ошибки. Методы параметризации в целях распознавания речевых команд Обработка речевых данных и распознавание речевых команд проводилось сотрудниками Федерального Государственного Унитарного Предприятия «Государственный научно-исследовательский институт авиационных систем» (ФГУП «ГосНИИАС»).

Для автоматического распознавания слов были сформированы образы слов на основе спектральных преобразований. Для формирования образа слова (параметрического портрета слова) использована методика вычисления параметров речевого сигнала, использующая следующую процедуру оценки спектральной плотности и параметров речи. Речевой сигнал для обработки в системе автоматического распознавания должен быть преобразован в вектор параметров. Далее рассматривается следующая последовательность преобразований исходного временного сигнала: - предыскажение сигнала (формула 1): x(n) = u(n)-a-u(n-l), а = 0,85...0,98; (1) - выделение кадра сигнала длительностью 20-40 мс из речевого фрагмента и взвешивание его при помощи окна Хэмминга (формула 2): s(n) = sin(ml + n\ 0 n Nftt-\, l = Nftt\ s (n) = wH(n)xs(n), 0 n Nm-l; (2) Г 2їт l wH (n) = 0,54- 0,46 x cos VNfft-lJ где Nfft - число точек быстрого преобразования Фурье (длина кадра), / - длина сдвига кадра анализа, т - номер кадра анализа.

После этого вычисляется модуль Фурье-образа анализируемого сигнала с помощью процедуры быстрого преобразования Фурье (формула 3). При этом весь диапазон частот, ограниченный частотой Найквиста, делится на заданное количество полос (20-40) и для каждой полосы вычисляется средняя амплитуда. В качестве характеристик для каждого кадра используется логарифм от средней амплитуды:

Сравнение экспериментальных данных групп с диагнозом «профессиональная НСТ» и без нарушений слуха

Представленные результаты свидетельствуют о том, что практически во всех экспериментальных условиях различия между мужской и женской подгруппами статистически значимы по параметру длительности произнесения слов: мужчины произносят тестовые слова быстрее женщин. Аналогичный вывод на уровне тенденции распространяется на неуказанные в Таблице 6 длительности тестовых слов. Также выявлено различие по выраженности психологического качества «нейротизм» – у женщин данный показатель более высокий, что соответствует литературным данным [53]. Значимых различий в интенсивности произнесения и вариативности показателей тестовых слов выявлено не было.

Вследствие того, что были выявлены различия произнесения слов в зависимости от фактора пола, необходимо определить, будет ли влиять данный фактор на речевые характеристики при сравнении показателей, полученных в разных экспериментальных условиях. Т. е. возможно ли проводить статистический анализ для всей выборки испытуемых (n = 60) или необходимо проводить исследования отдельно по подгруппам в зависимости от пола.

Поэтому для выявления совместного влияния фактора пола и серии эксперимента на исследуемые переменные была рассчитана общая линейная модель изменения длительности и вариативности слова «пилотаж» с помощью статистического метода однофакторного дисперсионного анализа с повторными измерениями. В Таблицах 8-10 представлены результаты полученных значимых данных. Остальные критерии анализа представлены в Приложении Д.

По результатам, полученным в статистическом анализе, можно сделать вывод, что совместного влияния фактора пола и фактора серии эксперимента на характеристики речи нет (p 0,05) как в длительности, так и в вариативности всех трех тестовых слов. Значимые различия проявляются только в изменении длительности произнесения слова между сериями, и на изменения длительности слов в разных экспериментальных условиях пол испытуемого не влияет (р 0,001). То есть, независимо от того, какого пола испытуемый – мужчина или женщина, длительность произнесения тестовых слов будет изменяться отсерии к серии одинаковым образом. Изменений в вариативности произнесения не происходит вообще (p 0,05), следовательно, даже в условиях шума, испытуемые без нарушений слухового аппарата контролируют свою речь. Графики оцененных средних представлены на Рисунках 8-10.

Результаты проведенного метода однофакторного дисперсионного анализа с повторными измерениями дает возможность использовать целостную выборку из 60 человек для сравнения показателей речи в различных сериях эксперимента.

Для определения того, каким именно образом изменяется длительность произнесения тестовых слов у группы без нарушений слуха в разных экспериментальных условиях, был произведен анализ сравнения средних по t-критерию Стьюдента для зависимых выборок. Статистически значимые результаты представлены в Таблице 11.

Выявлены статистически значимые различия между длительностями трех тестовых слов в парах «без шума и без наушников» и «без шума в наушниках»; «без шума и наушников» и «с шумом без наушников»; «без шума и наушников» и «с шумом в наушниками»; «с шумом без наушников» и «с шумом в наушниках» (p 0,01). Учитывая то, что большей достоверностью обладают изменения слова «пилотаж», стоит отметить, что также выявлено различие в парах «без шума и без наушников» и «с шумом в наушниках».

При этом в шуме без наушников испытуемые произносят слова дольше, чем в остальных трех экспериментальных условиях, что говорит о снижении биологической обратной связи: испытуемые хуже слышат себя, поэтому начинают растягивать слова и произносить их громче. Различий между сериями в наушниках нет, следовательно, СИЗ органа слуха позволяет говорить с привычной для себя скоростью, вероятно, за счет костной проводимости речевого сигнала. Стоит отметить, что средняя длительность в условиях с наушниками значимо меньше, чем в бесшумных условиях. Объяснение данному различию вытекает вследствие повышенного произвольного внимания [42], когда испытуемый прикладывает дополнительные усилия для осуществления выполняемой деятельности, более сконцентрирован (в данном случае на своем голосе) и показывает лучшие результаты. Эффектом снижения концентрации внимания (отвлечение на шум) объясняется удлинение произнесения слова без наушников. Следовательно, применение СИЗ органа слуха дополнительно помогает более комфортно и эффективно передавать необходимую речевую информацию. В случае пилотов – с другими членами экипажа и диспетчерскими центрами.

Далее были проведены сравнения по фактору выраженности психологических особенностей испытуемых, которые потенциально должны влиять на характеристики речи. Для каждого испытуемого был подсчитан основной результат по психологическим тестам, и относительно выраженности признака каждой тестовой шкалы он был причислен к группе либо со слабым проявлением признака, либо с сильным.

Сначала сравнение внутри группы испытуемых проходило по шкалам, соответствующим их темпераменту. Испытуемые были разделены на две группы по каждой из шкал в соответствии с методикой проведения теста (Приложение Б): «экстраверсия» (1 –экстраверты, 2 – интроверты) и «нейротизм» (1 – дисконкорданты, 2 – конкорданты). Сравнение производилось с помощью t-критерия Стьюдента для двух независимых выборок. Статистически значимые различия представлены в Таблице 12.

Статистически значимые различия есть в длительности произношения слова «пилотаж» во всех экспериментальных условиях и слов «масштаб», «навигация» во 2-х и 3-х экспериментальных условиях (p 0,05), а также в 4-х экспериментальных условиях для слова «навигация» – экстраверты произносят слова быстрее, чем интроверты. Аналогичный вывод присутствует на уровне тенденции для оставшихся вариантов произнесения слов в экспериментальных условиях. На уровне тенденций экстраверты также говорят громче и их громкость голоса более постоянна, чем у интровертов. При этом отсутствие значимых различий в длительностях слов «масштаб» и «пилотаж» в условиях без шума и СИЗ органа слуха можно объяснить тем, что с возрастом в силу условий жизни и профессиональной деятельности, человек становится социально адаптированным – его темпераментальные характеристики становятся менее выраженными (большую роль начинают играть черты характера, формирующиеся как раз в силу воспитания и социального окружения). Но в непривычных ситуациях (в условиях эксперимента), генетические темпераментальные черты, поэтому разница в речи становится более выраженной [9].

Значимых различий по внутригрупповому фактору нейротизма не выявлено, даже в случае выделения 3й группы – нормостеников. На уровне тенденций можно говорить о том, что эмоционально неустойчивые говорят быстрее, тише и их громкость голоса менее постоянна, чем у конкордантов. Для получения более подробных результатов было проведено сравнение испытуемых по темпераменту. Распределение испытуемых по 4 типам представлено на Рисунке 11.

Результаты сравнения полученных характеристик речи в зависимости от заданных экспериментальных условий

Однако в группе пилотов с диагнозом тугоухость даже для дикторозависимого варианта сохраняется высокий уровень ошибок, т. е. в смысле параметров речи отдельные испытуемые в группе плохо похожи сами на себя. Полученные результаты автоматического распознавания указывают на очень высокую степень разнообразия тонких характеристик речи, определяющих безошибочность распознавания, в группе с диагнозом «профессиональная НСТ». Полученная картина принципиально отличается от группы научных сотрудников с нормальным слухом, где доля ошибок распознавания для простой задачи из трех слов не превышает 0,5 % при выборе практически любого испытуемого в качестве эталона.

При сравнении пилотов с НСТ и другой группой без нарушения слуха (мужская и женская подгруппы) выявлены аналогичные различия, несмотря на то, что в силу различий способа записи данных, сравнить параметр интенсивности речи не удалось. Статистически значимые различия есть по всем показателям для слов «пилотаж» и «масштаб». Для длительностей произнесения слов «пилотаж, масштаб» и всех вариативностей произнесения слов p 0,001. При сравнении группы пилотов отдельно с каждой из подгрупп выявлены такие же значимые различия: мужчины и женщины без нарушений слуха говорят быстрее и менее вариативно, чем пилоты со снижением слуха. Но при этом сила различий более выражена при сравнении экспериментальной группы с мужской подгруппой.

Различия в длительности произнесения слов «пилотаж», «масштаб» и «навигация» можно объяснить через акустическую энергию формант, основной диапазон частот которых располагается около 300–4000 Гц. В силу некачественной биологической обратной связи пилоты с диагнозом «профессиональная НСТ» растягивают произносимые вслух слова для того, чтобы услышать звуковые форманты (с помощью вариативного увеличивая громкости голоса), совпадающие с частотами, которые они плохо слышат. Высока вероятность того, что статистически значимых различий внутри контрольной группы не выявлено из-за того, что у испытуемых по данным аудиограмм снижено звуковое восприятие речевых частот, соответствующих частотам стимульных слов, особенно на частоте 4 кГц. Поэтому формантными частотами объясняется и отсутствие статистически значимых различий при сравнении длительности слова «навигация» между экспериментальной группой и остальными испытуемыми без нарушения слуха: формантные частоты этого слова практически не совпадают со сниженными слуховыми порогами, в отличие от слов «пилотаж» и «масштаб».

Для выявления воздействия факторов шума и СИЗ органа слуха на характеристики речи были проведены четыре серии записей испытуемых без нарушения слуховой функции в различных экспериментальных условиях.

С точки зрения фактора пола были выявлены статистически значимые различия между мужской и женской подгруппами в разных экспериментальных условиях – мужчины произносят тестовые слова быстрее женщин.

При сравнении записей слов по факторам экспериментальных условий и пола испытуемого значимые различия были выявлены только в изменении длительности произнесения тестовых слов между сериями. Изменений в вариативности произнесения не происходит вообще, следовательно, даже в условиях шума, испытуемые без нарушений слуха с помощью биологической обратной связи контролируют свою речь.

При сравнении длительности слов в разных экспериментальных условиях выявлены статистически значимые различия между длительностями трех тестовых слов в парах «без шума и без наушников» и «без шума в наушниках»; «без шума и наушников» и «с шумом без наушников»; «без шума и наушников» и «с шумом в наушниками»; «с шумом без наушников» и «с шумом в наушниках» (p 0,01). Также выявлено различие в парах «без шума и без наушников» и «с шумом в наушниках» для слов «пилотаж» и «масштаб».

При этом в шуме без наушников испытуемые произносят слова дольше, чем в обоих экспериментальных условиях с наушниками, что говорит о снижении биологической обратной связи (испытуемые хуже слышат себя, поэтому начинают растягивать слова и произносить их громче) из-за нарушения саморегулировки организма. Различий между сериями в наушниках нет, следовательно, СИЗ органа слуха позволяет говорить с привычной для себя скоростью. Стоит отметить, что средняя длительность в условиях с наушниками значимо меньше, чем в бесшумных условиях. Объяснение данному различию вытекает вследствие повышенного произвольного внимания. Эффектом снижения концентрации внимания (отвлечение на шум) объясняется удлинение произнесения слова без наушников. Поэтому применение СИЗ органа слуха дополнительно помогает более комфортно и эффективно взаимодействовать с реципиентами сообщений. В случае пилотов – с другими членами экипажа и диспетчерскими центрами.

Сравнение параметров речи по фактору выраженности самочувствия, активности и настроения (опросник САН) статистически значимых различий не выявило. По шкалам опросника Айзенка значимым фактором оказался параметр экстраверсии-интроверсии: экстраверты произносят слова быстрее, чем интроверты, также на уровне тенденций экстраверты также говорят громче и их громкость голоса более постоянна, чем у интровертов. Выявлено, что фактор экстраверсии имеет более выраженное значение для испытуемых мужского пола. Поэтому факторы пола и экстраверсии должны учитываться для оптимизации систем распознавания речи.