Введение к работе
Актуальность работы. Изучение процессов обработки информации в зрительном восприятии является чрезвычайно значимой задачей для решения фундаментальных задач психологии и для практики построения систем машинного зрения (Уинстон, 1978). Восприятие отдельных, простых признаков зрительного стимула изучено уже достаточно хорошо, и нейрофизиологическая основа этого процесса в целом ясна (Соколов, 2003). Однако интеграция этих отдельных признаков, которая необходима для построения предметных образов, остается до конца не изученной (Treisman, 1999). Фундаментальная проблема «связывания» различных мозговых систем, и в частности, проблема интеграции признаков в зрительном восприятии, является одной из наиболее активно обсуждаемых в современной психофизиологической литературе (Roskies, 1999; Schmidt, 2009). На данный момент не существует общепринятого решения проблемы «связывания», хотя представлен ряд конкурирующих гипотез. Проблема интеграции признаков тесно связана с более общей проблемой функциональной организации мозговой деятельности (Singer, 1999). Таким образом, выявление механизмов интеграции признаков и восприятия сложных объектов является актуальной задачей для психофизиологии (Соколов, 2010).
В векторной психофизиологии построены модели восприятия отдельных признаков зрительного стимула - цвета, светлоты, ориентации линии. (Соколов, 2003). Построение моделей восприятия сложных стимулов, интегрирующих эти и другие базовые признаки, является важной задачей для развития теории векторного кодирования информации в нервной системе (Измайлов, Соколов, Чудина, 2005).
Методолого-теоретической основой работы являются теория векторного кодирования информации в нервной системе, а также методологический принцип «Человек - Нейрон - Модель» (Соколов, 2003). Методология данного исследования сочетает психофизиологическую
парадигму анализа мозговой активности, основанную на многоканальной регистрации электрических процессов в головном мозге человека, а также психофизическую парадигму анализа субъективных характеристик и объективных показателей процессов различения в сенсорной системе.
В соответствии с выбранной методолого-теоретической основой работы в тексте используется ряд специальных терминов. Здесь и далее под словом «признак» следует понимать любую характеристику зрительного стимула, различение которой производится зрительной системой. Различение отдельных признаков осуществляется нейросетевыми «модулями» зрительной системы. Такие модули составлены из одного или нескольких «каналов» - параллельных путей анализа зрительной информации. О многоканальном модуле различения признака говорят, если в его состав входят несколько каналов, имеющих какие-либо функциональные отличия друг от друга и совместно осуществляющих кодирование признака.
В работе также используется такой конструкт теории векторного кодирования информации в нервной системе, как «сферический закон нормировки векторов возбуждения». Суть сферического закона заключается в том, что длина вектора возбуждения, равно как и вектора связей, для любого нейрона является константой.
Основной целью исследования является изучение мозговых механизмов интеграции признаков в зрительной системе человека на основе комплексного психофизического и психофизиологического исследования.
Объект исследования - процесс интеграции признаков в зрительном восприятии человека.
Предмет исследования - особенности мозговой организации процессов интеграции признаков в зрительном восприятии человека. Задачи исследования:
1. Разработать экспериментальную процедуру исследования
функционирования зрительной системы в процессе интеграции признаков.
Разработать и валидизировать новую методику исследования различения стимулов зрительной системой, основанную на использовании задачи зрительного поиска.
Провести психофизическое исследование интеграции однородных признаков (линий) в зрительной системе человека.
Провести психофизическое исследование интеграции разнородных признаков (ориентации линии и светлоты) в зрительной системе человека.
Провести психофизиологическое исследование зрительной системы в процессе интеграции признаков.
Теоретическая гипотеза исследования: интеграция признаков в зрительном анализаторе осуществляется нейронными сетями, организация которых соответствует принципам теории векторного кодирования информации в нервной системе.
Частные гипотезы:
Интеграция однородных признаков (линий) при различении сложных стимулов (трехлинейных фигур) осуществляется многоканальным механизмом, составленным из модулей, кодирующих различные виды трехлинейных фигур и подчиняющимся сферическому закону нормировки вектора возбуждения.
Интеграция разнородных признаков (ориентации линии и ее яркости) при различении сложных стимулов, обладающих двумя вышеперечисленными признаками, осуществляется многоканальным механизмом, составленным из модулей, кодирующих яркость и ориентацию и подчиняющимся сферическому закону нормировки вектора возбуждения.
Процесс интеграции признаков осуществляется с помощью привлечения мозговой системы внимания.
Испытуемые. В соответствии с тремя выдвинутыми частными гипотезами проведены три эксперимента. В первом эксперименте приняли
участие 5 испытуемых, во втором эксперименте приняли участие 150 испытуемых, в третьем эксперименте приняли участие 20 испытуемых. Все испытуемые имели нормальное или скорректированное зрение. Таким образом, общее число испытуемых в данном исследовании составило 175 человек (в возрасте 20-25 лет). Методы исследования:
Психофизическое исследование кодирования стимулов различной сложности зрительной системой человека (метод прямого шкалирования [Shepard, 1964; Измайлов, 1980], метод зрительного поиска [Avraham, Yeshurun, Lindenbaum, 2008; Едренкин, 2009]).
Психофизиологическое (электрофизиологическое) исследование особенностей мозговых процессов при осуществлении интеграции признаков в зрительной системе человека на основе использования потенциалов, связанных с событиями (Измайлов, Соколов, Коршунова, Чудина, 2004).
Надежность и достоверность полученных результатов и выводов обеспечиваются применением методов регистрации и обработки данных, адекватных предмету и задачам настоящего исследования; организацией экспериментов в соответствии со стандартами экспериментальной психологии, психофизиологии и психофизики; системностью исследовательских процедур, использованием при обработке результатов современных статистических методов, отвечающих специфике эмпирических данных, а также согласованностью полученных результатов с данными других исследователей.
Научная новизна исследования заключается в построении моделей различения для сложных (составных) признаков. Эти модели построены путем применения методов векторной психофизиологии для исследования процессов различения сложной стимуляции, что осуществлено впервые. Также следует отметить применение новой психофизической методики, разработанной в рамках данного исследования и использованной в ряде
экспериментов (измерение различий между стимулами на основании показателей эффективности решения задач зрительного поиска). Впервые в рамках психофизиологической теории векторного кодирования информации в нервной системе исследована интеграция однородных признаков (сочетания линий) и разнородных признаков (ориентация и яркость). Данные, полученные с помощью оригинальной методики зрительного поиска, открывают новую информацию, которая указывает на принципиальные асимметрии процессов различения, осуществляющихся в зрительной системе.
Теоретическая значимость исследования заключается в получении новых сведений о психофизиологических механизмах интеграции признаков в зрительной системе человека. На примере признаков пространственной ориентации и яркости рассмотрен важный теоретический вопрос о принципиальной возможности и характере взаимодействия между отдельными признаками. Полученные данные позволяют более детально рассмотреть проблему механизма объединения простых признаков в сложный объект, и это касается как интеграции однородных признаков (сочетания линий, образующих элементы контура предмета), так и разнородных (ориентации линии и ее светлоты).
В настоящей работе проведено экспериментальное изучение восприятия сложных стимулов, на основании чего построены геометрические модели, отвечающие положениям векторной психофизиологии. Разработан психофизический метод измерения различий между стимулами, основанный на показателях эффективности их различения сенсорной системой при выполнении задач зрительного поиска. Показано, каким образом осуществляется интеграция однородных признаков (сочетания линий) и разнородных (ориентации линии и светлота).
Практическая значимость работы заключается в возможности использования установленных закономерностей в системах машинного зрения для построения программных и аппаратных средств, осуществляющих распознавание изображений.
Положения, выносимые на защиту:
Нейронные сети, осуществляющие кодирование сложных признаков, подчиняются сферическому закону, аналогично нейронным сетям, кодирующим простые признаки.
Совместное различение трех типов сложных стимулов, составленных из трех отрезков линий - «трехлинейных фигур» - осуществляется трехканальным модулем, на входы которого подается информация из двухканальных модулей, распознающих отдельные типы «трехлинейных фигур».
Различение сложных стимулов, сочетающих признак ориентации линии и признак светлоты, осуществляется четырехканальным модулем, объединяющим трехканальный модуль различения ориентации и одноканальный яркостный модуль, при этом наблюдается взаимодействие между признаками яркости и ориентации.
Интеграция признаков осуществляется с вовлечением механизмов ориентировочного рефлекса, обновляющего многомерную нервную модель стимула.
Не существует универсального принципа формирования нейронной сети, детектирующей сложный стимул, содержащий несколько простых признаков.
Апробация работы. Результаты работы обсуждались на заседаниях кафедры психофизиологии факультета психологии МГУ имени М.В. Ломоносова; представлены на XIII, XV, XVI Международной конференции студентов, аспирантов и молодых ученых «Ломоносов» (Москва, 2006, 2008, 2009); на Европейском конгрессе по математической психологии (Ювяскюля, Финляндия, 2010); на IV Международной конференции по когнитивной науке (Томск, 2010); на IX Российско-Германо-Китайском научном семинаре «Когнитивная нейронаука» (Пекин, Китай, 2011).
Используемые методы исследования и результаты диссертационной работы используются на факультете психологии МГУ имени М.В. Ломоносова в материалах курса «Категориальная структура зрительного восприятия» (кафедра психофизиологии).
По результатам диссертационного исследования опубликовано 9 работ, в том числе 3 публикации в рецензируемых журналах, рекомендованных ВАК при Министерстве образования и науки РФ для публикации основных результатов диссертационных исследований.
Структура и объем диссертации. Работа состоит из введения, четырех глав, выводов, списка литературы и приложений. Основной текст диссертации изложен на 159 страницах и включает в себя 49 рисунков и 2 таблицы. Список литературы включает 178 публикаций, из них 150 на английском языке.