Содержание к диссертации
Введение
1. Современные представления о механизмах зрительного внимания и восприятия. Аналитический обзор литературы . 12
1.1. Известные классификации механизмов и типов зрительного внимания; методы их изучения. 12
1.1.1 Представление о top-down и bottom-up механизмах зрительного восприятия 13
1.1.2 Механизмы, лежащие в основе явного и скрытого зрительного внимания 21
1.1.3 Селективное внимание. 26
1.1.4 Типы зрительного внимания 31
1.2 Характеристика движений глаз и их связь со зрительным вниманием 41
1.2.1 Контроль длительности фиксаций. 42
1.2.2 Дистрактор-эффект. 50
1.3 Перцептивная зрительная нагрузка 54
1.4 Связь параметров ЭЭГ и ССП с процессом осмотра изображений. 59
1.5 Постановка задач исследования. Подход к исследованию динамики механизмов осмотра изображений. 68
2. Методы исследования. 77
2.1 Организация эксперимента. 77
2.1.1 Испытуемые 77
2.1.2 Стимулы 77
2.1.3 Методика предъявления изображений . 80
2.1.4 Процедура проведения эксперимента. 81
2.1.5 Оборудование. 85
2.1.6 Запись движений глаз и анализ данных. 86
3. Результаты исследования 89
3.1 Результаты анализа длительности фиксаций. 89
3.1.1 Эксперименты со свободным осмотром и поиском измененных фрагментов. 89
3.1.2 Индивидуальные различия. 92
3.1.3 Эксперименты с распознаванием динамических и статических изображений разной сложности в присутствие дистракторов . 94
3.2 Результаты анализа эффекта дистрактора 101
3.3 Результаты анализа ССП 108
4. Обсуждение результатов 115
4.1 Динамика параметров глазных движений при осмотре и поиске измененных фрагментов художественных картин. 115
4.2 Динамика дистрактор-эффекта при осмотре проявляющихся и статичных изображений 117
4.3 Характеристика событийно-связанных потенциалов при решении зрительных задач различной сложности 120
Выводы 125
Список использованной литературы: 126
- Механизмы, лежащие в основе явного и скрытого зрительного внимания
- Методика предъявления изображений
- Эксперименты с распознаванием динамических и статических изображений разной сложности в присутствие дистракторов
- Динамика дистрактор-эффекта при осмотре проявляющихся и статичных изображений
Механизмы, лежащие в основе явного и скрытого зрительного внимания
Несмотря на большое количество исследований, посвященных осмотру сложных зрительных сцен и изображений, наиболее важные результаты, касающиеся механизмов работы зрительного внимания были получены при изучении осмотра примитивных зрительных стимулов (Treisman, 1985; Henderson, 2002; Awh, 2012;).
Еще Вильям Джемс ввел различие двух форм внимания – «пассивного» и «активного». В то время, как в качестве основного методического подхода при изучения психической деятельности применялся интроспективный подход, основным критерием для различия этих форм внимания оказалось наличие цели или волевого решения. «Пассивное» внимание означало, что человек не выбирает, что осматривать, а его взгляд как бы «притягивается» объектами или свойствами поля зрения к той или иной точке пространства. «Активное» внимание при этом направлялось к тем объектам, которые могли способствовать достижению осознаваемой конкретной цели, стоящей перед человеком. В дальнейшем, после исследований, проведенных Найссером, Ярбусом и многими другими учеными (Найссер, 1981, с. 42) сформировался подход к пониманию зрительного восприятия как процесса, в норме всегда сопровождающегося активностью разной степени осознанности.
Движения глаз, головы и тела происходят как при целенаправленном поиске зрительной информации, так и при случайном привлечении внимания человека к элементам зрительной сцены. Кроме того, при восприятии человек отчасти пытается «предвосхитить» события, и этот процесс происходит непрерывно, все время дополняемый новой информацией, поступающей через сенсорные системы. Найссер называл такой процесс «перцептивным циклом», изображая его модель в виде взаимосвязанных элементов – «объект», модифицирует «схему», которая направляет «исследование», которое в свою очередь отвечает за выбор объекта (Найссер, 1981). При этом, Найссер считал внимание не проявлениями работы отдельных систем, отвечающих исключительно за отбор стимулов, а следствием специфики организации структур, отвечающих за восприятие стимулов.
Исходя из того, что нет никаких специфических систем, отвечающих за селекцию признаков, была предложена гипотеза, согласно которой трудности при выполнении двух или более видов деятельности могут быть преодолены путем упражнения. Эксперименты, проведенные им, показали, что точность ответов при решении одной зрительной задачи выше, чем при решении двух задач одновременно, даже при исключении влияния таких факторов, как попадание стимулов из одной задачи на периферию поля зрения, или смешение стимулов между разными задачами.
Вывод был сделан в пользу того, что селективное внимание работает с помощью механизма преднастройки – например, при оценке кинетической информации строятся предположения о будущей позиции искомого объекта. Влияние преднастройки может ослабить стимуляция, вызывающая ориентировочные ответы – такая как громкий звук, вспышка или движение в поле зрения, собственное имя, названное во время осмотра. Такие события прерывают поиск или восприятие информации, имеющей отношение к решаемой задаче, и оцениваются с высокой скоростью независимо от предыдущей задачи. Найссер предлагает отказаться от понятия «предвнимания» поскольку оно создает ложное представление, будто внимание имеет отделенные друг от друга этапы, когда на самом деле это непрерывный процесс.
Преднастройку, объяснявшуюся ранее через предвнимание, Найссер объясняет работой простых, врожденных механизмов, которые необходимы для запуска новых «перцептивных циклов». Согласно представлениям Найссера, эти процессы могут лежать за пределами основного потока деятельности, но при этом контролируются и осознаются субъектом в разной степени (Найссер, 1981). В связи с этим, предполагалась принципиальная возможность одновременного восприятия нерелевантного стимула с релевантным, в случае если субъект достаточно практиковался.
В дальнейшем процессы, относящиеся к селективному вниманию, подвергались огромному количеству исследований (Duncan & Humphreys, 1989; LaBerge & Brown, 1989; Wolfe, Cave, & Franzel, 1989). Авторы этих работ сходятся в том, что когда человек ищет определенный объект в поле зрения, он использует знания о свойствах этого объекта для направления внимания; в этом случае контроль внимания имеет большой нисходящий компонент (top-down в англоязычных работах). В случае, если наблюдатель ищет необычный элемент в поле зрения, но не знает, чем именно он может выделяться, можно говорить о преобладающей роли восходящего (bottom-up) компонента. В работах, вышедших в 80-90 годах 20-го века, авторы уже не говорят об автономности этих двух компонентов внимания. Скорее, речь идет об изменении степени влияния одного из компонентов относительно другого.
Treisman and Gelade (1980) предложили гипотезу, описывающую возможные механизмы функционирования нисходящей системы управления вниманием. Согласно ей, зрительная система содержит всю информацию о свойствах зрительного поля как функционально разграниченные карты. Например, существует карта, указывающая на расположение вертикальных перепадов яркости, карта смещения элементов вправо, карта, содержащая признаки зеленого цвета. LaBerge and Brown (1989) предположили, что если наблюдатель знает об уникальных свойствах искомого объекта, то он может использовать подходящую карту из этого набора для направления внимания. Таким образом, если целевой и отвлекающие стимулы достаточно различны, чтобы активировать разные наборы признаковых карт, то поиск таких целевых стимулов будет происходить одинаково быстро, вне зависимости от количества дистракторов – в том случае, если испытуемый знает, каковы уникальные свойства целевого стимула.
В то же время, другая группа исследователей, изучая восходящую систему управления вниманием, предложила гипотезу о важности локального ингибирования связей внутри карты признаков, которое определяет заметность цели и ее последующие отношения с фокусом внимания (Itti, Koch, 1985). Похожие идеи были предложены Treisman (1988) и Huang, Pashler (2005). Когда многие дистракторы имеют сходные признаки, активность, которую они генерируют в соответствующей признаковой карте, подавляется из-за взаимного торможения. Такое торможение не может проявиться в отношении активности, генерируемой уникальным свойствам объекта, поскольку он не является одним из сети элементов, взаимно тормозящих друг друга. Активность во всех позициях стимулов затем суммируется, и внимание направляется к положению с наибольшей активностью. Учитывая, что торможение элементов локальное, то есть, лучше всего работает между близко расположенными элементами, логично предположить, что оно лучше всего работает, когда дистракторы расположены неподалеку друг от друга.
Альтернативный механизм, объясняющий работу восходящих процессов управления вниманием, был предложен Sagi (1986). Согласно его утверждению, механизмы, которые сравнивают признаки соседних элементов и затем направляют внимание к положению изменения признаков. Поскольку детекторы градиентов работают хорошо только в пределах ограниченной части пространства, этот процесс наиболее эффективен когда расстояние между целевым стимулом и дистрактором невелико.
Поскольку оба механизма восходящего управления вниманием основаны на обработке локальных признаков (между целью и дистрактором в одном случае, и между разными дистракторами в другом), они оба работают наиболее хорошо, когда расстояние между всеми стимулами минимальное. Так, когда внимание должно быть направлено на неизвестный целевой стимул, время поиска должно зависеть от расстояния между стимулами на дисплее.
Итак, выводы, полученные в данных работах, позволили сделать следующие предположения: В задачах, требующих фокального внимания (а) если испытуемый не знает, какими уникальными свойствами будет обладать целевой стимул, то время поиска такого стимула будет сокращаться с увеличением количества отвлекающих стимулов; (б) если уникальное свойство целевого объекта известно, то время поиска не должно зависеть от количества дистракторов. В задачах, требующих пространственного, или распределенного внимания: (а) известно, что количество дистракторов не влияет на скорость поиска, независимо от того, известны ли свойства целевого стимула; (б) расстояние между элементами может влиять на скорость поиска.
При проверке этих выводов, однако, необходимо учитывать, что большинство данных, касающихся работы нисходящих и восходящих процессов управления вниманием, было получено в экспериментах с абстрактными и примитивными стимулами, которые мало походили на естественные сцены, воспринимаемые человеком в обычных условиях. Эти результаты показали наличие некоторой динамики взаимодействия восходящих и нисходящих процессов. В то время, как в некоторых работах было показано, что они работают одновременно (Egeth and Yantis, 1997; Itti and Koch, 2001; Corbetta et al., 2008), другие обнаруживали разницу во времени активации обоих механизмов, по меньшей мере, в коротких временных периодах: сразу после появления новых стимулов, восходящий контроль доминирует до той поры, пока нисходящий контроль постепенно не станет более активным (Van der Stigchel et al., 2009; Hickey et al., 2010). Еще в некоторых работах показано, что сразу же после появления стимулов влияние нисходящего контроля становится доминирующим (Einhuser et al., 2008).
Методика предъявления изображений
В свою очередь, множество исследований указывают на различия не только между тремя формами, или системами, внимания; известны различия также между вниманием, сфокусированным на объекте, и пространственным вниманием, охватывающим большую площадь и не привязанным к конкретному объекту или определенной детали поля зрения (Величковский, 2010; Белопольский, 2008).
В работе Unema (2002) было показано, что в начале осмотра изображений параметры глазодвигательной активности человека отличаются от таковых через 5 секунд после начала осмотра. Подладчикова с соавторами (2009) показали, что при завершении осмотра, в случае, если испытуемый сам принимает решение о его прекращении, параметры движений глаз также отличаются от движений, совершенных в середине осмотра. Irwin and Zelinsky (2002) также указывали на наличие разницы в параметрах фиксационных и саккадических движений глаз.
Различия в двух путях обработки упоминаются постоянно, начиная с выхода специального выпуска журнала Psychologische Forschung in 1967 (Held, Ingle, Schneider, & Trevarthen, 1967). В этом выпуске, а также во многих работах, вышедших после него, упоминается дихотомия, связанная с наличием двух путей обработки визуальной информации в мозге. Этой дихотомии присваивали разные названия – оценка-ориентирование (Ingle, 1967), что-где (Schneider, 1967), фокальное-пространственное восприятие (Trevarthen, 1968), проверка-поиск (Weiskrantz, 1972), объектное-пространственное (Breitmeyer & Ganz, 1976), фовеальное-пространственное (Stone, Dreher, & Leventhal, 1979). Как можно заметить, во всех случаях один из процессов имеет отношение к пространственному положению и обнаружению объектов, а второй – к изучению деталей видимого объекта. Ungerleider and Mishkin (1982) показали в работе на приматах, что зрительное восприятие подвергается доминирующему влиянию одного из механизмов обработки зрительной информации, принадлежащему дорсальному или вентральному пути. Эта работа легла в основу наиболее распространенной сегодня модели двойной обработки зрительных стимулов (Milner & Goodale, 1995), которая была дополнена исследованиями неврологических пациентов с повреждениями различных структур головного мозга (Milner et al, 1991; 2003). Физиологические работы, касающиеся исследования дорсального пути, показали влияние его структур на движения глаз – в частности, на совершение длинных быстрых саккад через все поле зрения, под воздействием физических характеристик стимула в фиксационных точках.
В экспериментах, проведенных Величковским с соавторами (2005), изучалось восприятие, траектория и свойства движений глаз при использовании симулятора вождения автомобиля с набором экстренных ситуаций. Была выявлена взаимосвязь длительности фиксации с амплитудой последующей саккады. Кроме того, авторы описали отдельные «сегменты» траектории, различавшиеся набором свойств – длительностью фиксаций и амплитудой саккад. Первый сегмент, с фиксациями от 90 до 260 мс, как правило имел саккады больше, чем 5о, что выходит за пределы парафовеального поля зрения. Иными словами, эти саккады направлены на неясно различимые, но выделяющиеся яркостью или цветом части поля зрения, а не на конкретные объекты – что хорошо подходит под описание ориентировочного, или пространственного внимания. Фиксации более длинные, чем 260-280 мс скорее относятся к фокальной обработке: после них следуют саккады, которые в основном остаются внутри парафовеальной области поля зрения, где объекты более ясно различимы. Другой важный результат экспериментов состоял в том, что если экстренная ситуация была зафиксирована взглядом во время доминирования пространственного внимания, то шанс ошибки был значимо выше, чем при попадании такого события на фиксации, сопровождающиеся фокальным режимом обработки (Величковский, 2002).
В дополнительном эксперименте, целью которого была проверка предыдущих результатов на неподвижных изображениях, а также проверка гипотезы о разном представлении событий, связанных с фокальной и пространственной обработкой, в памяти. Фокальный режим, согласно работе Post, Welch & Bridgeman, (2003), основывается на памяти, поскольку вентральный путь хранит репрезентации объектов, необходимые для их распознавания. Напротив, в пространственном режиме работы внимания долговременное хранилище информации может вообще не использоваться, и только кратковременная память может быть доступна для выполнения необходимых моторных действий. Учитывая эту информацию, авторы предположили, что если эти две системы могут быть разделены, то распознавание сцен будет различаться в разных режимах функционирования зрительного восприятия.
В эксперименте испытуемые должны были решить, принадлежит ли показываемый кусочек изображения тому целому изображению, которое они осматривали перед ним. После каждого целого изображения для такого распознавания предъявляли по 30 кусочков, часть из которых действительно была вырезана из оригинального изображения в тех местах, куда попадали фиксации испытуемых. Свою уверенность при выборе ответа испытуемые могли указывать по пятибалльной шкале. Одним из интересных результатов работы стало то, что крайне высокий процент ложноположительных ответов (около 80%) продемонстрировали те испытуемые, у которых количество коротких фиксаций (менее 180 мс) было больше, чем у остальных, в среднем на 40%. Результаты этих испытуемых исключили из дальнейшего анализа. Наиболее важным результатом авторы считают найденную зависимость качества выполнения задания от длительности фиксаций на стадии осмотра оригинального изображения. В этом случае возможны две гипотезы, объясняющие это различие: возможное накопление большего количества данных при более долгих фиксациях, или же качественные различия, лежащие в основе обработки зрительной информации при доминировании того или другого типа зрительного внимания.
По мнению авторов, два факта могут поддерживать вторую гипотезу: во-первых, при совершении длинных фиксаций вместе с сопровождающими их короткими саккадами, повышался не только процент правильных ответов испытуемых, но и уровень их уверенности в правильно принятом решении. Движения глаз указывали на преобладание фокальной обработки, которая предполагает лучшее выполнение задач на распознавание (Post, 2003). Альтернативное объяснение этого, которое может заключаться в том, что из-за коротких саккад эта область в целом была лучше охвачена взглядом, не может быть применено в данном случае, поскольку все саккады короче, чем 1,5о, были исключены из анализа. Другой факт заключается в изменении паттерна саккад и фиксаций со временем осмотра сцены, который был показан во многих работах (Kahneman, 1973; Unema et al., 2005, Подладчикова, 2009). Этот факт говорит в пользу предположения о том, что дорсальная система, с ее функцией изучения пространственного окружения, доминирует при первоначальном осмотре сцены. Фокальная, более объектно-ориентированная обработка основана на более высокой активности вентральной зрительной системы (Velichkovsky,
Эксперименты с распознаванием динамических и статических изображений разной сложности в присутствие дистракторов
В основной серии экспериментов основной задачей испытуемых было распознавание проявляющихся изображений. Использовался набор контурных изображений, состоящий из двух подгрупп: первая группа была взята из работы Нуриевой (2003), где изображения были разработаны для работы по развитию речи у аутичных детей. Вторая группа изображений выбрана из базы MPEG 7 CE Shape-1 Part B, и изображения из этой группы имеют в некоторых случаях более плотный контур и могут отличаться по суммарной яркости от приведенных к одинаковым значениям по яркости изображений первой группы.
Набор изображений содержал 92 картинок с разными объектами, животными, фигурами. Размер стимулов был равен 2 угловым градусам по вертикали и по горизонтали. После завершения каждого триала испытуемые должны были отнести каждое изображение к одной из категорий: человек, спорт, мебель, посуда, игрушка, фрукт, инструмент, растение, аксессуар, транспорт, животное, насекомое, овощ, птица, еда, электроника, дерево, профессия, украшение, ничего из перечисленного – всего 20 категорий.
В конце триала предъявлялось 4 варианта ответа – один из них был правильным, а три остальных – заранее определенные псевдослучайные варианты. При подборе неправильных вариантов для каждой картинки мы избегали попадания нескольких категорий, к которым можно было отнести изображение: например, если на картинке была корова, то правильным ответом была категория «животное», а из неправильных вариантов исключалась возможность попадания в набор ответов категорий «еда»; после изображения яблока исключалась возможность попадания в набор ответов категорий «еда», «растение», «дерево», если правильным ответом была категория «фрукт».
Кроме того, в 31 триале использовалось изображение контрольного стимула – контурного крестика, который занимал всего 100х100 пикселей. После такого крестика в вариантах ответа появлялся всего один ответ – «продолжить тест».
Место появления правильного ответа, либо надписи «продолжить тест» выбиралось случайно после каждого триала, и могло располагаться сверху, снизу, справа или слева от центра монитора, с центром каждой надписи в середине верхней, нижней, правой или левой половины монитора. Испытуемый выбирал нужный ответ с помощью кнопок со стрелками, указывая, какой ответ он считает верным – верхний, нижний, правый или левый. В случае появления надписи «продолжить тест» он также был проинструктирован указывать сторону появления надписи, аналогично тому как он это делал в остальных триалах. Однако, испытуемый не получал обратной связи о совершенных ошибках; в любом случае, верно или ошибочно выбранная кнопка со стрелкой запускала следующий триал, а ее нажатие фиксировалось в специальном файле.
Уже после завершения всех тестов стимулы были нами разделены на группы «простых», «средних» и «сложных» для распознавания изображений. Это было сделано на основе анализа количества допущенных ошибок при определении категории, к которой относился стимул, с учетом времени, которое потребовалось испытуемым на распознавание. На рисунке 8 можно увидеть примеры изображений из 3 групп.
Примеры изображений: простые (1), средние (2), сложные (3). Под каждым изображением указана средняя длительность его распознавания.
Наиболее простыми стимулами были контурные кресты, симметричные по вертикальной и горизонтальной оси, и имеющие только прямые линии и углы 90о. В группу «простых» попали контурные изображения объектов, лишенные всяких деталей. В группу «сложных» попали изображения, в которых было большое количество плавных линий, изгибов, углов и штрихов, в которых можно было выделить отдельные детали. Несмотря на то, что разделение на группы проводилось на основе анализа скорости и точности распознавания изображений испытуемыми, при анализе количества ориентированных градиентов яркости методами автоматического анализа изображений, эти две группы изображений различались по количественным характеристикам, полученным в результате анализа. 2.1.3 Методика предъявления изображений.
Для проведения психофизических исследований разработана, программно реализована и тестирована оригинальная методика исследования динамики эффекта дистрактора при использовании изображений различного типа. Она основана на известных фактах (Walker et al, 1997; Pomplin et al, 2001; Deplancke et al, 2010; Tandonet et al, 2012) и результатах наших предварительных тестов.
Основные особенности разработанного метода, в отличие от известных при применении дистракторов, состоят в следующем: каждое целевое изображение как целое и дистракторы предъявляются внутри центральной (фовеальной) части поля зрения; эффект дистрактора оценивается на различных этапах распознавания целевых изображений, что позволяет раздельно анализировать вклад top-down и bottom-up механизмов на эффект дистракторов; использование оригинального вида проявляющихся стимулов, которые на первых этапах теста представляют собой неузнаваемый набор точек, а на последующих этапах становятся все более четко различимыми объектами; прекращение текущего теста после принятия решения испытуемым о распознавании изображения на данном этапе его прорисовки.
В отличие от известных методов применения дистрактора, разработанный метод обеспечивает устойчивый эффект увеличения длительности фиксаций взгляда при совместном предъявлении целевого стимула и дистрактора. Он может быть рассмотрен как частный тип gaze-contingent парадигмы при исследовании эффектов дистракторов (Pomplin et al, 2001), в котором целевые изображения целиком предъявляются внутри фовеального поля зрения, что дает возможность минимизировать вклад механизмов пространственного внимания.
В специальной среде для разработки схем эксперимента и его проведения EventIDE (okazolab.com) была создана программа, позволяющая использовать методику попиксельного проявления контурных изображений. В каждый фрейм монитора появлялось по 9 пикселей, принадлежащих картинке с контурным изображением объекта. Новые пиксели не заменяли, а добавлялись к предыдущим, таким образом, со временем контур становился все более плотным и видимым (см. рисунок 9). На мониторе с частотой 60 Гц один фрейм появляется примерно раз в 16,67 мс. Каждую секунду к изображению добавляется по 556 пикселей, однако, только случайное их количество имеет черный цвет и составляет собой часть контура, а оставшиеся принадлежат белому фону изображения, и потому видимо не изменяются. При размере картинок 100х100 пикселей предъявление всех пикселей занимает 18 500 мс. Таким образом, в конце триала полное изображение было целиком предъявлено на мониторе. Примеры стимулов можно увидеть на рисунке.
Процедура проведения эксперимента. Эксперимент 1. Эксперименты, в которых испытуемые участвовали поочередно, состояли из двух основных этапов. Для каждого этапа была разработана инструкция и форма отчета, следующего за экспериментом.
Первый этап состоял в свободном осмотре трех в разной степени структурированных сложных изображений. Инструкция давалась в устной форме и звучала так: «Сейчас на экране появится изображение. Вам нужно осмотреть его и запомнить как можно подробней. В следующем тесте надо будет найти отличия в похожем изображении».
На втором этапе, испытуемый осматривал те же изображения, но с измененными фрагментами – размытыми областями размером 1,5 угловых градуса, примерно с фовеальное поле зрения. Эти области располагались в местах, частично определяемых траекторией предыдущего осмотра испытуемым выбранного изображения. Размытия ставились в нескольких местах наиболее явного фокуса внимания, в местах, осмотренных испытуемым недолго, и в местах, которым внимание не было уделено вообще. Всего в каждом изображении размывалось по 12-14 фрагментов (например, красные точки на рис. 10). Инструкция к тесту поиска звучала следующим образом: «Сейчас на экране будет предъявлено одно из уже осмотренных вами изображений. Найдите все фрагменты, в которых есть отличия, сосчитайте и запомните их положение». Изображения, использованные в эксперименте по осмотру. Красными точками отмечены положения измененных фрагментов. В течение всего времени тестов работала звукозапись, и по окончании теста испытуемым задавались следующие вопросы:
Видели ли вы это изображение до начала тестов? Что изображено на картине? Какие детали привлекли наибольшее внимание? Можете ли вы описать этапы осмотра? Почему вы приняли решение закончить тест? Хотели ли вы закончить тест до того, как сказали об этом? Сколько было измененных фрагментов? Где они располагались?
Каждому испытуемому на каждом этапе предъявлялись последовательно три изображения, с небольшими (2-5 минут) перерывами для отдыха. Перед каждым тестом проводилась калибровка, тест начинался синхронно с началом записи движений глаз. Когда испытуемый заканчивал осмотр, он подавал сигнал, и экспериментатор завершал тест. Время осмотра не было ограничено, и в наиболее долгом случае составляло около восьми минут, обычно же испытуемые принимали решение об окончании теста в течение одной-трех минут.
Динамика дистрактор-эффекта при осмотре проявляющихся и статичных изображений
Как было показано ранее во многих работах, параметры движений глаз в процессе решения зрительных задач различной сложности зависят от множества факторов и механизмов, взаимодействующих между собой (Graupner, 2007; Underwood, 2006; Velichkovsky, 2010). Один из подходов к выяснению частных механизмов такого взаимодействия состоит в оценке временной динамики параметров движений глаз на различных этапах выполнения текущей зрительной задачи. Так, в работе Unema et al., (2005) было показано, что длительность фиксаций в течение первого 500-миллисекундного периода теста значительно меньше, чем в последующих периодах, что соответствует полученным нами результатам; однако, в работах (Over, 2007; Unema, 2005) указано, что после этого первого периода вариация уменьшается, и длительность фиксаций остается относительно стабильной на протяжении всего теста. Согласно нашим данным, длительность фиксаций также была относительно стабильной, но лишь до самого заключительного периода, когда испытуемому нужно было выполнить действие, означавшее окончание эксперимента. В этом периоде тестов длительность фиксаций взгляда резко уменьшалась и была даже меньше, чем в начальном периоде. При этом, время решения текущей зрительной задачи (свободный осмотр или поиск измененных фрагментов художественных картин) у различных испытуемых существенно варьировалось. Напротив, в работе Unema et al., (2005) время на проведение тестов было фиксированным и заранее определялось экспериментатором, чем и объясняются наблюдаемые различия в динамике длительности фиксаций на заключительном этапе тестов. По-видимому, уменьшение длительности фиксаций взгляда на последнем этапе тестов может быть связано с переключением внимания испытуемого с решения зрительной задачи на решение моторной задачи, связанной с завершением теста (Pannasch, 2001).
Динамика амплитуды саккад, как уже было показано во многих работах, изменяется обратно по отношению к длительности фиксаций – в частности, в первом и последнем периоде она увеличена по сравнению с промежуточными периодами. Высказываются предположения о том, что обратные отношения между длительностью фиксаций и амплитудой саккад связаны с функционированием разных форм внимания – фокальной и пространственной (Velichkovsky, 2008). Возможно, совместное изменение амплитуды саккад и длительности фиксаций в разных этапах осмотра изображений отражает доминирование пространственного внимания на ранних и поздних этапах осмотра, и фокального – в течение промежуточных этапов. Кроме того, согласно некоторым работам, снижение длительности фиксаций на ранних этапах осмотра может быть связано с увеличением вклада восходящих механизмов управления вниманием (Oliva et al., 2003; Smeets, Hooge, 2003). В нашем случае, если сравнивать периоды по 30 фиксаций, то длительность фиксаций в последних периодах пробы в среднем короче на 25 мс, чем в первых периодах. Амплитуда саккад имеет в этих периодах обратное соотношение. Взятые вместе, эти изменения могут означать снижение роли фокального внимания перед принятием решения об окончании теста, а возможно и снижение роли зрительного внимания в целом.
Известные данные об отношениях между локальными физическими свойствами изображения и параметрами движений глаз при осмотре и поиске весьма противоречивы (Foulsham, Underwood, 2008; Huang et al., 2009). Некоторые авторы утверждают, что области изображений с различающейся плотностью фиксаций не отличаются друг от друга по большинству физических признаков и их сочетанию (Huang et al., 2009); другие описывают возможность предсказывать траекторию движений глаз по карте распределения физических признаков (Foulsham, Underwood, 2008; Navalpakkam, Itti, 2005; Wolfe, 2005). В нашей работе на изображениях картин, использованных в тестах, выделялись области с одинаковой плотностью физических признаков, и группы фиксаций в этих областях могли значительно различаться по средней длительности фиксаций. Однако, в другом наборе областей, где плотность физических признаков увеличивалось, длительность фиксаций тоже возрастала. Очевидно, степень зависимости длительности фиксаций от локальной плотности цветовых перепадов может изменяться в широких пределах из-за влияния других факторов, например, семантического содержания осматриваемых областей.
Еще одним фактором, влияющим на длительность фиксаций взгляда, является наличие или отсутствие мотивации поиска во время осмотра изображений. В нашей работе было показано влияние мотивации поиска измененных фрагментов во время осмотра сложных изображений, которое приводило к появлению второй моды в распределении длительностей фиксаций взгляда. В работе Hooge et al (1996) приведено распределение длительности фиксаций, полученное при поиске простых стимулов – колец Ландольта (кольца с узким разъемом в произвольном месте, используются в офтальмологии для проверки остроты зрения). При поиске этих стимулов также обнаружено бимодальное распределение длительности фиксаций, однако, оба пика оказываются смещены в сторону более коротких значений по сравнению с пиками, полученными в наших экспериментах – они принимают значения около 150 и 300 мс (там же), тогда как в наших экспериментах пики находятся на 200 и 420 мс. Такая значительная разница может объясняться простотой зрительных стимулов, которая приводит к тому, что фокальное внимание не является доминирующим при осмотре, поскольку количество локальных свойств изображения для анализа невелико. Таким образом, мотивация поиска стимулов отражается в бимодальном распределении длительности фиксаций (в отличие от мономодального распределения при решении задачи свободного осмотра изображений) при использовании стимулов разной сложности и с совершенно разным количеством локальных признаков изображения.
Наиболее интересные результаты наших исследований были получены при использовании разработанного нового метода генерации изображений, состоящего в динамическом изменении фовеального целевого стимула, который на первых этапах теста представляет собой неузнаваемый набор точек, а на последующих этапах становится все более четко различимым объектом. В частности, наиболее простые из этих стимулов приводят к снижению второй моды в распределении длительности фиксаций, что может указывать на доминирование bottom-up механизмов перепрограммирования саккад в superior colliculus (Trappenberg et al, 2001). С другой стороны, распределение длительности фиксаций при предъявлении контурных изображений с дистракторами в качестве стимулов имело бимодальный характер, причем величина второй моды возрастала с увеличением сложности контурных изображений. Это может отражать активацию обоих механизмов (bottom-up и top-down). Возможно, вклад этих механизмов перепрограммирования саккад может быть оценен раздельно с помощью анализа временной динамики эффекта дистрактора.
При сравнении длительности фиксаций во время осмотра проявляющихся изображений с длительностью фиксаций на статичных контурных изображениях мы выявили различия, которые увеличивались с увеличением сложности стимулов. В среднем, длительность фиксаций на проявляющихся изображениях была больше, чем на статичных, что хорошо согласуется с известными данными о воздействии перцептивной нагрузки на длительность фиксаций (Lavie, 2005). По-видимому, наличие динамических изменений стимулов сглаживает различия в сложности. Это может происходить, во-первых, по причине постоянного появления новых элементов изображений, которые могут вызывать нечто похожее на эффект дистрактора, который оказывается почти не выраженным из-за большого количества и монотонности появления новых визуальных признаков, которые вызывают быструю адаптацию к их воздействию. В работах Jonides, 1981; Dark et al, 1985, Muller, 1991, было показано, что увеличение количества дистракторов, показанных одновременно, уменьшает выраженность реакции на любой из них. Во-вторых, это может означать, что задействованы разные механизмы обработки информации о подвижных и неподвижных стимулах, или разное влияние локальных зрительных признаков на процессы такой обработки (Cartwright-Finch, Wei, Zhou, 2006).
Динамика длительности фиксаций при осмотре контурных изображений показала отличие первого периода в 300 мс от последующих, однако, наиболее значительным оно было в пробах с крестами в качестве зрительных стимулов. Так же, как и в экспериментах со сложными изображениями, средняя длительность фиксаций в последнем периоде каждой пробы снижалась, достигая наиболее низкого значения. Однако, совсем другое распределение длительностей фиксаций наблюдалось в пробах с проявляющимися изображениями: в первых двух периодах динамика длительности фиксаций возрастала, однако затем снижалась и могла принять значения даже более низкие, чем в первом периоде. Следовательно, постоянное изменение изображений изменяет динамику их осмотра. Кроме того, значимое снижение средней длительности фиксаций в 3 и 4 периодах по сравнению с первым периодом наблюдалось в пробах с крестом. Динамика длительности фиксаций при предъявлении дистрактора имеет различия между двумя группами проб: (1) крестов с простыми изображениями, и (2) средних со сложными.