Содержание к диссертации
Введение
ГЛАВА 1. Сенсорный оператор зрительной систеш человека 30
1.1. Линейный анализ зрительной системы человека (обзор имеющихся в литературе данных)
1.1.1. Основные методы и результаты линейного анализа 33
A. Идентификация передаточной функции методом "вход-. выход" * 34
Б. Метод изоконтрастных кривых 39
B. Метод подпороговой суммации для определения пространственной функции рассеяния 47
1.1.2. Недостатки и ограниченность линейного подхода 49
1.2. Нелинейный анализ сенсорного оператора 53
1.2*1. Психофизический метод идентификации сенсорного оператора в предположении его нелинейности 58
Зрительное обнаружение разностной гармоники 58
1.2.2. Результаты идентификации передаточной функции 2-го порядка зрительной системы человека 73
Эксперимент 1.1. Измерение контрастной чувстви тельности к разностной гармонике 73
1.3. Психофизическая структура сенсорного оператора 93
1.3.1. Оптическая передаточная функция зрительной системы человека 94
1#3.2. Физиологическая передаточная функция зрительной системы человека 97
1.3.3. Рецепторная функция передачи 102
1*3.4. Ряд Вольтерра сенсорного оператора 105
1.4. Нейронные механизмы сенсорного оператора 107
ГЛАВА II. Зрительное обнаружение и различение стимулов человеком 145
2.1. Современные представления об обнаружении в зритель ной системе человека 147
2«1,1« Одноканальные модели 148
2,1*2. Многоканальные модели 151
Прямое сопоставление одно- и многоканальной модели в эксперименте 154
Дальнейшее развитие многоканальной концепции зрительного обнаружения 156
2.1.3. Методы и результаты опытов по определению пространственно-частотных характеристик каналов 161 Метод пространственной суммации 162
Метод маскировки 164
Метод избирательной адаптации 166
2.1.4. Сравнительный анализ данных относительно пространственно-частотных характеристик каналов, полученных различными методами 167
Эксперимент
2.1. Пространственно-частотная избирательность адаптации к составной решетке 170
2.2, Проблема каналов в зрительной системе человека 184
2*3. Теоретический анализ проблемы обнаружения и разли
чения в зрительной системе человека 196
2.4. Экспериментальное исследование зрительного обнаружения 209
Эксперимент 2.2. Контрастные пороги обнаружения составных решеток 222
2.5. Согласованное зрительное обнаружение 227
2.6. Нейронные механизмы согласованного обнаружения 233
2.7. Нейронная модель зрительного обнаружения стимулов человеком 244
ГЛАВА III. Восприятие предметов в движении 253
3.1, Смазывание в линейной системе 254
3.1.1, Анализ смазывания в частотной области 255
3.1.2, Анализ смазывания в пространственно-временной области 259
Движение с постоянной скоростью 259
Смазывание при произвольном движении 267
3.2, Экспериментальное исследование феноменальных преобразований, которые претерпевают образы предметов в движении 270
3.2.1, Изменение светлоты образов движущихся предметов 271
3.2.2, Различение и опознание движущихся изображений 282 Различение движущихся прямоугольных и синусоидальных решеток 283 Сравнение, опознания движущихся и неподвижных (подвергнутых пространственной фильтрации) изображений 287
Выводы 298
Литература ,
- Линейный анализ зрительной системы человека (обзор имеющихся в литературе данных)
- Современные представления об обнаружении в зритель ной системе человека
- Смазывание в линейной системе
- Экспериментальное исследование феноменальных преобразований, которые претерпевают образы предметов в движении
Введение к работе
В науке всегда существовали проблемы, которые не укладывав лись в прокрустово ложе какой-либо одной научной дисциплины. Именно так обстоит дело с проблемой чувственных основ познания. Психические механизмы чувственного познания действительности издавна служили традиционным объектом исследования как в естествознании, так и в философии. В настоящее время работа органов чувств изучается биофизиками, физиологами, психологами и другими учеными. Фундаментальность проблемы чувственных основ познания, ее философско-методологическое значение определяются рядом объективных обстоятельств, среди которых важнейшими являются следующие.
Во-первых, чувственное познание, по известному выражению В.И.Ленина, "есть действительно непосредственная связь сознания с внешним миром" (Ленин, Поли. собр. соч., т.18, с.46). Без такой связи нельзя себе представить не только всякое познание вообще, но и предметную практическую деятельность, являющуюся основой жизни человека.
Признавая активный, творческий характер познавательной деятельности человека, в том числе и чувственной познавательной деятельности , было бы неправильно преувеличивать, абсолютизировать этот момент чувственного познания. В конечном счете адекватное отражение внешнего мира возможно в первую очередь благодаря его постоянному взаимодействию с этим миром посредст Активный характер чувственного познания убедительно показан в рамках деятельностного подхода к психологии познавательных процессов (Леонтьев, 1959; Запорожец, 1960; Зинченко, 1970, 1975). Сердцевиной этого подхода служит понимание процесса чувственного познания как особого вида деятельности познающего субъекта (Леонтьев, 1975, с.36). вом органов чувств. Субъективной формой, в которой человеку даны результаты такого взаимодействия, являются ощущения. Именно поэтому "иначе, как через ощущения, мы ни о каких формах вещества и ни о каких формах движения ничего узнать не можем,.;я (Ленин, Поли. собр. соч., т.18, с.320).
Во-вторых, в акте чувственного познания совершается диалектический переход от материи к сознанию, или, если придерживаться ленинской формулировки, "превращение энергии внешнего раздражителя в факт сознания. Это превращение каждый человек миллионы раз наблюдал и наблюдает действительно на каждом шагу" (Ленин, Прлн. собр. соч., т.18, с.46).
Некоторые буржуазные ученые поспешили объявить этот переход загадочным и принципиально недоступным для научного позна ния. Так, вопрос о первом возникновении ощущения неоднократно относился к числу неразрешимых "мировых загадок" (см., например, Дюбуа-Реймон, 1901; Геккель, 1935)гК
Иной подход к проблеме демонстрирует наука, занимающая ди-алектико материалистические позиции по вопросу познаваемости явлений природы. Признавая, что вопрос о возникновении ощущения из материи еще не решен естествознанием и "остается еще исследовать и исследовать, каким образом связывается материя, якобы не ощущающая вовсе, с материей, из тех же атомов (или электро • Не стоит думать, однако, будто со времени произнесения Эмилем Дюбуа-Реймоном своей речи в честь Лейбница (1880) произошли какие-либо принципиальные изменения в этом вопросе. Сравнительно недавно издательство pergamon Press выпустило в свет "Энциклопедию непознанного" ( Encyclopaedia of Ingo rance, Pergamon Press, 1977, 443 p.). K ЧИСЛУ непознанных современной наукой вопросов, достойных включения в Энциклопедию, ее составители отнесли и вопрос о принципах кодирования сенсорной информации в центральной нервной системе, которому посвящена статья известного английского нейрофизиолога Х.Барлоу.
нов) составленной и в то же время обладающей ясно выраженной способностью ощущения", Ленин указывал, что тем самым "материализм ясно ставит нерешенный еще вопрос и тем толкает к его разрешению, толкает к дальнейшим экспериментальным исследованиям" (Ленин, Поли. собр. соч., т.18, с.40).
В-третьих, чувственное познание является одной из форм и ступеней процесса познания вообще (Ойзерман, 1957; Леонтьев, 1975, с.33). Из этого следует, что без изучения закономерностей и структуры чувственного познания невозможно развитие теории познания.
Изучение чувственных форм отражения действительности может вестись (и ведется) на разных уровнях: гносеологическом, психологическом и физиологическом. О важности научного анализа чувственного познания говорит уже тот факт, что В.И.Ленин включил физиологию и психологию органов чувств в число тех научных дисциплин, разработку которых он считал необходимой для дальнейшего развития теории познания (Ленин, Поли. собр. соч., т.29, с.256). Тем не менее, признавая на словах необходимость научно-конкретного анализа чувственных форм отражения действительности, в частности, необходимость психофизиологического изучения (анализа) ощущений, на деле часто его либо подменяют качественным анализом в гносеологическом аспекте, либо растворяют в море частных фактов, добытых при количественном анализе работы органов чувств на нейрофизиологическом уровне. В связи с этим задача психофизиологического анализа чувственной основы познания нам представляется весьма актуальной и необходимой.
В гносеологическом плане принято выделять три основные формы чувственного познания: ощущение, восприятие и представление (Ананьев, 1960; Георгиев и др., 1965). Придерживаясь этой терминологии, можно сказать, что темой настоящей диссертационной работы является анализ пространственно-временной динамики зрительных ощущений.
Следует, однако, заметить, что использование понятия "ощущение" в психологическом аспекте обременено грузом ассоциаций с устаревшей понятийной схемой созерцательно-сенсуалистической психологии прошлого века. Психологический анализ сознания, выполненный с позиций диалектико-материалистической методологии потребовал введения особых категорий для описания психологической структуры сознания. Были выделены такие образующие сознания, как его чувственная ткань, значение и личностный смысл (Леонтьев, 1959, 1975). В гносеологическом аспекте понятия "чувственная ткань сознания" и "ощущения" по существу совпадают, но как психологические понятия они включены в совершенно различные теоретические концепции и поэтому отличаются по смыслу.
В современной философской и психологической литературе, посвященной анализу чувственных форм отражения человеком окружающей его действительности, преобладает тенденция к качественному анализу этих форм. Конкретный количественный анализ структуры и строения чувственной сферы той или иной модальности отдается на откуп нейрофизиологии и биофизике, в которых, кстати сказать, изучаются частные вопросы, а системность чувственной сферы, ее психологическая целостность не затрагиваются. "Поэтому, как ни парадоксально на первый взгляд, « писал почти четверть века назад Б.Г.Ананьев, - но единство чувственного познания, целостность его структуры, взаимосвязь между ее частями до сих пор еще недостаточно поняты, хотя именно чувственное по знание составляет источник и основу рационального познания, в единой структуре которого нет никакого сомнения" (Ананьев, 1960, с.72).
За время, прошедшее с момента написания этих строк в этом вопросе по существу мало что изменилось. Задача количественного и вместе с тем системного анализа чувственного отражения остается по-прежнему актуальной. В связи с этим при разработке избранной для диссертационного исследования темы акцент был сделан на количественном анализе пространственно-временной динамики чувственной ткани.
Исторически первую попытку количественного анализа ощущений предпринял Г.-Т.Фехнер, заложивший фундамент новой научной дисциплины, названной им психофизикой (Feehner, I860). Ввиду чрезвычайной сложности вопроса Г.-Т.Фехнер вынужден был ограничиться количественным анализом лишь интенсивности ощущений, поставив перед собой задачу поиска функциональной зависимости между интенсивностью ощущения и интенсивностью вызывающего это ощущение стимула. Для решения этой задачи Г.-Т.Фехнер разработал специальные методы измерения интенсивности ощущений. С помощью этих методов ему удалось установить вид искомой зависимости, за которой в психологии укоренилось название психофизической функции. Г.-Т.Фехнер, выражаясь современным языком, идентифицировал психофизическую функцию.
Понятие психофизической функции прочно вошло в арсенал психологической науки. Нисколько не пытаясь умалить роль, которую сыграло это понятие в становлении экспериментальной психологии, следует все же признать, что психофизическая функция так и не стала универсальным средством количественного описания сенсорных явлений. Иначе и не могло быть, ибо фехнеровская проблема, как выяснилось, настолько тесно переплетена с вопро сами восприятия протяженности, что изучение одного в отрыве от другого оказалось малопродуктивным.
Факты, накопленные экспериментальной психологией за более чем столетнюю историю ее существования, убедительно свидетельствуют о том, что интенсивность ощущения зависит не только от интенсивности стимула, но и от непосредственного окружения это-го стимула, т.е. от пространственного распределения интенсивности в стимуле. В справедлиовсти этого утверждения убеждают, например, такие хорошо изученные зрительные явления, как полосы Маха, иллюзия О Брайен-Корнсвита, одновременный контраст и ряд других (см., например, cornsweet, 1971).
Хорошо известно также, что психофизическая функция имеет различный вид для ощущений разных модальностей (Пьерон, 1966; Стивене, 1974). Более того, даже внутри одной и той же модальности психофизическая функция может изменяться в зависимости от пространственного окружения стимула. Так, в частности, было показано, что психофизическая функция "светлота « яркость", измеренная для однородного светового пятна, существенно зависит от контраста, который составляет это пятно с фоном. И хотя степенной характер этой функции сохраняется, показатель степени уменьшается с увеличением контраста и даже становится отрицательным (Stevens, 1961).
Все эти факты говорят о том, что фехнеровское ограничение задачи изучением лишь интенсивности ощущений, бывшее вполне оправданным на начальном этапе развития экспериментальной психологии и психофизики, впоследствии стало тормозом на пути количественного изучения ощущений. На наш взгляд, необходимо отказаться от этого ограничения и перейти от изучения функциональной зависимости между интенсивностями ощущения и стимула к изу чению функциональной зависимости, связывающей пространственно-временное распределение субъективной интенсивности в целом с пространственно-временным распределением энергии в стимульном поле.
Для описания пространственно-временных распределений как стимульной, так и субъективной интенсивностей используются функции. В математике функциональная зависимость между множеств вами, элементы которых сами являются функциями, называются операторами. Учитывая это, можно так сформулировать основную мысль, высказанную выше: эмпирический материал» собранный за последнее время, диктует необходимость перехода от изучения психофизических функций к изучению психофизических или, что то же самое, сенсорных операторов.
В данной работе нас будет интересовать сенсорный оператор, характеризующий зрительную модальность. Иными словами, в диссертационной работе под сенсорным оператором мы будем иметь в виду математическую форму описания той связи, которая существует между чувственной тканью зрительного образа и его прокси . мальным стимулом, причем эта связь берется нами лишь в одном, вполне определенном аспекте1 . Таким образом, сенсорный оператор является одним из возможных способов описания функциональной зависимости между пространственно-временным распределением светлоты в чувственной ткани зрительного образа и пространственно-временным распределением световой энергии в проксимальном стимуле.
Сенсорный оператор является обобщением понятия психофизической функции. И так же, как психофизическая функция служит Цветовой тон, например, также является одним из пара метров чувственной ткани зрительного образа, однако он оста » ется вне рассмотрения в данной работе.
средством, позволяющим вычислять интенсивность ощущения, если известна интенсивность стимула, так и сенсорный оператор дает возможность по данному проксимальному стимулу вычислять чувственную ткань зрительного образа, а вернее, пространственно-временное распределение светлоты в образе. Поэтому конечной целью при изучении сенсорного оператора является его математическое описание (или идентификация), которое позволяло бы проводить подобного рода вычисления.
Поскольку сенсорный оператор является обобщением психофизической функции, то и методы его идентификации должны быть обобщением методов идентификации психофизической функции, т.е. обобщением классических психофизических методов. Однако такое обобщение нельзя осуществить механически, оно представляет особую задачу, ретение которой возможно лишь с помощью привлечения методов идентификации неизвестных систем, разработанных в математической теории систем.
Расширяя фехнеровскую постановку проблемы введением понятия "сенсорный оператор", мы тем самым преодолеваем излишнюю абстрагированность классической психофизики от психологии вое приятия. Действительно, проблема сенсорного оператора соединяет две (прежде оторванные друг от друга) линии в исследовании зрения человека, каждая из которых имеет богатую историю. Одна из этих двух линий (о ней в основном до сих пор и шла речь) восхо-дит к Г.-Т.Фехнеру и связана с изучением того, как зрительная система обрабатывает информацию об интенсивности зрительного стимула. Вторая связана с восприятием пространства.
Для психологического анализа зрительного восприятия пространства характерны следующие два момента. Во-первых, подавляющее большинство современных исследований в этой области так или иначе связаны с изучением восприятия удаленности. Восприятие удаленности по традиции обсуждается в контексте проблемы утраченного третьего измерения (Boring, 1942). Суть этой проблемы в том, что в двумерном сетчаточном изображении объекта теряется информация о его рельефе, объеме, а также о его удаленности от наблюдателя.
Во-вторых, изучение зрительного восприятия пространства ведется именно в плане восприятия. Большинство исследователей полагает, что утраченную сенсорную информацию о третьем измерении мозг компенсирует привлечением дополнительных источников внесенсорной информации о третьем измерении, таких, например, как признаки удаленности (carr, 1935; Boring, 1942). Иными словами, по мнению этих авторов, утраченную сенсорную информа цию могут компенсировать лишь перцептивные механизмы.
Разумеется, зрительное восприятие пространства не сводится к восприятию удаленности и глубины. За проблемой утраченного третьего измерения осталось в тени восприятие, так сказать, "первых" двух измерений, хотя в прошлом столетии этому вопросу была посвящена обширная литература. Восприятие первых двух измерений обсуждалось в контексте проблемы пространственной протяженности зрительных ощущений. Впоследствии эта проблема отошла на задний план и была забыта вместе с концептуальной схемой старой созерцательно-сенсуалистической психологии, в рамках которой она появилась.
Все эти обстоятельства и послужили, на наш взгляд, причиной того, что в современной психологической литературе проблеме сенсорных основ зрительного восприятия пространства практически не уделяется должного внимания. Сложившаяся ситуация явно указывает, на необходимость радикальной смены позиции, изменения подхода к этой проблеме. Сложившийся в психологии прошло го века подход со всей очевидностью обнаружил свою непродук- . тивность. Его основными недостатками были умозрительность и отсутствие выхода в сферу экспериментального исследования с использованием количественного анализа.
В самом деле, все многочисленные дискуссии прошлого века по этому поводу велись по существу вокруг одного и того же вопроса: откуда в зрительном ощущении появляется протяженность, если протяженность стимула теряется в фоторецепторе, адекватным раздражителем для которого, как известно, является световая энергия безотносительно к ее пространственному распределению. За такой постановкой вопроса нетрудно усмотреть неправомерное, на наш взгляд, абстрагирование протяженности от ее носителя, тогда как представляется совершенно очевидным, что изучать протяженность саму по себе в отрыве от ее субстрата невозможно.
Экспериментальному изучению можно подвергнуть лишь протяженность чего-члибо, например, протяженность стимула, чувственной ткани образа и т.п. Если при этом за отправной пункт взять принцип отражения, как один из основополагающих методологических принципов, которым, на наш взгляд, надлежит руководствоваться при изучении психических механизмов чувственного познания, то проблема приобретает следующий вид. Каковы закономерности субъективного отражения пространственной протяженности стимула в пространственной протяженности образа?
Разумеется, в такой постановке проблема еще излишне обща для того, чтобы ее можно было перевести в плоскость экспериментального исследования. Одна из возможных ее конкретизации заключается, например, в том, чтобы подвергнуть изучению закономерности отражения пространственного распределения интенсивности зрительного проксимального стимула в пространственном рас пределении светлоты в чувственной ткани зрительного образа. Количественное изучение закономерностей и структуры такого отражения становится возможным, как уже говорилось, если представить это отражение в виде математического отображения, т.е. сенсорного оператора.
Таким образом, к понятию сенсорного оператора мы приходим и в рамках классической постановки проблемы протяженности зрительных ощущений, т.е. проблемы сенсорных основ зрительного восприятия пространства.
Понятие сенсорного оператора является центральным для данного диссертационного исследования, а идентификация сенсорного оператора - его главной (хотя и не единственной) задачей. Решение этой задачи дано в диссертационной работе в виде математической модели сенсорного звена зрительной системы человека. Такая модель открывает широкие возможности для количественного описания и объяснения с единой точки зрения многих эмпирических фактов, полученных разными исследователями в разное время и в разных экспериментальных парадигмах. Эти возможности модели были продемонстрированы в работе на материале зрительных порогов и смазывания.
Такой выбор материала для демонстрации продуктивности разработанной модели был далеко не случайным. Дело в том, что зрительные пороги для интенсивности изучаются вот уже более двух столетий, и в этой области накоплен громадный эмпирический материал. На этом фоне особенно заметно отсутствие универсальной теории, которая могла бы охватить хотя бы часть накопленных экспериментальных данных. Явление же смазывания зрительных образов при движении, напротив, является малоисследованной областью науки о зрении1 . Причем следует подчеркнуть, что сма II I II I ИГ" г- По существу, изучались лишь верхние скоростные пороги смазывания.
зывание представляет собой надпороговое зрительное явление. Важность этого замечания проистекает из того, что в современной науке о зрении практически нет теорий или моделей, которые с равным успехом можно было бы применять как в пороговом, так и в надпороговом диапазоне.
Предлагаемая в диссертационной работе математическая модель сенсорного звена зрительной системы дает возможность теоретически рассчитывать как зрительные пороги, так и те феноменальные трансформации, которые претерпевает зрительный образ предмета при его движении. Проведенные нами соответствующие экспериментальные исследования показали, что расчетные данные находятся в полном соответствии с эмпирическими результатами и, следовательно, модель действительно позволяет вычислять чувственную ткань зрительного образа. Причем, поскольку модель позволяет вычислять чувственную ткань не только неподвижных, но и движущихся образов, то, на наш взгляд, имеются все основания считать, что теория, положенная в основу модели, является математической теорией не только чувственных основ зрительного восприятия пространства, но в какой-то мере и зрительного восприятия движения.
Математическое моделирование зрения (как, впрочем, и всякое иное моделирование) таит в себе неизбежный произвол, связанный с тем, что для одного и того же явления можно создать несколько структурно различающихся, но функционально эквивалентных математических моделей. В связи с этим возникает проблема выбора типа модели.
Основным структурным элементом математической модели, разрабатываемой в данной диссертационной работе, является ней-роподобный элемент, называемый нами каналом. Тем самым в рабо те реализуется основной принцип современной психофизиологии: "Анализ начинается с изучения психофизических характеристик той или иной функции (вход-выход системы), но на этом работа не заканчивается, а идет дальше к раскрытию нейронных механизмов. ... Интеграция психофизических и нейрофизиологических данных осуществляется путем построения модели. Модель строится из нейроподобных элементов - технических единиц, соответствующих реальным нейронам в отношении основных свойств передачи информации. К модели предъявляются два требования: она должна воспроизводить полученную психофизическую характеристику исследуемой функции в целом, а каждый нейроподобный элемент модели должен воспроизводить реакции реального нейрона, участвующего в осуществлении этой функции" (Соколов, 1982, с.85),
Обобщение многочисленных результатов Психофизических исследований (как собственных, так и описанных в литературе), характеризующих "вход-выход" зрительной системы, в форме сенсорного оператора составило первый этап диссертационного исследования. Задача его второго этапа заключалась в том, чтобы раскрыть нейрофизиологическую структуру сенсорного оператора. Поскольку микроэлектродное изучение свойств отдельных нейронов зрительной системы человека по известным причинам практически невозможно, эта задача решалась в соответствии с принципами психофизиологического исследования, а именно: посредством создания модели сенсорного оператора из нейроподобных элементов.
Следует заметить, что после пионерской работы У.МакКалока и У.Питтса (1956) с термином "нейроподобный элемент" стали прочно ассоциировать формальные нейроны, подчиняющиеся закону "все-или-ничего", изучению которых и была.посвящена работа этих авторов. Однако формальные нейроны У.МакКалока и У.Питтса отражали представления о структурных элементах нервной системы более чем полувековой давности. Ныне при моделировании зритель » ных нейронных сетей исходят из того, что нейрон представляет собой аналоговый преобразователь непрерывных сигналов (Позин, 1970; Grossberg, 1976). Иными словами, для описания нейронов зрительной системы (и в частности, зрительной коры) более под » ходит не логическая функция (каковой в сущности и является фор-мальный нейрон), а функционал, определенный на множестве проксимальных стимулов. Психофизические каналы, являющиеся основными структурными единицами, из которых составлена математическая модель сенсорного оператора, с математической точки зрения являются линейными функционалами.
Замена логической функции как способа математического представления нейроподобных элементов линейными функционалами с необходимостью приводит к тому, что аппарат математической логики, которым пользовались У.МакКалок, У.Питтс и их последователи при изучении нейронных сетей, утрачивает роль основного языка математического анализа нервной системы и уступает ее линейной алгебре (см., например, Фомин, Вайткявичус, Соколов, 1979), если предполагается конечномерность пространства стимулов, или функциональному анализу, если допускается бесконечномерность стимульного пространства, как это сделано, например, в настоящей работе. Привлечение математического аппарата функционального анализа открывает широкие возможности для использования при описании работы зрительной системы геометрического языка, неоценимыми достоинствами которого являются его наглядность и апелляция к нашей интуиции и воображению.
В заключение хотелось бы отметить, что необходимость разработки математических моделей сенсорного эвена зрительной сие темы человека диктуется не только естественным ходом событий в науке о зрении (многие проблемы в области зрительного вос приятия пространства и движения уже созрели для их строгого количественного анализа с привлечением математических методов), но также и рядом практических задач. Как известно, при разработке автоматизированных систем управления промышленными объектами, средствами передвижения и т.п. появилась необходимость учитывать человека-оператора как звено в цепи управления. В ответ на подобные запросы практики возникла прикладная ветвь психологической науки - инженерная психология, цель которой заключается в проектировании средств внешней и внутренней деятельности человека-оператора, в том числе и проектирование его перцептивной деятельности (Зинченко, 1970; Зинченко, Смолян, 1972; Ломов, 1982).
Следует признать, что психологи оказались объективно не вполне готовыми к столь стремительному вовлечению их в бурный процесс научно-технической революции. В то время, как в психологии продолжается дискуссия о предмете инженерной психологии (см., например, Пископпель, Щедровицкий, 1981), в промышленности уже ставится вопрос о полной замене человека в отдельных технологических звеньях современного производства промышленными роботами. Успехи робототехники столь впечатляющи (Янг, 1979; Корендясев и др., 1983), а экономический эффект в перспективе столь значителен, что в "Основных направлениях экономического и социального.развития СССР на 1981-1985 годы и на период до 1990 года" поставлена задача обеспечить широкое применение промышленных роботов в производстве, вплоть до создания автоматизированных цехов и заводов.
Одним из наиболее слабых мест в робототехнике являются искусственные органы чувств для роботов. Дальнейший прогресс в этой области сдерживается тем обстоятельством, что искусственное зрение роботов пока еще принципиально уступает зрению человека. Например, несмотря на значительные усилия, затрачиваемые создателями современных искусственных систем распознавания образов, таким системам по-прежнему недоступен анализ сложных реальных пространственных сцен, тогда как для любого человека такой анализ не представляет никаких затруднений,
К сожалению, сведения, которыми располагает психология зрительного восприятия, нельзя положить в основу создания искусственного аналога зрения человека. Поэтому задача выработки такого подхода к анализу зрительного восприятия вообще и восприятия пространства и движения в частности, который сделал бы возможным количественное описание восприятия, обладал бы объяснительной и предсказательной силой и конечный результат которого был бы представим в виде математической модели из нейроподобных элементов, допускающей техническую реализацию, - представляется чрезвычайно актуальной и практически необходимой. Мы надеемся, что предлагаемую в диссертационной работе математическую модель сенсорного звена зрительной системы человека можно рассматривать как шаг на пути решения этой важнейшей задачи.
Линейный анализ зрительной системы человека (обзор имеющихся в литературе данных)
Как показано в Приложении 1, линейные методы идентификации систем распадаются на методы идентификации ядра интегрального оператора, т.е. функции рассеяния, и методы идентификации передаточной функции системы. Своеобразие задачи идентификации сенсорного оператора заключается, как уже отмечалось выше, в том, что невозможны непосредственные наблюдение и регистрация выходной реакции зрительной системы, ибо чувственная ткань зрительного образа недоступна для самонаблюдения испытуемого. Экспериментатор имеет дело лишь с опосредствованными (некоторой перцептивной деятельностью) реакциями испытуемого, например, с вербальными реакциями "да-нет" при обнаружении (и/или различении) тестовых стимулов. Это обстоятельство делает невозможным прямое использование методов, разработанных в теории систем, при идентификации сенсорного оператора. В связи с этим возникает особая, характерная лишь для сенсорного оператора зрительной системы человека, проблема специального психофизического метода идентификации. Смысл этой проблемы заключается в необхо-димости приспособить известные в теории систем методы к специфике психофизической ситуации, о которой идет речь.
Все авторы, предпринимавшие попытки определить передаточную функцию зрительной системы, сталкивались с этой проблемой и в той или иной мере пытались решать ее, хотя следует отметить, что специально этой проблемой, насколько нам известно, никто не занимался. Возможно поэтому для нелинейного случая.эта проблема вообще не поднималась, и попытки идентифицировать сенсорный оператор в его нелинейном представлении не предпринимались.
При линейном представлении сенсорного оператора можно выделить три различных подхода к решению этой проблемы, в соответствии с которыми имеет смысл говорить о существовании трех различных методов линейной идентификации сенсорного оператора, которые мы условно назовем методами: а) "вход-выход", б) изокон-трастных кривых и в) подпороговой суммации. Первые два метода использовались для построения передаточной функции, последний -функции рассеяния точки и/или линии зрительной системы человека. А, Идентификация передаточной функции методом "вход-выход" В Приложении 1 показано, что передаточную функцию зрительной системы человека можно определить, если для какого-нибудь тестового (широкополосного) стимула известны его яркостная функция и соответствующая ему функция светлоты. В этом случае для вычисления передаточной функции зрительной системы необходимо разделить спектр яркостной функции (т.е. результат ее Фурье-преобразования) на спектр функции светлоты.
Такой метод идентификации передаточной функции зрительной системы человека требует умения эмпирически оценивать функцию светлоты для тестового стимула. Построение функции светлоты для двумерного стимула является весьма трудоемкой задачей, ибо предполагает локальную оценку светлоты (т.е. оценку значений функции светлоты в некоторых отдельных точках) с помощью известных психофизических методов шкалирования субъективных вели чин, т.е. построение графика функции светлоты "по точкам". Трудоемкость "поточечной" оценки эмпирической функции светлоты видимо послужила основной причиной того, что метод "вход-выход" редко применялся для идентификации передаточной функции. Нам известны лишь две работы, в которых определяли одномерную пространственную передаточную функцию зрительной системы человека с помощью этого метода (Lowry, De Palma, 1961; Bryngdahl, I964).
В одной из этих работ (bowry, De Palma, 1961) в качестве тестовых стимулов использовались однородные по вертикали изображения, каждое из которых состояло из темной и светлой полос, разделенных участком линейного изменения яркости. Как известно, функция светлоты для такого стимула существенно отличается от его яркостной функции. Возникает субъективное впечатление потемнения у края темной полосы и посветления у края светлой полосы. Это зрительное явление хорошо изучено и известно в литературе под названием "полосы Маха" (Fiorentini, 1972).
Современные представления об обнаружении в зритель ной системе человека
За последние два-три десятилетия наука о зрении испытала плодотворное влияние со стороны ряда технических дисциплин. Наиболее заметный след, по крайней мере в области психофизиологии зрения и слуха, остался, пожалуй, от содружества со специалистами в области статистической теории обнаружения сигналов (Петерсон, Бирдзолл, Фокс, 1960; Хелстрем, 1963; Ван Трис, 1972). Оставляя за собой право не разделять оптимизма некоторых авторов относительно продуктивности простой подмены психологических понятий терминами, заимствованными из теории обнаружения сигналов, тем не менее следует признать полезность ис« пользования понятийного строя этой общей дисциплины об обнаружении сигналов для анализа обнаружения сигналов человеком.
Так, например, полезно иметь в виду, что всякую (а следовательно, и зрительную) систему обнаружения можно условно раз бить на два блока или на два этапа: 1) этап некоторой предварительной обработки сигнала и представления его в форме, удобной для последующего принятия решения, и 2) собственно этап при -нятия решения (Green, Swets, 1966). В теории обнаружения сигналов первый блок называют "идеальным наблюдателем" (Green, I960). В рамках принятой нами в конце предыдущей главы терминологии роль идеального наблюдателя в зрительном обнаружении играет сенсорный оператор. Для того, чтобы подчеркнуть, что в этой главе нас будет интересовать сенсорный оператор не сам по себе, а как блок системы зрительного обнаружения, мы будем использовать введенный там же термин "препроцессор".
В любой из многочисленных моделей зрительного обнаружения, предлагавшихся в течение последнего времени в психофизиологической (и психофизической) литературе, можно выделить препроцессор и блок принятия решения. Поэтому о сходстве и различии этих моделей удобно судить по тому, какое содержание вкладывается авторами этих моделей в эти два блока.
Так, например, в соответствии с одной иэ наиболее часто встречающихся в современной литературе классификаций все моде ли зрительного обнаружения принято различать на одноканальные и многоканальные (Грэхэм, 1S81; Braddick, Campbell, A-fckin » son, 1978} Graham, I98O, 1981). Поскольку многие исследо ватели придают принципиальное значение этому делению, отмечая новизну и оригинальность идеи многоканального обнаружения, представляется целесообразным детально рассмотреть принципы, лежащие в его основе.
Препроцессором в одноканальной модели зрительного обнаружения служит один единственный канал-оператор. Иными слова ми, входом в препроцессор является яркоетная функция проксимального стимула, а выходом - функция светлоты.
Предполагается, что решение о наличии или об отсутствии стимула принимается на основе выхода с препроцессора (т.е. функции светлоты) в соответствии с определенным правилом решения. Авторы одноканальних моделей в основном использовали пиковое и интегральное правила решения.
Пиковое правило решения состоит в том, что решение о наличии стимула принимается в случае, если светлота превышает хотя бы в одной точке образа некоторую пороговую величину є , называемую критерием испытуемого К
Одноканальную модель с пиковым правилом решения можно представить в виде последовательного соединения препроцессора и пикового детектора, т.е. устройства, которое выдает положительную реакцию, если на его вход подать сигнал, превышающий по модулю хотя бы в одной точке некоторый фиксированный уровень , и нулевой сигнал в противном случае. Пиковый детектор в свою очередь можно представить в виде последовательности из двух блоков. Первый блок получает на входе функцию светлоты и вычисляет ее максимальную величину, а второй блок представляет собою пороговый элемент.
Смазывание в линейной системе
В общем-то более или менее очевидно, что за явлением смазывания лежит инерционность зрительной системы. Вопрос заключается в том, чтобы понять, является ли инерционность единственной причиной смазывания. Чтобы ответить на этот вопрос, необходимо уметь вычислять те феноменальные трансформации зрительных образов, которые возникают при движении из-за инерционности зрительной системы, т.е. разработать теорию смазыва ния в зрительной системе человека. До сих пор, насколько нам известно, такого рода теоретический анализ проблемы смазывания никем не проводился, тогда как математическая модель сен-сорного звена зрительной системы, представленная нами в предыдущих главах диссертации, позволяет без труда это сделать. После того, как такая теоретическая работа будет проведена, следует обратиться к опыту и посмотреть, насколько экспери -ментальные данные могут быть объяснены с помощью инерционной теории смазывания (т.е. теории, учитывающей лишь инерционность зрительной системы).
Инерционная теория смазывания приобретает весьма простой вид для линейных систем. Эта простота служит оправданием тому, что основное внимание в этой главе мы уделили смазыванию именно в линейных системах. Однако, полученные при этом результаты легко могут быть обобщены на случай нелинейных систем.
Если объект перемещается с постоянной скоростью, смазывание1 удобно анализировать в частотной области. В этом случае оно сводится к некоторому преобразованию спектра зрительного образа. Наша задача состоит в том, чтобы вывести математическую форму этого преобразования, которое в дальнейшем мы ради краткости будем называть преобразованием смазывания. Преобразование смазывания имеет особенно простой вид, если допустить такую идеализацию, как бесконечное движение в бесконечной плоскости.
Прежде всего выясним, как трансформируется спектр изображения ЕСх\хг), если оно перемещается со скоростью я = \лу1,яэ-г). Поначалу не будем исключать и случай, когда само изображение изменяется во времени. Пусть fcc Vs t) - такое изображение и LC-P1, -fz, ы) -его спектр. Тогда I CxV-v4t,xl-vat,t) представление этого изображения в движении со скоростью v . Введем векторные обозначения для координат: СС = ("Зс Л И e a J, где х , 1R. Таким образом, искомое преобразование, которому подвер-гается спектр изображения при его равномерном и прямолинейном движении, сводится к линейному преобразованию координат в частотной области. Матрицей этого преобразования служит матрица СА-«) . Рассмотрим частный случай, когда стимул с=с\ аЛ)разде ляется по временным и пространственным переменным, т.е. с?с\ гД)-Е(эс\эсг)А(Л) . При этом функцию Ct) мы будем называть функцией экспозиции. Тогда, если положить Л 0 = 1 то формула (3) приобретает следующий вид:
Приступим теперь к анализу преобразований, которые, претерпевает движущееся изображение в линейной системе, т.е. к анализу смазывания. Рассуждения будем вести для случая двух переменных, неограниченного движения и единичной функции экспозиции, т.е. при Xt) = l . Поскольку Фурье-преобразованием константы служит дельта-функция (Папулис, 1971, с.108), то в этом случае спектр движущегося изображения имеет вид: eC ft)]-2xLC S(u r) (5).
Анализ смазывания при произвольной функции экспозиции Мл) удобнее вести в пространственно-временной области в терминах алгебры свертки. Этому будет посвящен следующий раздел.
Итак, пусть изображение (.«) і перемещающееся вправо по оси х с постоянной скоростью -cr , подается на вход линейной системы ц/ с передаточной функцией ц ($,» )
Экспериментальное исследование феноменальных преобразований, которые претерпевают образы предметов в движении
Известно, что различение и опознание движущихся предметов ухудшается сравнительно с опознанием неподвижных объектов. В реальной ситуации два фактора могут быть причиной этому: уменьшение времени экспозиции и смазывание. В настоящее время прочно установилась точка зрения, согласно которой уменьшение времени экспозиции само_по себе (т.е. в отсутствие последующего маскирования, при условии компенсации уменьшения светлоты, сопровождающего уменьшение времени экспозиции) не оказывает заметного влияния на успешность опознания (Спер-линг, 1967). Поэтому в поисках причин ухудшения опознания объектов в движении следует прежде всего обратить внимание на смазывание. Вопрос состоит в том, можно ли считать смазывание единственным фактором, определяющим опознание движуще-гося изображения, а если нет, то какова его роль в этой перцептивной деятельности.
Поскольку смазывание является пространственной фильтрацией движущегося изображения,.то естественным образом возникает желание сравнить успешность опознания неподвижных, но подвергнутых предварительной фильтрации изображений с успешностью опознания этих же изображений в движении. Если смазывание является единственным фактором, определяющим опознание движущихся изображений, то успешность опознания должна быть в обоих случаях идентичной. Если же обнаружится различие, то можно надеяться, что в ходе дальнейших исследований удастся вычленить вклад смазывания в ухудшение опознания и попытаться выявить другие факторы, оказывающие влияние на эту важнейшую в практическом отношении перцептивную деятельность.
Различение движущихся прямоугольных и синусоидальных решеток
Прежде чем приступить к реализации этого замысла, требовалось решить один важный в методологическом отношении вопрос относительно влияния пространственной фильтрации на опознание изображений. Здесь возможны по крайней мере две гипотезы. Одна из них заключается в том, что малейшее изменение амплитуды любой гармоники в спектре изображения немедленно приводит к изменению успешности опознания этого изображения. Например, при увеличении амплитуды - к улучшению, а при уменьшении амплитуды - к ухудшению опознания. Вторая гипотеза состоит в том, что изменение амплитуды любой гармоники не сказывается существенно на опознании до тех пор, пока она не станет под-пороговой.
Для выяснения того, какая гипотеза больше соответствует действительности, был проведен эксперимент, замысел которого состоял в следующем. Изучалась зависимость опознания синусоидальных и прямоугольных решеток одной и той же частоты от их контраста и скорости движения. При фиксированном контрасте синусоидальной и прямоугольной решеток можно найти максимальную скорость их движения, при которой решетки впервые перестают уверенно различаться испытуемым. Различение считалось уверенным, если вероятность правильных ответов была не менее 0,75. Если справедлива вторая гипотеза, то уверенное различение будет теряться на такой скорости, на которой в спектре прямоугольной решетки полностью смажутся все гармоники кроме фундаментальной. Иными словами, вторая гипотеза применительно к опознанию синусоидальных и прямоугольных решеток приобретает следующий вид. До тех пор, пока в спектре прямоугольной решетки сохранится на надпороговом уровне хотя бы одна гармоника, отличная от фундаментальной, различение синусоидальной и прямоугольной решеток будет уверенным.
Действительно, как известно, спектр прямоугольной решетки содержит нечетные гармоники, амплитуда которых обратно пропорциональна их номеру. По мере увеличения скорости движения прямоугольной решетки будет возрастать наименьший номер гармоники, подвергнувшейся полному смазыванию . В тот момент, когда смажется третья гармоника, спектр прямоугольной решетки не будет отличаться от спектра синусоидальной решетки. Следовательно, скорость, на которой будет утрачено уверенное различение решеток, в точности должна равняться скорости, на которой произойдет полное смазывание третьей гармоники. Для проверки этого положения был проведен следующий эксперимент (Логвиненко, Меньшикова, 1981).