Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Механизмы процесса узнавания изображений разной сложности Кроль, Владимир Михайлович

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кроль, Владимир Михайлович. Механизмы процесса узнавания изображений разной сложности : автореферат дис. ... доктора биологических наук : 03.00.13.- Москва, 1993.- 53 с.: ил.

Введение к работе

Актуальность исследования. Зрительная система живых организмов является аппаратом,предназначенным для получения сведений о внешней среде, необходимых для выработки команд регулирования поведения.Одной из основных задач физиологии зрения является выяснение механизмов восприятия и узнавания объектов.Работа всех отделов зрительной системы направлена в конечном счете на решение этой задачи.

Центральные вопросы работы зрительной системы при этом в существенной степени связаны с проблемами инвариантного выделения на сложной зрительной сцене на фоне других объектов и шумов . фигур определенного типа, определения характеристик этих объектов и их классификации.При этом зрительная система должна выполнять анализ сцены в соответствии с текущими требованиями и мотивациями организма,т.е. в соответствии с решаемой в данное время поведенческой задачей (Э.А.Асратян.В.П.Зинченко, П.В.Симонов, О.С.Адрианов и др.). Изучение активного характера зрительного восприятия имеет, таким образом^существенное значение в связи с вопросом организации целенаправленного поведения организма.

Нейрофизиологические и психофизические механизмы работы зрительной системы в процессе восприятия интенсивно разрабатываются в" настоящее время (В.Д.Глезер, А.М.Йваницкий, Л.Й.Леуши-на, Н.Н.Любимов, Э.А.Констандов, Н.Ф.Подвигин, В.Б.Полянский, Е.Н.Соколов, А.Я.Супин, Л.А.Шевелев, М. С.Шехтер и др.) -

Изучение различных аспектов зрительного восприятия направлено на выяснение таких важных вопросов как работа механизмов обобщенного описания формы и классификации объектов, пространственная организация обработки зрительной информации, механизмы текстурного анализа, стереозрения.

В настоящее время при комплексном подходе, сочетающем применение современных методов психофизики,электрофизиологии и компьютерного моделирования становится реальной эффективная разработка этих вопросов.

С другой стороны решение перечисленных проблем имеет значение не только для развития теории переработки информации в зрительной системе живых организмов.Получаемые данные актуальны с точки зрения их непосредственного использования для разработки

-2-и построения биоподобных роботов-манипуляторов,используемых для автоматизации производства, работы в труднодоступных местах,а также для образного представления информации,организованной адекватно характеристикам восприятия оператора человеко-компь-ютерных систем управления.

Цель и задачи исследования. Анализ данных литературы, касающихся различных сторон проблемы зрительного узнавания, показывает существование большого количества работ, посвященных исследованию вопросов микрогенеза восприятия, соотношения симультанных и сукцессивных процессов, в частности, роли контекста в ходе восприятия, эффектов преобладания целого над частью, иерархии признаков описания изображений.С другой стороны существуют данные,показывающие наличие и некоторые характеристики работы нейронов, реагирующих на сложные элементы формы объектов.

Тем не менее целостная картина процесса зрительного узнавания включающая данные макро- и микроуровней изучения, остается не ясной, Существует разрыв между результатами, описывающими проблему узнавания на нейронном уровне, и результатами, описывающими макроуровень процесса узнавания. Этот разрыв касается определения этапов узнавания, их последовательности, характеристик, структуры инвариантных описаний классов зрительных объектов и т.д.

Анализ литературных данных приводит, таким образом, к формулированию следующих основных задач исследования.

1. Психофизическое изучение временного развития процесса
восприятия формы изображений разной сложности,анализируемых в
условиях различных зрительных шумов.Определение основных харак
теристик этапов классификации и идентификации воспринимаемых
фигур. Формулирование системы представлений о структуре перцеп
тивного, эталонного описания класса зрительных объектов и об
основных этапах и стратегии работы зрительной системы в ходе
процесса узнавания.

2. Определение взаимоотношений между ходом текстурного ана
лиза и процессами описания формы элементов текстур. Психофизи
ческое изучение соотношений интегральных и локальных механизмов
текстурного анализа.

3 Определение с помощью синтезированных на ЭВМ и не имеющих

монокулярных признаков глубины стереограмм роли операций анализа формы фрагментов в процессе стереовосприятия.

Научная новизна работы.В данной работе проведено комплексное изучение монокулярных и бинокулярных закономерностей и механизмов зрительного восприятия. В работе впервые установлены, следующие явления и закономерности.

1. Измерение порогов восприятия формы изображений в услови
ях прямого и обратного паттернового маскирования показало, что
пороговое время предъявления тестовых фигур, необходимое для их
восприятия, определяется степенью сходства тестовой фигуры и
маскирующего изображения.

Полученные данные позволяют сделать вывод, что обработка изображений на центральных стадиях опознания является фрагмент-но специфичной и осуществляется многоуровневой структурой, анализирующей различные характеристики формы.

  1. Показано, что изменение условий восприятия (смена маскирующих изображений или переход к режиму направленного поиска объектов) приводит к существенному варьированию хода процесса узнавания. Данный эффект проявляется в изменении пороговых характеристик отдельных стадий узнавания, вплоть до выпадения одних и появления других стадий.

  2. Систематическое измерение порогов стадий узнавания и анализ ошибок, имеющих место на стадиях частичного, описания, оценочной классификации и идентификации тестовых фигур, привели к выводу, что узнавание объекта осуществляется путем проведения операций генерации вариантов разбиения изображения на фрагменты, а также операций выдвижения и проверки гипотез об отдельных фрагментах, их характеристиках и характеристиках взаимного расположения постепенно усложняюшихся групп фрагментов.

  3. В результате нейрофизиологических экспериментов по изучению закономерностей отображения зрительного поля в зрительную кору мозга подтверждены выводы о значимости характеристик взаимоотношений групп фрагментов различных уровней сложности. Показано сохранение при отображении в пространство зрительной коры подобия малых элементов анализируемых фигур, сохранение величин углов между любыми линиями фигур при одновременном искажении формы больших фрагментов (конформность отображения).

  4. Полученные экспериментальные данные о временном ходе процесса восприятия формы изображений разной степени сложности

-4-и зашумленности позволили сформулировать положение о узнавании как об иерархическом контекстно - управляемом поиске фрагментов, характеристики которых удовлетворяют критериям перцептивного эталонного описания класса объектов.

6. В работе показано, что процесс восприятия текстур и вы
деления границ между текстурными областями включает в себя
частично интегральные и в основном локальные стадии обработки.
Процесс тесно связан с операциями усложняющегося описания формы
фрагментов, составляющих текстурные области. На основании полу
ченных экспериментальных данных разработана модель текстурного
анализа, сущность работы которой заключается в определении раз
личных характеристик формы элементов текстур и выявлении харак
теристик, имеющих близкие значения на компактном множестве
фрагментов.

Результатом работы модели является генерация естественных для восприятия вариантов разбиения сложного текстурного изображения на отдельные текстурные области, выступающие в дальнейшем как целостные единицы восприятия. Окончательный выбор варианта разбиения происходит после сопоставления характеристик текстурных областей с критериями перцептивного эталонного описания.

  1. Сравнительное изучение восприятия синтезированных на ЭВМ и не имеющих монокулярных "ключей" стереограмм из точек,линий и символов свидетельствует в пользу активного участия в ходе сте-реовосприятия операций анализа формы фрагментов. Время реакции при восприятии стереофигур, состоящих из имеющих форму фрагментов (линий и символов) мало зависит от наклона стереофигуры вглубь, тогда как время реакции восприятия точечных стереоизображений в этом случае резко растет.

  2. На основании полученных экспериментальных данных сформулирована гипотеза -о "полоеовом" механизме решения одной из основных задач стереозрения - задачи идентификации пар неточечных фрагментов двух стереограмм. Разработана и реализована в виде программы для ЭВМ модель процесса стереовосприятия, определяющая расстояния до элементов зрительной сцены на основании анализа информации входной стереопары изображений.

Практическое значение работы. 1. Полученные экспериментальные результаты и следующие из модели зрительного узнавания выводы о характеристиках пофраг-ментнои обработки изображений в процессе их узнавання и классп-

-5- фикащш полезны для использования при разработке способов образного представления данных для автоматизированных рабочих мест (АРМ) операторов человеко-компьютерных систем.

  1. Полученные данные о механизмах восприятия сложных, естественных текстур позволили разработать и реализовать в виде программы для ЭВМ принципиально новую модель процесса текстурного анализа. Модель осуществляет выделение и охаракте-ризацию сложных текстурных областей, играющих роль целостных единиц в ходе дальнейшего узнавания.

  2. На основании данных, полученных при изучении бинокулярного зрения разработана и реализована на ЭВМ модель процесса стереовосприятия. Модель на основании двух плоских сетчаточных изображений позволяет определять удаленность от наблюдателя любых элементов зрительной сцены.

Результаты изучения характеристик стереозренияия (число стереопланов, временной ход процесса стереовосприятия ) могут быть использованы при разработке способов представления информации человеку -оператору путем кодирования параметров объекта управления удаленностью элементов сцены от наблюдателя.

Показано, что нарушение работы предложенного "полосового" механизма идентификации пар фрагментов двух стереоизображении играет важную роль в возникновении ряда форм косоглазия.

4. Полученные в работе экспериментальные и теоретические
результаты использованы при чтении курсов психофизиологии восп
риятия в эргономики в Московском институте радиотехники, элект
роники и автоматики.

Основные положения, выносимые на защиту.

  1. Изучение временных этапов и анализ характерных ошибок восприятия формы изображений позволили сформулировать положение об узнавании как о процессе направленного поиска на зрительной сцене фрагментов, удовлетворяющих критериям перцептивного эталонного описания соответствующего класса объектов. Процесс поиска является перестраиваемым, контекстно управляемым и проводится путем выполнения операций генерации вариантов разбиения изображении на фрагменты, а также операций выдвижения и проверки гипотез о характеристиках отдельных фрагментов и характеристиках взаимоотношения сложных групп Фрагментов.

  2. Механизмы текстурного анализа и стереовосприятия, имеющие место в ходе процесса узнавания, основаны на многоэтапном

усложняющемся процессе анализа формы фрагментов.

  1. Текстурный анализ включает в себя интегральные, локальные и собственно текстурные этапы, сущность которых заключается соответственно в постепенно усложняющейся охарактеризации фрагментов, составляющих текстурные области, и выделении самих областей и границ между ними. Важная черта текстурного анализа заключается также в порождении вариантов разбиения на текстурные области с последующим отбором тех вариантов, которые удовлетворяют критериям перцептивных эталонных описаний и рассматриваются в дальнейшем как целостные единицы восприятия.

  2. В работе сформулирован "полосовой" механизм решения одной из основных задач стереозрения - задачи идентификации пар фрагментов двух стереограмм. Предложенный "полосовой механизм отбора соответствующих пар среди множества фрагментов основан на измерении элементарных характеристик формы сравниваемых фрагментов.

В работе показано, что нарушение работы "полосового" механизма играет важную роль в возникновении некоторых форм косоглазия.

Апробация диссертационного материала. Результаты диссертации доложены и обсуждены на III,IV» ТІ и VIII Всесоюзных конференциях по нейрокибернетике (Ростов-на-Дону, 1967,1970,1976, 1980,1983),1 Всесоюзной конференции по проблемам биологической и медицинской кибернетики (Москва,1971), Республиканской школе по нейробионике (Канев.1971),II симпозиуме по физиологии сенсорных систем "Физиология зрения" (Ленинград,1973), IV симпозиуме по физиологии сенсорных систем (Ленинград, 1976),IV Международной объединенной конференции по искуственному интеллекту (Москва,1975), V Всесоюзном съезде психологов (Москва, 1977), II Международной конференции стран членов СЭВ (Ленинград, 1978), VII Всесоюзном съезде психологов (Москва,1982), Биофизическом конгрессе (Москва,1982), VI Всесоюзной конференции по инженерной психологии (Москва, 1984), XIII и XV научно-методических конференциях МЙРЭА по новым методам и средствам обучения (Москва,1989,1991), Международной конференции "Взаимодействие человека с компьютером*(Москва, 1993).

Публикации.Основное содержание диссертации опубликовано в 32 печатных работах.

Объем работы.Диссертация состоит из следующих разделов:

введение, обзор -литературы. ' методика, результаты, обсуждение результатов, выводы, список литературы. Работа изложена на 405 страницах машинописного текста, содержит 51 таблицу, 41 рисунок. Список литературы содержит 132 русских я 373 иностранных наименования.

Методы исследования.

Исследование проводилось при использовании методов психофизики, электрофизиологии и компьютерного моделирования.

Психофизические методы. Работа проводилась с 65 здоровыми испытуемыми обоего пола в возрасте от 18 до 40 лет. с нормальным или корректированным до нормы зрением. В качестве тестовых фигур использовались разные типы черно-белых, контурных или полутоновых изображений: паттерны из параллельных линий и полос, одинаковой: длины, геометрические фигуры и их комбинации, схематические изображения лиц, одиночные предметные изображения, полутоновые изображения реальных текстур и лиц людей, компьютерно синтезированные стереопары, лишенные монокулярных "ключей" узнавания.

В экспериментах использовались различные типы искажений и зрительных шумов: пересечение и продление линий тестовых фигур, раздвяженке их частей и др. Тестовые фигуры предъявлялись з центре экспозиционного поля после сигнала готозности. их размер в разных сериях находился в пределах 1,5 - 3.0. Яркость изображений имела порядок 7-10 люкс.

В качестве маскирующих использовались шумовые и паттерновые изображения разных типов, детально описанные при изложении результатов соответствующих экспериментов.

3 экспериментах по изучению монокулярных характеристик узнавания использовался трехканальныи тахистоскоп с электронным блоком управления, обеспечивающим независимую регулировку длительности предэкспозиционного. экспозиционного и послеэкспози-ционного полей. Ввиду того что в разных сериях длительности экспозиции находились в пределах от 2 до 300 мс. фронты экспозиционного поля были доведены до величин порядка 2-3 мс. Минимальный шаг роста экспозиции равнялся 2-3 мс. Маскирующее поле предъявлялось непосредственно после окончания времени экспозиции тестового изображения. Пороговым временем считалось время предъявления тестовой фигуры, необходимое для ее узнавания.

При измерении времени реакции тестовые фигуры предъявлялись

з тахистоскопе на неограниченное время при отсутствии постэкспозиционного маскирования. Испытуемые обучались нажимать указательным пальцем на одну из клавиш, расположенных розеткой. При этом каждая из клавиш символизировала то или иное тестовое изображение; количество клавиш соответствовало числу тестовых фигур. Включение счета времени реакции происходило одновременно с предъявлением тестового изображения непосредственно от управляющего блока тахистоскопа.

Для синтеза стереоизображений, лишенных монокулярных ключей узнавания, были разработаны компьютерные программы, поточечно определяющие координаты элементов тестового объекта на правой и-левой стереограмме. В качестве тестовых фигур использовались пандусы, пары плоскопараллельных плоскостей, лестницы с варьирующим числом ступенек, куполообразные фигуры. Для рисования стереограмм использовался графопостроитель. Стереопары предъявлялись в зеркальном стереоскопе, позволяющем проводить измерение времени реакции у испытуемых. Начало экспозиции стереопары определялось моментом включения источника света. Передние фронты полей экспозиции имели величину, порядка 20 не, что на порядок или два меньше, чем измеряемое з этих экспериментах время реакции.

Остановка счета времени проводилась так же как и в экспериментах по измерению времени реакции при изучении і монокулярных механизмов восприятия. Маскирующее поле в экспериментах отсутствовало. Фиксационная точка , сигнал готовности/ содержалась в предэкспсзиционном поле, измерение вертикальной диспа-ратности проводилось при помощи микрометрического винта, сдвигающего одно из изображений стереопары.

Электрофизиологические методы. Эксперименты проводились на 14 обездвиженных миорелаксантом взрослых кошках. Световая стимуляция осуществлялась при помощи газонаполненных ламп типа ДРГМ-70. дающих бесшумную вспышку белого света с регулируемой интенсивностью и длительность». Определение положения светового пятна в зрительном поле производилось в сферической системе координат. В экспериментах использовались пятна света диаметром от 0.5 до нескольких градусов. Для регистрации вызванных ответов использовались электроды с диаметром конца 5-10 мкм.