Введение к работе
Актуальность проблемы
Обработка зрительной информации представляет собой сложный иерархически организованный процесс, цели которого – категоризация, классификация и выявление биологической значимости объектов окружающей среды. Основной единицей, занятой в анализе характеристических признаков зрительных объектов, является нейрон-детектор. Детекторный принцип работы мозга был сформулирован после того, как в 1959 г. МакКаллок и Питс с коллегами в сетчатке лягушки обнаружили нейроны, тонко настроенные на параметры сложных зрительных образов: размер, скорость движения, контраст и т.д. Позднее подобного рода клетки-детекторы были найдены на разных уровнях корковой системы анализа зрительной информации: детекторы ориентации линий в первичной зрительной коре кошки (Hubel & Wiesel, 1962); детекторы пересечений и ветвлений линий в стриарной коре кошки (Шевелев, 1993); нейроны-детекторы лиц в нижневисочной коре мозга макаки резус (Gross, 1972). Теоретические и практические исследования в области детекторной модели кодирования сенсорного сигнала были проведены Е. Н. Соколовым (Соколов, 1995).
Изучение свойств нейронов-детекторов тесно связано с теоретическими работами в области моделирования зрительной системы. Еще в 1982 Марр сформулировал формальные принципы, которые следует принимать в расчет при создании искусственных систем распознавания зрительных образов. Тем не менее, всеобъемлющая теория работы зрительного анализатора до сих пор не создана, а компьютерные системы распознавания образов показали свою функциональность лишь при определенных условиях зрительной среды. Именно поэтому так важны работы по изучению детекторных свойств нейронов, которые смогут объяснить принципы обработки информации в мозге животных. Понимание механизмов, лежащих в основе работы зрительного анализатора, позволит создать интеллектуальные системы распознавания зрительных образов, способные облегчить работу операторов как в сфере обеспечения безопасности жизнедеятельности, так и в разнообразных областях промышленности.
В процессе работы зрительный анализатор сталкивается и успешно решает проблемы, которые вызывают серьезные затруднения при создании искусственных систем распознавания зрительных образов. Так, даже незначительные вариации условий освещения зрительных объектов или изменение их размеров оказывают значительный негативный эффект на успешность распознавания объектов искусственным зрительным анализатором. В связи с этим крайне актуальны исследовательские работы, направленные на детальное изучение свойств нейронов-детекторов. Высокая эффективность нейронов-детекторов связана с их уникальной адаптивной способностью. При этом нервные клетки мозга могут не только приспосабливаться к быстро изменяющимся условиям среды, но и подстраиваться к особенностям зрительного окружения, с которым приходится длительное время контактировать живому организму. Другой важной отличительной чертой детекторов является их способность стабильно кодировать информацию о характеристических признаках изображения и зрительных объектах. И, наконец, однозначность кодирования обеспечивает высокую точность представления информации в мозге. Исследования последних лет значительно обогатили знания о принципах кодирования информации в зрительном анализаторе человека и животных. Тем не менее, изучение адаптивности, стабильности и однозначности кодирования занимают главенствующее положение в работе ведущих мировых лабораторий.
По существующим на настоящий момент представлениям процесс распознавания сложных зрительных объектов можно условно разбить на несколько стадий: выделение фигуры из фона – определение характеристических признаков – связывание отдельных характеристик в единое внутреннее представление – сопоставление с хранящейся в памяти информацией – категоризация. Таким образом, успешное распознавание зрительного образа не заканчивается созданием его внутренней копии, лишь категоризация и выявление биологической значимости объекта логически завершают этот процесс.
Так, было показано, что информация о зрительном образе уже на уровне сетчатки и далее в первичной зрительной коре разделяется на два основных потока, каждый из которых заканчивается в определенных структурах головного мозга (Wssle & Boycott, 1991). Дорзальный путь, закачивающийся в теменных отделах коры больших полушарий, участвует в анализе информации о зрительном пространстве и перемещениях объектов в нем, тогда как включенные в вентральный путь нейронные структуры принимают участие в обработке информации, идентифицирующей зрительные образы. На вершине иерархии вентрального пути находятся области передней нижневисочной коры (Ungerleider & Mishkin, 1982). Именно здесь были обнаружены нейроны, селективно реагирующие на появление в поле зрения сложным образом организованных зрительных стимулов, таких как лица человека или обезьяны (Gross, 1972).
Способность к анализу информации о лицах является одной из самых интригующих функциональных особенностей мозга приматов. В процессе эволюции у приматов сформировалась высокоразвитая мимическая мускулатура, которая играет важную роль в обеспечении социальных взаимооотношений у этих животных, ведущих групповой образ жизни. Поэтому в ходе эволюции в мозге приматов возникли специализированные структуры, анализирующие информацию о лицах и их эмоциональных выражениях (Perrett et al., 1992). С помощью методов функциональной магнитно-резонансной томографии удалось локализовать такие структуры как в мозге человека (Kanwisher, 1997; Tsao et al., 2008), так и обезьян (Logothetis et al., 1999; Tsao et al., 2006), а детальные микроэлектродные исследования позволили выявить специфические свойства нейронов-детекторов лиц (Freiwald et al., 2009). Эти нейроны обладают большими рецептивными полями, что дает им возможность анализировать информацию с протяженных участков поля зрения (Gross, 1972). Детекторы обладают свойством инвариантности: изменения параметров освещения зрительных объектов или их размеров не оказывают значительного влияния на их активность (Vogels & Orban, 1996; Vogels & Biederman, 2002). Существует точка зрения, что кодирование информации о сложных зрительных образах происходит не только с помощью увеличения частоты импульсации, но и за счет временных модуляций нейронного разряда (Richmond et al. 1987; Richmond & Optican, 1987; Sugase et al, 1999). Система распознавания таких сложных зрительных стимулов как лица является, по крайней мере частично, врожденной: нейроны-детекторы лиц были обнаружены даже у новорожденных детенышей макак (Rodman, 1991).
В последнее время появился ряд психофизических работ, которые демонстрируют важную роль прототипа или так называемого «усредненного лица» в организации системы распознавания лиц (Leopold et al., 2001). Предполагается, что узнавание индивидуальных лиц происходит путем сравнения их с прототипом, который формируется у субъекта в результате накопления и обработки информации о лицах в процессе жизни. Принцип кодирования информации о сложных зрительных образах, в основе которого лежит сравнение с прототипом, считается универсальным принципом, который широко ипользуется в мозге для формирования внутреннего представления объектов и событий в окружающей среде (Edelman, 1999). В связи с этим особый интерес приобретает исследование роли нейронов-детекторов в кодировании информации о прототипе и индивидуальных лицах.
Исследование сложных свойств нейронов-детекторов предъявляет особые требования к методикам, используемым в таких экспериментах. Перспективным может быть как использование функционального картирования больших популяций нейронов, так и применение электрофизиологических подходов, с помощью которых возможна стабильная одновременная регистрация нескольких отдельных нейронов. Дело в том, что к настоящему моменту получено значительное количество данных, подверждающих гипотезу о кодировании сложных признаков нейрональными ансамблями (Georgopoulos et al., 1986; Nicolelis et al., 1995; Deadwyler & Hampson, 1997). Регистрация популяционного ответа с помощью визуализирующих работу мозга методик, а также одновременное отведение активности нескольких отдельных нейронов позволяет получить ценную информацию о кооперативной работе клеток мозга, направленной на решение определенных сенсорных задач. Особенно важным представляется использование методик, позволяющих наблюдать за активностью идентифицированного нейрона в течение длительного времени. Хронические имплантации микроэлектродов делают возможными такие долговременные наблюдения за активностью (а также ее изменениями) одной и той же клетки. Речь идет о регистрациях активности, которые отставлены друг от друга не только на несколько часов, но и на дни, недели или даже месяцы. Увеличение количества регистрирующих электродов в хроническом эксперименте позволяет получить уникальные данные по сочетанной работе отдельных клеток в составе нейронных ансамблей. В настоящее время развитие экспериментальных технологий позволяет вплотную приблизиться к созданию таких методик (Porada, 2000).
Цели исследования
Целью настоящей работы является детальное изучение принципов, лежащих в основе представления информации о характеристических признаках изображения и сложных зрительных объектах: адаптивности, стабильности и однозначности кодирования.
Задачи работы
1. Изучить с помощью оптического картирования по внутреннему сигналу особенности представления информации об ориентации зрительного стимула в первичной зрительной коре головного мозга кошки. Наблюдение за большими популяциями нейронов позволит оценить степень адаптации детекторной системы первичной зрительной коры к особенностям зрительного окружения.
2. Разработать методику стабильной одновременной регистрации активностей нескольких нейронов с помощью хронически имплантируемых в мозг обезьян микроэлектродов, а также разработать критерии, позволяющие по характеристикам нейронного ответа оценивать стабильность регистрации сигнала от одного и того же нейрона в разные экспериментальные дни.
3. С помощью хронически имплантированных множественных микроэлектродов изучить способность нейронов-детекторов нижневисочной коры сохранять селективные свойства в условиях отсутствия обучающих воздействий и обеспечивать стабильность кодирования информации.
4. Используя математическую модель морфинга лиц создать наборы зрительных стимулов (лиц), которые могли бы позволить в психофизических экспериментах на обезьянах проверить гипотезу о важной роли прототипа («усредненного лица») в распознавании лиц.
5. Используя наборы проверенных в психофизических опытах стимулов, в электрофизиологических экспериментах исследовать настройку нейронов-детекторов лиц и охарактеризовать полученные данные с позиций представлений по кодированию информации о лицах, ключевым звеном которых является использование однозначного кода при участии прототипа.
Научная новизна работы
В представленной работе с помощью современных методических подходов получены принципиально новые данные. Были применены три уникальных методики, позволивших сформулировать оригинальные теоретические выводы об особенностях функционирования зрительной системы: метод оптического картирования коры по внутреннему сигналу, хронические имплантации множественных микроэлектродов и математическая система морфинга лиц. Оптическое картирование по внутреннему сигналу позволяет опосредованно регистрировать активность больших популяций нейронов в ответ на изменяющиеся условия внешней стимуляции. С помощью данного подхода возможно выявление тонкой функциональной организации корковых областей, а также исследование вовлеченности отдельных функциональных модулей коры в процессы переработки информации. Оптическое картирование позволило показать, что популяции нейронов-детекторов в первичной зрительной коре тонко подстроены к статистикам анализируемого зрительного окружения.
По-своему уникален также метод хронических имплантаций множественных микроэлектродов в мозг, который за время выполнения данной работы был успешно адаптирован для использования в длительных экспериментах на обезьянах. Новизна данного подхода заключается в том, что он обеспечивает стабильную регистрацию клеточной активности от одного и того же нейрона. Такого рода данные являются абсолютно уникальными и приоритетными, поскольку позволяют напрямую тестировать не только стабильность свойств нейронов-детекторов, но и позволяют наблюдать за формированием селективности нейронов и ее изменениями у клеток мозга. На основе формы потенциала действия нейрона и распределения межспайковых интервалов были разработаны критерии оценки, которые позволяют выявлять периоды стабильности клеточного сигнала. Впервые напрямую удалось показать, что стимул-специфический паттерн разряда нейронов нижневисочной коры мозга обезьян остается неизменными в течение длительного периода времени: максимальный период наблюдения за такого рода стабильной активностью составил 17 дней.
На основе модели морфинга лиц впервые была разработана шкала лиц с градуальным именением уровня индивидуальности. Изменения уровня индивидуальности были возможны в диапазоне от 0% (прототип или «усредненное лицо») до 160% (карикатура). Осуществлено прямое сравнение результатов психофизических экспериментов по распознаванию лиц, проводимых с человеком и обезьяной. Было показано, что человек и обезьяна используют один и тот же принцип при распознавании лиц: степень сходства с хранящимся в памяти прототипом.
Изучение характеристик настройки нейронов-детекторов лиц в коре мозга обезьян показало, что ключевую роль в активности этих нейронов играет прототип: кривые настройки были центрированы относительно усредненного лица. Были обнаружены два типа нейронов-детекторов лиц в нижневисочной коре обезьян. Одна часть нейронной популяции увеличивала частоту разряда в ответ на усиление индивидуальных черт лица, тогда как другая ее часть реагировала сильнее на появление в поле зрения животного прототипа. Именно сравнение активностей указанных типов нейронов может служить однозначным кодом, лежащим в основе функционирования системы распознавания лиц. По всей видимости, принцип кодирования, основанный на сравнении с прототипом, является универсальным принципом и для распознавания других сложных зрительных объектов.
Теоретическое и научно-практическое значение работы
Основное теоретическое значение данной работы заключается в подтверждении принципов кодирования информации нейронами-детекторами зрительного анализатора млекопитающих, которые могут быть в дальнейшем использованы для создания искусственных интеллектуальных систем распознавания зрительных образов.
Развитие методик визуализации популяционной активности нейронов и картирования мозга интересно с практической точки зрения, в связи с использованием различных модификаций оптического картирования для диагностических целей в нейрохирургии. Ценный методический опыт, накопленный в ходе выполнения данной работы, может быть успешно использован в широком спектре практических задач в будущем.
Методика длительной регистрации клеточной активности может быть использована дла новых вариантов интерфейсов мозг-компьютер и нейропротезов. В настоящий момент для управления внешними устройствами используют электроэнцефалограмму, которая, однако, не позволяет достигать той степени специфичности реакций, которая наблюдается на нейронном уровне. Поэтому создание безопасных внутримозговых зондов может получить широкое применение в будущем. Накопленные в ходе работы данные по биосовместимости имплантатов и стабильности регистрации клеточной активности приближают применение данных технологий в практике.
Основные положения, выносимые на защиту
1. В условиях нормального зрения функциональные модули первичной зрительной коры настраиваются на статистики окружающей зрительной среды, обнаруживая свойство долговременной адаптивности.
2. При отсутствии обучающих воздействий нейроны-детекторы нижней височной коры мозга обезьяны способны длительное время сохранять селективный стимул-специфический паттерн разряда, что обеспечивает стабильность кодирования сенсорной информации.
3. Системы распознавания лиц человека и обезьяны принципиально похожи: в основе распознавания лежит принцип сравнения с прототипом.
4. В качестве однозначного кода нейроны-детекторы лиц используют монотонные изменения частоты импульсации относительно базового уровня разряда, который задается реакцией клеток на прототип.
Апробация работы
Основные материалы диссертации были представлены на Гёттингенских нейробиологических конференциях (1995, 1996, 1998); на 1-ой Тюбингенской конференции по исследованию восприятия (1998); конференциях Американского общества по нейронаукам (Новый Орлеан, 2000; Сан Диего, 2001; Новый Орлеан, 2003); на Сьездах физиологического общества России им. И.П. Павлова (Екатеринбург, 2006; Москва, 2008; Калуга, 2010); на 29-ой Европейской конференции по зрительному восприятию (Санкт-Петербург, 2006); на XIV-ом всемирном Конгрессе по психофизиологии «Olympics of the brain» (Санкт-Петербург, 2008); на Международной конференции «Прикладная оптика - 2010» (Санкт-Петербург, 2010) и апробированы на межлабораторной конференции ИВНД и НФ РАН (Москва, 2010).
Структура и объем диссертации