Введение к работе
Актуальность. Одной из центральных проблем в области создания искусственных систем обработки и анализа визуальной информации, которые не иашлн эффективного решения в рамках традиционных подходов технического зрения, является проблема инвариантности распознавания изображений по отношению к основным геометріпеским преобразованиям ( изменению масштаба, сдвигу, позороту), условиям освещения, уровню сигнал-шум и т.д.
В настоящее время разработки и исследования в этой области
развиваются в двух направлениях. Первое состоит в
совершенствовании традиционных процедур и алгоритмов технического зрения для увеличения скорости и эффективности вычислений. Второе направление основано на разработке новых нейробионических методов и алгоритмов.
В рамках последнего направления выделяется бурно растущая область исследований и разработок, связанных с концепцией активного зрения [D.H.Ballard, 1986; P.J.Burt, 1988; R.Bajscy, 1988; C.Bandera, P.Scolt, 1991], которая рассматривается как один из самых перспективных подходов для сжатого представления зрительной информации, ее быстрой обработки и инвариантного распознавания изображений. В настоящее время исследования в этой области, в основном, решают теоретические проблемы, и известны лишь отдельные разработки, посвященные решению частных задач
инвариаігшого распознавания изображений ' . Концепция активного зрения основана на ряде нейрофизиологических и психофизических данных и идей. Однако, имеющиеся на современном уровне знаний количественные данные и представления о вычислительных алгоритмах, реализуемых п зріггельиом восприятии естественных систем, неполны и недостаточно формализованы для того, чтобы они могли быть детально воспроизведены в системах искусственного зрения. В этом плане искусственные бионические системы могут являться одним из инструментов для исследования структурно-функциональной организации и механизмов зрительного восприятия путем разработки реалистических моделей, проведения
-
R.A.Messncr, H.H.Szu. An image processing architecture for real time generation of scale and rotation invariant patterns. // Computer Vision, , Graphics, and Image Processing. - 1985. - 31. -pp. 50-60.
-
M.Fukumi, S.Omatu, F.Takeda, T.Kosaka. Rotation-invariant neural pattern recognition system with application to coin recognition. // IEEE Transaction on Neural Networks. - 1992. - v.3. - n.2. -pp. 272-278.
имитационных экспериментов, формулировки предсказаний и последующей их верификации в нейрофизиологических и психофизических экспериментах.
Цель и задачи исследования. Целью работы являлись разработка и исследование бионических алгоритмов и математической модели системы для инвариантного представления и распознавания полутоновых изображений на основе данных нейрофизиологии и психофизиологии.
В процессе исследования решались следующие задачи: 1 .Разработка концептуальной модели и архитектуры системы. 2. Разработка алгоритмов нижнего и верхнего уровней обработки визуальной информации для ее инвариантного представленій и распознавания.
З.Создание программной версии модели.
4.Проведение имитационных экспериментов на модели при обработке полутоновых изображений для оптимизации параметров модели и формулировки предсказаний о возможных механизмах выбора точек фиксации взгляда в реальной зрительной системе. Научная новизна результатов исследования. Разработана и исследована математическая модель системы обработки зрительной информации, обеспечивающая распознавание полутоновых изображений инвариантно по отношению к основным геометрическим преобразованиям и уровню зашумления. D основе функционирования системы лежит формирование инвариантного описання фрагментов и изображения в целом, наличие специфических траекторий "осмотра" объектов, ориентационная фильтрация фрагментов изображений и уменьшение уровня разрешения от центра "окна обработки" к его периферии. Предложена оригинальная архитектура "окна обработки", которая реализует сложное преобразование фрагментов исходного изображения и каждой точке фиксации "окна обработки" и обеспечивает сжатое и инвариантное представление информации. По результатам имитационного моделирования сделан ряд предсказаний о возможных механизмах зрительного восприятия и выбора точек фиксации взгляда при осмотре зрительных объектов и реальной зрительной системе.
Практическая значимость. Разработанные алгоритмы и программы, обеспечивая сжатое, специфичное представление изображений и инвариантное описание объектов и сцен, могут быть использованы в системах технического зрения*и в робототехнике. В частости, предложенное "окно обработки" может быть аппаратно реализовано в качестве визуального сенсора нового типа.
Результаты работы использованы при реализации проекта российско-французского сотрудничества "Теоретическое и
экспериментальное изучение контекстного зрения с приложением к
проблеме управления роботом" между НИИ нейрокибернетики РГУ и
лабораторией LACOS Гаврского университета (Франция), при
выполнении темы 7037 (1991г.) по программе
"Супсрмакронейрокомпыотер" н при чтении і1)акультативного курса
по нейронпформатнкс студентам механико-математического
факультета РГУ.
Разработанная система может быть использована в качестве программно-аппаратного стенда для проведения психофизических экспериментов, направленных на изучение механизмов зрительного восприятия человека.
Апробация работы. Результаты работы докладывались: на Международном симпозиуме "NEURONET9Q" в 1990 г. (г.Прага, Чехословакия); на XIV-ой Европейской конференции по зрительному восприятию в 1991 г. (г.Вильнюс); на Международной конференции "Применение искусственных нейронных сетей" в 1991 г. (г.Орландр, Флорида, США); на Х-ой Всесоюзной конференции по пейрокибернетике d 1992 г. (г.Ростов-на-Дону); на Международной конференции по нейронным сетям в І 992 г. (г.Балтнмор, США); на 1-ом и 2-ом Международных симпозиумах по нейроинформатике и нейрокомпьютерам в 1992 г., 1995г. ( г.Ростов-на-Дону ); на Международной конференции по оптической обработке информации в 1993 г. (г.Санкт-Петербург); на семинаре " Алгоритмы обработки информации в нейроподобннх системах" в 1993 г. ( г. Нижний Новгород); на заседании Ростовского отделения Физиологического" общества в 1994 г. (г.Ростов-на-Дону); на семинаре "Математические методы в экономике и экологии " в 1995 г. (НИИ механики и прикладной математики РГУ, г.Ростов-на-Дону). Публикации. По теме диссертации опубликовано 15 работ, из них 13 в международной печати.
Структура и объем диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы и изложена на /Q-? страницах; содержит \Є рисунков; список литературы включает І06* наименований.