Введение к работе
Актуальность темы.
Эволюция систем обработки информации показывает, что по мере развития систем, усложнения и расширения реализуемых ими функций наиболее «Ефективними и жизнеспособными являются системы, в которых расширение функциональных возможностей элементов, находящихся на различных уровнях иерархии системы, опережает рост их сложности. Развитие вычислительной техники убедительно иллюстрирует периодичоскор изменение соотношения между многофункциональными и специализированными средствами на различных этапах развития. Учитывая то, что почти все отрасли науки и техники з своем развитии достигли такого этапа, когда интеллектуализация систем управления становится неизбежным, встает вопрос о необходимости расширония области разработки систем искусственного интеллекта в системах различного назначения. Одной из таких систем можно считать распознавание изоОракений, которая относится к области моделирования интеллектуальной деятельности человека во внешнем ее проявлении-интерпретагии визуальной информации.
Подавляющая часть исторического наследия, касающегося не только Азербайджана, но и достаточно Лзльиого региона, представлена в рукописях на арабском, персидском, турецком языках в арабской графике, в связи с чем особую значимость приобретает задача распознавания символов арабской графики.
Анализ существующих систем распознавания показывает, что их реальное использование в большинстве случаев связаны с такими трудностями как кодирование и ввод рукописной информации в обрабатывающую систему, огромное многообразие возможных написаний этдэлг ых знаков, сложность определения характерных свойств при-зущих отдельным элементам. Применение стандартных систем и алгоритмов для кодирования и идентификации символов арабской графики становится невозможным из-за специфики написания букв арабского алфаьита. Помимо этого при составлении математичесикх формул распознавания необходимо четкое разбиение слов на элементы (буквы), что так же долает эти системы чеггризмлимнми.
В связи с этил представляется актуальним разработка методики, алгоритмов и аппаратно-программных средств для кодирования и
- 4 -идентификации символов арабской графики.
Цель работы.
Цэлко диссертационной работы являются: -разработка методики, алгоритмов и аппаратно-программных средств кодирования и идентификации символов арабской графики -создание базы знаний для распознавания символов арабской графики и базы данных слов и фраз.
Методы исследования.
При разработке алгоритмов И программ идентификации символов арабской графики использованы статистические методы, а также принципы программного анализа и распознавания образов; методология искусственного интеллекта;проводились вычислительные эксперименты и корректировал!'сь алгоритмы. Моделирование разработанных алгоритмов и принципов функционирования системы распознавания реализовано на IBM PC/AT на алгоритмическом языке BASIC версии 4.БО.
Научная новизна.
Разработаны алгоритмы иерархического выделения признаков для распознавания арабской письменности без выделения отдельных букв» целыми словами,.а также фразами и соответствующая классификация слов и фраз.
Создана база знаний и экспертная система, распознающая арабскую письменность, и база данных в виде перевода отдельных слов и фраз.
Разработаны аппаратно-программные средства для одномерного и двумэрного кодирования и идентификации слов и фраз, основанные на использовании спешґ'іическюс информативных признаков символов арабской графики.
Практическая ценность и внедрение результатов работы.
Разработанная система распознавания и идентификации позво- -ляет ускорить процесс обработки материалов в арабской графике независимо от языка написания, так повысить скорость чтения и точность перевода; оказать помощь специалисту в принятии решения: сократить время, затрачиваемое на поиск нужной информации .
Разработанные аппаратно-программные средства и алгоритмы использованы при создании автоматизироьатюго каталога рукописного фюида института рукописей АН Аз.Р.
АпроЗация работы. Основные результати диссертационной работі.
- 5 -были локоны и обсуждены на:
Научной конференции аспирантов ЛН Лз.Р. (Баку, 1987)
Научной конференции аспирантов ЛИ Аз.Р. (Баку, 1988)
Республиканской научно-практической конференции молодше ученых и специалистов "Актуальные проблемы информатики и ВТ", (Баку, 1990)
Всесоюзной научной конференции "Интеллектуализация систем управления", (Баку, 1991)
Публикация. По.теме диссертации опубликовано 7 печатных работ.
Структура и обьем работы.'Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, включающего 75 наименований и 2 приложений. Основное содержание работы изложено на 127 страницах, включая 9 рисунков, I таблицу.