Содержание к диссертации
Введение
Раздел 1. Современное состояние проблемы визуализации и сущность предлагаемого подхода 13
1.1. Особенности социально-экономических данных и методов их обработки 13
1.2. Основные понятия теории распознавания образов 16
1.3. Основные методы распознавания образов в системах поддержки принятия решений 20
1.4. Применение интерактивных систем поддержки принятия решений к управлению экономическими и социальными процессами 32
1.5. Основные методы визуализации объектов n-мерного пространства 33
1.6. Сущность предлагаемого подхода к визуализации многомерных данных 40
1.7. Выводы 44
Раздел 2. Разработка методов и процедур обратимой визуализации 46
2.1. Линейное преобразование в многомерном пространстве 46
2.2. Нелинейное преобразование объектов многомерного пространства 51
2.3. Метод визуализации многомерных объектов-образов 56
2.4. Средства осуществления возвратных переходов к топологии исходного многомерного пространства 59
2.4.1 Процедура переноса начала координат 60
2.4.2 Поворот объектов-образов в исходном пространстве 62
2.4.3 Метод рассечения многомерных конфигураций со сложной топологией динамически перемещаемыми гиперплоскостями 63
2.5. Процедура определения информативной ценности признаков 66
2.6. Разрешение коллизии визуализации для некоторых специфических точек пространства 67
2.7. Иерархическое разбиение образов сложной топологии 70
2.8. Выводы 73
Раздел 3. Алгоритмические средства выполнения обратимой визуализации 75
3.1. Алгоритмизация метода визуализации многомерного объекта-образа 75
3.2. Алгоритм визуализации набора многомерных объектов-образов 80
3.3. Алгоритмизация метода и процедур выполнения возвратных переходов к исходному многомерному пространству 87
3.3.1 Алгоритм переноса начала координат 87
3.3.2 Алгоритм поворота в многомерном пространстве 90
3.3.3 Алгоритм рассечения многомерных конфигураций со сложной топологией динамически перемещаемыми плоскостями 92
3.4. Описание разработанных программных средств 94
3.4.1 Платформа, аппаратные требования, средства разработки 94
3.4.2 Назначение разработки 95
3.4.3 Входные данные 95
3.4.4 Процессы обработки 96
3.4.5 Выходные данные 96
3.4.6 Структурно-функциональная организация разработанных программных средств 97
3.5. Выводы 105
Раздел 4. Верификация программных средств поддержки принятия решений и результаты сопоставительного анализа 106
4.1. Оценка кредитоспособности предприятия-заемщика 106
4.2. Анализ надежности кредитных организаций 120
4.3. Моделирование социально-политических процессов 127
4.4. Массовая социально-медицинская диагностика 133
4.5. Сопоставительный анализ функциональных возможностей разработанных программных средств с прототипом 136
4.6. Сопоставительный анализ временных характеристик разработанных программных средств с прототипом 141
4.7. Выводы 145
Заключение 147
Список использованных источников
- Основные понятия теории распознавания образов
- Нелинейное преобразование объектов многомерного пространства
- Алгоритм визуализации набора многомерных объектов-образов
- Моделирование социально-политических процессов
Введение к работе
Актуальность работы. Задачи принятия решений в контурах управления социальными и экономическими системами (СЭС) имеют определенную специфику, связанную с тем, что социально-экономические объекты и процессы трудно поддаются формализации и характеризуются множеством разнородных признаков. В частности, для задач управления СЭС характерно представление исходных данных в виде многомерных пространственно распределенных конфигураций со сложной топологией. В процессе решения данных задач необходимы методы и алгоритмы для отождествления и различения многомерных объектов-образов и определения тенденций их поведения. Автоматическое определение границ и динамики названных объектов-образов приводит к разработке или узкоспециализированных, или неоправданно сложных и дорогостоящих универсальных программных средств. Вместе с тем, любое лицо, принимающее решение (ЛПР), по своим психофизиологическим ограничениям принципиально не может оперировать объектами, представленными n-мерными динамическими топологическими конфигурациями (при п»3). Приведенные противоречия инициировали множество работ по созданию интерактивных систем поддержки принятия решений, основанных на паритетном разделении функций в рамках человеко-машинного взаимодействия. При этом функции компьютера заключаются в реализации отображений ср: R —»R объектов и процессов многомерного пространства на плоскость дисплея с целью их визуализации, а функции различения и отождествления делегируются ЛПР. Реализация отображений ф: R —»R с помощью известных методов визуализации с необходимостью приводит к потере информации о многомерных особенностях топологии и взаимном расположении объектов-образов в исходном пространстве (многомерных ландшафтах), порождая ошибки как распознавания, так и
5 определения тенденций процессов, что приводит к неотвратимым ошибкам ЛПР.
Подавляющее большинство методов и алгоритмов визуализации для решения задач отождествления, разграничения и определения тенденций процессов в системах управления СЭС имеют существенный недостаток. Он заключается в отсутствии или недостаточности инструментов для реализации возвратного перехода от двумерных визуализированных форм представления объектов-образов к их многомерным формам с целью анализа конфигураций и ландшафтов. При этом ЛПР не имеет возможности исследовать некоторые многомерные топологические свойства и особенности объектов-образов, содержащие качественно новую ценную информацию о состоянии и поведении СЭС. Такую ценную для управления информацию, как правило, невозможно извлечь из статического набора значений признаков, из их динамических характеристик, или из двумерных проективных форм представления объектов и процессов.
Приведенные обстоятельства являются основанием для постановки в диссертации основной задачи, которая заключается в разработке инструментальных средств в виде совокупности методов, алгоритмов и структурно-функциональной организации программных приложений выполнения обратимой визуализации многомерных конфигураций и ландшафтов для анализа их многомерных топологических свойств и особенностей, а также для оценки уровня информативной ценности признаков, с целью различения и отождествления состояний и явлений в СЭС и/или их компонентах для принятия управленческих решений.
Решению проблем разграничения и отождествления объектов, в том числе в многомерных пространствах, и их топологическому анализу посвятили свои работы К. Фу, К. Пирсон, К. Фукунага, М. Стоун, А.И. Галушкин, Н.Г. Загоруйко, Р.С. Лбов, К. Куратовский, А.Н.Тихонов, П.С. Александров и многие другие отечественные и зарубежные исследователи. Таким образом, для решения основной решаемой задачи на сегодняшний
день имеются необходимые предпосылки и четко очерченный концептуальный базис.
На основании изложенного можно заключить, что тема диссертационного исследования является актуальной и перспективной при современном состоянии теории и практики применения интерактивных систем поддержки принятия решений.
Диссертационное исследование выполнялось в рамках научного направления Курского государственного технического университета «Разработка и исследование средств обработки информации электронными и оптическими методами».
Цель работы заключается в повышении уровня качества принятия управленческих решений путем разработки: программных средств на основе новых методов и алгоритмов для визуализации на дисплее многомерных объектов-образов с сохранением инвариантов отображений в виде размерности исходного пространства признаков и расстояниями между точками многомерного пространства; алгоритмов и программных инструментов для осуществления ЛПР анализа конфигураций и ландшафтов, разграничения и отождествления объектов-образов, а также для определения тенденций поведения и определения информативной ценности признаков.
Задачи исследования:
Выявить особенности СЭС и существующих методов анализа социально-экономических данных. Установить, что состояние и динамика поведения СЭС могут быть представлены в виде объектов-образов многомерного пространства признаков.
Определить особенности существующих методов визуализации объектов-образов многомерного пространства и обосновать необходимость разработки новых методов для визуализации и осуществления возвратных переходов в процессах принятия решений.
Разработать метод визуализации многомерных объектов-образов, метод и процедуры осуществления возвратных переходов в исходное многомерное
7 пространство для получения информации о топологических параметрах сложных многомерных конфигураций и ландшафтов.
Произвести алгоритмизацию разработанных методов, а также разработать структурно-функциональную организацию программных средств визуализации объектов-образов многомерного пространства и осуществления возвратных переходов для исследования топологии исходных пространств (обратимой визуализации).
Выполнить сопоставительный анализ разработанных программных средств визуализации и осуществления возвратных переходов с функциональными возможностями и временными затратами прототипа при решении практически важных задач в СЭС.
Объектом исследования являются многомерные пространства, отображающие состояния и динамику СЭС или ее компонентов.
Предметом исследования являются методы, алгоритмические и программные средства поддержки принятия решений на основе визуализации и организации возвратных переходов в исходные многомерные пространства.
Методы исследования основываются на положениях современной теории систем поддержки принятия решений, теории распознавания образов, линейной алгебры, топологии, теории алгоритмов, теоретического программирования, теории проектирования информационных систем.
Достоверность и обоснованность результатов исследования подтверждается проведенными экспериментами по программному моделированию разработанных методов; согласованностью теоретических и экспериментальных результатов анализа визуализированных данных, полученных в ходе исследований экономических и социальных систем; корректным использованием положений линейной алгебры, а также рецензированием печатных работ, их обсуждением на научно-технических конференциях и экспертизой разработанных программных средств.
Научная новизна работы состоит в разработке нового метода,
алгоритмов, процедур и программных средств визуализации многомерных
объектов-образов и осуществления возвратных переходов в исходное
многомерное пространство с помощью программных инструментов для ЛПР
с целью повышения уровня качества принятия решений в заданной
предметной области.
Впервые получены следующие результаты:
1. Разработан метод визуализации на плоскость дисплея многомерных
конфигураций со сложной топологией, позволяющий определить
логические условия и операционный каркас для разработки алгоритмов
реализации отображения (р: Rn—>R и отличающийся сохранением в
> качестве инвариантов отображения размерности пространства и
расстояния от любой точки до начала координат в исходном пространстве.
2. На основе разработанного метода синтезирован алгоритм визуализации
объектов-образов многомерного пространства, имеющий двукратное
преимущество по вычислительной сложности по отношению к прототипу,
которое достигается путем линеаризации традиционно используемых
нелинейных функций и предварительного вычисления коэффициентов
і отображения, что составляет отличительные особенности разработанного
алгоритма.
3. С целью реализации возвратных переходов в исходное многомерное
пространство признаков (R —>R) разработаны метод, процедуры и
алгоритмы (инструментальные средства), обеспечивающие разрешение
коллизий пересечения классов объектов-образов, для извлечения ценной
дополнительной информации при принятии решений путем исследования
особенных топологических свойств многомерных конфигураций и
ландшафтов, а также для оценки информативной ценности признаков,
отличающиеся структурно-функциональной организацией, для
повышения уровня качества принятия решений и возможностью
определять структуру хаотических автоматов. Разработана структурно-
9 функциональная организация программных средств обратимой визуализации многомерных конфигураций.
Разработанные инструментальные алгоритмические средства и процедуры составляют арсенал манипуляций, применяемых ЛПР для получения дополнительной информации с целью принятия адекватных решений.
Практическая ценность работы заключается в разработке программных средств, пригодных для практического использования в качестве ядра интерактивной системы принятия управленческих решений в СЭС. При этом достигается двукратное снижение вычислительной сложности, что особенно важно при обработке больших объемов данных. Полученные результаты открывают пути создания систем поддержки принятия решений в реальном времени: обработки и исследований результатов биржевых торгов, опросов, анкетирования, массовых медицинских явлений и т.п. Практическая ценность подтверждается актом о внедрении, тремя свидетельствами об официальной регистрации программы для ЭВМ Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, а также решением практически важных задач: оценки кредитоспособности заемщиков, коррекции рейтинговой таблицы надежности банков, анализа социально-политических организаций и массовой экспресс-диагностики панкреонекроза в современных социальных условиях.
Апробация результатов работы. Результаты диссертационной работы обсуждались и получили положительную оценку на Юбилейной межвузовской научной конференции студентов и молодых ученых «Молодежная наука и современность», посвященной 70-летию КГМУ, г. Курск, 2005 г.; V Международной научно-практической конференции «Информационные технологии и математическое моделирование», г. Томск, 2006 г.; 13 Международной научно-технической конференции «Физические и компьютерные технологии», г. Харьков, 2007 г.; научно-технических
10 семинарах кафедры ПО ВТ Курского государственного технического университета в 2005-2007гг.
Реализация результатов работы. Основные результаты диссертационного исследования в виде интерактивных программных средств поддержки принятия решений на основе визуализированных объектов-образов многомерного признакового пространства внедрены в ЗАО «Мобиком-Центр», где названная разработка применяется для анализа текущего положения компании на рынке сотовой связи и приятия управленческих решений в коммерческой деятельности.
Публикации. По результатам выполненных разработок и исследований опубликовано 7 статей, в том числе 2 по перечню центральных рецензируемых журналов и изданий, рекомендуемых ВАК Министерства образования и науки РФ, получены 3 свидетельства об официальной регистрации программы для ЭВМ, имеется одна публикация тезисов доклада.
В работах, написанных в соавторстве, лично автором диссертации разработаны и описаны методы и алгоритмы обратимой визуализации многомерных объектов-образов [1, 2, 3, 6], выполнено сравнение временных характеристик разработанного и известных методов отображения многомерных данных на плоскость [1, 7]; исследовано его применение в системах поддержки принятия управленческих решений в СЭС [10, 11] и созданы программные средства визуализации многомерных объектов-образов с целью их последующего отождествления, разграничения и выявления тенденций поведения [1,2,8,9].
На защиту выносятся: 1. Метод, алгоритм и программные средства визуализации многомерных
конфигураций со сложной топологией, позволяющие выполнить
отображение ф: Rn—>R2 и отличающиеся линеаризацией и
предварительным вычислением коэффициентов преобразования, что
позволяет ускорить реализацию отображения.
Метод, алгоритмы, процедуры и программные средства для осуществления возвратных переходов R2—»Rn в исходное многомерное пространство признаков с целью исследования особенных топологических свойств многомерных конфигураций и ландшафтов и разрешения коллизий пересечения классов объектов-образов для извлечения дополнительной информации для принятия решений и оценки информативной ценности признаков. Обобщенная структурно-функциональная организация программных средств обратимой визуализации.
Результаты сопоставительного анализа с прототипом: функциональных возможностей разработанных программных средств визуализации и осуществления возвратных переходов; временных затрат на построение отображения (р: Rn—»R2.
Структура и объем работы: диссертация состоит из введения, четырех глав и заключения, изложенных на 149 страницах машинописного текста, содержит 41 рисунок, 7 таблиц, список литературы из 78 наименований и 2 приложения объемом 30 страниц. Общий объем работы 186 страниц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении приводится обоснование актуальности темы, сформулированы цель и задачи диссертационного исследования, научная новизна, практическая ценность, апробация и реализация результатов работы, публикации по теме диссертации, структура и объем работы.
В первой главе показано, что исходные данные для социально-экономических исследований, состояния объектов и явлений в СЭС могут быть представлены в виде многомерных объектов-образов. Выполнен аналитический обзор методов обработки многомерных данных, применяемых в экономических и социальных системах, отмечены их особенности, достоинства и недостатки; обосновано применение методов классификации и распознавания образов для принятия решений в процессах управления СЭС.
Во второй главе рассматриваются математические аспекты линейного и нелинейного преобразований, разрабатывается новый метод визуализации на основе нелинейного W-отображения, которое имеет прототип в виде R-отображения. Также разрабатывается совокупность методов и процедур для осуществления возвратных переходов в исходное многомерное пространство признаков.
В третьей главе разрабатываются алгоритмические и программные средства визуализации многомерных объектов-образов и осуществления возвратных переходов к топологии исходного пространства, пригодные для практического применения в современных системах управления социально-экономическими объектами.
В четвертой главе приводятся результаты применения разработанного метода визуализации многомерных объектов-образов к задачам управления в СЭС. Сравниваются функциональные возможности и временные показатели разработанного метода с прототипом.
В заключении формулируются основные результаты диссертационного исследования.
В приложениях приводятся листинги разработанных программных средств, описание формата входных данных.
Основные понятия теории распознавания образов
Необходимым этапом разработки системы распознавания образов является построение объектной модели рассматриваемой предметной области, которое заключается в определении состава сведений, характеризующих изучаемые объекты (выборе исходного описания объектов) и, в ряде случаев, обозначении классов, по которым будет производиться разделение объектов (выделении классов эквивалентности). Выбор совокупности характеризующих признаков во многом определяет сложность решаемой задачи распознавания: при удачном выборе исходного описания объектов решение задачи распознавания может оказаться тривиальным, тогда как неудачно выбранное описание может привести к неоправданно сложному решению или к отсутствию решения.
Совокупность характеризующих признаков объекта реального мира, называемого прообразом, отображаясь на множестве воспринимающих органов распознающей системы, формирует образ данного объекта, который можно представить в виде точки-вектора с координатами (х/, %2, х„) в некотором n-мерном пространстве признаков, при этом каждый элемент вектора несет информацию о числовом эквиваленте некоторого свойства прообраза.
Введем базовые семантические соглашения. Определение 1. Объектом-образом называется дескриптор прообраза в виде набора значений признаков. Определение 2. Под классом объектов-образов будем понимать множество разграниченных и отождествленных объектов-образов, имеющих общие свойства. Определение 3. Многомерная конфигурация - это гиперобъем, соотнесенный с конкретным классом объектов-образов. Определение 4. Многомерным ландшафтом называется взаимное расположение конфигураций в n-мерном пространстве. Приведенные определения отражают терминологические особенности, принятые в рамках объектно-ориентированной алгоритмической концепции.
Критерием существования приемлемого решения задачи распознавания принята гипотеза компактности [6] образов, которая гласит: в выбранном пространстве признаков классам соответствуют компактные множества объектов-образов. Под компактными множествами понимаются сгустки объектов-образов в признаковом пространстве, между которыми существуют разделяющие их разряжения. В соответствии с приведенной гипотезой, признаковое пространство должно выбираться таким образом, чтобы
совокупность выделенных характеристик задавала свойство, на основании которого формируется разбиение исходного множества объектов на классы эквивалентности. Большую роль играет выбор масштаба (единиц измерения). Как правило, данные нормализуют вычитанием среднего и делением на стандартное отклонение, так что дисперсия оказывается равной единице.
Если утверждается, что в некотором пространстве существует несколько непересекающихся классов, это значит, что в заданном пространстве существует несколько областей, не имеющих общих точек.
Задача распознавания заключается в отнесении объекта-образа а к одному из известных классов kj...k„, причем распознаваемый объект-образ будет считаться эквивалентным другим объектам-образам этого класса с точки зрения некоторого критерия качества распознавания.
Процедура распознавания образов состоит из двух частей: обучения и распознавания. Из приведенного определения следует, что необходимым этапом процесса распознавания образов является разбиение исходного множества объектов-образов на классы эквивалентности.
Критерии разбиения формализуются в виде классификационных (решающих) правил для каждого из классов объектов-образов предметной области. Под классификационным правилом некоторого класса понимается методика, на основе ряда сведений о рассматриваемом объекте-образе определяющая его принадлежность к данному классу. В частности, состав и количество классов в системе классификации во многом зависит от выбираемых решающих правил.
Под обучением понимается процесс выработки в некоторой системе той или иной реакции на группы внешних идентичных сигналов путем многократного воздействия на систему внешней корректировки. Такую внешнюю корректировку принято называть «поощрениями» и «наказаниями».
Нелинейное преобразование объектов многомерного пространства
Линейное проецирование в подпространство меньшей размерности хорошо передает структуру данных в случае, когда исследуемые образы линейно разделимы в исходном признаковом пространстве.
Разделяющей поверхностью при этом служит гиперплоскость, определяемая уравнением [71]: Jc-Z = d, (2.19) где к = (ki, к2, .... кп) - вектор нормали к гиперплоскости, определяющий ее наклон относительно осей координат.
Гиперплоскость (2.19) разбивает исходное пространство на два подпространства R" и Щ [53], для которых Jc-2{ d и k-22 d соответственно. Отнесение исследуемого объекта z0 к конкретному классу эквивалентно вычислению выражения Jc-Z0=d0. (2.20)
Все объекты, для которых do d, лежат в подпространстве R" и относятся к одному образу; объекты, для которых d0 d, лежат в подпространстве RI и относятся, соответственно, к другому образу.
Если же совокупности точек, принадлежащих различным классам, разделяются некоторой нелинейной поверхностью в п-мерном пространстве, их линейные отображения могут накладываться друг на друга. Например, рассмотрим две n-мерные гиперсферы радиусов г і и г2, таких что: г, г2. (2.21)
Пусть центры исследуемых гиперсфер совпадают в точке 0(0...0). Очевидно, что две описываемые совокупности точек разделимы в n-мерном пространстве, причем разделяющей поверхностью служит гиперсфера с центром в точке О и радиусом гз (рисунок 2.3) таким что: г, г3 г2. (2.22)
Для анализа подобных сложных конфигураций применяются нелинейные методы понижения размерности, математической основой которых является нелинейное преобразование f=f(x), 2.23) где хє R" - исходный вектор, подлежащий отображению, /є Rm - его нелинейное отображение в пространство Rm, такое что m п.
Сущность преобразования (2.23) заключается в минимизации некоторой функции F, описывающей заданный критерий качества разграничения отождествления, поэтому в большинстве нелинейных методов понижения размерности отображение определяется в процессе итерационной минимизации данного критерия.
В основу данного диссертационного исследования положено нелинейное R-отображение [45-46, 52], представляющее собой результат последовательного применения к исследуемым данным линейного оператора (2.9), при котором n-мерный вектор х = (xj, Х2, ..., хп) переходит в точку на плоскости xi = (хц; xL2) и нелинейного преобразования xR=f(x,xL) = --\x\. (2.24) Выражение путем нормализации вектора XL(XU; Хи) формирует единичный двумерный вектор, задающий направление от начала координат на точку xL - двумерную линейную проекцию n-мерной точки х. \х\ представляет собой евклидово расстояние от начала координат до точки х в n-мерном пространстве и вычисляется по формуле: M = jl ,2, (2.26) где xt - значение і-ой координаты точки х.
Выражение (2.24) определяет двумерный вектор, исходящий из начала координат в направлении точки XL, длина которого равна длине вектора х в п-мерном пространстве (рисунок 2.5).
Таким образом, преобразование (2.24) сохраняет расстояние от п-мерной точки до начала координат при ее отображении на плоскость. Подставляя выражения для XL (2.9) и \х\ (2.25) в (2.24), с учетом (2.11), получим общие формулы для координат двумерного R-отображения многомерной точки
При проектировании систем поддержки принятия решений, основанных на отображении (2.12) возникает проблема, заключающаяся в высокой вычислительной сложности определения значений тригонометрических функций, используемых для расчета коэффициентов линейного преобразования.
Сопоставляя аналитическое выражение (2.9) линейного оператора А: R"- R2 с выражением (2.12), можно сделать вывод, что в (2.12) коэффициенты ah bt вычисляются как:
Разрабатываемый в настоящей диссертационной работе метод визуализации многомерных объектов-образов заключается в построении нелинейного отображения исследуемых объектов на плоскость, получившего название W-отображения.
W-отображение состоит из двух этапов. На первом этапе выполняется линейное преобразование (2.31), в результате которого формируется двумерный вектор - проекция многомерного объекта-образа на плоскость. На втором этапе осуществляется нелинейное преобразование в соответствии с (2.24), инвариантное к расстоянию от точки до начала координат в исходном многомерном пространстве (рисунок 2.5).
На рисунке 2.8 представлены отображения двух непересекающихся классов 13-мерных объектов-образов, построенные с использованием исходного R-отображения на основе линейного преобразования (2.12) (рис. 2.86) и разработанного W-отображения, основанного на преобразовании (2.31)-(2.32) с линеаризацией коэффициентов (рис. 2.8а).
С целью реализации возвратных переходов (R — R) в исходное многомерное пространство признаков разработаны метод и процедуры, обеспечивающие разрешение коллизий пересечения классов объектов-образов: процедура переноса начала координат в произвольную точку п мерного пространства, позволяющая исследовать топологию исходного пространства относительно данной точки; процедура поворота системы координат для разрешения проблемы «ложных» пересечений классов объектов-образов;
Алгоритм визуализации набора многомерных объектов-образов
Записанные таким образом исходные данные образуют выборку, при формировании которой исследованию подвергаются М объектов, на каждом из которых регистрируются значения п характеризующих его признаков [5].
Условие М=1 означает, что анализу подвергается единственный объект-образ, измеряющийся по п признакам. Алгоритм отображения единичного объекта-образа на плоскость рассмотрен в пункте 3.1. Обработка такого представления данных, применяемого как в эконометрических исследованиях, так и при изучении социальных процессов и явлений, предполагает построение нелинейного отображения М n-мерных точек на плоскость. В результате получим двумерное изображение, характеризующее топологию исходных данных, на основе которого лицом, принимающим управленческие решения, осуществляется классификация данных и распознавание новых объектов путем определения очевидной границы, разделяющей компактные группы объектов на плоскости.
Разработаем алгоритм реализации R-отображения для множества X, состоящего из М n-мерных объектов предметной области и определяемого матрицей «объект-свойство» (3.2). Пусть отображение каждой точки xt є X, / є 1, М осуществляется по алгоритму, схема которого представлена на рисунке 3.1. Данный алгоритм подразделяется на три этапа:
1) этап инициализации, на котором переменным присваиваются начальные значения (операции 1-4);
2) цикл из п итераций (операции 5-12), в котором вычисляются а) коэффициенты матрицы линейного преобразования (операции 6-8), б) координаты линейного отображения исходного вектора на плоскость (операции 9-10), в) длина этого вектора в пространстве (операция 11);
3) вычисление координат R-отображения многомерной точки на основе параметров, рассчитанных на втором этапе работы алгоритма (операции 13-16).
Как уже было указано, на этапе инициализации устанавливаются в 0 начальные значения аккумулятивных переменных, использующихся для расчета координат линейного отображения и длины вектора х. На втором этапе происходит итеративное вычисление этих параметров, на третьем этапе полученные значения используются для расчета итоговых координат нелинейного отображения исследуемой точки.
Этапы 1, 26, 2в и 3 рассматриваемого алгоритма зависят от координат входного n-мерного вектора. Этап 2а, на котором происходит вычисление коэффициентов линейного преобразования, зависит только от размерности исходных данных п. Следовательно, значения a[i], b[i] одинаковы для всех точек отображаемой совокупности, принадлежащих пространству R".
В рассматриваемом алгоритме значения a[i], b[i] вычисляются для каждой точки в отдельности, что приводит к непродуктивным затратам времени при построении отображения множества n-мерных точек.
Из формул (2.29), (2.30) следует, что для расчета коэффициента a[i] необходимо выполнить 2 операции вычитания, 1 операцию умножения, 1 операцию деления и одну операцию аннуляции знака числа (модуль); для расчета коэффициента b[i] требуется выполнить 1 операцию вычитания, 1 операцию умножения и 1 операцию деления.
Из таблицы 3.1 видно, что при отображении М n-мерных точек по алгоритму, схема которого представлена на рисунке 3.1, необходимо произвести ЗпМ операций вычитания, 2пМ операций умножения, 2пМ операций деления и пМ операций аннуляции знака числа. Поскольку значения коэффициентов a[i], b[i] одинаковы для всех точек обрабатываемой совокупности, то для получения результата достаточно вычислить п коэффициентов a[i] и п коэффициентов Ь[і], для чего в сумме потребуется выполнить Зп операций вычитания, 2п операций умножения, 2п операций деления и п операций аннуляции знака числа. Следовательно, при применении алгоритма нелинейного отображения одной точки для обработки совокупности из М точек n-мерного пространства непродуктивно выполняются: Зп(М-1) операций вычитания; 2п(М-1) операций умножения; 2п(М-1) операций деления; п(М-1) операций аннуляции знака числа.
Таким образом, в целях классификации и распознавания многомерных объектов, когда требуется отобразить совокупность n-мерных точек на плоскость, целесообразно выделить операции, не зависящие от координат обрабатываемой в данный момент точки. К таким операциям относится вычисление коэффициентов а„ bj линейного преобразования, значения которых зависят только от размерности входных данных п. Указанные операции следует вынести в отдельный цикл, что позволяет снизить вычислительные затраты по сравнению с обработкой каждой точки совокупности по алгоритму, предложенному в пункте 3.1. Блок-схема алгоритма визуализации набора многомерных объектов-образов представлена на рисунке 3.3.
Моделирование социально-политических процессов
Утверждается [70], что с помощью описанной модели можно прогнозировать банкротство предприятия за три квартала с вероятностью 81%. Доля ошибочного прогноза банкротства предприятий составляет при этом -7%.
Применение разработанных средств обратимой визуализации многомерных объектов-образов для оценки кредитоспособности заемщика рассмотрено на примере 312 предприятий. Результаты, полученные с помощью разработанных средств обратимой визуализации, сравниваются с прогнозом, построенным на основе аналитической модели R, применяемой для оценки кредитного риска в банковской сфере, и фактическими сроками и порядком погашения кредитов предприятиями-заемщиками. На основании аналитической модели были приняты 26 ошибочных решений из 312. С помощью разработанных инструментальных средств названные ошибки были устранены, но 14 заемщиков рекомендованы для дополнительной проверки кредитной комиссией, что соответствует уровню качества принятия решений 0.95.
Рассмотрим применение разработанных инструментальных средств обратимой визуализации многомерных объектов-образов для оценки кредитоспособности заемщика на примере шести различных предприятий Курской области.
В качестве характеристических признаков выберем коэффициенты Xt -Х4, являющиеся базовыми показателями для расчета вероятности банкротства предприятия в соответствии с описанной выше моделью R.
Для всех заемщиков значения признаков Xt - Х4 рассчитываются дважды с интервалом в один год, что позволяет проследить динамику развития предприятий в указанный период и своевременно выявить возникшие у заемщиков финансовые затруднения. Таким образом, итоговая выборка состоит из 12 четырехмерных объектов. При этом каждому предприятию соответствуют два объекта: один характеризует финансовой состояние предприятия в начале рассматриваемого периода, другой - в конце.
В результате применения модели R к исследуемым объектам получены прогностические значения вероятностей банкротства рассматриваемых предприятий (таблица 4.3). Коэффициент R1 характеризует состояние объектов в первом периоде, R2 - во втором.
На основании данных таблицы 4.3 произведено первичное разбиение исходного множества объектов на классы.
В категорию вероятных банкротов попали объекты, соответствующие предприятию Пога-1 в первом и втором расчетном периодах и Автомир во втором расчетном периоде. Вероятность их банкротства составила 90 %.
К отдельному классу отнесены оба объекта, характеризующие деятельность «Рыльскхлебопродукта». Финансовые показатели этой организации в первом периоде были оценены положительно, во втором периоде прогнозируемая вероятность ее банкротства увеличилась до 25-50%. На практике предприятие не выполнило взятые на себя финансовые обязательства, а кредит был возвращен только после реализации залога.
Объекты, вероятность банкротства которых минимальна, представлены двумя классами: к одному относятся крупные промышленные предприятия ЗАО «Курскрезинотехника» и ОАО «Счетмаш», ко второму - небольшие торговые организации «Курск-Лада» и «Автомир». Такое разделение обусловлено, во-первых, различием масштабов предприятий: стоимость активов ЗАО «Курскрезинотехника» и ОАО «Счетмаш» в десятки раз превышает аналогичные показатели «Курск-Лады» и «Автомира», во-вторых, их отраслевой спецификой: торговые организации могут успешно работать при более низком соотношении собственных и заемных средств, чем промышленные предприятия.
Действительно, из рисунка 4.1 видно, что крупные промышленные и средние торговые предприятия разграничены в избранном признаковом пространстве. Следовательно, оценивать кредитоспособность заемщиков каждой группы следует отдельно, в соответствии со спецификой и масштабом организации.
Отметим также тот факт, что пространственное положение «Курск-Лады» во втором периоде существенно отличается от ее позиции в первом периоде, причем вектор, соединяющий данные объекты, практически параллелен оси Х3. Сопоставляя пространственную конфигурацию объектов, представленную на рисунке 4.1, с финансовыми показателями деятельности данного предприятия, сформулирован вывод о том, что такой отрыв «Курск-Лады» от основной группы объектов, принадлежащих тому же классу, обусловлен большой суммой выручки при относительно невысокой стоимости активов во втором расчетном периоде.