Содержание к диссертации
Введение
1 Анализ предметной области 10
1.1 Классификационные системы поддержки принятия решений (СППР) 10
1.2 Методы и модели классификации многомерных объектов 20
1.3 Структурированность проблемы классификации объектов 27
1.4 Выводы 32
2 Теоретические аспекты системного анализа в построении классификационных СППР 33
2.1 Формулирование целей в решении слабоструктурированных задач классификации 33
2.2 Анализ и синтез в классификации объектов 38
2.3 Этапы реализации СППР 42
2.4 Выводы 49
3 Методика построения классификационных СППР 50
3.1 Построение обучающей эталонной выборки 50
3.2 Методы классификационного анализа 55
3.3 Методика ранжирования многомерных объектов и выбор итогового класса 59
3.4 Программная реализация классификационной СППР 63
3.5 Выводы 69
4 Разработка СППР для классификации предприятий малого и среднего бизнеса 70
4.1 Моделирование обучающей выборки 74
4.2 Применение методов классификационного анализа 92
4.3 Математические модели оценки финансовых возможностей предприятий 112
4.4 Пример практического использования СППР 122
4.5 Выводы 127
Заключение 130
Список литературы
- Методы и модели классификации многомерных объектов
- Анализ и синтез в классификации объектов
- Методика ранжирования многомерных объектов и выбор итогового класса
- Математические модели оценки финансовых возможностей предприятий
Введение к работе
Актуальность работы. Во многих сферах деятельности человека возникают проблемы классификации многомерных объектов (МО), описываемых совокупностью количественных и качественных показателей. Определение группы однородности, к которой следует отнести конкретный объект, в зависимости от значений, принимаемых характеризующими его показателями, является важной задачей, без решения которой невозможно принятие эффективных управленческих решений.
Задачи классификации относятся к слабоструктурированным проблемам, решение которых осуществляется посредством совмещения знаний лица принимающего решения и возможностей компьютера. В связи с чрезвычайной трудоемкостью вычислительных процедур длительное время решение прикладных задач классификации даже небольшой размерности было связано с большими временными затратами. Статистические пакеты прикладных программ существенно расширили возможности применения математических моделей для решения задач классификации. Они открыли новые перспективы в классификации объектов различной природы на основании закономерностей, выявленных в эмпирических данных практически неограниченного объема.
С другой стороны при использовании методов классификации с обучением – дискриминантного анализа, деревьев классификации, нейронных сетей, логистической регрессии появляются определенные трудности, влияющие на решение задач:
– обучающие выборки, представляющие собою реальные эмпирические данные, не удовлетворяют требованиям применимости методов (небольшие объемы, несоответствие распределения показателей нормальному закону, наличие выбросов – нетипичных значений, большие разбросы показателей и т.д.);
– неоднозначен выбор наиболее информативной системы показателей, определяющей принадлежность объектов к группам классификации;
– достаточно трудоемка классификация объектов по совокупности построенных математических и нейросетевых моделей.
Преодолеть указанные сложности можно при помощи систем поддержки принятия решений, позволяющих автоматизировать наиболее трудоемкие процедуры классификации в конкретной прикладной области человеческой деятельности.
Поэтому актуальным является создание классификационных систем поддержки принятия решений (СППР), как результата интеграции компьютерных средств обработки, анализа и хранения данных.
Степень разработанности проблемы. Интерес к изучению задач
классификации МО нашел свое отражение в многочисленных исследованиях
российских и зарубежных авторов: Н.И. Куренкова,
С.Н. Ананьева, С.А. Айвазяна, З.И. Бежаевой, О.В. Староверова, Р.Н. Каримова, T. Кохонена, Г. Дебока, М. Дж. Кендалла, А. Стьюарта и др.
В настоящее время известно много работ отечественных ученых в области разработки систем поддержки принятия решения: Уринцова А.И., Дика В.В., Орлова А.И., Симанкова В.С., Смирнова Э.А., Ларичева О.И., Петровского А.Б., Терелянского, П. В. и зарубежных специалистов Паркинсона С.Н, Кина П., Тейлора Дж., Пауера Д., Маракаса Г. и др.
Работа выполнена в соответствии с паспортом специальности ВАК при Минобрнауки РФ (технические науки, специальность 05.13.01 - Системный анализ, управление и обработка информации):
п.4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации»;
п.5 «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации»;
п. 11 «Методы и алгоритмы прогнозирования и оценки эффективности, качества и надежности сложных систем»;
п. 12 «Визуализация, трансформация, и анализ информации на основе компьютерных методов обработки информации».
Объектом исследования является система поддержки принятия решений для классификации МО произвольной природы.
Предметом исследования выступает совокупность методов и алгоритмов классификации МО.
Целью исследования является разработка методики построения СППР для слабоструктурированных задач классификации МО. Задачи исследования: – осуществить систематизацию методов классификации МО, исследовать проблему классификации с позиций системного анализа;
– построить СППР для задач классификации МО на основе системного подхода;
– разработать блок-схему алгоритма СППР; – предложить методику ранжирования МО;
– как пример, построить СППР для экспресс-анализа финансового состояния предприятий малого и среднего бизнеса.
Методы исследования. Для решения поставленных задач были использованы методы системного анализа, экспертных оценок, лингвистической классификации, многомерного классификационного анализа, нейронных сетей, математического моделирования, методы решения разностных уравнений и разработки программного обеспечения.
Научная новизна заключается в следующем:
-
Впервые предложена систематизация методов классификации МО по трем основным признакам – по целевому временному интервалу, по типу используемых методик и по характеру используемой информации;
-
Построена оригинальная схема решения задач классификации на основе системного подхода и выделенных основных этапов системного анализа при создании СППР для слабоструктурированных задач классификации;
-
Впервые предложена методика создания СППР для классификации МО, разработан алгоритм СППР, предложена оригинальная методика ранжирования объектов, описываемых системой количественных показателей;
-
Разработана новая методика расчета индивидуальных и среднерыночных значений параметров кредитования предприятий малого или среднего бизнеса (МСБ).
Практическая значимость. Результаты научного исследования могут быть использованы при построении СППР для решения задач классификации объектов произвольной природы.
Разработанная методика построения СППР позволит формализовать:
процедуру решения слабоструктурированных задач классификации МО;
построение модельной обучающей выборки, удовлетворяющей условиям применимости методов классификации;
выбор итогового класса принадлежности объекта в случае несогласованности результатов классификации.
СППР для экспресс-анализа финансового состояния предприятий МСБ обеспечит их достоверную классификацию по группам риска кризисного финансового состояния, позволит снизить риски кредитования, определить оптимальную сумму и процентную ставку выдаваемых кредитной или инвестиционной организацией денежных средств.
Реализация и внедрение работы. Диссертационная работа выполнена по программе стратегического развития Кубанского государственного университета в рамках проекта «Интеллектуальная информационная система поддержки принятия решений в сфере оценки финансового состояния предприятий малого и среднего бизнеса», регистрационный номер12/13с-1.3.
Разработанная СППР размещена на сайте , результаты научного исследования внедрены в учебный процесс факультета прикладной математики КубГУ, в рабочий процесс консалтинговой компании ООО «Велбод» и инвестиционной компании ООО «Инвестфинанс Юг», о чем свидетельствуют акты о внедрении.
Апробация результатов диссертации. Основные положения диссертации докладывались на конференциях: VI Всероссийская открытая научно-практическая конференция «Актуальные задачи математического моделирования и информационных технологий», г.Сочи, 2010; III Международная научно-практическая конференция «Современные тенденции в экономике и управлении: новый взгляд», г.Новосибирск, 2010; IV Международная научно-практическая конференция «Наука и современность», г.Новосибирск, 2010; XIV Международная научно-практическая конференция «Актуальные вопросы экономических наук», г.Новосибирск, 2010; II Международная научная заочная конференция «Актуальные вопросы современной экономической науки», г.Липецк, 2010; VI Международная научно-практическая конференция студентов и молодых ученых «Молодые экономисты - будущему России», г.Ставрополь,
2014; Научно-технический семинар Института компьютерных систем и информационной безопасности КубГТУ, г.Краснодар, 2016.
Основные положения, выносимые на защиту диссертации:
-
Методика создания СППР и алгоритм СППР для классификации МО, построенные на основе предложенной систематизации методов классификации и схемы решения задач классификации;
-
Методика ранжирования объектов произвольной природы как точек многомерного метрического пространства;
-
Методика расчета индивидуальных параметров кредитования МСБ при пакетном, индивидуальном подходе и в процессе становления долгосрочного равновесия.
Достоверность и обоснованность научных положений подтверждается использованием системного подхода и математического аппарата к решению задач научного исследования; применением признанных научным сообществом литературных источников предметной области решаемой задачи; построением адекватных математических моделей; согласованностью проведенных научных исследований с практическим опытом и известными знаниями в предметной области; апробацией и результатами внедрения классификационной СППР.
Публикация результатов работы. По теме диссертационной работы опубликовано 13 печатных работ, в том числе 7 в изданиях, рекомендованных ВАК РФ для публикации основных результатов диссертации. Получены свидетельства о регистрации 4 программ для ЭВМ.
Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, выводов по каждой главе, заключения, списка используемой литературы и приложений. Диссертация изложена на 152 листах основного текста, содержит 26 рисунков и 26 таблиц. Список используемой литературы содержит 231 наименование.
Методы и модели классификации многомерных объектов
Прогнозные модели на основе данных о нынешнем состоянии дают классификацию объекта в будущем (ближайшем или не очень). В условиях стабильной внешней среды системы прогнозные модели являются устойчивыми, но как только наблюдается колебания внешних факторов, вероятность ошибочного прогноза резко возрастает.
Статические модели позволяют классифицировать объект исследования на основе его текущего состояния, не ориентируясь на его состояние в будущем.
Количественные методы используют в качестве статистических данных для расчета своих параметров (например, весов показателей или коэффициентов решающих правил или предельных значений) данные по всем имеющимся объектам, руководствуясь принципом: «чем больше, тем лучше».
В сфере оценки финансового состояния предприятия примером такой методики является методика количественной оценки риска банкротства предприятия [64]. В сфере здравоохранения использование количественных методов способствовало возникновению доказательной медицины, инструментом которой является клинические исследования [65]. Они используются для доказательства эффективности и доказательства методов лечения. Так, например, в 1998г в ряде стран Евросоюза, Японии и США было введено руководство по гармонизации технических требований к регистрации лекарственных препаратов для человека «Статистические принципы для клинических испытаний» [66]. А в 2003 г. в России были утверждены методические рекомендации «Принципы применения статистических методов при проведении клинических испытаний лекарственных средств» в виде разъяснений к отраслевому стандарту [67], в которых изложены требования к надлежащему применению статистических методов при планировании и проведении клинических испытаний.
Качественные методы основаны на статистических данных признаков многомерных объектов однородных по своей природе, т.е. принадлежащих одной группе признаков. Существует множество различных качественных методов и подходов. Но далеко не все они являются приемлемыми из-за недостатка исходных данных и их качества. Например, качественные методы оценки банкротства предприятий в Российской Федерации применять не целесообразно. Это объясняется тем, что в России пока еще отсутствует статистика банкротств предприятий по причине молодости института банкротства в нашей стране, что затрудняет создание кредитными организациями их собственных разработок, основанных на реалиях нашей экономики и направленных на достоверное прогнозирование возможного банкротства предприятий [68]. Примером использования качественного метода в медицине может послужить метод «копи-пара» [69]. В его основе лежит подбор для каждой исследуемой единицы «копи-пары» по некоторому множеству исследуемых признаков.
Коэффициентные методы дают классификацию многомерного объекта на основе сравнения значений признаков с нормативными значениями. В зависимости от методики классификация одного и того же объекта может быть проведена на основе различных совокупностей признаков. В основе методики прогнозирования банкротства ФСФО России [70] (принятой 1994 г.) лежит коэффициентный метод. Ее недостатком являются завышенные нормативные значения коэффициентов, по которым делается вывод о платежеспособности предприятия. Например, нормативное значение коэффициента текущей ликвидности, равное 2, выбрано без учета отраслевых особенностей экономических субъектов. Оно взято из мировой учетно-аналитической практики, а значит не ориентировано на Российский рынок. Большинство предприятий нашей страны продолжает работать со значительно более низким значением коэффициентом ликвидности – в условиях дефицита собственных оборотных средств. Рейтинговая оценка финансового состояния предприятия [71] так же относится к коэффициентным методам. Она позволяет выявлять отдаленность банкротства, основываясь на 8 показателях. Классификация заемщиков производится по степени близости к банкротству – вполне благополучное состояние; состояние, характерное за пять лет до банкротства; за один год до банкротства и т.д. Результат классификации зависит от общего количества баллов предприятия, по значению которого определяется его класс. Недостатки данной модели – неполная система коэффициентов, бальная система оценки и высокая степень зависимости от опыта разработчиков модели. Аналогичными недостатками обладает анализ коэффициентов с помощью спектр балльной оценки, которая предполагает проведение анализа финансовых коэффициентов путем сравнения полученных значений с рекомендуемыми нормативными величинами, играющими роль пороговых значений. Чем удаленнее величина коэффициентов от нормативного уровня, тем ниже степень финансового благополучия предприятия и выше риск попадания в категорию несостоятельных предприятий. Рейтинговая и бальная оценки предприятия-заемщика рассчитывается на основе полученных значений финансовых коэффициентов и выражается в баллах. Баллы исчисляются путем умножения значения любого показателя на его вес в интегральном показателе (рейтинге), то есть при помощи линейной функции, коэффициенты которой не являются устойчивыми во времени и пространстве.
В медицине коэффициентные методы используют часто, например, при изучении результатов общего анализа крови пациента. Врач по завышенным или заниженным показателям структуры крови может диагностировать состояние пациента, определить инфекционное или вирусное заболевание у больного, выявить такие болезни как анемия, полицитемия, лейкоз и другие.
Аналитические методы классификации многомерного объекта заключаются в анализе аналитиком основных аспектов и характеристик многомерного объекта. Критерием отбора является попадание значений рассчитанных параметров в некоторый диапазон. Такой анализ производится вручную (или частично автоматизирован), так как центральным моментом принятия решения является интуиция и опыт лица принимающего решение. Примерами таких методов в сфере оценки финансового состояния предприятий являются упрощенные модели, основанные на системе определенных показателей Бивера [72]. Агрегировать количественные и качественные характеристики заемщика позволяют модели комплексного анализа: правило «шести СИ» (США), CAMPARI, PARTS (Англия), оценочная система анализа [73]. Перечисленные аналитические методы не адаптированы под условия Российской экономики, так как разработаны и исследованы на основе данных зарубежных предприятий. В качестве примера аналитического метода, ориентированного на Российский рынок, можно привести методику отечественных экономистов [74].
В медицине к аналитическим методам классификации состояния больного относится, например, диагностика на основе лабораторных исследований, а так же диагностика на основе симптомов болезни.
Аналитические методы классификации обладают недостаточной теоретико-методологической проработанностью и слабым использованием математического аппарата. Основной акцент в их реализации делается на субъективное мнение экспертов. Эти особенности в значительной мере затрудняют использование методик данного типа.
Скоринговые методы основаны на математических моделях, позволяющих на основе рассчитанной пороговой оценки классифицировать объект. Скоринговые методы можно разделить на детерминированные и эмпирические. Их основное различие состоит в том, что в детерминированных методах статистические данные используются для построения модели, а при непосредственной классификации нужны только данные исследуемого объекта. Эмпирические же методы используют статистические данные непосредственно для классификации.
Анализ и синтез в классификации объектов
Одним из самых важных критериев, которому должна удовлетворять разрабатываемая СППР, является обеспечение повсеместного и удобного сетевого доступа по требованию пользователя и возможность использования СППР независимо от программного обеспечения точки доступа. Это требование, в первую очередь, связано с удобством применения системы и снижением расходов на программное обеспечение и его сопровождение.
Учитывая специфику российского рынка информационных технологий, была выделена следующая система критериев, которым должна удовлетворять разрабатываемая СППР.
Интероперабельность. Способность подключения дополнительно разработанных программных компонент для увеличения вычислительных возможностей СППР.
Рациональная стоимость. При приобретении СППР покупатель обращает внимание на доминирование выгоды, которую может принести использование данного программного продукта над общими затратами – на покупку и поддержку.
Простота и комфортность использования. Чем проще и удобнее компьютерная программа, тем быстрее проходит обучение и тем эффективнее ее применение.
Скорость принятия решения. Решение должно предлагаться СППР в максимально короткий промежуток времени, осуществляя оптимизацию работы лица принимающего решение (ЛПР).
Простота и удобство доступа к СППР. Доступ к СППР должен осуществляться независимо от характеристик ПК пользователя и места его расположения. Гибкость. СППР должна легко адаптироваться к изменениям во внешних условиях.
Низкая стоимость. СППР должна функционировать на базе недорогого программного обеспечения, тем самым снижая стоимость процесса классификации объекта.
Надежность. Информация об объекте исследования является существенной для задачи классификации, следовательно, СППР, содержащая данную информацию, должна быть стабильна в работе.
Защита от несанкционированного доступа. При внедрении СППР особую актуальность приобретают различные аспекты безопасности информации, например, защита прав личности от распространения конфиденциальной информации.
Многокомпонентность. Качественная автоматизированная система должна опираться на значительный объем информации, требующей периодического обновления.
Эффективность. Оценка эффективности СППР осуществляется по результатам ее работы. Для решения многих из поставленных задач были применены он-лайн технологии, которые позволили наделить разработанную классификационную СППР указанными выше преимуществами. Применительно к разработке классификационной СППР реализация системы заключалась в генерировании и выборе альтернатив решения поставленной проблемы; разработке методологии и технологии классификации объекта; программной реализации системы; испытании, наблюдении и экспериментах; опытной эксплуатации СППР; определении путей модернизации. В соответствии с таким выбором последовательности действий, реализацию системы можно представить в виде IDEF0-диаграммы (рисунок 2.2).
Первый этап реализации СППР – генерирование альтернатив (идей о возможных способах достижения целей), является творческим процессом для разработчиков системы. Выбор одного или нескольких вариантов решения проблемы из некоторого исходного множества вариантов (альтернатив) на основе системы критериев представляет собой задачу принятия решений. В общем случае задача принятия решений представима кортежем следующего вида [117] 2= \X,I,S,K), где X - множество альтернатив, / - уровень информации, S - метод поиска (вывода) решения, К - множество критериев оценки альтернатив.
Множество альтернатив зависит от имеющейся базы знаний, новизны задачи, типа проблемной информации. Стратегия поиска (вывода) зависит от имеющейся информации о задаче и включает способ выбора альтернатив, определяемый структурой предпочтений ЛПР, и метод (модель) оптимизации, обуславливающий способ агрегирования критериев (векторная оптимизация, использование функции полезности, интерактивное программирование). Множество критериев определяется степенью детализации задачи и требуемым качеством ее решения.
Методы выбора наилучшей системы альтернатив тесно связаны с вопросом численной оценки альтернативы. Наиболее ранние исследования в области оценки альтернатив были проведены французскими учеными Кондорсе и Борда, которые обратили внимание на недостаточность процедуры выбора лучшей альтернативы на основе мнения большинства [129]. Позже, Эрроу на основе анализа ситуаций, возникающих при согласованном выборе, сформулировал принцип отбрасывания альтернатив. Он выявил пять условий, каждое из которых является естественным требованием к коллективному выбору [129]. Парадокс Эрроу [130] заключается в невозможности их совместного выполнения. Для выбора альтернатив используются методы, основанные на понятии меры близости.
Методика ранжирования многомерных объектов и выбор итогового класса
На этапе концептуального проектирования создается семантическая модель предметной области, которая описывает ее понятия, связи между ними и ограничения целостности. На этапе логического проектирования строится схема базы данных на основе модели данных, проектируются сущности, атрибуты и связи между сущностями, отношения модели преобразуются к виду согласно нормальным формам. Нормализация сущностей модели данных обеспечивает минимальную логическую избыточность, позволяет устранить недостатки структуры, которые приводят к ошибкам в процессе эксплуатации базы и нарушениям целостности данных. Физическое проектирование состоит в построении базы данных для конкретной выбранной системы управления базами данных с ориентацией на ее специфику (например, ограничения на типы данных, наименования сущностей и др.).
Информационная оболочка СППР является web-приложением. Такой подход имеет ряд преимуществ. К ним относятся возможность доступа к системе из любой точки земного шара; экономия денежных средств на приобретении, сопровождении и модернизации программного обеспечения; независимость от вычислительной мощности точки доступа; расширение вычислительных возможностей системы. К недостаткам такой организации доступа к разрабатываемой СППР относятся понижение уровня сохранности конфиденциальных данных и постоянная необходимость в высокоскоростном доступе в Интернет. Так как вопрос безопасности и конфиденциальности данных в некоторых случаях имеет первостепенную важность, то одним из путей его решения является использование облачных технологий, а именно, развертывание частного облака и управление СППР без привлечения сторонней организации. Такой подход к сохранности данных надежен, но дорогостоящ. Поэтому использование частного облака могут позволить себе только крупные организации, вопрос конфиденциальности данных для которых, в силу специфики их работы, является существенным.
Интеграция моделей классификационного анализа многомерного объекта в информационную оболочку СППР позволит наполнить систему функциональностью, их включение в оболочку системы возможно двумя способами: посредствам импорта-экспорта данных или посредствам реализации моделей на соответствующем языке web-программирования. Первый способ обеспечивает оперативное перестроение моделей за счет использования статистических пакетов. Второй – сокращение времени ожидания результата классификации системой и повышение надежности работы системы.
Тестирование системы состоит в наблюдениях и экспериментах над построенной программой, в проверке адекватности использованных моделей классификации. Данный этап позволит определиться с выбором альтернатив решения поставленной задачи. На данном этапе возможно выявление ошибок, допущенных при разработке и программной реализации СППР.
После устранения ошибок, результатом этапа тестирования будет пилотная (пробная) версия СППР. За тестированием следует опытная эксплуатация продукта, где эксперты и специалисты могут внести свои дополнения, пожелания и замечания в работу системы. На их основе осуществляется дальнейшая технологическая и программная доработка СППР. Результатом этапа опытной эксплуатации и доработки программного продукта станет окончательная версия СППР.
Ниже представлена блок-схема алгоритма классификационной СППР, которая включает четыре подсистемы (рисунок 3.3): работы с данными (I); формирования системы показателей (II); многомерного классификационного анализа (III), выбора итогового результата классификации (IV).
Подсистема работы с данными предназначена для хранения, обработки и представления информации о многомерных объектах в базе данных, которая позволяет структурировать, систематизировать и организовывать данные. Подсистема с помощью SQL запросов обеспечивает возможность СППР внесения, удаления и поиска данных об объекте. Использование встроенной в оболочку СППР базы данных позволяет наполнить систему функциональностью, а также обеспечить возможность расширение функциональности в случае необходимости. Рисунок 3.3 – Блок-схема алгоритма СППР
Подсистема формирования показателей предназначена для анализа корректности данных. Для каждого показателя рассчитываются пороговые значения, при выходе за которые генерируется сообщение о возможной ошибке или фальсификации данных. Система предусматривает два источника формирования значений показателей: база данных объектов и диалоговое окно ввода данных пользователем. Первый – удобен в случае неоднократного обращения к данным, а второй – обеспечивает более высокую степень конфиденциальности данных. Выбор способа формирования системы показателей осуществляется пользователем СППР.
Подсистема классификационного анализа позволяет отнести объект к группе однородности согласно выбранным методам классификации, например, дискриминантному анализу, деревьям классификации, нейронным сетей, логит-регрессии и др. Описание некоторых методов классификации представлено в 3.2. Совокупность методов может быть расширена или изменена в соответствии с решаемой задачей. Например, не всякий многомерный объект может быть классифицирован по двум классам, поэтому применение метода логит-регрессии возможно только для некоторого круга задач. Одним из условий применимости параметрических методов дискриминантного анализа является соответствие распределения признаков объекта нормальному закону. Если показатели реальных объектов распределены в соответствии с другим законом распределения, то и показатели модельной базы, в силу технологии построения, будут так же иметь распределение отличное от нормального. Использование параметрических методов при этом некорректно и следует воспользоваться непараметрическим методом дискриминантного анализа, который не требуют знаний о точном функциональном виде распределений показателей и допускает использование показателей, измеренных в порядковой или номинальной шкале. Такие методы как деревья классификации и нейронные сети не имеют каких-либо строгих теоретических предположений, налагаемых на выборочные данные, и так же могут использовать качественные показатели. Следует отметить, что чем строже условия применимости метода, тем при их выполнении метод дает более качественную классификацию.
Математические модели оценки финансовых возможностей предприятий
На анализ стохастических взаимосвязей между финансовыми коэффициентами могут оказать влияние предприятия, деятельность которых приостановлена, либо они еще не признаны несостоятельными в соответствии с решением арбитражного суда, или уже ликвидированы в соответствии с приказом МВД РФ [182]. Для таких предприятий типичны нулевые или бесконечно большие величины финансовых коэффициентов рентабельности, так как именно эти коэффициенты несут в себе информацию о прибыли, выручке и об активах компании. Из 441 предприятия было выявлено и исключено из рассматриваемой выборки 32 таких организации.
Для оставшейся совокупности данных 409 предприятий был произведен анализ стохастической взаимосвязи между каждой парой финансовых коэффициентов. В случае выявления сильной значимой корреляции между ними (коэффициент корреляции r 0,75), один экономический показатель рассматриваемой пары исключали из рассмотрения. Такое сокращение числа показателей способствовало созданию не избыточной системы финансовых коэффициентов. Все рассматриваемые коэффициенты измерены в интервальной шкале, поэтому для изучения их взаимосвязи был использован коэффициент корреляции Пирсона, значение которого не зависит от единицы измерения финансовых коэффициентов. Для сокращения расчетов сначала были исследованы парные корреляции внутри каждой группы, исключены зависимые показатели, а после – коэффициенты, относящихся к разным группам. В результате система финансовых коэффициентов была сокращена с 25 параметров до 20: R3, R4, R5, R6, L1, L2, L3, P1, P2, 1/A1, A2, 1/A3, A4, 1/A5, A6, F1, F2, F3, F4, F11.
Наличие выбросов в выборочной совокупности в значительной мере влияет на среднее арифметическое, стандартное отклонение, асимметрию, эксцесс выборки, а также критерий согласия с нормальным законом. Построение обучающей выборки основано на однородности реальных и моделируемых данных. Чем однороднее данные, тем надежнее и адекватнее результаты статистического анализа на основе обучающей выборки. Однородность данных определяли схожестью средних величин и дисперсий. Поэтому наличие выбросов в реальной совокупности данных может в значительной мере оказать влияние на моделирование обучающей выборки и, как следствие, на результаты дальнейшего классификационного анализа. К сожалению, не существует общепринятого метода автоматического удаления аномальных значений показателей. Поэтому была произведена процедура ручного поиска выбросов и крайних точек. Для замены аномальных значений коэффициентов использовали метод k – ближайших соседей, реализованный в программе STATISTICA – пропущенные данные заменяли средними величинами k схожих наблюдений. Значение k было определено минимальным числом наблюдений в группах. Группирующей переменной был выбран показатель краткосрочной финансовой устойчивости (финансовой независимости) [175]. Меньше всего наблюдений (19) было отнесено к группе со значением группирующей переменной нормальная краткосрочная финансовая устойчивость, поэтому выбрали k=19.
Задача экспресс-анализа финансового состояния предприятий МСБ подразумевает наличие некоторой порядковой шкалы [183], на основе которой дают оценку финансового состояния исследуемого объекта. Для классификации предприятий МСБ в соответствии с их финансовым состоянием ввели качественную переменную – уровень риска кризисного финансового состояния [184]. Она предусматривает градацию предприятий МСБ по 5 уровням: 1 группа – предприятия очень низкого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором без просрочек платежей; 2 группа – предприятия низкого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой до 30 дней; 3 группа – предприятия среднего уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой платежей от 30 до 90 дней; 4 группа – предприятия высокого уровня риска кризисного финансового состояния, если финансовое состояние позволяет выполнять долговые обязательства перед кредитором с максимальной просрочкой платежей более 90 дней; 5 группа – предприятия очень высокого уровня риска кризисного финансового состояния, если финансовое состояние не позволяет выполнять долговые обязательства перед кредитором.
На практике часто используют бинарные и тринарные классификации, но деление объектов по пяти группам является более информативным. Использование пятиуровневой классификации позволяет более развернуто построить отношение предпочтения объектов различных групп. В то же время, деление на семь и более групп значительно рассеивает внимание и является более громоздким. Кроме того, пятиуровневая классификация предприятий выбрана в соответствии с требованиями Центрального Банка России [185] об отнесении заемщика к одному из пяти групп категорий качества клиентов на основе выполнения его обязательств перед кредитором.
По значениям финансовых коэффициентов реальных предприятий кредитными аналитиками посредством «ручного» анализа были классифицированы предприятия МСБ по пяти уровням риска кризисного финансового состояния. По три предприятия из каждой группы образовали тестовую выборку, которая в дальнейшем использовалась для кросс-тестирования методов классификационного анализа по определенным выше группам риска.