Содержание к диссертации
Введение
ГЛАВА I. Системный подход к разработке нейросетевых моделей в системах финансового контроля в условиях неопределености11
1.1. Элементы системы финансового контроля 11
1.2. Системный пoдхoд к разрабoтке нейрoсетевoй мoдели. Oснoвные пoнятия и oпределения 14
1.3. Условия моделирования и особенности развиваемого подхода к нейросетевому моделированию. Концепция квазистатистики 16
1.4. Общие преимущества и недостатки нейросетевых моделей при решении обратных задач восстановления зависимостей 19
1.5. Концептуальный базис нейросетевого моделирования 23
ГЛАВА II. Методы построения нейросетевых моделей сложных объектов и их регуляризация 35
2.1. Анализ устойчивости нейросетевых моделей 35
2.2. Классификация метoдoв регуляризации нейрoсетевых мoделей при решении oбратных задач вoсстанoвления функциoнальных зависимoстей, скрытых в данных 41
2.3. Oригинальный квазибайесoвский метoд регуляризации oбучения нейрoсети при сильнoм зашумлении данных с неизвестнoй функцией закoна распределения шума 48
2.4. Модифицированный метод вложенных математических моделей 55
2.5. Вычислительные эксперименты по апробации метода вложенных математических моделей 77
2.6. Метод многоступенчатой оценки адекватности нейросетевой модели 84
ГЛАВА III. Нейросетевые модели оценки кредитоспособности как инструмент управления кредитным процессом и экономической безопасностью предприятий 88
3.1. Предварительные замечания к пoстанoвке задачи 88
3.2. Анализ известных моделей диагностики банкротств в системе корпоративного управления в реальном и финансово-банковском секторе 91
3.3. Гибридный метод оценки риска банкротств на базе байесовского ансамбля нейросетей и logit-модели (GNBL) 112
3.4. Количественная апробация гибридного метода GNBL 119
3.5. Применение гибридного метода GNBL в динамических прогнозных моделях банкротств 126
3.6. Вычислительный эксперимент по построению динамической модели банкротств 135
ГЛАВА IV. Метод синтеза плана налоговых проверок и поддержки принятия решений по налоговому регулированию 143
4.1. Повышение эффективности систем налогового контроля и управления (СНКУ) на основе моделирования объектов налогообложения 143
4.2. Методы синтеза оптимального плана выездных налоговых проверок 149
4.3. Алгoритм синтеза oптимальных планoв выездных налoгoвых прoверoк 156
4.4. Результаты вычислительных и натурных экспериментов 157
Заключение 165
Список использованной литературы 168
Приложения 180
- Условия моделирования и особенности развиваемого подхода к нейросетевому моделированию. Концепция квазистатистики
- Вычислительные эксперименты по апробации метода вложенных математических моделей
- Применение гибридного метода GNBL в динамических прогнозных моделях банкротств
- Повышение эффективности систем налогового контроля и управления (СНКУ) на основе моделирования объектов налогообложения
Введение к работе
Актуальность темы исследования обусловлена следующими соображениями. Наполнение государственного бюджета налоговыми поступлениями является одной из приоритетных задач государственной системы финансового контроля. Административные способы повышения собираемости налогов (увеличение налогового бремени, усиление налогового контроля со стороны государства, увеличение количества инспекторов) практически себя исчерпали. Решение данной проблемы надо искать в рамках повышения эффективности процедур камеральных проверок. Поэтому совершенствование технологий налогового администрирования на основе новейших инструментариев принятия решений, математического моделирования, информационных технологий в условиях искажения данных налоговых деклараций, дефицита наблюдений и сложных условий формализации моделей представляется актуальной задачей.
Вопросы моделирования процессов сбора налогов и оценки добросовестности отдельных налогоплательщиков рассматривались в работах А. Б. Паска-чева, Д. Г. Черника, М. В. Мишустина и др. Проблемы интеллектуального управления и нейросетевого моделирования экономических объектов исследованы в трудах отечественных ученых В. И. Васильева, А. А. Ежова, Б. Г. Ильясова, Л. А. Исмагиловой, Е. М. Миркеса, С. А. Терехова, С. А. Шумского, Д. А. Тархова, Л. Р. Черняховской, Н. И. Юсуповой, зарубежных ученых И. С. Абу-Мустафы, Д.-Э. Бэстенса, В.-М. ван ден Берга, Д. Вуда. Общие вопросы теории нейронных сетей и нейрокомпьютинга изложены в работах А. И. Галушкина, А. Н. Горбаня, Т. Кохонена, Ф. Розенблата, С. Хайкина и других ученых нашей страны, дальнего и ближнего зарубежья.
Г. И. Букаевым была предложена технология оценки финансовых показателей налогоплательщиков. С. А. Горбатковым были разработаны общие принципы нейросетевого моделирования сложных экономических систем, включая системы налогового администрирования. Построению нейросетевых моделей камеральных проверок торговых предприятий посвящены исследования Н. Т. Габдрахмановой, Д. В. Полупанова, С. А. Фархиевой.
Степень разработанности темы исследования. Несмотря на существующие разработки в области нейросетевого моделирования для стохастических объектов с сильно зашумленными и даже сознательно искаженными данными, методы и принципы построения эффективных, адекватных и качественных нейросетевых моделей (НСМ) не были разработаны в полном объеме. В частности, отсутствуют работы посвященные оценке адекватности нейросете-вых моделей сложных экономических объектов. Поэтому актуальной научной задачей является разработка методов предобработки данных во взаимосвязи с управлением качеством НСМ; методов регуляризации НСМ; разработка гибридных методов на основе НСМ и моделей поддержки принятия решений в финансовых системах в условиях высокой неопределенности данных.
Несмотря на существование множества российских и зарубежных исследований в области диагностики и прогнозирования банкротств, задача построения адекватных и надежных моделей остается востребованной и актуальной. Раннее обнаружение тенденций банкротства и, соответственно упреждающие
процедуры, направленные на финансовое оздоровление предприятия, по сути являются условием стабильности предприятия, его экономической безопасности. Для этого необходим систематический мониторинг финансового состояния предприятия на основе комплексного анализа экономических показателей в их нелинейной взаимосвязи. Для этого нужны достаточно информативные (адекватные) динамические экономико-математические модели диагностики платежеспособности предприятия и его кредитоспособности.
В теоретическом аспекте остается актуальным вопрос выбора оптимальной системы экономических показателей и сокращения размерности факторного пространства внутри выбранной системы показателей для построения модели банкротств в каждой конкретной отрасли. Следует отметить, что уровень автоматизации процедур налогового контроля и процесса оценки кредитоспособности предприятий не соответствует запросам практики, с одной стороны, и потенциальным возможностям современного математического аппарата, в частности нейросетевых методов, с другой стороны. Эти обстоятельства определили цель данной работы и задачи исследования.
Объектом исследования в работе являются процессы управления в системах финансового контроля, на примере задач налогового контроля и диагностики банкротств. Несмотря на различие в деталях, указанные классы задач имеют общую методологическую и теоретическую основу. Методологической основой является концептуальный базис нейросетевого моделирования экономических систем, функционирующих в условиях неопределенности. Теоретической основой являются конкретные методы построения устойчивых нейросе-тевых моделей (НСМ).
Предметом исследования в работе являются системы поддержки принятия решений на основе нейросетевых экспертных систем, функционирующие в условиях высокой неопределенности.
Цель диссертационной работы состоит в повышении эффективности систем налогового и финансового контроля, финансового менеджмента на основе новейших интеллектуальных методов моделирования. Для достижения этой цели в диссертационной работе были поставлены следующие задачи:
-
Разработка метода построения нейросетевых моделей восстановления многомерных экономических зависимостей, скрытых в данных.
-
Разработка метода синтеза оптимальных планов выездных налоговых проверок для максимизации налоговых поступлений в бюджет.
-
Разработка метода оценки адекватности нейросетевых моделей.
-
Разработка нейросетевой модели поддержки принятия решений по ситуационному управлению кредитным процессом.
-
Разработка алгоритмов управления выездными налоговыми проверками и процессом кредитования клиентов в банке.
Методы исследования. Для решения поставленных в работе задач применялись методы системного анализа, теории принятия решений, методы нейро-математики, эконометрики, нечетких множеств и математической статистики.
На защиту выносятся:
-
Модифицированный метод вложенных математических моделей для обратных задач восстановления многомерных зависимостей, скрытых в данных.
-
Метод синтеза оптимальных планов выездных налоговых проверок на основе фрактального и логистического подхода к учету неопределенности.
-
Многоступенчатый метод оценки и управления адекватностью нейросе-тевых моделей финансового контроля.
-
Нейросетевой метод разработки модели поддержки принятия решений по ситуационному управлению кредитным процессом.
-
Алгоритм управления выездными налоговыми проверками и алгоритм управления процессом кредитования клиентов банка.
Научная новизна положений, выносимых на защиту:
-
Разработанный модифицированный метод вложенных математических моделей (МВММ), содержащий алгоритмы предобработки данных и алгоритмы их аппроксимации с помощью байесовского ансамбля нейросетей, отличается тем, что управление информативностью данных и качеством их аппроксимации производится взаимосвязано для обеспечения состоятельности задачи регуляризации НСМ.
-
Разработанный гибридный метод синтеза оптимальных планов отбора налогоплательщиков для выездных налоговых проверок, отличается тем, что учитывается не только величина индикатора нарушения налогового законодательства, но и вероятность этой оценки: а) для «длинных» временных рядов указанного индикатора – через оценку фрактальной размерности; б) для «коротких» временных рядов – через логистическую трансформацию вероятности.
-
Разработанный многоступенчатый метод оценки и управления адекватностью нейросетевых моделей финансового контроля в условиях, когда нарушаются практически все предпосылки классического регрессионного анализа, отличается тем, что механизм оценки и управления адекватностью основан на принципе последовательного сужения класса искомых решений обратной задачи восстановления зависимостей, скрытых в данных. Такой подход обеспечивает адекватность НСМ в сложных условиях моделирования, отягченных дефицитом наблюдений.
-
Нейросетевой метод разработки модели поддержки принятия решений по ситуационному управлению кредитным процессом с логистической трансформацией вероятности риска банкротства, отличается тем, что показатель экспоненты логистической функции агрегируется с помощью байесовского ансамбля нейросетей в виде многомерной нелинейной динамической функции с непрерывным временем, что позволяет прогнозировать во времени различные стадии развития процесса банкротства и, соответственно, разрабатывать упреждающие управленческие решения.
-
Предлагаемый алгоритм управления выездными налоговыми проверками отличается от известных методик тем, что очередность проверки объектов налогового контроля ставится в соответствие с синтезированным оптимальным планом отбора налогоплательщиков, что позволяет повысить объективность и
достоверность управленческих решений в системе налогового контроля, и, в конечном итоге, увеличить собираемость налогов.
Предлагаемый алгоритм управления процессом кредитования отличается от известных тем, что в нем, на основе динамической нейросетевой модели, учитывается непрерывная зависимость вероятности риска банкротства заемщика от времени. Это позволяет принимать упреждающие управленческие решения по реструктуризации кредитной задолженности.
Перечисленные элементы научной новизны ранее не были известны и опубликованы в приоритетных публикациях автора.
Теоретическая ценность выносимых на защиту положений заключается в том, что они создают концептуальный базис нейросетевого моделирования в системах финансового контроля для сложных условий моделирования.
Практическая значимость работы заключается в том, что разработанные нейросетевые модели поддержки принятия решений в сфере финансового контроля позволяют обеспечить объективность и научную обоснованность управленческих решений. Автором получено 2 свидетельства о государственной регистрации электронных ресурсов в ОФЭРНиО, а также акт об использовании результатов работы в межрайонной налоговой инспекции №39 Республики Башкортостан. Научное исследование выполнено в 2009 – 2013 гг. в Финансовом университете при Правительстве Российской Федерации на кафедре математики и информатики, в рамках комплексной темы «Социально-экономическая политика России в условиях модернизации и перехода экономики на инновационный путь развития». В дальнейшем полученные в работе результаты могут служить научной базой для модернизации существующих в настоящее время систем финансового контроля.
Апробация работы. Результаты работы обсуждались на следующих конференциях: Всероссийская научно-техническая конференция «Нейроинформа-тика» (Москва, 2011-2014 гг.); Международная заочная научно-практическая конференция «Научная дискуссия: вопросы экономики и управления» (Москва, 2013 г.); Всероссийская научно-практическая конференция «Финансовая политика инновационного развития России: проблемы и пути решения» (Уфа, 2013 г.); Всероссийская научно-практическая конференция «Социальная ответственность бизнеса: теория, методология, практика» (Уфа, 2010-2011 гг.); Международная научно-практическая конференция «Экономико-математические методы исследования современных проблем экономики и общества» (Уфа, 2013 г.). Соискатель дважды принимал участие в Международном конкурсе научных работ студентов и аспирантов (Москва, 2012-2013 гг.). Получены дипломы I и II степени в номинации «Математические и инструментальные методы в экономике».
Публикации. Основные результаты, представленные в диссертации, опубликованы в 28 печатных работах; из них 6 статей – в научных журналах, рекомендованных ВАК; 18 работ – в трудах международных и всероссийских конференций; получено 2 свидетельства о регистрации алгоритмов. Автор диссертации участвовал в написании отдельных глав и параграфов в 2-х монографиях.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы из 111 наименований и 4 приложений. Работа содержит 175 страниц основного текста, включая иллюстрации и таблицы. В приложениях приводятся выборки данных, на основе которых были построены нейросетевые модели налогового контроля и диагностики банкротств.
Условия моделирования и особенности развиваемого подхода к нейросетевому моделированию. Концепция квазистатистики
Разрабатываемые методы и алгоритмы ориентированы на экономические объекты со сложными условиями моделирования, наглядным примером которых являются объекты налогового контроля и диагностики банкротств.
Так в задаче налогового контроля на стадии камеральных проверок [54] в НСМ помимо обычных неизбежных проявлений неопределенности - наличия неучтенных существенных входных факторов и противоречивых данных, зашумления наблюдений, пропущенных (некомплектных) вектор-столбцов и вектор-строк таблицы данных - имеют место специфические для этих объектов сложные условия моделирования:
Высокий уровень зашумления данных вплоть до их сознательного искажения налогоплательщиками в сторону снижения налогооблагаемой базы.
Неконтролируемое изменение структуры моделируемых объектов -предприятий (юридических лиц).
Высокая неоднородность выборки данных по масштабу и условиям функционирования. Высокий уровень зашумления данных с неизвестным априори зако ном распределения шума, который отягчается дефицитом наблюде ний. Последнее вызвано тем, что данные налоговых деклараций предоставляются один раз в квартал в течение 1..3 лет, когда усло вия внешней экономической среды можно приближенно считать одинаковыми. К естественным осложнениям условий разработки НСМ, обусловленным прикладным характером задач, мы сознательно добавили еще одно условие теоретического характера - отказ от допущения об задании параметрической функции закона распределения шумов. На это допущение опирается большинство известных подходов к разработке методов регуляризации обучения нейро-сетевых моделей [84], [96], [106]. (см. Рис. 3.2). Возникает вопрос: что дает отказ от допущения о нормальном законе распределения шумов в задачах:
восстановления фундаментальных зависимостей, скрытых в данных;
классификации;
прогнозирования 1). В прикладном аспекте это приближает модель к реальным условиям объекта, а значит уменьшает функцию потерь от ошибок моделирования, вызванных именно неверным заданием закона распределения шумов.
2). В теоретическом аспекте отказ от «навязывания» объекту несвойственного ему закона распределения шумов уточняет и расширяет инструментарии нейросетевого моделирования.
3). В алгоритмах байесовской регуляризации, описанных в параграфах 2.5, 2.6, открывается перспектива разработки простых критериев апостериорной фильтрации гипотез-нейросететй {hq} по качеству описания НСМ данных.
Концепция «квазистатистики»
Модели трудноформализуемых экономических объектов с высоким уровнем неопределенности будем называть моделями с «триадой НЕ-факторов» (неполноты, неточности, неопределенности). Наличие этой триады предопределяет расширение границ использования статистических выборок данных до так называемых «квазистатистик», концепция которых разработана относительно недавно [56].
Остановимся на этом вопросе подробнее. Как известно [1], границы применимости теоретико-вероятностного способа рассуждения основаны на удовлетворении используемой выборки данных требованиям классического «статистического ансамбля». Приведем цитату из [1, с. 30]. «Статистический ансамбль не имеет место в ситуациях, когда «условия сбора (регистрации) исходных данных не укладываются в рамки так называемого статистического ансамбля, т.е. в ситуациях, когда не имеется практической или хотя бы принципиально мысленно представимой возможности многократного тождественного воспроизведения основного комплекса условий, при которых проводились измерения анализируемых данных». К этому следует добавить требование достаточно большого количества наблюдений.
Ясно, что отмеченные выше сложные условия моделирования риска экономических объектов не удовлетворяют концепции классического статистического ансамбля.
Квазистатистика [56], в отличие от теоретико-вероятностного подхода, использующего «классический статистический ансамбль», - «это выборка наблюдений из генеральной совокупности, которая считается недостаточной для идентификации вероятностного закона распределения с точно определенными параметрами, но признается достаточной для того, чтобы с той или субъективной степенью достоверности обосновать закон наблюдений в вероятностной или другой форме, причем параметры этого закона будут заданы по специальным правилам, чтобы удовлетворить требуемой достоверности идентификации закона наблюдений».
Например, для квазибайесовского метода регуляризации обучения нейро-сети из параграфа 2.3. в связи с отсутствием априорных сведений о законе распределения шумовой составляющей в наблюдениях, а также отклонении выборки от классического статистического ансамбля, вместо апостериорной вероят 19 ности P{hq{XJV)\H) о порождении данных в соответствии с данной априорной гипотезой-нейросетью hq, которую необходимо вычислять через функцию правдоподобия, предложен простой критерий качества объяснения данных, т.е. апостериорной фильтрации гипотез P =N qIN, (1.2) где N q- количество точек данных, объясненных моделью с удовлетворительной точностью; N - общее количество точек в данных; X - вектор объясняющих переменных; W - матрица синаптических весов нейросетевой модели (НСМ); Н-мета-гипотеза для нейросетей байесовского ансамбля (см. ниже в параграфе 2.5, 2.6).
В связи с данным определением «квазистатистики» возникает вопрос: какой объем выборки считать достаточным, а какой - нет. Например, при оценке финансового состояния предприятий машиностроительной отрасли можно утверждать, что каждое предприятие уникально, т.к. занимает свою нишу на рынке, и поэтому статистики в классическом понимании «статистического ансамбля» нет - выборка неоднородна [56]. Однако, выборка какого-то одного показателя, например, отношение цены к доходу, группируется в основном внутри некоторого диапазона, ближе к некоторым наиболее ожидаемым значениям. Это дает основание утверждать, что имеет место некоторый закон распределения (ЗР), и можно попытаться найти для этого закона вероятностную или, к примеру, нечетко-множественную форму, где параметры ЗР - нечеткие числа.
Вычислительные эксперименты по апробации метода вложенных математических моделей
В данном параграфе приводятся результаты вычислительных экспериментов по апробации модифицированного метода вложенных математических моделей для задачи налогового контроля. Результаты вычислительных экспериментов построения НСМ диагностики банкротств будут подробно изложены в главе 3.
Постановка задачи
Имеются данные квартальных налоговых деклараций 24 сельскохозяйственных предприятий (формы 1 и 2 бухгалтерского баланса) за период с 2006 по 2009 гг. Предполагается, что в данных налоговых деклараций присутствует как случайный шум, так и сознательное искажение данных налогоплательщиками. В качестве моделируемой величины Y рассматривалось отношение суммарных затрат к величине выручки предприятия. По мнению автора, эта величина точнее характеризует величину налогооблагаемой базы, чем собственно выручка или валовая прибыль предприятия.
Необходимо построить НСМ, восстанавливающую скрытые в данных многомерные закономерности между рядом факторов {X j} и моделируемой величиной Y .
Ранее отмечалось, что для рассматриваемого класса задач отсутствует исторически сложившаяся система показателей {X j}, которая позволила бы наиболее точно идентифицировать нарушителей налогового законодательства. Поэтому в качестве факторов, характеризующих финансовое состояние предприятия были использованы 16 удельных показателей (финансовых коэффициентов), характеризующих различные аспекты деятельности фирмы и широко применяемых для анализа финансово-экономического состояния предприятия [56]. Традиционно эти показатели делятся на 4 группы.
Группа 1 - показатели рентабельности: общая рентабельность; рентабельность активов; рентабельность собственного капитала; рентабельность продукции; рентабельность оборотных активов.
Группа 2 - показатели ликвидности и платежеспособности: быстрый коэффициент ликвидности; коэффициент покрытия запасов; текущий коэффициент ликвидности;
Группа 3 - показатели деловой активности: оборачиваемость активов; оборачиваемость кредиторской задолженности; оборачиваемость дебиторской задолженности; оборачиваемость запасов.
Группа 4 - показатели финансовой устойчивости: коэффициент финансовой зависимости; коэффициент автономии собственных средств; обеспеченность запасов собственными оборотными средствами; индекс постоянного актива.
Формулы для вычисления указанных показателей можно найти в [56].
В итоге была сформирована база данных D = fc,x,lf, где /-номер вектор-строки наблюдений, состоящая из 276 наблюдений (см. Приложение 1). Данные были нормированы стандартным способом.
Результаты вычислительных экспериментов
В сформированной базе данных D не было некомплектных столбцов поэтому процедура «ремонта» с помощью инверсных НСМ (см. блок 1.2 на рис. 2.4) не проводилась.
В качестве нейросетевой парадигмы был выбран многослойный персеп-трон (MLP) с алгоритмом обучения типа Back Propagation - обратного распространения ошибки.
Процедура выбора оптимальной системы показателей (блоки 1.4 - 1.6 на рис. 2.4) также не проводилась из-за отсутствия альтернативы - рассматривается единственная система показателей из 16 факторов. Далее была проведена процедура сокращения размерности факторного пространства согласно алгоритму из блока 1.7. В качестве стартового набора факторов были выбраны 6 показателей (Rl, R2, R4, R5, А2, F2), имеющие статистически значимую линейную связь с моделируемой величиной Y. Отбирались эти факторы на основе коэффициента парной линейной корреляции.
Была построена вспомогательная нейросеть следующей конфигурации: персептрон с 3-мя скрытыми слоями; активационная функция в скрытых слоях -гиперболический тангенс, в выходном слое - линейная; количество нейронов в скрытых слоях - 10, 14 и 8 соответственно. Данные были разбиты на обучающее и тестовое множество в соотношении 70:30. Сеть обучалась на стартовом наборе факторов, качество обучения оценивалось по частотному критерию:
Так как данные на этом этапе еще не структурированы (не удалены противоречивые наблюдения) уровень допустимой погрешности был взят достаточно большим: = 0,2.
К стартовому набору факторов случайным образом добавлялся один фактор из числа оставшихся, сеть переобучалась и фиксировался критерий качества обучения Р и величина средней относительной ошибки Ёш . Итерационный процесс отбора факторов описан в таблице 2.3.
В таблице знак «+» соответствует включению в модель очередного фактора, знак «-» - исключению на данном шаге. Как видно из таблицы, наибольшее значение критерия Р было получено для системы из 9 показателей: Rl, R2, R4, R5, А2, F2, L3, А5, PI на 8-ой итерации.
После удаления противоречивых вектор-строк по алгоритму, описанному в параграфе 2.4.7, в базе данных осталось 262 строки (14 наблюдений были признаны противоречивыми). Этот алгоритм различает для вектор-строк с Ls s+l 1 и Ls_x s+l 1 источник противоречивости по критерию аналога константы Липшица (2.33). Если (Lss+1 l)n(Z5_15+1 1), то именно строка с номером S при водит к противоречивости данных она и удаляется из обучающего множества. Если дефицита наблюдений нет, то можно удалить обе строки с номерами (S-1) и S – это упрощенный алгоритм очистки.
Применение гибридного метода GNBL в динамических прогнозных моделях банкротств
Задача состоит в том, чтобы учесть изменение вероятности банкротства P по (3.7) во времени и тем самым получить информацию о развитии процесса по стадиям, аналогично работе В. Ю. Жданова [36].
До настоящего времени нейросетевые динамические модели оценки вероятности риска банкротств практически не были исследованы, хотя и представляют наибольший практический интерес. Знание динамики развивающего процесса банкротства позволяет в каждый момент времени определить стадию банкротства и применить упреждающие управляющие воздейст вия.
На пути создания динамических моделей риска банкротства предприятий возникают труднопреодолимые препятствия в виде неполноты данных. Суть проблемы заключается в следующем. Пусть имеются данные наблюдений вектора З в нескольких временных срезах {tk\ k = l,2,...,N , т.е. известны значения всех факторов во временных срезах {хД j = \ji; k = \jj. Пусть обучающая выборка D содержит наблюдения для нескольких предприятий (ygk, х\ g = l,G, где , - знак кортежа; g - номер предприятия. При этом в последнем временном срезе (k=N), как правило, известны векторы значений факторов {x gN}, а также значения эндогенной (выходной) переменной {y gN}, характеризующей вероятность банкротства на данный момент времени. Это позволяет оценить вероятность риска банкротства в последнем временном срезе по формуле логистической трансформации вероятности риска банкротства: PgN =1/[1 + ехр(-4(х ))]. (3.16) При этом показатель экспоненты Yg(xgN) является нелинейной функцией от вектора факторов xgN и аппроксимируется нейросетевой моделью (4). Однако, в других временных срезах \tk\ k N известны только векторы факторов {х, а значения эндогенной переменной {уJ и, соответственно, вероятности \Рot \ неизвестны, поскольку часть предприятий имеет промежу точную (неизвестную) стадию банкротства, которую по статистической модели вида (3.16), связывающей х и Р, определить не представляется возможным. Причиной этого является деформация связи вида (3.16) с течением времени во временных срезах {tk}.
В итоге столбцы (либо строки) данных во временных срезах оказываются неполными и обучение нейросетевой динамической модели оценки риска банкротства невозможно.
Предлагается гибридный нейросетевой итерационный метод, суть которого основана на следующее идее. Будем считать, что нелинейная функциональная связь между Y и вектором х в последнем временном срезе t = N приближенно сохраняется и в других временных срезах {tk\ k N. При таком допущении эндогенная переменная уф, k = \2,...,N-\ может быть восстановлена поочередно в каждом временном срезе подстановкой вектора xgk в ней росетевую модель вида (3.18) (см. ниже). После этого данные становятся полными (комплектными), несущими в себе динамическую информационную через функции xg(tk) и yg(tk), где временной аргумент tk, k = \2,...,N-l является дискретным. Естественно, допущение о сохранении нелинейной зависимости Yg{xgN) во всех временных срезах вызывает определенную погрешность в оценке динамики риска банкротства, поэтому для уменьшения этой погрешности вводится специальный итерационный процесс исправления функции Yg(xg(t)). В итоге получим динамическую модель оценки риска банкротства с непрерывным временем t є [0; Г], что и является целью исследования. Постановка задачи Пусть известны неполные данные D D, где под «неполнотой» понимается отсутствие наблюдаемых значений эндогенной переменной {yj в части временных срезов для некоторых предприятий. Здесь D гипотетически полные данные.
Требуется построить логистическую динамическую нейросетевую модель оценки вероятности риска банкротства вида
Поскольку требуемая нейросетевая модель (3.17) имеет четко выраженную прикладную направленность, то постановку задачи приблизим к реальным сложным условиям моделирования:
1) помимо оговоренной неполноты данных и возникающей при этом неопределенности в динамической ситуации оценки риска банкротства, будем считать, что данные D = сильно зашумлены (вплоть до сознательного искажения части данных, что может иметь место в бухгалтерской отчетности);
2) априорный вид закона распределения шумов неизвестен;
3) количество наблюдений в выделенном кластере предприятий ограничено несколькими сотнями.
Описание алгоритма предлагаемого гибридного метода
Алгоритм метода (Рис. 3.4) содержит два итерационных цикла:
внутренних итераций с индексом tk, k = \2,...,N-l, целью которых является восстановление эндогенной переменной {ygJ во временных срезах {tk};
внешних итераций с индексом S = l,2,..., целью которых является введение в нейросетевую модель вида (3.17) информации о времени и, соответственно, получение нейросетевой динамической модели с непрерывным временем.
Повышение эффективности систем налогового контроля и управления (СНКУ) на основе моделирования объектов налогообложения
Экономические и правовые аспекты налогообложения подробно рассмотрены в коллективной монографии [54]. Большое внимание здесь уделено также статистическим методам моделирования налогооблагаемой базы и анализу границ их применимости. Для случая нормального закона распределения относительных отклонений расчетных значений моделируемой величины у І от измеренных данных yt(i = 1,J{) предложен непараметрический метод аналогово-усредненной величины налога (налоговой базы). Однако вопросы построения нейросетевых моделей в задачах налогового контроля и особенно вопросы оценки адекватности этих моделей и управления качеством аппроксимации данных в цитированной монографии лишь обозначены.
Рассмотрим специфику условий построения и эксплуатации модели объекта налогообложения.
Первая особенность моделирования состоит в том, что объекты налогообложения представляют собой совокупность предприятий-налогоплательщиков, функционирующих в различных условиях внешней среды. При этом, однако, модель, или, как минимум, принципы ее построения должны быть едиными для всей совокупности объектов. Это можно сделать в рамках отмеченной выше концепции квазистатистики [56].
Второй особенностью условий моделирования является возможность вариации технологических параметров производственного процесса. При использовании массивов статистических данных по предприятиям-налогоплательщикам за достаточно большой промежуток времени следует учитывать, что в начале и в конце этого промежутка параметры моделируемого процесса могут быть различными. Например, применительно к деятельности торговых предприятий это может быть смена приоритетов от торговли импортными товарами к торговле товарами отечественного производства, а также смена ценовой и ассортиментной политики с учетом изменения потребительских предпочтений.
Экономическая модель предполагает широкое использование статистических данных предприятий. При этом ограничения по затратам на моделирование и эксплуатацию моделей абсолютно исключают возможность организации дополнительных сборов данных. Другими словами, большую долю массивов данных будут составлять данные, предоставляемые самими предприятиями, заинтересованными в уменьшении объема налогооблагаемой базы. Из этого следует, что данные по ряду параметров будут искаженными (в ряде случаев сознательно).
Построение модели проводится в контексте решения задачи автоматизации процесса налогового контроля. Конечной целью при этом является повышение эффективности функционирования СНКУ. Из этого следует, что при всей сложности моделируемых процессов затраты на разработку и внедрение моделей объектов налогообложения должны быть существенно меньше предполагаемого прироста налоговых поступлений в результате этого внедрения. В частности затраты на построение моделей для групп малых и средних предприятий должны быть достаточно малыми.
Рассмотрим теперь основные типы объектов налогообложения и основные трудности процесса их налогового контроля с целью обоснования выбора методов построения их математических моделей.
Первую группу предприятий-налогоплательщиков образуют крупные, уникальные в своем роде предприятия, дающие большой объем налоговых поступлений в бюджет. Такие предприятия иногда называют градообразующими и регионообразующими. Применительно к таким предприятиям задача построения модели заключается не в том, чтобы ответить на вопрос о целесообразности или нецелесообразности проведения выездной налоговой проверки. Имеются примеры крупных предприятий, налоговые платежи которых только в бюджет субъекта федерации, на территории которого они зарегистрированы, составляют около половины всей доходной части данного бюджета. Поэтому цена ошибки принятия решения о проведении или отказа от проведения налоговой проверки слишком высока для того чтобы это решение принималось на основе математической модели. Затраты на проведение проверки не настолько высоки по сравнению с возможными доначислениями в бюджет, риск потери которых слишком велик в случае отказа от проведения проверки. В интересах бюджета такие предприятия необходимо подвергать налоговым проверкам так часто, насколько это позволяет налоговое законодательство. Тем не менее, модели таких объектов налогообложения необходимы для планирования самой процедуры проведения проверки. При наличии ресурсной экономико-математической модели данного предприятия сопоставление декларируемых показателей с их оценочными значениями, получаемыми на основе модели, позволит оптимально организовать процедуру проверки, составить перечень ключевых вопросов, на которые в ходе проведения проверки следует обратить особое внимание.
Деятельность крупных градообразующих предприятий характеризуется многополярностью, наличием большого числа контрагентов. Поэтому говорить о построении модели таких предприятий в виде модели типа производственной функции вряд ли возможно. Кроме того, вследствие высокой динамичности деятельности таких предприятий статистические данные отражающие количественные показатели этой деятельности неоднородны как по условиям внешней среды, так и по технологии производства. Поэтому применение к таким статистическим данным методов нейросетевого или регрессионного анализа заведомо неправомерно. Применительно к таким предприятиям наиболее эффективными методами моделирования являются методы экспертного оценивания, в сочетании с наиболее «продвинутыми» методами автоматизированной обработки экспертной информации, такими как методы имитационного моделирования. Построение такого рода моделей является дорогостоящей процедурой, но применительно к рассматриваемой группе предприятий эти расходы вполне оправданы. Естественно, нельзя при этом говорить об универсальном наборе методов экспертного моделирования, применимых к таким корпорациям как «РАО ЕС», «Северсталь» и «Лукойл». Целесообразно для моделирования деятельности каждого такого предприятия создавать специальную исследовательскую группу высококвалифицированных специалистов, обладающих большим опытом в области экспертных оценок и проектирования экспертных систем.