Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Бирюков, Александр Николаевич

Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней
<
Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бирюков, Александр Николаевич. Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней : диссертация ... доктора экономических наук : 08.00.13 / Бирюков Александр Николаевич; [Место защиты: ГОУВПО "Пермский государственный университет"].- Пермь, 2012.- 432 с.: ил. РГБ ОД, 71 13-8/70

Содержание к диссертации

Введение

1. Обзор и анализ возможностей интеллектуального моделирования в бюджетно-налоговой системе регионального и муниципального уровней 39

1.1. Бюджетно-налоговая система как составляющая бюджетно-налогового федерализма России 39

1.2. Разработка когнитивной мультиагентной модели финансовых и информационных потоков в бюджетно-налоговой системе регионального и муниципального уровней. Формулировка целей моделирования 44

1.2.1. Когнитивная карта 44 Р

1.2.2. Формулировка целей моделирования 58

1.2.3. Особенности постановок задач нейромоделирования 60 «

1.3. Специфические условия моделирования бюджетно-налоговой системы регионального и муниципального уровней 61

1.4. Обзор традиционных подходов и моделей для трудно формализуемых , экономических систем. Применение интеллектуальных экспертных систем.63

1.4.1. Применение традиционных методов математического моделирования 63

1.4.2. Системы искусственного интеллекта. Экспертные системы 67

1.5. Некоторые примеры использования интеллектуальных ЭСС в

зарубежных налоговых системах 78

1.6. Формулировка проблемы, решаемой в диссертации 81

2. Разработка концептуального базиса как логической основы нейросетевого моделирования бюджетно налоговой системы регионального и муниципального уровней 88

2.1. Основные понятия и определения. Цель разработки концептуального базиса 88

2.2. Комбинированный системно - синергетический - информационный подход к исследованию сложных организационных систем 91

2.2.1. Нейросетевая модель как математико-информационная модель 91

2.2.2. Сущность системно - синергетического - информационного подхода к исследованию сложных систем 93

2.3. Концепция построения модели «обобщенной производственной функции» для кластера налогоплательщиков на основе закона энтропийного равновесия и фонового закона 97

2.3.1. Закон энтропийного равновесия в открытой информационной системе .91

2.3.2. Фоновая закономерность 99

2.3.3. Формулировка концепций 1 и 2 сравнения показателей состояния предприятий-налогоплательщиков с «эталонным» фоном 104

2.4. Концепция 3 байесовской регуляризации обучения нейросетей на основеЛч;, общесистемного закона неполного подавления дисфункций структурируемой ; системы 108 ,

2.4.1. Закон подавления дисфункций при структурировании информационной системы и необходимость их парирования 108

2.4.2. Формулировка концепции 3 регуляризации нейросевой модели на основе байесовского ансамбля нейросетей 110

2.5. Концепция 4 взаимосвязанного управления информативностью данных и качеством их аппроксимации в нейросети для обеспечения состоятельности

процедуры регуляризации на основе закона роста и убывания энтропии 113

2.5.1. Проблема обеспечения состоятельности процедуры регуляризации нейросети 113

2.5.2. Формулировка концепции 4 115 2.6. Концепция 5 учета неопределенности в оценке отклонений показателей

налогоплательщиков от эталонной поверхности на основе вероятностного и фрактального подходов 117

2.6.1. Двойственная природа больших отклонений как результат неполного подавления дисфункций структурируемой математико-информационной системы 117

2.6.2. Вероятностный подход к оценке неопределенности в задаче ранжирования налогоплательщиков 119

2.6.3. Фрактальный подход к оценке неопределенности в задаче ранжирования налогоплательщиков 120

2.6.4. Формулировка концепции 5 синтеза оптимального плана отбора налогоплательщиков для выездных проверок 124

2.7. Концепция 6 создания модели распределения фонда материальногоразвития муниципальных учреждений 124

2.7.1. Формулировка экономической концепции трёхуровневой системы распределения субвенций 124

2.7.2. Модель верхнего уровня I распределения субвенций муниципальным образованиям 128

2.7.3. Модель среднего уровня II распределения фонда материального развития (ФМР) между МО 128

2.8. Концепция 7 планирования расходной части муниципального бюджета с учетом риска выхода за границы доверительных интервалов прогнозныхоценок 130

2.9. Концепция 8 декомпозиционного подхода к построению модели поддержки принятия решений по налоговому регулированию 130

3. Исследование устойчивости неиросетевои модели восстановления многофакторных зависимостей. разработка приближенных байесовских методов регуляризации неиросетевои модели для условий сильного зашумления данных с неизвестным законом распределения шумов 132

3.1. Обобщенная постановка задачи восстановления многофакторных

зависимостей, скрытых в данных 132

3.1.1. Некорректность обратной задачи 133

3.1.2. Предварительные замечания по регуляризации нейросетевых моделей 133

3.1.3. Взаимосвязь ошибки обобщения и регуляризации нейросети 135

3.2. Обобщенная постановка задач ранжирования 135

3.3. Вычислительные модельные эксперименты по анализу устойчивости нейросетевых моделей 137

3.3.1. Методика вычислительных экспериментов по устойчивости нейросетевой модели 137

3.3.2. Обсуждение вычислительных экспериментов. Обобщения. Парирование больших возмущений в данных 140

3.4. Корректная постановка обратных задач восстановления многофакторных зависимостей (задач интерпретации) и понятие регуляризации по А.Н. Тихонову 144

3.4.1. Основные понятия и определения 144

3.4.2. Введение обратных задач интерпретации в класс условно корректных по А.Н. Тихонову 148

3.4.3. Понятие квазирешения 152

3.4.4. Принцип регуляризации для задач интерпретации 153

3.4.5. Задача о квазиминимизации и регуляризирующий алгоритм для задач интерпретации 154

3.4.6. Понятие стабилизатора А.Н. Тихонова и связанные с ним обобщенно-корректные постановки обратных задач 156

3.5. Использование сглаживающего функционала А.Н. Тихонова для задачи восстановления многомерных нелинейных зависимостей в MLP и RBF сетях 159

3.5.1. Приближенный метод регуляризации MLP-нейросетей в задаче восстановления с использованием стабилизатора Тихонова 160

3.5.2. Регуляризация RBF-сетей 163

3.6. Байесовский подход к регуляризации нейросетевых моделей восстановления многофакторных зависимостей 165

3.6.1. Постановка задачи и её особенности 165

3.6.2. Обучение по Байесу. Основные понятия. Регуляризация обучения. 169

3.6.3. Связь между ошибкой обобщения и минимальной длиной описания в байесовском подходе 176

3.6.4. Итерационный процесс байесовского обучения (ЕМ - алгоритм)... 178

3.6.5. Байесова аппроксимация функций без кросс-валидации 179

3.7. Оригинальный приближенный метод байесовской регуляризации обучения нейросети при сильном зашумлении данных с неизвестным законом распределения шумов 182

4. Разработка нейросетевого метода вложенных математических моделей для идентификации нарушения налогового законодательства на стадии камеральных проверок в подсистеме налогового контроля 189

4.1. Зарубежный опыт отбора налогоплательщиков 190

4.2. Возможность использования зарубежного опыта налогового контроля в России 191

4.2.1. Особенности технологии камеральных налоговых проверок в России 191

4.2.2. Ограничения для использования зарубежных методик отбора налогоплательщиков в России 194

4.2.3. Предложения ФНС по использованию зарубежного опыта в технологиях камеральных проверок 195

4.3. Обзор зарубежных и отечественных математических моделей налогового контроля 196 4.4. Метод вложенных математических моделей, основанный на взаимосвязанном управлении информативностью данных и качеством их аппроксимации в байесовском ансамбле нейросетей 197

4.4.1. Логическая схема MB ММ 198

4.4.2. Алгоритм 1.1 априорного экспертного выбора типа нейросети, её архитектуры, активационных функций и алгоритма обучения 202

4.4.3. Алгоритм 1.2 квазиоптимальной процедуры «дообучения экспертов» при спецификации переменных 205

4.4.4. Алгоритм нормировки и фильтрации, независимых переменных по их статистической значимости 209

4.4.5. Алгоритм 1.4 удаления из данных противоречивых вектор - строк (примеров) наблюдений по критерию Липшица 212

4.4.6. Алгоритм 1.6 оптимальной итерационной очистки данных от аномальных точек при обучении сети с использованием вспомогательных,. нейросетевых моделей 220

4.4.7. Алгоритм 1.7 «ремонта» вектор-столбцов данных в кластерах 224 L

4.4.8. Алгоритмы II. 1 - II.6 для подмодели II в рамках МВММ-метода .225

4.5. Вычислительные эксперименты по апробации метода МВММ 226

4.5.1. Вычислительные эксперименты по алгоритму 1.5 оптимальной-! итерационной кластеризации данных (серия 1) 226

4.6. Вычислительные эксперименты по алгоритму 1.6 оптимальной итерационной очистки образованных кластеров данных от аномальных точек (серия 4) 229

4.7. Вычислительные эксперименты по алгоритму 1.7 «ремонта» вектор столбцов данных (серия 5) 234

5. Разработка гибридного метода синтеза оптимального плана выездных налоговых проверок на основе нейросетевого метода вложенных математических моделей для подсистемы налогового планирования 238

5.1. Анализ известных подходов к синтезу оптимальных планов налоговых проверок , 238

5.2. Гибридный метод синтеза оптимального плана выездных налоговых проверок 241

5.2.1. Модификации I метода на основе предположения о нормальном законе распределении отклонений 242

5.2.2. Модификация II метода на основе фрактального подхода 250

5.3. Вычислительные и натурные эксперименты по верификации метода синтеза оптимального плана выездных проверок 255

5.3.1. Вычислительные эксперименты 255

5.3.2. Верификация нейросетевых моделей на основе натурных экспериментов 259

5.3.3. Оценка адекватности ГНСМ путем ее сравнения с альтернативной непараметрической моделью Estimation Tax 267

6. Разработка нейросетевого метода итерационной кластеризации с селекцией признаков и байесовской, регуляризацией для поддержки принятия решений в подсистеме налогового регулирования. разработка,, неиронечеткого метода оценки финансового состояния" налогоплательщиков 269

6.1. Обобщенная постановка задачи кластеризации. Анализ известных подходов к разработке байесовских классификаторов 269

6.1.1. Предварительные замечания по прикладным аспектам моделей кластеризации для подсистемы налогового регулирования 269

6.1.2. Элементы теории классификации на основе байесовского подхода к принятию решений 270

6.1.3. Байесовский классификатор для нормального распределения признаков 273

6.2. Разработка байесовского итерационного метода кластеризации на основе селекции признаков 274 6.2.1. Алгоритм метода 275

6.2.2. Квазибайесовский метод (КБМ) регуляризации нейросетевого кластеризатора 282

6.2.3. Фильтрация нейросетей-гипотез для случая А 283

6.2.4. Фильтрация нейросетей-гипотез для случая Б 286

6.3. Оптимизация числа образуемых кластеров 287

6.4. Регуляризация задачи кластеризации для гауссовой смеси распределений 288

6.5. Кластеризация налогоплательщиков при выработке управленческих решений по налоговому регулированию 288

6.5.1. Взаимосвязь моделей налогового администрирования регионального и муниципального уровней 289

6.5.2. Пример решения задачи кластеризации налогоплательщиков по обобщенному критерию кредитоспособности с применением, разработанного в главе 7 морфологического метода агрегирования показателей и квазибайесовского метода регуляризации нейросетевого кластеризатора 293

6.5.3. Рекомендации по принятию управленческих решений по налоговому регулированию на основе решения задачи кластеризации 304

6.6. Сравнение результатов кластеризации, полученных с помощью квазибайесовского метода из пункта 6.2.2, с результатами применения классического метода k-средних 304

6.7. Гибридный метод оценки кредитоспособности (ГМОК) для разработки модели поддержки принятия решений по налоговому регулированию с использованием нечетких правил вывода 306

6.7.1. Идея метода 306

6.7.2. Модификация А метода с оперированием всеми показателями 307

6.7.3. Модификация Б ГМОК с оперированием одним обобщенным критерием 313

6.7.4. Пример использования ГМОК для оценки уровня риска банкротства предприятия-налогоплательщика 314

7. Разработка гибридных нейросетевых моделей многокритериального и многофакторного ранжирования муниципальных учреждений по принципу бюджетирования, ориентированного на конечный результат 317

7.1. Предпосылки разработки нейросетевой модели ранжирования муниципальных учреждений 317

7.1.1. Связь разработанной экономической концепции 6 распределения ФМР между МУ с общей проблемой реформирования бюджетного процесса на уровне субъектов РФ 319

7.1.2. Задачи реформирования бюджетного процесса 320

7.1.3. Расходная часть местных бюджетов 323

7.2. Модель нижнего уровня (III) распределения финансовых средств в системе муниципального бюджетирования - распределения фонда материального развития муниципального образования между муниципальными учреждениями 325

7.2.1. Спецификация выходных (зависимых) переменных на основе теории «русел» 325

7.2.2. Спецификация входных (независимых) переменных 328

7.2.3. Гибридная модель распределения финансовых средств на III уровне муниципальных учреждений 329

7.2.4. Обучение нейросетевой модели. Вычислительные эксперименты по предобработке данных и регуляризации нейросети 332

7.3. Апробация теоретических предложений по структурированию НСМ на третьем иерархическом уровне для гибридной модели II расходной части бюджета 335

7.4. Метод агрегирования переменных на основе морфологического подхода 337

7.4.1. Постановка задачи 337

7.4.2. Разработка метода агрегирования 339

7.4.3. Количественные оценки по предложенному методу агрегирования переменных 344

7.5. Пример построения динамической многофакторной нелинейной неиросетевои модели с байесовской регуляризацией обучения для оценки эффективности работы лечебных учреждений 346

7.5.1. Построение «рабочей» модели и ее регуляризация на байесовском ансамбле нейросетей 346

7.5.2. Количественные оценки 347

7.6. Итоги ранжирования лечебных учреждений по эффективности деятельности 355

8. Построение неиросетевои многофакторной прогнозной модели наполнения муниципального бюджета 359

8.1. Спецификация переменных неиросетевои модели 359

8.2. Вероятностная модель оценки риска превышения заданного уровня

ошибки прогноза наполнения бюджета 362

8.3. Вычислительные эксперименты для гибридной модели 364

8.4. Обобщающие выводы по вычислительным экспериментам 366

9. Инструментальные средства поддержки принятия решений в бюджетно-налоговой системе регионального и муниципального уровня 371

9.1. Программная реализация нейронных сетей. Нейрокомпьютеры 371

9.2. Алгоритмическое обеспечение компьютерных технологий в подсистемах бюджетно-налоговой системы регионального и муниципального уровней..376

9.3. Разработка структурно-функциональной схемы интеллектуальной

информационно-аналитической системы поддержки принятия решений по

налоговому администрированию (СНА) 377

9.3.1. Методические основы разработки СНА и места в ней ГНСМ 377

9.3.2. Описание работы структурно-функциональной схемы СНА 382

Заключение 389

Литература

Введение к работе

Актуальность темы исследования. Бюджетная и налоговая система на всех ее трех уровнях - федеральном, региональном, муниципальном - это две стороны единого бюджетно-налогового федерализма.

Бюджетно-налоговая система России в настоящее время находится в состоянии реформирования. В соответствии с Концепцией долгосрочного социально-экономического развития Российской Федерации (РФ) на период до 2020 года принят курс на изменение принципа бюджетирования регионов и муниципальных образований (МО): вместо смежного принципа (планирование от достигнутого уровня), требуется обеспечение равномерного социально-экономического развития территорий регионов в аспекте предоставления населению бюджетных услуг определенного вида (общеобразовательных, здравоохранения, жилищно-коммунальных и др.). На уровне муниципальных учреждений (МУ), которые непосредственно реализуют оказание бюджетных услуг населению, планирование финансовой поддержки со стороны бюджетов различных уровней, например, распределение фонда материального развития (ФМР) должно быть прозрачным и эффективным в плане бюджетного ориентира на конечный результат (БОР).

Что касается второй подсистемы бюджетно-налогового федерализма -налоговой, то для повышения эффективности функционирования налоговых органов необходимо создание современного механизма налогового администрирования, обеспечивающего высокое качество контроля за соблюдением налогового законодательства.

Сложившийся к настоящему времени механизм налогового администрирования не обеспечивает требуемого сегодня повышения эффективности деятельности налоговой подсистемы.

Построение такого механизма невозможно без применения современных информационных технологий, разработки интеллектуальных экспертных систем на базе нейросетевого моделирования.

Степень научной разработанности темы. Разработка теоретических аспектов создания, обучения и функционирования нейросетей, нейрокомпьютеров представлена в фундаментальных работах таких авторов, как Р. Вильяме, П. Вербос, Р. Земел, Иох-Хан Пао, Т. Кохоннен, Э. Минай, Ф. Розенблатт, Е. Хинт.

Существенное влияние на развитие общей теории нейрокомпьютеров, нейроинформатики оказали работы российских ученых Э.Д. Аведьяна, СИ. Барцева, А.И. Галушкина, А.Н. Горбаня, В.Л. Дунина-Барковского, Г.Г. Малинецкого, Е.М. Миркеса, В.А. Охонина, ЯЗ. Цыпкина, и др. Следует отметить также вклад ученых ближнего и дальнего зарубежья, таких как Э. Баррон, В.А. Головко, А.Г. Ивахненко, Э.М. Куссуль, В. Мак-Калок, М. Минский, Н. Нильсон, В. Пите, С. Пайперт, Д.Е. Румельхарт, Ф. Таккенс, Дж. Такер, К. Фунахаши, С. Хайкин, Р. Хент-Нильсен, Д. Хопфилд, К. Хорник, Г. Цыбенко и др.

Проблема нейросетевого математического моделирования экономических объектов и систем, в том числе объектов налогового контроля и налогообложения, привлекает внимание многих отечественных и зарубежных ученых. Методам и результатам решения практических задач финансового рынка с использованием нейронных сетей, в частности решения задачи ранжирования корпоративных заемщиков при предоставлении им кредитов, посвящена работа Д.-Э.Бэстенса, В.-М. ван ден Берга и Д. Вуда. Приложениями нейрокомпьютинга в экономике и бизнесе, прогнозированием финансового рынка и оценкой платежеспособности предприятий занимались А.А. Ежов и С.А. Шумский. Существенный вклад в область интеллектуального управления производственными системами на основе нейро-нечетких моделей внесен Р.Г. Валеевой, Б.Г. Ильясовым, В.И. Васильевым. Анализу процессов управления и поддержке принятия решений в условиях неопределенности на основе использования методов искусственного интеллекта, в частности классификации критических ситуаций с помощью нейронных сетей, посвящены работы Л.Р. Черняховской. В работах Л.А. Исмагиловой осуществляется оценка налогового потенциала и прогнозирование налоговых поступлений с использованием методов искусственного интеллекта. Применением нейросетевых технологий в сложных инженерных и экономических системах, в частности нейросетевыми непараметрическими методами анализа экспериментальных данных, занимался С.А. Терехов. Использованию нейронных сетей в финансовом инжиниринге посвящены работы И.С. Абу-Мустафы и др.

Вопросам управления налогообложением в аспекте моделирования процессов сбора налогов и оценки добросовестности отдельных налогоплательщиков посвящены работы А.Б. Паскачева (в соавторстве), А.Б. Соколова.

Г.И. Букаевым, Н.Д. Бубликом, С.А. Горбатковым, И.И. Голичевым предложена и обоснована новая технология оценки финансовых показателей налогоплательщиков на основе получения с помощью нейросетевых моделей (НСМ) «эталонного» значения производственной функции класса налогоплательщиков.

Тематике имитационного моделирования экономических систем и бизнес-процессов посвящены работы Н.П. Бусленко, А.А. Емельянова, У. Кельтона (W. Kelton), В.Н. Томашевского, Дж. Форрестера (J. Forrester), Дж. Шрайбера (T.J. Schriber) и др.

Интеллектуальные алгоритмы поддержки принятия решений по управлению FuzzyCalc, CubiCalc, BrainMaker, IDIS, BERT, ISIS и экспертных систем EXSYS, GURU, KL, KRYPTON описаны в работах P.А. Алиева, А.Э. Церковного, В.А. Кабанова, А.В. Лапко, СВ. Ченцова, СИ. Крохова, Л.А. Фельдмана, Ю.А. Любарского, Д.А. Поспелова, А.Н. Романова, Б.Е. Одинцова и др.

Значительные результаты в области теоретических и практических вопросов налогообложения получены в Институте экономики РАН, Институте экономики переходного периода, Институте развития налоговой системы. Ряд технологических решений по автоматизации задач налогообложения выполнен

в ГНИВЦ ФНС России, Нижегородском филиале НИИ развития налоговой системы.

В то же время значительное число проблем продолжает оставаться недостаточно или вообще не исследованным. В теоретическом плане не исследовано применение нейросетевых и нейро-нечетких информационных технологий для бюджетно-налоговой системы регионального и муниципального уровней. Степень разработанности темы диссертационной работы, с одной стороны, и запросами практики, с другой стороны, не соответствуют современным требованиям.

Проблема, решаемая в диссертации, формулируется так: создание теоретических и методологических основ комплексного нейро-моделирования бюджетно-налоговой системы регионального и муниципального уровней.

Целью диссертационной работы является решение алгоритмически сложных задач (а в некоторых случаях и просто недоступных задач для других подходов), а также научно обоснованная аккумуляция знаний об объекте, т.е. поддержание уже имеющейся системы экономических моделей объекта исследования и пополнение ее недостающими моделями и задачами. В прикладном экономическом аспекте поставленная цель работы ориентирована на повышение эффективности государственного управления в области бюджетно-налоговых систем регионального и муниципального уровней.

Для достижения поставленной цели в процессе диссертационного исследования необходимо решить следующие задачи:

1. Разработка общей методологии исследования, основанной на
системном подходе.

  1. Разработка мультиагентной когнитивной модели бюджетно-налоговой системы регионального и муниципального уровней, описывающей причинно-следственные связи всех исследуемых подсистем.

  2. Разработка на базе общесистемных законов концептуального базиса нейросетевого моделирования в сложных условиях сильного зашумления данных как методологической основы разработки новых методов, алгоритмов и нейросетевых моделей.

  3. Разработка новых нейросетевых методов для задач: предобработки (предрегуляризации) данных; байесовской регуляризации обучения нейросетей; синтеза оптимальных планов выездных налоговых проверок; оценки адекватности нейросетевых моделей; многофакторного и многокритериального ранжирования налогоплательщиков, а также муниципальных учреждений; кластеризации предприятий-налогоплательщиков; прогноза наполнения бюджета; прогноза для целей налогового регулирования.

  4. Апробации предложенных методов и алгоритмов в вычислительных и натурных экспериментах, сравнение расчетов по нейросетевым моделям с альтернативными моделями.

6. Разработка прикладных нейросетевых моделей для подсистем
мультиагентной когнитивной карты.

7. Апробация и анализ доступных инструментариев (пакетов программ).
Разработка примера инструмента представления и накопления знаний для

интеллектуальной экспертной системы поддержки принятия решений по налоговому администрированию.

Объектом исследования в диссертации является бюджетно-налоговая система регионального и муниципального уровней.

Предметом исследования являются технологии налогового планирования, регулирования, контроля; технологии бюджетирования, ориентированные на конечный результат.

Методология и методы исследования. Основой представленной диссертации послужили труды отечественных и зарубежных ученых, внесших вклад в области системного анализа, теории управления и общесистемные законы, методы математического моделирования, методы нейросетевого моделирования, теории вероятностей и математической статистики, фрактальной теории, методы теории принятия решений, методы нечетких множеств.

Информационной базой исследования послужили научные работы отечественных и зарубежных авторов, монографии, статьи, материалы научных конференций по проблемам нейросетевого моделирования экономических систем.

В процессе исследования использовались материалы Федеральной службы государственной статистики РФ, территориального органа Росстата по Республике Башкортостан - Башкортостанстата, основные положения Федеральной Программы модернизации налоговой системы РФ (раздел: научные исследования и практические разработки совершенствования организации налогового контроля на основе современных информационных технологий и математического моделирования, автоматизации операций налогового контроля, сопряжения новых технологий налогового контроля с действующей системой электронной обработки данных (ЭОД)). А также отчетные данные управления Федеральной налоговой службы РФ по Республике Башкортостан, статистическая информация из территориального финансового управления Министерства финансов Республики Башкортостан на территории г. Стерлитамак, статистические ежегодники, периодическая печать и Интернет.

Соответствие содержания диссертационной работы избранной специальности. Тема и содержание диссертации относятся к области исследования научной специальности ВАК 08.00.13 - «математические и инструментальные методы экономики», раздел 1. Математические методы: п. 1.4. Разработка и исследование моделей, математических методов анализа микроэкономических процессов и систем.... Раздел 2. Инструментальные средства: п. 2.3. Разработка систем поддержки принятия решений для рационализации организационных структур и оптимизации управления экономикой на всех уровнях; п. 2.5. Разработка концептуальных положений использования новых информационных и коммуникационных технологий с целью повышения эффективности управления в экономических системах; п. 2.6. Развитие теоретических основ и инструментария проектирования, разработки и сопровождения информационных систем субъектов

экономической деятельности: методы формализованного представления предметной области, программные средства, базы данных, базы знаний; п. 2.8. Развитие методов и средств аккумуляции знаний о развитии экономической системы и использование искусственного интеллекта при выработке управленческих решений.

Научная новизна диссертационной работы заключается в разработке теоретических положений и методологических основ нейросетевого моделирования процессов в бюджетно-налоговой системе регионального и муниципального уровней.

Конкретно научная новизна состоит из 6 концепций, образующих концептуальный базис, создающий методологическую основу исследований, а также 10 положений, выносимых на защиту (см. ниже).

Концепция 1, состоящая в формировании «ядра» нейросетевого моделирования - «обобщенной производственной функции» в виде нелинейной многофакторной зависимости выходного показателя («обобщенного продукта») Y от вектора X «обобщенных производственных факторов». Построение этой зависимости Y(X), которая скрыта в данных соответствующих подсистем бюджетно-налоговой системы, создает методологическую основу объективного сравнения (ранжирования) объектов, обслуживания тем самым соответствующие задачи подсистем: прогнозирования, ранжирования, налогового регулирования, налогового контроля. Концепция 1 для рассматриваемых БНС, предложена автором впервые (п. 2.6. Паспорта специальности 08.00.13 ВАК).

Концепция 2 байесовской регуляризации обучения нейросетевых моделей, основанная на общесистемном законе энтропийного равновесия открытой системы и законе о подавлении дисфункций структурируемой системы, отличается от известных подходов к построению нейросетевой модели тем, что оценку условного математического ожидания Y(X,W) при восстановлении многомерной нелинейной зависимости, скрытой в исходных данных D = {j,yj >},i = l,N, с помощью нейросетевой модели целесообразно выполнять, используя не одну нейросетевую модель, а байесовский ансамбль из нескольких нейросетей - гипотез {hq(X,W)}, где hq - q-я априорная гипотеза о

порождении эмпирических данных. При этом все априорные гипотезы {hq(X,W)} принадлежат к одной метагипотезе (классу Д MLP - сетей с

алгоритмом обучения типа обратного распространения ошибки).

После построения нейросетей - гипотез производится их апостериорная фильтрация по предложенному вероятностному критерию Р*, равному

отношению числа «хорошо» объясненных точек Nq (с допустимой относительной ошибкой расчета 8t < , %, где Е, - экспертно задаваемый уровень ошибки объяснения данных) к общему числу точек N в кластере. В итоге априорный ансамбль гипотез {hq(X,W)} сужается, что соответствует

увеличению наших знаний о моделируемом объекте. Финишная оценка всех расчетных характеристик производится путем осреднения на отфильтрованном

апостериорном байесовском ансамбле нейросетей. Данная концепция оригинальна. Известен байесовский подход к регуляризации обучения нейросетей, развитый в работах С.А. Шумского и А.С. Нужного, в котором апостериорная оценка качества обучения гипотез - нейросетей {hq}

производится с привлечением функций правдоподобия (Likelihood) P(D\hq),

т.е. вероятности появления данных D при зафиксированной гипотезе h о

порождении данных. Для расчета P(D\hq) требуется введение довольно

жесткого, стесняющего модель ограничения об априорном знании закона распределения плотности вероятности шумовой составляющей наблюдений < хгг >,i = \,N. Как указано в главе 1 диссертации, в задачах налогового

контроля указанное ограничение не выполняется. В концепции 2 фильтрация гипотез - нейросетей производится по предложенному вероятностному критерию Р* =Nq/N, который не требует выполнения упомянутого

обременительного для практики ограничения, что позволяет приблизить разработанные нейросетевые модели к практическим сложным условиям моделирования и, соответственно повысить их достоверность (п. 2.3. Паспорта специальности 08.00.13 ВАК).

Концепция 3, основанная на общесистемном законе подавления дисфункций структурируемой системы, состоит в том, что управление информативностью данных путем их предобработки (сглаживания и структурирования) по разработанным числовым мерам (критериям) а должно производиться взаимосвязано с управлением качеством аппроксимации восстанавливаемой функции Y(X) и, соответственно, с прогностическими свойствами сети и ее устойчивостью по разработанной числовой мере р0, где р0=<р(є). В алгоритмы предобработки (предрегуляризации) данных

целесообразно вводить байесовскую процедуру, т.е. проводить байесовское обучение вспомогательных нейросетевых субмоделей (НССМ). Концепция оригинальна. В трудах А.Н. Тихонова, В.Я. Арсенина и других представителей школы академика А.Н. Тихонова по методам решения некорректных обратных задач интерпретации данных лишь упоминается о возможной несостоятельности алгоритмов регуляризации, опирающихся на разнородные данные. Применительно к нейросетям с разработкой конкретных способов обеспечения указанной состоятельности вопрос не исследовался. Предложенная концепция 3 позволяет наделить предложенные алгоритмы предобработки данных свойством «предрегуляризации» и в итоге повысить эффективность байесовской регуляризации обучения нейросети (п. 2.5. Паспорта специальности 08.00.13 ВАК).

Концепция 4, основанная на общесистемном законе обеспечения гомеостата системы, подверженной дестабилизирующему влиянию внешней среды, отличается предложением трехуровневой иерархической системы государственного управления социально-экономическим развитием региональных и муниципальных территорий, где на каждом иерархическом уровне реализуется свой принцип распределения финансовой поддержки и

строится соответствующая математико-информационная модель поддержки принятия решений по бюджетированию: на верхнем 1-ом уровне субъектов РФ реализуется принцип равномерной нормативной подушевой обеспеченности населения в бюджетных услугах определенного вида, например, общеобразовательных; на среднем П-ом уровне муниципального образования реализуется принцип обеспечения равномерности темпов развития муниципального образования; на нижнем Ш-ем уровне предлагается использовать соревновательный принцип. Большую федеральную поддержку получает муниципальное учреждение, у которого прогнозный обобщенный показатель эффективности работы Ф, оцениваемый в нейросетевой модели, выше при прочих равных условиях. Новизна концепции заключается во введении Ш-го уровня государственного управления распределением федеральных субвенций и трансфертов - уровня МУ, что замыкает снизу общую систему распределения, и количественно оценивает эффективность работы сравниваемых муниципальных учреждений на основе общей нейросетевой модели (п. 2.3. Паспорта специальности 08.00.13 ВАК).

Концепция 5, основанная на общесистемных законах гомеостата и подавления дисфункций структурируемой системы, состоит в том, что прогнозирование наполнения бюджета должно осуществляться на основе комбинированного системно - синергетического - информационного подхода не изолированно, а в составе общей методики бюджетирования, основанного на принципе равномерного обеспечения населения бюджетными услугами определенного вида. При этом, как расходная, так и доходная части бюджета должны планироваться с учетом риска выхода за границы доверительных интервалов прогнозных оценок с заданной доверительной вероятностью, чтобы пересечение этих границ не было пустым множеством. Новизна этой концепции состоит в оценке риска выхода за границы доверительного интервала прогноза наполнения муниципального бюджета, получаемого на основе байесовского ансамбля многофакторных динамических нейросетевых моделей, что позволяет учесть неопределенность в процедурах планирования муниципального бюджета, т.е. сделать его более достоверным (п. 2.6. Паспорта специальности 08.00.13 ВАК).

Концепция 6, основанная на общесистемном законе декомпозиции систем, состоит в том, что общая модель поддержки принятия решений по налоговому регулированию, декомпонируется на две подмодели: 1) групповой экспертной оценки для образованных кластеров мелких и средних юридических лиц - налогоплательщиков (с использованием методов кластеризации); 2) модели количественной углубленной оценки финансового состояния крупных и проблемных налогоплательщиков (с использованием разработанного гибридного нейросетевого метода с нечетким правилом вывода в базе представления знаний). Концепция оригинальна, ее использование позволяет:

повысить оперативность принимаемых решений по налоговому регулированию за счет групповой экспертной оценки;

сочетать преимущества нейросетевой и нечеткой моделей представления базы знаний в экспертной системе налогового регулирования, т.е. способность

Помимо изложенного выше концептуального базиса научную новизну диссертационной работы составляют следующие 10 положений, выносимых на защиту:

Положение 1. Мультиагентная когнитивная модель для бюджетно-налоговой системы регионального и муниципального уровней разработана автором впервые. Модель представляет причинно-следственные связи (потоки финансов и информации) для всех подсистем БНС и позволяет декомпонировать общую цель моделирования на подцели для отдельных подсистем (бюджетной и налоговой) и тем самым более четко очертить рамки постановки задач, уменьшить их размерность и определить требования к уровню обобщения в разрабатываемых методах.

Положение 2. Метод вложенных математических моделей реализует концепции 1, 2, 3 и содержит 6 оригинальных итерационных оптимальных алгоритмов предобработки данных и 5 процедур байесовской регуляризации обучения нейросетей, причем алгоритмы предобработки данных и регуляризации нейросети взаимосвязаны итерационно для обеспечения состоятельности процедуры регуляризации в соответствии с концепцией 3. Метод вложенных математических моделей является новым и позволяет найти оптимальный компромисс между прогностическими свойствами нейросетевой модели и ее устойчивостью в очень сложных условиях моделирования.

Положение 3. Приближенный метод байесовской регуляризации, основанный на концепции 2, является новым и отличается от известного метода С.А. Шумского регуляризации обучения нейросети критерием апостериорной фильтрации гипотез - нейросетей, измеряющим вероятность приемлемого качества объяснения данных нейросетями ансамбля, что позволяет отказаться от требования априорного знания закона распределения плотности вероятности шумовой составляющей наблюдений и, соответственно, учесть реальные условия моделирования.

Положение 4. Метод регуляризации MLP-сетей с использованием стабилизатора А.Н. Тихонова Q(z) для решения обратной задачи является частично новым и отличается алгоритмом нахождения параметра регуляризации X на основе байесовского подхода, что позволяет с большей достоверностью оценивать этот параметр, а значит увеличить эффективность стабилизации решения.

Положение 5. Гибридный метод синтеза оптимального плана (ГМСОП) выездных налоговых проверок, состоящий из двух основных методов - метода вложенных математических моделей для оценки отклонения декларируемого выходного показателя от эталонного и метода оценки статистической устойчивости появления больших отклонений.

Положение 6. Двухступенчатый метод оценки адекватности нейросетевой модели отбора налогоплательщиков для выездных проверок, полученный с помощью ГМСОП, является новым, и ранее не рассматривался. Метод позволяет получить надежную оценку адекватности нейросетевой модели отбора в сложных условиях моделирования, когда нарушаются практически все предпосылки классических методов регрессионного анализа.

Положение 7. Иерархическая (Зх-уровневая) модель поддержки принятия решений по распределению субвенций и федеральных финансовых трансфертов, содержащая на нижнем (третьем) уровне нейросетевую модель оценки эффективности работы муниципальных учреждений.

Положение 8. Прогнозная многофакторная нейросетевая модель наполнения муниципального бюджета, построена впервые, что позволяет исследовать и оптимизировать в будущем (в планируемом периоде) управляющие воздействия, в частности, нормативы налогов, устанавливаемые местным законодательством.

Положение 9. Итерационный нейросетевой метод кластеризации предприятий-налогоплательщиков, является оригинальным и отличается от известных методов кластеризации на основе сетей Кохонена двумя процедурами - селекции признаков и байесовской регуляризации по критерию качества фильтрации, который позволяет повысить оперативность принятия решений в подсистеме налогового регулирования.

Положение 10. Прикладные нейросетевые модели для поддержки принятия решений в подсистемах - бюджетные системы муниципальных образований (БСМО), муниципальные учреждения, подсистема налогового планирования (ПНП), подсистема налогового контроля (ПНК), подсистема налогового регулирования (ПНР) - получены впервые. Эти модели создают научную основу повышения эффективности функционирования аналитических блоков информационных систем в указанных подсистемах бюджетно-налоговой системы регионального и муниципального уровней.

Достоверность положений, выносимых на защиту. Поскольку положения, выносимые на защиту, являются, по - мнению автора, новыми, то априори было неясно, как они будут работать в сложных условиях моделирования, оговоренных в пункте 1.2.3 и параграфе 1.3 диссертации. Данному вопросу достоверности положений, методов, алгоритмов и адекватности полученных нейросетевых моделей в диссертации уделено особое внимание.

Достоверность концептуального базиса и предложенных методов (положения 2, 3, 5, 6, 7, 8, 10) обосновывается, прежде всего, корректным применением методов системного анализа, математических методов функционального анализа, теории нейросетевого моделирования, теории некорректных обратных задач, теории нечетких множеств, теории принятия решений.

Достоверность всех 10 положений, выносимых на защиту, кроме положения 4, которое носит характер научной гипотезы, проверена также в широких сериях вычислительных экспериментов на реальных данных

налоговых деклараций и бюджетных показателей муниципальных образований и их муниципальных учреждений. Результаты вычислительных экспериментов на нейросетевых моделях также сравнивались с альтернативной непараметрической моделью И.И. Голичева и натурными экспериментами по итогам выездных налоговых проверок.

Теоретическая и практическая ценность и внедрение результатов. Теоретическая база диссертации посвящена проблемным вопросам совершенствования системы налогового администрирования (планирования, регулирования, контроля) и основам моделирования процессов наполнения и расходования муниципального бюджета на базе нейросетевых информационно-аналитических моделей, теоретической основой которых служат общесистемные законы. Методологическая часть может быть использована в системных областях экономики для моделирования нелинейных динамических процессов.

Практическая ценность диссертационного исследования в целом заключается в том, что создана научная база для совершенствования интеллектуальных компьютерных технологий поддержки принятия решений по планированию бюджета муниципальных образований, распределению субвенций и трансфертов, налоговому планированию, контролю и регулированию в бюджетно-налоговой системе регионального и муниципального уровней.

Исследования в данном направлении выполнялись в период с 2005 г. по 2011 г.г. на кафедре «Национальная экономика» Башкирского государственного университета и в рамках научной школы по нейросетевому моделированию экономических систем, возглавляемой профессором, д.т.н., Заслуженным деятелем науки Республики Башкортостан, действительным членом Академии инженерных наук РФ Горбатковым С.А. Прикладные аспекты исследований были связаны с договорами творческого содружества с территориальным финансовым управлением Министерства финансов Республики Башкортостан на территории г. Стерлитамак: «Апробация концептуального базиса и алгоритма построения гибридных моделей доходной и расходной частей бюджета муниципального образования на основе интеллектуальных (нейросетевых) моделей»; муниципальным бюджетным учреждением здравоохранения «Клиническая больница № 1» г. Стерлитамак: «Агрегирование множеств разрозненных показателей в один обобщенный критерий ранжирования учреждений здравоохранения по эффективности их работы в медицинском и экономическом аспектах на основе интеллектуальных (нейросетевых) математических моделей»; муниципальным бюджетным учреждением здравоохранения «Санитарный автотранспорт» г. Стерлитамак: «Алгоритм оценки показателей качества работы муниципального бюджетного учреждения здравоохранения «Санитарный автотранспорт» на основе нейросетевой математической модели». Внедрение подтверждено

Модернизация налогового контроля (модели и методы): Монография/Под. Ред. А.Н. Романова. - М.: Вузовский учебник, 2010. - 320 с.

соответствующими документами и протоколом намерений Департамента организации налогового контроля ФНС РФ.

Материалы диссертационного исследования внедрены в учебном процессе подготовки специалистов с высшим профессиональным образованием экономического профиля по дисциплинам «Эконометрика», «Компьютерные технологии в экономической науке и производстве», «Теория социально-экономического моделирования», «Методы прогнозирования финансовых показателей» в Башкирском государственном университете.

Апробация работы и публикации. Теоретические и практические положения, содержащиеся в диссертационной работе, послужили материалом к разработке учебных пособий «Эконометрика», «Экономика труда», так и лекционных курсов по соответствующим дисциплинам, читаемых автором в Башкирском государственном университете.

Основные положения и результаты диссертационной работы
докладывались и обсуждались на конференциях, наиболее значимые из
которых: IX Всероссийская научная конференция «Нейрокомпьютеры и их
применение» (Москва, 2011 г.); X Международная конференция «Новые
тенденции в экономике и управлении организацией» (г. Екатеринбург, 2011 г.);
III ежегодная Международная научно-практическая конференция
«Перспективы развития информационных технологий» (г. Новосибирск, 2011
г.); I Всероссийская (с международным участием) научно-практическая
конференция «INEM - 2011» в сфере инноваций, экономики и менеджмента.
При поддержке Fachhochschule Ludwigshafen am Rhein (Central Eastern Europe
Institute) (г. Томск, 2011 г.); Международная научно-практическая конференция
«Современные малые города: проблемы и перспективы развития» (Ивантеевка,
Московская область, 2010 г.); Всероссийская научно-практическая
конференция «Актуальные проблемы экономической политики» (г.
Нефтекамск, Республика Башкортостан, 2010 г.); IV Международная научно-
практическая конференция «Воспроизводственный потенциал региона» (г. Уфа,
2010 г.); Всероссийская научно-практическая конференция Института
социально-экономических исследований УНЦ РАН (г. Уфа, 2010 г.); IV
Всероссийская научно-практическая Internet-конференция Института
социально-экономических исследований УНЦ РАН (г. Уфа, 2010 г.); II
Международная научно-практическая конференция «Анализ, моделирование и
прогнозирование экономических процессов» (г. Воронеж, 2010 г.); II
Всероссийская научно-практическая Internet-конференция (Института
социально-экономических исследований УНЦ РАН) «Проблемы
функционирования и развития территориальных социально-экономических
систем» (г. Уфа, 2009 г.); семинарах в Государственном автономном научном
учреждении «Институт прикладных исследований» Академии наук Республики
Башкортостан, Башкирского Государственного университета и в Пермском
государственном национальном исследовательском университете

(международная лаборатория конструктивных методов исследования динамических моделей экономики на кафедре информационных систем и

математических методов в экономике - руководитель д.ф.-м. н., проф. Максимов В.П.).

Публикации. Основные результаты диссертационной отражены в 83 работах, все по теме диссертации, в том числе 29 в рецензируемых журналах, входящих в список ВАК, 9 монографиях, 18 научных журналов и сборников трудов, 5 препринтов, 20 международных и всероссийских научных конференций и 1 свидетельство о регистрации алгоритма в отраслевом фонде (общий объем 88,97 авт. листов).

Структура и объем работы. Диссертационная работа состоит из введения, 9 глав, заключения, библиографического списка литературы из 220 источников. Основное содержание работы изложено на 432 страницах машинописного текста. В работе содержатся 44 рисунка, 33 таблицы и 8 разделов приложений. В Приложениях кратко описаны принципы работы нейросетей типа многослойного персептрона (MLP), сетей с базисными радиальными функциями (RBF) и нейросетей Кохонена (SOM-карт), а также приведены фрагменты таблиц исходных данных (полные таблицы содержатся в монографиях автора [1,2].

Разработка когнитивной мультиагентной модели финансовых и информационных потоков в бюджетно-налоговой системе регионального и муниципального уровней. Формулировка целей моделирования

Прикладные цели математического моделирования обусловлены происходящим в настоящее время процессом реформирования бюджетно-налоговой системы России.

Поскольку создание единой нейросетевой гибридной экспертной системы для БНС регионального уровня вряд ли возможна (база знаний и база данных такой системы имели бы огромную размерность), то автор предлагает ее декомпонировать. При этом иерархия целей моделирования подчинена иерархической структуре разработанной когнитивной карты (рис. 1.3).

Сформулированы следующие прикладные цели моделирования: а) на верхнем иерархическом уровне (рис. 1.3) подсистем регионального и муниципального уровней: для бюджетной подсистемы (вершина 2) - это повышение эффективности и прозрачности государственного управления и повышения равномерности социального и экономического развития территорий регионов в аспекте предоставления населению бюджетных услуг; для налоговой подсистемы (вершина 3) - это повышение собираемости налогов при сохранении экономических условий успешного функционирования предприятий - налогоплательщиков после уплаты налогов. б) на нижеследующем иерархическом региональном уровне: для бюджетных налоговых систем муниципальных образований (вершина 2.1) - прогнозирование наполнения бюджета на планируемый период в функции структуры поступлений (налоговых и неналоговых); для подсистем налогового контроля (вершины 3.1, 3.2, 3.3) - выделены следующие цели разработки нейромоделей и соответствующих экспертных подсистем; для подсистемы налогового контроля (вершина 3.2) - ранжирование предприятий-налогоплательщиков по степени отклонения моделируемого показателя от «эталонного» (ожидаемого) с учетом статистической устойчивости этих отклонений; для подсистемы налогового планирования (вершина 3.1) - синтез оптимального по критерию суммы ожидаемых доначислений плана выездных налоговых проверок; для подсистемы налогового регулирования (вершина 3.3) - кластеризация предприятий-налогоплательщиков по обобщенным (агрегированным) критериям платежеспособности, разработка эффективных управленческих решений. в) на самом нижнем иерархическом уровне бюджетной подсистемы когнитивной карты рис 1.3, т.е. уровне МУ (вершина 2.2) качество предоставляемых населению бюджетных услуг (школьного и дошкольного образования, здравоохранения, спортивно-оздоровительных и др.) непосредственно зависит от работы МУ. В то же время методики объективной и всесторонней оценки деятельности МУ, определяющей распределение бюджетных средств при планировании и определение направления развития МУ, практически не разработаны (см. главу 7).

Поэтому в диссертации сформулирована основная прикладная цель моделирования для подсистемы МУ - это создание на основе нейросетей методики агрегированной оценки эффективности деятельности МУ в соответствии с принципом БОР.

Особенности постановок задач нейромоделирования

Если при формулировке прикладных целей моделирования автор использовал декомпозиционный подход системного анализа, то при математической постановке задач нейросетевого моделирования использован другой подход теории систем - агрегирования. Другими словами, автор стремился при постановке задач нейросетевого моделирования достичь той степени обобщения, которая бы позволила охватить различные подсистемы БНС (рис. 1.3) и, более того, в аспекте применимости разработанного концептуального базиса (см. главу 2) и методов нейромоделирования позволила бы в перспективе решать задачи из смежных областей экономики, например оценки кредитоспособности хозяйствующих субъектов-заемщиков. В диссертации рассмотрены семь таких обобщенных задач: 1) предобработки сильно зашумленных и частично противоречивых данных при неизвестном законе распределения плотности вероятности шумов; 2) аппроксимации (интерпретации), данных, т.е. восстановления многофакторных нелинейных зависимостей, скрытых в данных; 3) регуляризации нейросетевой модели (повышения устойчивости искомого решения); 4) прогнозирования на основе одно- и многомерных временных рядов; 5) многокритериального выбора и ранжирования; 6) распознавания образов (классификации и кластеризации); 7) управления (принятия решений в условиях неопределенности).

Здесь под «обобщенностью» постановок перечисленных задач понимаются: наличие сильной зашумленности данных (вплоть до их сознательного искажения), характерной для исследуемых БНС и многих других экономических систем; дефицит наблюдений; наличие противоречивых элементов данных; отсутствие стесняющих допущений (предпосылок метода наименьших квадратов; допущений о нормальном законе распределения плотности вероятности шумов; о том, что распределения плотности вероятности кластеризуемых вектор-строк данных являются гауссовыми смесями; об отсутствии некомплектных вектор-строк данных; о нормальном распределении ошибок аппроксимации и других, которые будут подробно оговорены в соответствующих главах).

Для обеспечения возможности такого «расширения» за рамки узко прикладных целей моделирования БНС автор поставил перед собой задачу разработки на основе нейросетевого базиса и байесовского подхода достаточно общих методов и алгоритмов решения указанных выше обобщенных задач, не теряющих работоспособность при сложных условиях моделирования, оговоренных ниже в параграфе 1.3.

Особенностью развиваемых в диссертации подходов является то, что для всех перечисленных выше обобщенных задач 1... 7 исключительное внимание уделялось вопросам исследования устойчивости получаемых решений, регуляризации моделей и их адекватности, поскольку эти вопросы пе исследованы в литературе.

Нейросетевая модель как математико-информационная модель

Оговорим характер взаимодействия системы со средой. Система выступает как нечто целое относительно окружающей среды. Возмущающим воздействиям окружающей среды противостоят внутренние связи между элементами системы, и, чем эти связи сильнее и устойчивее, тем более устойчива система к внешним возмущениям. Другими словами, система должна обладать механизмом иммунитета по отношению к деструктурирующим сигналам внешней среды, и об этом надо позаботиться при постановке задачи и разработке модели. Например, изменение налогового законодательства является деструктурирующим фактором по отношению к нейросетевой модели отбора налогоплательщиков для выездных проверок. «Механизмом иммунитета» в этом случае должна быть разработка не одной модели, а их ансамбля, где каждая модель должна соответствовать неизменным условиям налогового законодательства.

Общая цель функционирования всей налоговой системы регионального уровня - соблюдение в масштабе региона Налогового кодекса РФ, увеличение собираемости налогов. Цель бюджетной системы - представление своевременно и в полном объеме бюджетных услуг бюджетополучателям, обеспечение устойчивости бюджета соответствующего уровня.

Системное (интегративное) свойство СНА порождаемое рациональным взаимодействием элементов, состоит в обеспечении, с одной стороны, интересов государства в аспекте исполнения плана бюджета (наполнения казны) на соответствующем уровне бюджетной системы, а, с другой стороны, сохранение условий стабильного развития предприятий - налогоплательщиков.

Системный аспект развиваемого комбинированного подхода к исследованию СНА заключается также в том, что концептуальный базис (методологическая основа) информационно-математических моделей СНА разработан как следствие из детерминированных общесистемных законов и закономерностей кибернетики [144] (см. ниже).

2. Синергетический подход представляет собой новый метод научного познания, переосмысливающий роль случайных факторов с порождением синергетического (интегративного) эффекта, открывающий новые возможности для анализа нелинейного взаимодействия этих факторов, пересматривающий роль организации и хаоса в природе и обществе.

Конкретно в исследуемых математико-информационных нейросетевых моделях СНА синергетический подход, по существу, положен в основу всех восьми разработанных концепций (см. ниже) в том смысле, что рациональное взаимодействие элементов модели порождает новые знания о восстанавливаемых закономерностях в моделируемом объекте и закономерностях преобразуемой информации. Наглядный пример тому описан в параграфе 2.3, где взаимодействие подсистем Ai и Аг порождает синергетический эффект - концепцию взаимосвязанного управления информативностью данных и качеством их аппроксимации в НСМ.

3. Информационный подход состоит в том, что основные модели БНС агентов на рис. 1.3 - это математико-информационные модели и разрабатываемые компьютерные технологии налогового контроля, планирования и регулирования, являющиеся по сути, интеллектуальными информационными технологиями.

Информационный подход в научном познании можно рассматривать как развитие системного подхода, органически дополняющего его, за счет извлечения новых знаний при преобразовании информации.

Сегодня считают, что информация - это мера порядка, мера сложности системы, характеристика внутреннего разнообразия системы, мера вероятного выбора одной из возможных траекторий развития процесса. Информационные процессы лежат в основе практически всех явлений в природе и обществе. Информационный подход позволяет высветить ранее не замеченные качества и свойства объекта. В последних исследованиях [74] показано, что существуют законы природы более общие, чем физические, - законы информатики.

С позиции информационного подхода БНС рассматривается как система, где в части блоков и подсистемах по заданным правилам (алгоритмам) осуществляется структурирование, хранение, извлечение, перемещение и преобразование информации с извлечением закономерностей, скрытых в сильнозашумленных данных (см. главы 4, 5).

Суть информационного подхода в исследовании БНС состоит в том, что за счет преобразования информации при обучении нейросетевой адаптивной модели порождаются новые знания об экономических закономерностях, скрытых в данных.

Взаимодействие системного, синергетического и информационного подходов состоит в следующем. Комбинация системного и синергетического подходов обеспечивает специфическое наполнение предлагаемых системных концепций при исследовании БНС и ее моделей, использует вероятностные законы и стохастические модели, в частности нейросетевые.

При образовании подсистемы извлечения знаний из данных отчетности, т.е. объединении данных отчетов и планов многих налогоплательщиков в одну базу данных (одну информационную подсистему) начальная энтропия такой подсистемы вначале возрастает по сравнению с энтропией отдельного элемента. Действительно, каждая объясняющая переменная Xj и моделируемая величина Y имеют больший размах в таком массиве и соответственно большее число возможных состояний. Другими словами мы «вносим дополнительную энтропию» в систему.

Вычислительные модельные эксперименты по анализу устойчивости нейросетевых моделей

В работе [173] для задач интерпретации (восстановления) показано, что задача (3.40) о минимизации стабилизатора на множестве с ограничениями типа неравенств может быть редуцирована к классической задаче на условный экстремум с ограничением вида равенств (метод Лагранжа). Такая задача, значительно более удобная для численного решения на ЭВМ, формулируется следующим образом. Пусть X 0 числовой параметр. Выражение:

Задача (3.42), в самом деле, допускает более простой алгоритм решения. Для всякого X 0 элемент z ) может быть (обычно однозначным образом) { найден каким-либо прямым методом безусловной минимизации Ji [28]; уравнение (3.42) есть обычное трансцендентное уравнение ср{Х) - д = Ос алгоритмически определенной левой частью, и оно может быть решено любым из известных методов [28] на ЭВМ; определив отсюда X = Х(8), находим и zg= zws» Использование указанного уравнения для определения значения параметра (Я) обычно называют методом «невязки» (невязка ср(Х)). Этот метод подробно изучался в работе [173].

Для замыкания задачи восстановления гиперповерхности Г(х) с использованием сглаживающего функционала Тихонова применительно к нейросетевому моделированию «ядра» модели («обобщенной производственной функции» для подсистем рис. 1.3) следует определить 5. В диссертации в качестве 8 предлагается выбирать константу Липшица L как меру неоднородности данных косвенно зависящую от меры зашумления:

Как показано [173], некоторые обобщенно-корректные постановки обратных задач при самых общих предположениях относительно оператора А и искомого решения z и независимо от класса задачи связаны с конструкцией сглаживающего функционала Тихонова. Оказывается, что задача о минимизации этого параметрического функционала порождает целое семейство регуляризирующих операторов (РО), зависящих от выбора параметра X.

Приближенный метод регуляризации MLP-пейросетей в задаче восстановления с использованием стабилизатора Тихонова

В диссертации предлагается следующий алгоритм регуляризации MLP-нейросетей, отличающийся от известного алгоритма Harris D и Yann Le Cun [200] тем, что параметр регуляризации X в выражении стабилизатора Тихонова оценивается на основе байесовского подхода, аналогично идее, подробно описанной в параграфе и 3.7. Ниже приводится краткое описание этого алгоритма.

Как показано в параграфе П.1, в режиме обучения для MLP - сети решается задача восстановления многомерной параметрической функции z{X) = Y(X,W) с помощью оператора А(»), представляющего собой композицию операторов F30F2 при прямом ходе сигнала и F40F3 при обратном ходе (см. Приложение (П. 1.1) - (П. 1.5)).

Таким образом, неизвестным искомым элементом в операторном уравнении Az = її является матрица синаптических весов нейросети W. Запишем общее выражение сглаживающего функционала для искомого решения этой обратной задачи:

Если принять в качестве оценки качества аппроксимации данных в нейросети числовую меру по (П. 1.4): а в качестве сглаживающего функционала: то получим алгоритмически определенную вариационную задачу, решаемую в нейросетевом базисе, т.е. регуляризированный по А.Н. Тихонову алгоритм обучения: w :Jx{z) = Здесь W - обычная евклидова норма матрицы:

В диссертации предлагается следующий байесовский подход для нахождения Л. Строится не одна НСМ, а байесовский ансамбль априорных нейросетей - гипотез о порождении данных \hq\X,W,X]\, различающихся архитектурой, видом активационных функций и параметром регуляризации L После построения ансамбля производится фильтрация НСМ внутри ансамбля по критерию со (3.85), т.е. отбраковываются сети-гипотезы, hq, у которых отношения (N IN) числа «хорошо объясненных точек N» к общему числу примеров N, оказывается меньше со. Затем в отфильтрованном ансамбле все оценки, включая оценку параметра регуляризации X, проводятся путем осреднения по ансамблю.

Ограничения для использования зарубежных методик отбора налогоплательщиков в России

Если ряд случайный, размах будет увеличиваться пропорционально корню квадратному из времени. Для калибровки временных измерений Херст ввел безразмерное отношение посредством деления размаха на стандартное отклонение наблюдений [137]. Этот способ анализа стал называться методом нормированного размаха (R/S - анализ). Херст показал, что большинство естественных явлений следует «смещенному случайному блужданию» - тренду с шумом. Сила тренда и уровень шума могут быть оценены тем, как изменяется нормированный размах со временем, т.е. насколько величина Н превосходит

При 0 Н 0,5 ряд является антиперсистентным или эргодическим. Такой тип динамической системы называют «возврат к среднему». Если система демонстрирует рост в предыдущий период, то, скорее всего в следующем периоде начнется спад. Устойчивость такого антиперсистентного поведения зависит от того, насколько Н близко к нулю.

Антиперсистентный ряд с 0 Н 0,5 дает более высокую фрактальную размерность D и далее «зазубренный» его характер, чем случайное блуждание.

Тренд оустойчивость поведения, или сила персистентности, увеличивается при приближении Н к единице. Таким образом, чем ближе Н к 0,5, тем более зашумлен ряд и тем менее выражен его тренд.

Персистентный временный ряд, определенный для 0,5 Н 1,0 является фракталом, поскольку может быть описан как обобщенное броуновское движение, где существует корреляция между событиями на временной шкале. Вследствие этого вероятность двух событий, следующих друг за другом, не равно 0,5.

Процесс с Н = 0,5 отличается короткой памятью, т.е. эффект памяти уменьшается до того уровня, что становиться незаметным. В терминах нелинейной динамики [108] систем средняя длина цикла (N 200) есть длительность, по истечению которой теряется память о начальных условиях.

В сущности, оценка Н, которая значительно отличается от 0,5, в сторону 1 может иметь следующее объяснение: в изучаемом временном ряду имеется долговременная память. Каждое наблюдение коррелирует до некоторой степени с последующими наблюдениями.

Заметим, что (R/S) - анализ работоспособен безотносительно к закону распределения временного ряда [137].

Метод обобщенного перекрестного подтверждения для опенки адекватности модели СПВП и всей гибридной нейросетевой модели

Итог байесовской регуляризации НСМ по критериям (3.85), (3,87) является в то же время оценкой адекватности нейросетевой модели с доверительной вероятностью Р по (3.87), которая измеряет качество объяснения данных отфильтрованным байесовским ансамблем.

Естественно, критерий Р по (3.87) «наследует» качество данных, получаемых в итоге алгоритма предпроцессорной обработки «сырых» данных по алгоритмам 1.1 - 1.7 МВММ (рис. 4.1). Поэтому алгоритмы 1.1 - 1.7, направленные на структурирование данных (повышение их информативности), можно рассматривать как процесс предрегуляризации.

При рассмотрении гибридной нейросетевой модели (ГНСМ) включающей в себя НСМ и модель СПВП, требуется дополнительный критерий адекватности, по сравнению с (3.85), (3.87), который бы служил финишной оценкой адекватности всей ГНСМ, аккумулирующий в себе оценку всех взаимосвязанных процедур МВММ и метода СПВП. Причем такой критерий должен быть единым для обеих модификаций I и II метода СПВП, описанных выше.

Похожие диссертации на Нейросетевое моделирование в бюджетно-налоговой системе регионального и муниципального уровней