Содержание к диссертации
Введение
ГЛАВА 1. Анализ проблемной области и постановка задачи исследования 12
1.1. Информационная система финансового мониторинга 12
1.2. Состояние вопроса оценки обстановки в финансовом мониторинге 17
1.3. Комплексная методика автоматизации процесса оценки обстановки в ИС финансового мониторинга 24
1.4. Постановка задачи обработки информации на этапе оценки обстановки в ИС финансового мониторинга 26
1.5. Разработка признакового пространства и формирование матрицы исходных данных 31
Выводы по главе 1 39
ГЛАВА 2. Разработка алгоритма синтеза рейтинговых оценок субъектов обстановки в информационной системе финансового мониторинга 40
2.1. Анализ методов скаляризации многокритериальных оценок 40
2.1.1. Метод k-средних кластерного анализа 40
2.1.2. Метод главных компонент факторного анализа 41
2.1.3. Другие методы скаляризации многокритериальных оценок 43
2.2. Синтез рейтинговых оценок субъектов обстановки 47
2.2.1. Применение метода k-средних кластерного анализа 47
2.2.2. Применение метода главных компонент факторного анализа 52
2.2.2.1. Формализация задачи синтеза рейтинговых оценок субъектов обстановки в терминах метода главных компонент 52
2.2.2.2. Синтез рейтинговых оценок субъектов обстановки методом главных компонент 57
2.2.2.3. Верификация рейтинговых оценок субъектов обстановки 65
2.3. Алгоритм синтеза рейтинговых оценок субъектов обстановки в информационной системе финансового мониторинга 73
Выводы по главе 2 76
ГЛАВА 3. Разработка алгоритма генерации информации о девиантной деятельности субъектов в информационной системе финансового мониторинга 78
3.1. Разработка моделей классификации субъектов для идентификации девиантных субъектов 78
3.1.1. Использование алгоритма CART деревьев решений 79
3.1.2. Использование алгоритма QUEST деревьев решений 85
3.2. Алгоритм генерации информации о девиантной деятельности субъектов на естественном языке (в виде логических правил) в ИС финансового мониторинга 88
Выводы по главе 3 91
ГЛАВА 4. Модернизация информационной системы на основе результатов исследования и оценка положительного эффекта 92
4.1. Внедрение программной реализации алгоритмов в ИС Росфинмониторинга 92
4.2. Методика визуализации информации об обстановке по данным финансового мониторинга 97
4.3. Формирование оптимального набора проверяемых субъектов 105
Выводы по главе 4 110
Заключение 112
Список литературы 115
- Комплексная методика автоматизации процесса оценки обстановки в ИС финансового мониторинга
- Другие методы скаляризации многокритериальных оценок
- Использование алгоритма QUEST деревьев решений
- Методика визуализации информации об обстановке по данным финансового мониторинга
Введение к работе
Актуальность диссертационного исследования. Противодействие отмыванию преступных доходов является важной задачей финансового мониторинга1, решение которой основано на использовании больших (несколько терабайт) информационных массивов гетерогенных данных. Эти массивы поступают в информационную систему (ИС) финансового мониторинга. В целях оценки обстановки (ситуации), являющейся исходным и важнейшим этапом принятия решений, в ИС осуществляется обработка поступающих данных, что позволяет представить субъекты векторами показателей. Суть оценки обстановки заключается в свёртке показателей в единую рейтинговую оценку, характеризующую меру девиантной деятельности субъекта. Существующий в финансовом мониторинге подход к оценке обстановки заключается в том, что эксперты назначают компонентам вектора весовые коэффициенты и складывают полученные результаты. При этом, в соответствии со сложившейся практикой эксперты осуществляют подготовку информации об обстановке на естественном языке.
Однако, получаемые таким способом результаты сопровождаются экспертным субъективизмом и социально-политической мотивацией экспертов. Кроме того, возрастающий объём поступающих данных (приблизительно на 20% ежегодно) приводит к снижению оперативности обработки данных на этапе оценки обстановки. Руководство Росфинмониторинга вынуждено работать с субъективными оценками и сталкиваться с существенно увеличенными сроками получения результата.
В этих условиях возникает противоречие между потребностью руководства Росфинмониторинга и существующей практикой обработки данных, сопровождающейся большими временными и ресурсными затратами, а также экспертным субъективизмом. Данное противоречие связано с недостаточным уровнем системности существующего подхода и может быть устранено путём разработки комплексной методики автоматизации процесса оценки обстановки в ИС финансового мониторинга, основанной на алгоритмах решения частных задач оценки обстановки с учётом их специфики.
Таким образом, исследование и разработка научно-технических решений обработки данных финансового мониторинга для оценки обстановки, исключающих экспертный субъективизм и удовлетворяющих критерию к временным и ресурсным показателям процесса обработки данных, является актуальной задачей.
Разработке и исследованию методов и моделей обработки данных посвящены работы С.А. Айвазяна, М.Г. Завельского, Г.Б. Клейнера, А.Н. Колмогорова, Т.И. Овчинникова, Н.К. Разумовского, В.Я. Райцина, А.Ф. Филиппова, Л.М. Чёрного, Г.О. Крылова и других учёных. Большой вклад в системный анализ процессов в прикладных областях внесли труды
1 В соответствии с Федеральным законом от 07.08.2001 №115-ФЗ.
зарубежных учёных Р. Кини, М. Месаровича, П. Ромер, Х. Райфа, Т. Саати, Р. Солоу, И. Такахары, Дж. Айтчисона, Дж. Брауна и других.
Между тем, исследование и разработка научно-технических решений обработки данных финансового мониторинга для оценки обстановки, позволяющих исключить экспертный субъективизм и повысить оперативность получения результатов, другими исследователями ранее не осуществлялись.
В соответствии с функцией предпочтения лиц, принимающих решения (ЛПР) в Росфинмониторинге, интерпретация теоретических результатов диссертации осуществляется на примере области биоресурсов.
Цель и задачи исследования. Целью диссертационного исследования является разработка научно-технических решений автоматизированной обработки данных финансового мониторинга для оценки обстановки в области биоресурсов, исключающих экспертный субъективизм при обработке данных и удовлетворяющих критерию к временным и ресурсным показателям процесса обработки данных, для повышения качества принимаемых решений по противодействию легализации преступных доходов.
Достижение поставленной цели предполагает решение следующих задач:
-
Анализ существующих в финансовом мониторинге подходов к оценке обстановки.
-
Постановка и формализация частных задач этапа оценки обстановки, декомпозиция временных и ресурсных показателей.
-
Формирование критерия к временным и ресурсным показателям процесса обработки данных на этапе оценки обстановки.
-
Разработка алгоритма синтеза рейтинговых оценок субъектов обстановки в ИС финансового мониторинга.
-
Разработка алгоритма генерации информации о девиантной деятельности субъектов на естественном языке.
-
Разработка комплексной методики автоматизации процесса оценки обстановки в ИС финансового мониторинга, основанной на алгоритмах синтеза рейтинговых оценок субъектов и идентификации девиантной деятельности.
Объектом диссертационного исследования является информационная система финансового мониторинга.
Предметом диссертационного исследования являются алгоритмы и методы синтеза оценок девиантной деятельности в информационной системе финансового мониторинга.
Методы исследования
В работе использовались методы структурного системного анализа, математической статистики (факторный анализ, кластерный анализ), численные методы линейной алгебры, исследования операций.
Научная новизна состоит в разработке и обосновании научно-
технических решений обработки данных финансового мониторинга,
отличающихся от существующих подходов тем, что исключают экспертный
субъективизм при обработке данных и удовлетворяют критерию к временным и
ресурсным показателям процесса обработки данных. Новыми являются следующие научные результаты:
-
Определены основные этапы обработки данных при оценке обстановки, поставлены и формализованы частные задачи обработки данных в ИС финансового мониторинга для оценки обстановки.
-
Впервые предложена комплексная методика автоматизации процесса оценки обстановки в ИС финансового мониторинга.
-
Разработан алгоритм синтеза рейтинговых оценок субъектов обстановки в ИС финансового мониторинга, учитывающий некоторую априори неизвестную вариацию исходных показателей, характеризующую девиантную деятельность субъектов.
-
Разработан алгоритм генерации информации о девиантной деятельности субъектов на естественном языке путём обработки текущей информации об их деятельности в ИС финансового мониторинга.
-
Впервые проверена гипотеза о применимости логнормального закона для описания зависимости количества субъектов в области биоресурсов от меры их вовлечённости в девиантную деятельность.
-
Разработанные алгоритмы и методика обработки данных финансового мониторинга в области биоресурсов в полной мере применимы к решению класса задач оценки обстановки в других областях деятельности объектов финансового мониторинга.
Практическая значимость работы состоит в следующем:
1. На основе разработанных алгоритмов и методики обработки данных
финансового мониторинга модернизирована ИС Росфинмониторинга для
обработки данных в области биоресурсов, что позволило:
синтезировать рейтинговые оценки субъектов обстановки в области биоресурсов (2292 субъекта), лишённые экспертного субъективизма;
сгенерировать логические правила идентификации девиантных субъектов в области биоресурсов, выраженные на естественном языке, по которым компетентные органы могут своевременно идентифицировать девиантную деятельность в области биоресурсов;
на порядок сократить длительность процесса обработки данных для оценки обстановки в области биоресурсов (по экспериментальным данным экспертов Росфинмониторинга в 19 раз при формировании рейтинговых оценок и в 3-5 раз при генерации информации о девиантной деятельности в области биоресурсов).
-
С использованием разработанного алгоритма синтеза рейтинговых оценок разработана методика визуализации информации об обстановке, использование которой позволило сформировать карту обстановки в Дальневосточном Федеральном округе в области биоресурсов.
-
Экспериментально подтверждены теоретические положения диссертации: при сопоставлении предоставленной экспертами выборки субъектов (содержащей равное количество девиантных и недевиантных субъектов) с результатами ранжирования субъектов по синтезированным
рейтингам, около 100 субъектов выборки оказались первыми 100 наблюдениями (наиболее девиантными), оставшиеся 100 оказались последними 100 субъектами в списке (недевиантными).
-
Cинтезированные рейтинговые оценки и информация о девиантной деятельности субъектов использованы функциональными подразделениями Росфинмониторинга в практической деятельности.
-
Научные результаты диссертации использованы в учебном процессе в рамках курса «Национальная система противодействия легализации преступных доходов и финансированию терроризма» кафедры финансового мониторинга стратегической академической единицы Институт интеллектуальных кибернетических систем НИЯУ МИФИ.
Положения, выносимые на защиту
-
Комплексная методика автоматизации процесса оценки обстановки в ИС финансового мониторинга.
-
Алгоритм синтеза рейтинговых оценок субъектов обстановки в ИС финансового мониторинга.
-
Алгоритм генерации информации о девиантной деятельности субъектов на естественном языке при обработке текущей информации об их деятельности в ИС финансового мониторинга.
-
Результаты внедрения программной реализации разработанных алгоритмов в ИС финансового мониторинга.
Соответствие темы диссертационного исследования паспорту
специальности. Диссертационная работа по своему содержанию соответствует
пунктам 2 (формализация и постановка задач системного анализа, оптимизации,
управления, принятия решений и обработки информации), 4 (разработка методов
и алгоритмов решения задач системного анализа, оптимизации, управления,
принятия решений и обработки информации), 5 (разработка специального
математического и алгоритмического обеспечения систем анализа,
оптимизации, управления, принятия решений и обработки информации) паспорта специальности 05.13.01 – системный анализ, управление и обработка информации (в информационных системах).
Апробация работы
Основные результаты диссертационной работы докладывались на следующих Всероссийских и международных конференциях:
-
XXII Всероссийская научная конференция «Информатизация и информационная безопасность правоохранительных органов», Москва, 29-30 мая 2013 г.
-
I Международный конгресс по информационной безопасности национальных экономик в условиях глобализации InfoSecurityFinance, Москва, 15-16 мая 2013 г.
-
VI Международная научно-практическая конференция «Информационные технологии в науке, бизнесе и образовании», InfoSecurityFinance, Москва, 27 ноября 2013 г.
-
II Международный конгресс по информационной безопасности национальных экономик InfoSecurityFinance, Москва, 15 мая 2014 г.
-
XXIV Всероссийская научная конференция «Информатизация и информационная безопасность правоохранительных органов», Москва, 3 июня 2015 г.
-
Международная научно-практическая конференция «Угрозы и риски для экономик стран БРИКС», Москва, 10-12 ноября 2015 г.
-
Всероссийский научный семинар «Актуальные вопросы управления в социально-экономических системах», Москва, 15 марта 2016 г.
Достоверность результатов обеспечивается корректностью применяемого математического аппарата, доказанностью выводов, совпадением теоретических выводов и экспериментальных данных, апробацией на научно-практических конференциях и семинарах, положительным эффектом внедрения результатов исследования.
Публикации. Основные результаты диссертации опубликованы в 7 печатных работах, из них 3 статьи в периодических научных изданиях, рекомендованных ВАК России, 2 статьи в журналах, представленных в базе цитирования Scopus, 2 работы в других изданиях.
Личный вклад автора. Основные научные результаты, заключающиеся в разработке алгоритмов автоматизированной обработки данных финансового мониторинга, получены автором лично.
Объём и структура работы
Диссертация состоит из введения, четырёх глав, заключения, списка литературы, изложена на 136 страницах, в том числе основного текста на 114 страницах. Работа иллюстрирована 28 таблицами и 32 рисунками. Список литературы содержит 163 источника, в том числе 42 на иностранных языках.
Комплексная методика автоматизации процесса оценки обстановки в ИС финансового мониторинга
Другое исследование проведено специалистами Института управления стоимостью совместно с информационным агентством «Интерфакс». Ими разработан «индекс должной осмотрительности» (ИДО). ИДО – это количественный показатель, отражающий вероятность того, что компания создана не для уставных целей (является «однодневкой»). По имеющимся оценкам, точность, которую предоставляет данный индекс, достаточно высока – для компаний, отчетность которых представлена в СПАРК точность прогнозов на тестовой выборке составила 88,44%, для компаний без отчетности – 84,18%. Факторное пространство ИДО включает в себя такие параметры как срок последней представленной в налоговые органы отчетности, наличие массового директора и массового адреса регистрации, учитывает значение некоторых показателей финансовой отчетности компании и их динамику. ИДО является одним из наиболее используемых параметров в российских информационно аналитических системах. С его помощью компании оцениваются на предмет фиктивности (отсутствие существенных собственных активов и операций либо «брошенный» актив). Мониторинг и анализ этого показателя помогает с одной стороны, заказчику или ответственному исполнителю проекта или программы оградить себя от недобросовестного контрагента, способного исчезнуть из поля зрения, не выполнив обязательств, с другой стороны, дает возможность эксперту проводить аналитическую работу по выявлению недобросовестных контрагентов.
Достоинства подхода: - высокая достоверность классификации в рамках поставленной задачи; - наглядная визуализация результатов классификации (использование цветового кодирования результирующего интегрального показателя). Тем не менее, подход не лишён недостатков, к которым можно отнести следующие: - пользователям ИДО недоступны сведения о критериях, которые имели ключевое значение для формирования индекса (требуется дополнительный анализ организации, чтобы объяснить значение индекса); - расчет индекса ресурсоемок и проводится один раз в квартал, история значений не хранится; - отсутствует возможность поиска организаций с указанием условия по значению индекса. Анализ иностранной литературы показывает, что для оценки риска банкротства и кредитоспособности предприятий широко используются модели Альтмана [6], Лиса, Таффлера, разработанные с помощью многомерного дискриминантного анализа. Альтман [7], Хальдеман и Нарайана впервые исследовали 22 финансовых коэффициента и выбрали из них 5 для включения в окончательную модель определения кредитоспособности субъектов.
Полученная модель позволяла оценивать риск банкротства корпорации. В результате анализа исследуемый объект относили либо к фирмам-банкротам, либо к успешно действующим фирмам. Особый интерес представляет исследование Ю.М. Бекетновой [102], принадлежащей к научной школе профессора Г.О. Крылова. В работе представлено исследование компаний с признаками фиктивности, ликвидированных по решению арбитражного суда, по субъектам Российской Федерации. В качестве исходных данных использовались решения арбитражного суда о ликвидации юридических лиц и официальная ежегодная статистика Росстата России. Для углублённого понимания задач Росфинмониторинга автором исследованы существующие методические материалы, в которых описан процесс анализа схем аналитиками. Так, установлено, что экспертная оценка аналитиком хозяйствующих субъектов формируется по частным оценкам элементов схемы, в которую вовлечён субъект, и в результате сопоставления данных оценок с известными аналитику классами объектов и связями между ними. Эта работа требует анализа многочисленных информационных объектов, поэтому при проведении анализа схем финансовых операций аналитики формируют оценки не для всех элементов схем и их взаимосвязей, а стремятся выделить ключевые элементы схем, ключевые связи и, в первую очередь, сформировать оценки для них.
Анализ задач Росфинмониторинга позволил определить следующие аналитические потребности: - анализ обстановки, количественная оценка её меры, анализ динамики оценок; - синтез информации об обстановке на естественном языке для формулирования и обоснования тактических и стратегических решений финансовой разведки; - обеспечение ЛПР информацией о девиантной деятельности субъектов; - представление о мере риска и динамике его изменения в отраслях экономической деятельности в субъекте Федерации, Федеральном округе; - выявление наиболее проблемных отраслей экономической деятельности, определяемых в соответствии с полученными экспертными оценками; - исследование динамики меры риска в отраслях экономики субъектов Федерации и Федеральных округов Российской Федерации. В основе существующего в Росфинмониторинге подхода к оценке обстановки – экспертные оценки. Каждому субъекту в информационной системе присвоен ОКВЭД, поэтому оценив каждого субъекта группы ОКВЭД, аналитики получают экспертную оценку ситуации отрасли экономической деятельности в целом.
Другие методы скаляризации многокритериальных оценок
Метод главных компонент (МГК) позволяет перейти от набора признаков x(1), x(2), …, x(p) к набору факторов f(1), f(2), …, f(p ). Связь между признаками и факторами носит статистический характер, поскольку точное восстановление значения признаков по соответствующим значениям факторов невозможно – существует некая остаточная случайная компонента u(j), специфическая для каждого признака и обуславливающая статистический характер связи x(j) и f(1), (2) (p ) f , …, f . Фактор является общим для той группы переменных, которую он определяет, а между собой факторы являются ортогональными [149]. Применительно к поставленной задаче МГК обладает рядом преимуществ по сравнению с другими методами: метод позволяет автоматически перейти от исходных коррелированных признаков к новому ортогональному базису, а анализ выделенных факторов позволит установить новые, ранее неизвестные характеристики (свойства) обстановки. Обладая таким свойством, МГК позволяет получать разные проекции обстановки в области добычи биоресурсов. В некоторых случаях, например, при анализе кредитных организаций, искомые свойства у объектов были обнаружены на десятой главной компоненте. Другие методы не обладают данным свойством. В отношении метода главных компонент возросла функция предпочтения руководства Росфинмониторинга.
При проведении измерений в таких областях как экономика, биология, медицина исследуемые признаки вариабельны от объекта к объекту, а также существует ошибка измерения. Величина, зарегистрированная в процессе измерений, в действительности состоит из трёх компонент и может быть представлена суммой: х..= хт+ xsi+ xei, где xtJ - зарегистрированное значение измеряемого признака у /-го объекта исследования, хт - истинное значение измеряемого признака у /-го объекта (соответствующее математическому ожиданию), xsi - вариативное значение изменяемого признака /-го индивида, хе1 - ошибка измерения при определении у-го признака у /-го объекта исследования. Выделение главных компонент позволит минимизировать шум за счёт возможности выбора и интерпретации той компоненты, которая характеризует интересующую его дисперсию в исходных признаках.
Существует интересный эксперимент, иллюстрирующий сущность метода главных компонент. Представим, что человеку нужно показать изображение чайника. Имеется 2 варианта изображения, сделанные с разных ракурсов: вид снизу и «классический» вид сбоку. В большинстве случаев, второй вариант воспринимается как более информативный. Таким образом, выбирая наиболее информативную фотографию (проекцию трёхмерного объекта на двумерную плоскость), мозг человека «выполняет» алгоритм метода главных компонент (в данном случае -поиск ортогональной проекции с наибольшим рассеянием). Другой пример: чтобы анализировать объект, человек крутит объект в руках, чтобы выбрать ту проекцию, в которой наблюдается максимальный разброс параметров.
Прикладной целью при проведении анализа методом главных компонент является ранжирование объектов по степени проявления в них латентных свойств, за которыми стоит тот или иной фактор.
Исходными данными для метода главных компонент являются ковариационная либо корреляционная матрица. В исследовании использована корреляционная матрица. Модель метода главных компонент имеет вид [4]: п Уу=Та;гЛ, (2.6) г=\ где г=1,2,…,и, у=1,2,…,и; fir - значение r-й главной компоненты для /-го наблюдения; а]Г - вес r-й компоненты в у-й переменной (факторная нагрузка г-й главной компоненты нау-ю переменную); у ц - нормированное значениеу-го признака для /-го объекта.
Использование алгоритма QUEST деревьев решений
Исследование источников по теме логнормального распределения показало его широкое распространение в различных предметных областях. В.Т. Самсонов в своей работе [113] отмечает, что акад. А.Н. Колмогоров теоретически получил закон распределения размеров частиц, наиболее полно соответствующий действительным распределениям измельченных материалов [51]. Дальнейшее развитие этот закон получил в трудах проф. Н.К. Разумовского, Л.М. Чёрного, А.Ф. Филиппова и др. А.Н. Колмогоров математически обосновал некоторую общую схему процесса измельчения, при которой плотность распределения размеров частиц по мере измельчения асимптотически стремится к логарифмически нормальному закону. Он предположил, что распределение логарифмов размеров частиц не зависит ни от абсолютных размеров частиц исходного материала, ни от применяющихся методов измельчения. При этом не только линейные размеры частиц подчиняются этому закону, но и любые другие характеристики частиц, зависящие от размера. Исследованию логнормального распределения и его распространённости в природе посвящено множество работ Б.В. Карасева, в том числе [47-50] и другие. В работе, посвящённой симметрии распределения вещества и симметрии распределения энтропии, Карасев Б.В. отмечает широкую распространенность логнормального распределения. В частности, весьма часто наблюдается логнормальная структура многих тел. В этой же работе отмечается, что физическое происхождение логнормального закона для функции распределения вероятности остается неясным, но для практического применения он может быть полезен. В [46] указано, что появились новые данные, подтверждающих предположения о теории кластерной логнормальной структуре стекол, зависимости характеристик радиоактивного распада от солнечной активности и т.д.
В [3] приведён ряд вариантов интерпретации логнормальной модели, таких как деление целого на части, время пребывания системы в состоянии, распределение лиц по уровню благосостояния. Наиболее подходящим объяснением логнормальной зависимости количества субъектов от их рейтингов является идея многократного дробления целого на части. Классическим примером в данном случае является задача о делении наследства. Если X — случайная величина размера состояния в поколении, то Xi — доля состояния отца, которая достается случайно выбранному наследнику следующего поколения. Если пропорции деления наследства в некоторой мере случайны и существует требуемая независимость между поколениями, то на основании изложенного можно ожидать, что распределение будет асимптотически логнормальным.
В [121] авторы рассматривают и обосновывают применимость логнормальной функции в различных приложениях к исследованию процессов экономической динамики. Авторы утверждают, что природа логнормального распределения связана с теорией группирования, в соответствии с которой группы получают путем последовательного деления. Например, при изучении контингента рабочих они вначале подразделяются по уровню квалификации, затем по полу, затем по уровню физического труда и т.д. Распределение численности рассматриваемых групп может быть асимптотически логнормальным.
Аналогичную аргументацию можно применить при рассмотрении повторяющегося деления любой количественно выраженной величины. Например, общество при изучении делится на все более мелкие группы, численность которых в пределе имеет приближенно логнормальное распределение.
В докладе о методах аппроксимации распределения доходов граждан Е. Пенухина, анализируя свойства экспоненциального закона, закона Парето и других, приходит к выводу о возможности использования в решении этой задачи логнормального закона.
К весьма интересным выводам о целесообразности введения прогрессивной шкалы подоходного налога в России приходят в своей работе, посвящённой интерпретациям особенностей логнормального распределения, Горлов С.К., Родин В.А. [107].
Таким образом, логнормальное распределение может быть использовано для моделирования зависимости между проявлением девиантной деятельности у субъектов и количеством субъектов в группах. С увеличением меры девиантной деятельности, субъекты образуют всю меньшие (по количеству элементов) группы, причём количество субъектов в этих группах может быть описано логнормальным законом. В исходной выборке 101 субъект (около 5% выборки) обладает значениями рейтинговых оценок больше или равными среднему ожидаемому значению. Большинство субъектов имеет несущественное проявление выделенного фактора.
Методика визуализации информации об обстановке по данным финансового мониторинга
В финансовом мониторинге осуществляется визуализация информации об обстановке в регионах России в целях принятия решений. Это позволяет вырабатывать предложения нормативного, организационного и оперативного характера. Автором предложена методика, позволяющая автоматизировать процесс формирования рейтинговых обстановки в Федеральных округах для формирования карт обстановки. На вход в качестве исходных данных требуется подать матрицу, содержащую агрегированные статистические данные о деятельности субъектов в субъектах Федерации в Федеральном округе (табл. 4.3). Схема методики представлена на рис 4.3. Рассмотрим применение методики для решения задачи визуализации информации об обстановке в области биоресурсов в Дальневосточном Федеральном округе. За базис признаков взят предложенный в главе 1 набор. Интерпретация главных компонент, полученных при выполнении алгоритма, позволили сделать вывод о том, что для оценки обстановки целесообразно использовать первую главную компоненту. Практически вся вариация (около 97%) объясняется тремя главными компонентами (рис. 4.4). Остальными главными компонентами (ГК4-ГК13) можно пренебречь, поскольку их суммарный вклад в общую дисперсию изменения признаков около 3%.
Анализ этой матрицы позволяет интерпретировать смысл первой главной компоненты, поскольку именно она практически исчерпывающе характеризуют обстановку в области биоресурсов по субъектам Федерации. В частности, в первую главную компоненту положительный вклад в порядке убывания вносят х5, х13, х4, х7 и др.
Из этого следует, что первая главная компонента характеризует вклад показателей объём финансовых транзакций, которые могут сопровождать деятельность девиантных субъектов. Эта матрица используется также для расчета главной компоненты для каждого из исходных признаков. Иными словами, максимальный вклад в составляющую девиантной деятельности при оценке обстановки вносит теневая деятельность руководителя и учредителя субъекта, а наименьший - получение субъектом денежных средств из-за рубежа, что объясняется внешнеэкономическими особенностями деятельности субъектов в результате экспортно-ориентированного характера экономики исследуемой области.
Обоснованность и внутренняя сходимость результатов этого исследования вытекает из возможности полного восстановления данных с помощью обратного преобразования полученных результатов.
Таким образом, при решении данной задачи определены ранги показателей по степени их влияния на составляющую девиантной деятельности при оценке обстановки в субъекте Федерации. Этот результат согласуется с физической сущностью явления. Действительно, увеличение теневых финансовых потоков руководителя и учредителя с иностранными государствами ведет к уклонению от контроля экспортируемых товаров и минимизации налогообложения прибыли, получаемой субъектами.
Из этого следует, что самым доступным механизмом минимизации составляющей девиантной деятельности в обстановке в субъектах Федерации в рамках исследуемой области является увеличение объёма денежных средств, совершаемых субъектом за счёт минимизации сомнительных финансовых потоков, совершаемых руководителем и учредителем. Интенсификация контроля за группой показателей трансграничных финансовых расчётов в области биоресурсов является основным показателем, на который следует ориентироваться для минимизации рисков отмывания доходов в области биоресурсов.
Выше было показано, что максимальный вклад в дисперсию изменения показателей обстановки вносит первая главная компонента. В рамках данной работы в качестве меры информативности главных компонент выбраны (определены) их весовые коэффициенты. Очевидно, что чем большее значение принимает весовой коэффициент для того или иного субъекта Федерации, тем главная компонента является более информативной. В частности, предельным случаем, когда весовой коэффициент первой главной компоненты стремится к 100%, главная компонента обладает абсолютной информативностью. Следует отметить и другой предельный случай, что величина первой главной компоненты не может быть равна нулю в силу принципиальных особенностей метода главных компонент. Значение информативности первой главной компоненты минимально при максимальной энтропии (мере неопределенности) показателей оценки обстановки. В этом случае значение весовых коэффициентов всех главных компонент равны.