Содержание к диссертации
Введение
Глава 1. Особенности стратегического планирования социально-экономического развития региона 13
1.1. Методологические основы стратегического планирования регионального развития. 14
1.2. Качество жизни населения как стратегическая цель регионального развития 22
1.3. Концепция интегрального индикатора качества жизни 40
1.4. Оценка показателей качества жизни как инструментов для принятия управленческих решений 47
Выводы 53
Глава 2. Определение приоритетов социально-экономического развития региона Российской Федерации 54
2.1. Общая схема определения приоритетов социально-экономического развития региона 54
2.2. Описание методики построения интегрального индикатора качества жизни 58
2.3. Определение проблемных факторов социально-экономического развития региона... 67
2.4. Определение факторов, наиболее значимо влияющих на качество жизни населения региона 70
2.5. Определение приоритетов социально-экономического развития региона 74
Выводы 76
Глава 3. Обобщенный метод А-средних как процедура типологизации регионов 77
3.1. Меры близости объектов, используемые в задачах классификации 78
3.2. Классический метод ^-средних с неизвестным числом классов 83
3.3. Основные недостатки классического метода-средних 86
3.4. Обобщенный метод Аг-средних с неизвестным числом классов 87
3.5. Классификация регионов РФ по показателям интегральных категорий качества жизни 95
Выводы 102
Глава 4. Экспериментальная апробация методики определения приоритетов социально-экономического развития региона в рамках процесса стратегического планирования развития Пермской области .104
4.1. Определение проблемных факторов социально-экономического развития Пермской области 104
4.2. Определение значимых факторов социально-экономического развития Пермской области 107
4.3. Определение перечня приоритетов социально-экономического развития Пермской области 119
Выводы 120
Заключение 121
Библиография
- Качество жизни населения как стратегическая цель регионального развития
- Оценка показателей качества жизни как инструментов для принятия управленческих решений
- Определение проблемных факторов социально-экономического развития региона...
- Обобщенный метод Аг-средних с неизвестным числом классов
Введение к работе
Актуальность темы исследования. В современных условиях устойчивое социально-экономическое развитие региона невозможно без существования приоритетов государственной политики. В связи с этим выявление и обоснование приоритетов являются ключевыми элементами стратегического управления развитием региона.
В настоящее время во многих развитых странах системы стратегического планирования закреплены на законодательном уровне как важнейшее направление повышения эффективности работы государственного сектора. В России вследствие относительной политической и социально-экономической стабилизации в последнее время также начинают применяться принципы стратегического управления в государственном секторе. В то же время в мировой и отечественной практике установление приоритетов развития в большинстве случаев является предметом политического усмотрения или торга.
Такой подход характеризуется большой долей субъективизма (в определенных случаях является популистским инструментом) и не гарантирует точность и оптимальность выбора приоритетных направлений. В предложенной работе представлен формализованный подход к решению задачи определения приоритетов, позволяющий на основе анализа объективных данных выявить приоритеты социально-экономического развития региона и положить их в основу стратегического планирования развития.
Необходимость повышения эффективности принятия решений в вопросе формирования приоритетов развития и создания систем поддержки принятия таких решений подтверждает актуальность настоящего исследования.
Область исследования соответствует требованиям паспорта специальности ВАК 08.00.13 - Математические и инструментальные
методы экономики (1.1. Разработка и развитие математического аппарата
анализа экономических систем: математической экономики, эконометрики,
прикладной статистики, теории игр, оптимизации, теории принятия
решений, дискретной математики и других методов, используемых в
экономико-математическом моделировании; 1.9. Разработка и развитие
математических методов и моделей анализа и прогнозирования развития
социально-экономических процессов общественной жизни:
демографических процессов, рынка труда и занятости населения, качества жизни населения и др.; 2.3. Разработка систем поддержки принятия решений для рационализации организационных структур и оптимизации управления экономикой на всех уровнях; 2.4. Разработка систем поддержки принятия решений для обоснования общегосударственных программ в областях: социальной; финансовой; экологической политики).
Цели и задачи исследования. Целью исследования является создание методики определения приоритетов социально-экономического развития региона, включая разработку специальной математической процедуры типологизации регионов (обобщенного метода ^-средних), и экспериментальная апробация предложенной методики в рамках процесса стратегического планирования развития Пермской области.
Для достижения поставленной цели необходимо решить следующие задачи:
проанализировать существующие в мировой практике подходы к стратегическому планированию и определению приоритетов социально-экономического развития региона;
предложить теоретическую базу для определения критериев качества стратегического планирования социально-экономического развития региона;
разработать методику определения приоритетов социально-экономического развития региона, основанную на понятиях
проблемносте и значимости анализируемых социально-экономических показателей;
с целью решения задачи типологизации анализируемых регионов обобщить известную процедуру кластерного анализа - метод к-средних на случай неизвестного числа классов и использование в ней адаптивной метрики;
провести экспериментальную апробацию предложенной методики в рамках процесса стратегического планирования развития Пермской области.
Объект и предмет исследования. Объектом исследования является регион Российской Федерации.
Предметом исследования является процедура установления среднесрочных приоритетов социально-экономического развития в рамках процесса стратегического планирования развития региона.
Теоретическая и информационная база исследования. При проведении исследования использовались работы российских и зарубежных авторов по теории государственного управления и общественного выбора, планирования социально-экономического развития, концепции нового государственного управления. Кроме того, автором учитывались нормативно-правовые акты федеральных органов власти и органов исполнительной власти Пермской области, публикации в периодических изданиях, документы органов власти исследуемых стран. Значительную базу исследования составляют документы международных и российских организаций, занимающихся проблемами государственного управления и социально-экономического развития, таких как Всемирный Банк, Международный валютный фонд, Программа развития Организации Объединенных Наций. В работе использовались результаты научно-исследовательских работ, выполненных Центральным экономико-математическим институтом Российской академии наук, Институтом
проблем государственного и муниципального управления Государственного университета - Высшей школы экономики и Центром прикладной экономики Пермского филиала Государственного университета - Высшей школы экономики по заказам Министерства экономического развития и торговли РФ, Администраций Пермской и Самарской областей.
Степень разработанности проблемы. Вопросам планирования социально-экономического развития посвящено большое число научных работ в области социально-экономического развития региона и экономики общественного сектора. Классическими трудами, описывающими подходы к решению данной проблемы, являются работы А.Аткинсона, Дж.Стиглица, Р.Масгрейва, П.Масгрейва, А.Пигу, П.Дасгупты и др.
Проблемам стратегического планирования определения векторов развития региона посвящено значительное количество научных работ и положений теорий качества жизни, социально-экономического развития и общественных финансов. Так, А.Сен, Р.Лейн, Т.Скалтон, Д.Моррис и др. использовали в качестве критериев эффективности принятия решений в вопросе социально-экономического развития региона качество жизни населения. Математический инструментарий, применяемый для оценки интегральных показателей качества жизни, предложен в работах С.А.Айвазяна, В.В.Коссова, Дж.Миклерайта. Проблема разработки приоритетов развития региона в рамках концепции нового государственного управления рассматривается в исследованиях С.Прадхана, Р.Аллана и Д.Томасси.
При разработке стратегии социально-экономического развития региона принимается во внимание опыт других регионов, сопоставимых по уровню социально-экономического развития. Поэтому одним из начальных этапов стратегического планирования является типологизация регионов, которая может осуществляться с помощью процедур кластерного анализа. Разработке и анализу свойств процедур кластерного анализа посвящены
труды Кронбаха и Глесера, Снита и Сокала, Алдендерфера и Блашфилда, Джаккарда, МакКвина. Систематизация и анализ кластерного инструментария проводятся в работах С.А.Айвазяна и др.
Научная новизна исследования. Основные результаты, определяющие научную новизну работы, заключаются в следующем.
Автором предложен механизм выявления приоритетов социально-экономического развития региона, основанный на анализе проблемности и значимости факторов качества жизни населения региона.
В работе осуществлено построение и исследование обобщенного метода кластерного анализа ^-средних с неизвестным числом классов с учетом идеи адаптивной метрики махаланобисского типа и динамически определяемых мер однородности классов и аномальности наблюдений (общая схема алгоритма предложена проф. С.А.Айвазяном).
В диссертационном исследовании обосновано использование интегрального индикатора качества жизни, разработанного проф. С.А.Айвазяном, как целевого показателя при разработке приоритетов социально-экономического развития региона.
Практическая значимость исследования. Построенный автором обобщенный метод ^-средних может быть реализован и включен в качестве специального модуля в интегрированные статистические и эконометрические пакеты прикладных программ.
Предложенный механизм определения приоритетов социально-экономического развития региона может быть использован (результаты его применения уже использовались в 2005-2006 гг. администрациями Пермской и Самарской областей) при формировании системы стратегического планирования развития субъектов Российской Федерации и их муниципальных образований.
Положения диссертационного исследования могут быть использованы в учебном процессе при разработке курсов по региональной экономике, государственному и муниципальному управлению.
Апробация и внедрение результатов исследования. Результаты и положения диссертационного исследования использовались в научно-исследовательской работе «Внедрение системы целеполагания и оценки деятельности администрации и органов исполнительной власти Пермской области», проведенной по заказу Аппарата администрации Пермской области в 2004-2005гг., а также научно-исследовательской работе «Разработка интегрального показателя, отражающего основные тенденции динамики качества жизни населения Самарской области», выполненной по заказу Правительства Самарской области в 2005 г.
Выводы, связанные с оценкой значимости социально-экономических факторов, использовались в виде консультационно-методических рекомендаций для Администрации Пермской области при экспериментальном внедрении Методики определения эффективности оказания бюджетных услуг1.
Часть результатов диссертационной работы легла в основу научно-исследовательской работы по теме «Проведение экспериментов и осуществление пилотных проектов по применению новых подходов к организации государственной службы и обеспечению деятельности государственных гражданских служащих в Пермской области», проводимой по заказу Министерства экономического развития и торговли РФ.
Кроме того, результаты исследования использовались при выполнении научных исследований по заказу Администрации Пермской области на разработку системы целеполагания в исполнительных органах
Утверждена Указом губернатора от 30.06.04 № 93 «Об утверждении Методики определения эффективности оказания бюджетных услуг и мерах по ее внедрению в практику бюджетного планирования и исполнения бюджета Пермской области».
власти Пермской области, которая строилась на основе двух последовательных процессов: 1) установления долгосрочных и среднесрочных приоритетов развития области, формально выражавшихся в виде межведомственных целевых заданий, и 2) их последующей декомпозиции до уровня оперативного управления, имеющей на уровне отдельных исполнительных органов государственной власти и структурных подразделений аппарата администрации форму докладов об ожидаемых результатах. Результаты диссертационного исследования были включены в общую модель системы целеполагания Пермской области.
Научно-исследовательские материалы были одобрены Институтом проблем государственного и муниципального управления ГУ-ВШЭ как ведущим исполнителем работ Министерства экономического развития и торговли и Администрации Президента РФ по вопросам стратегического планирования и управления в органах власти и согласованы с Администрацией Пермской области , являвшейся заказчиком научно-исследовательской работы.
Апробация результатов на основе данных по Пермской области позволила определить приоритеты развития области на среднесрочную перспективу. В рамках реализации смежного пилотного проекта по внедрению сводных докладов об ожидаемых результатах (СДОР) выделенные приоритеты были декомпозированы до оперативного уровня.
Публикации. По теме диссертации автором было подготовлено 5 публикаций общим объемом 1,9 п.л.
Объем и структура диссертации. Диссертация построена в соответствии с целью и задачами исследования и состоит из введения, четырех глав, заключения, библиографии, двух приложений, изложена на
2 В числе согласующих сторон Администрации Пермской области были Главное управление экономики, Главное управление финансов и налоговой политики, Комитет по развитию системы государственного управления.
164 страницах, содержит 6 рисунков и 13 таблиц. Список использованных источников включает 118 наименований.
Во введении обосновываются актуальность, цели и структура диссертации по проблеме разработки приоритетов социально-экономического развития.
В первой главе приводится обзор подходов к планированию социально-экономического развития региона и методов комплексной оценки состояния региона. На основе анализа ряда показателей качества жизни обосновывается выбор интегрального индикатора качества жизни (разработанного проф. С.А.Айвазяном в ЦЭМИ РАН) в качестве инструмента определения приоритетности аспекта социально-экономического развития.
Во второй главе предлагается схема выявления приоритетов социально-экономического развития региона с помощью определения проблемных и значимых факторов развития. Проблемность социально-экономических аспектов устанавливается на основе анализа автодинамики и сравнительной динамики показателей социально-экономического развития. Значимость социально-экономических аспектов определяется на основе анализа интегрального индикатора качества жизни, предложенного проф. С.А.Айвазяном.
В третьей главе осуществляется построение, исследование свойств и апробация кластерной процедуры, основанной на методе ^-средних с неизвестным числом классов. Обобщенная процедура кластеризации позволяет устранить часть недостатков классического метода, таких как игнорирование различий в масштабе шкал, игнорирование корреляционных зависимостей между анализируемыми признаками, а также чисто эвристический характер выбора значений свободных параметров процедуры - так называемых «мер точности и грубости». С помощью предложенного метода осуществляется типологизация регионов РФ для
проведения сравнительного анализа и выявления проблемных факторов социально-экономического развития.
В четвертой главе описываются результаты апробации предложенной методики определения приоритетов для Пермской области.
В заключении диссертационной работы сформулированы основные выводы исследования, а также представлены теоретические и практические результаты проведенного исследования.
Качество жизни населения как стратегическая цель регионального развития
Многочисленная группа исследователей полагает, что, поскольку конечной целью существования государственного института является повышение качества жизни населения3, именно этот критерий следует заложить в основу процесса стратегического планирования социально-экономического развития региона. Достоинство этого измерителя состоит в том, что он не так существенно зависит от субъективных оценок, личных взаимоотношений и общественного поведения, позволяя измерить прогресс, не базируясь на личной оценке потребителей. Такой подход логично вписывается в концепцию стратегического планирования. Заявление о стремлении к повышению уровня жизни в качестве верхней ступени стратегического плана позволит организовать систему управления в исполнительных органах власти, ориентируя ее не на стремление к достижению определенных показателей, а на достижение поставленных целей. Ориентация на повышение качества жизни является вполне оправданной, поскольку среди исследователей государственных институтов редко можно встретить мнение о существовании иной приоритетной цели функционирования государственных органов власти.
Основной проблемой в рамках концепции является то, что качество жизни является многокритериальным показателем, который сложно измерить. Мнения исследователей расходятся при определении самого понятия качества жизни и его составляющих, а также возможностей измерения. Вместе с тем этот индикатор, очевидно, удобен тем, что позволяет постоянно отслеживать направление и интенсивность движения на пути к достижению ключевой цели, а также связывать тактические планы со стратегическими направлениями деятельности, координируя таким образом процессы долгосрочного и краткосрочного планирования.
Оценивая представленные выше концепции с точки зрения целесообразности их применения в системе стратегического планирования, следует отметить, что система сбалансированных показателей и качество жизни населения являются наиболее приемлемыми подходами к разработке показателей результативности. Вместе с тем важным является тот факт, что эти концепции не противоречат, а скорее дополняют друг друга, нейтрализуя слабые места. Это создает возможность построения некоторой синтезированной модели на основании представленных подходов. На самом деле, концепция качества жизни привлекательна с точки зрения стратегического планирования тем, что позволяет поставить на вершину иерархии целей качество жизни населения как цель, ориентированную на удовлетворение заинтересованных групп, следовательно, определяемую самим назначением государственных институтов. Кроме того, она дает возможность решения основной проблемы, возникающей при применении сбалансированной системы показателей, - определения значимости каждого из направлений деятельности. Вместе с тем сбалансированная система показателей может использоваться на более низкой ступени стратегического планирования как инструмент для установления показателей результативности.
При использовании концепции качества жизни в роли ориентира для построения иерархии целей в системе регионального стратегического планирования необходимо решить проблему, связанную с выбором наиболее приемлемой с точки зрения принятия управленческих решений концепции качества жизни.
Обширные исследования, посвященные изучению качества жизни, ведутся с середины 60-х гг. XX века. Однако вопрос о содержании и структуре понятия «качество жизни» остается дискуссионным и в настоящее время. Одни связывают его с понятиями уровня, стиля или образа жизни; другие - с объективными факторами, такими, как качество окружающей среды, количество стрессовых ситуаций и др. Такой плюрализм обусловливается, во-первых, неоднозначностью понятия качества жизни конкретного индивида, во-вторых, еще большей неопределенностью понятия качества жизни социальной группы. Существует множество теорий, позволяющих оценить качество жизни индивида, выдвигающих на первый план различные аспекты жизни индивида (счастье, здоровье, возможность вести достойный образ жизни). При этом нет устоявшегося мнения о том, с каких позиций должно рассматриваться качество жизни.
Существует по крайней мере три основных подхода к объяснению понятия уровня жизни человека.
Первый (утилитаристский) подход состоит в том, что уровень жизни рассматривается как некое понятие полезности, получаемой человеком в течение жизни.
Сторонники второго подхода, объединяющего теории экономического благосостояния, отождествляют понятие качества жизни с понятием богатства. Родоначальником этого подхода можно считать Адама Смита. Он рассматривал две задачи политической экономии: обеспечение обильного государственного дохода или средств существования людей и обеспечение государства доходом, достаточным для осуществления публичных функций (предоставления общественных благ).
Оценка показателей качества жизни как инструментов для принятия управленческих решений
Для определения критериев оценки показателей качества жизни с точки зрения возможности их использования органами государственной власти при разработке стратегий социально-экономического развития рядом исследователей [69] была использована процедура Дельфи, применение которой позволило выделить 14 критериев.
1. Показатель качества жизни должен иметь ясную практическую значимость, быть полезным при разработке социально-экономической политики органов власти. Работа Е.Динера [57], например, была сфокусирована на теории построения, а не на «практической значимости» показателей. В то же время в работе К.Лэнда [81] подчеркивается, что показатели качества жизни должны «помогать» общественной политике.
2. Индекс должен способствовать органам государственной власти разрабатывать и оценивать программы развития на всех уровнях агрегирования. Агрегирование начинается с индивидуального уровня (например, медик или адвокат помогает гражданам) и продолжается на уровне семьи или домохозяйства (например, социальный работник помогает нуждающейся семье), уровне сообщества (например, городские власти разрабатывают программы, которые позволяют улучшить качество жизни городского сообщества), региональном уровне (например, региональные власти внедряют программы, которые повлияют на жителей целого региона), уровне страны (например, национальные правительства разрабатывают политику, влияющую на жизнь всех граждан страны) и на интернациональном уровне (например, наднациональные организации разрабатывают программы, которые повлияют на ситуацию во всем мире).
3. Индекс должен строиться на временных данных, что позволит проводить периодический контроль и мониторинг. Лэнд подчеркивает, что этот критерий является ключевым, так как позволяет оценить деятельность органов исполнительной власти, выяснить, улучшаются или ухудшаются условия жизни целевой аудитории, а также спрогнозировать будущую динамику условий жизни целевой аудитории [81].
4. Индекс должен быть основан на проработанной теории, прошедшей эмпирическую проверку. Применительно к задачам государственного управления причинно-следственные связи и промежуточные переменные, с помощью которых «управляющие» переменные будут влиять на различные аспекты качества жизни, должны быть специфицированы, с тем чтобы государственные органы могли предсказать эффект от реализации новых программ.
5. Компоненты индекса должны быть надежными, обоснованными и чувствительными (индекс должен отражать изменения, вызванные влиянием на компоненту индекса государственной политики).
6. Индекс должен представляться как скаляр, но должен иметь возможность быть декомпозированным на составляющие его компоненты. Следует отметить, что этот критерий («критерий одного числа») вызвал много споров среди экспертов. Аргументы большинства исследователей заключались в том, что скаляр продемонстрирует гражданам и органам власти улучшение или ухудшение качества жизни. В то же время часть исследователей утверждала, что концептуальные проблемы интегрирования индекса качества жизни в один показатель слишком значимы, что веса для интегрирования показателей сильно варьируются среди людей и что большинство интервенций государственной политики попросту сведутся к отслеживанию компонент качества жизни. А.Микалос обозначил основные проблемы построения одноразмерных индексов.
7. Агрегированные в один показатель категории качества жизни должны полностью описывать качество жизни. Если качество жизни сегментируется на отдельные, составляющие ее категории, то эти категории «в сумме» должны отображать всю конструкцию. Один из простых способов проверки этого условия - построение регрессионной модели зависимости показателя качества жизни от категорий качества жизни, представляемых агрегированными показателями соответствующей категории качества жизни. Если категории качества жизни действительно «полностью характеризуют качество жизни», то следует ожидать значимых регрессионных коэффициентов.
8. Каждая категория качества жизни должна представлять существенный, но отдельный аспект качества жизни. Количество возможных категорий бесконечно, если рассматривать каждый аспект качества жизни как предполагаемую категорию качества жизни. Таким образом, необходимы «расчетливость и бережливость», чтобы определить небольшое количество категорий, которые бы удовлетворяли критерию 7. Достаточность количества категорий можно проверить путем вычисления общей дисперсии между категориями или, что более адекватно, долей дисперсии каждой категории в общей дисперсии показателя качества жизни.
Определение проблемных факторов социально-экономического развития региона...
Определение проблемных факторов социально-экономического развития региона должно основываться, с одной стороны, на анализе динамики социально-экономических показателей области, с другой стороны, на анализе положения региона относительно других регионов, имеющих сопоставимый уровень социально-экономического развития. Таким образом, можно предполагать, что отрицательная динамика показателя относительно своего прошлого значения и одновременное ухудшение положения региона по определенному показателю относительно сопоставимых регионов сигнализируют о наличии так называемой проблемной области общественной жизни. Это позволяет использовать динамику показателей для выявления приоритетности сфер общественной жизни с точки зрения необходимости воздействия на него государственной политики.
Другими словами, ухудшение положения региона по показателю относительно своих достигнутых значений в прошлом и относительно сопоставимых регионов означает высокую степень приоритетности рассматриваемого показателя с точки зрения существования необходимости и возможности его изменения. В обратном случае устойчивое улучшение значения показателя относительно прошлых значений показателя сопоставимых регионов, говорит в общем случае лишь о необходимости поддерживать текущую тенденцию. Вместе с тем необходимо отметить, что ранжирование показателей в разрезе всех регионов РФ может не дать адекватной оценки в связи с существенными различиями в социально-экономическом положении регионов. Таким образом, ранжирование показателей происходит среди регионов, сопоставимых с целевым регионом по уровню социально-экономического развития. В связи с этим возникает задача предварительной типологизации регионов. Одним из подходов к решению этой задачи является использование кластерных процедур. В частности, для определения однородных групп регионов может использоваться процедура кластерного анализа - метод -средних с адаптивной метрикой махаланобисского типа, предложенный в главе 3 настоящей работы. Кластеризация регионов осуществляется в пространстве апостериорного набора показателей модели ИИКЖ. Использование апостериорного набора показателей позволяет провести кластеризацию в пространстве сравнительно небольшой размерности, достаточно полно характеризующем качество жизни в регионах.
Согласно приведенной выше логике, показатели разбиваются на четыре группы проблемности (см. таблицу 2.1), в соответствии со следующим алгоритмом.
1. В первую группу попадают показатели, значение которых ухудшается относительно значений предыдущих периодов и значений в рейтинге других регионов (первый класс проблемности).
2. Во вторую группу попадают показатели, значение которых ухудшается относительно других регионов и улучшается или остается на прежнем уровне относительно значений предыдущих периодов (второй класс проблемности).
3. В третью группу попадают показатели, значение которых ухудшается относительно предыдущих значений, но улучшается или остается на прежнем уровне относительно рейтинга других регионов (третий класс проблемности).
4. В четвертую группу попадают показатели, значение которых улучшается и относительно предыдущих значений, и в рейтинге регионов (четвертый класс проблемности).
Таким образом, первая группа содержит наиболее проблемные показатели, то есть показатели, значения которых должны быть «улучшены» в первую очередь. Четвертая группа является наименее проблемной с точки зрения значений показателей.
Определение позиции в матрице проблемности факторов происходит по следующему алгоритму.
1. Определяется динамика изменения значения среднесрочных показателей региона. Определение состояния «ухудшения» или «улучшения» значения показателей осуществляется на основе анализа динамики скользящей средней: средней за текущий год и два предыдущих и средней за три года, предшествующих текущему (окно в три года соответствует сроку, на который устанавливаются показатели).
2. Составляется рейтинг регионов по показателям. Критерием «улучшения» или «ухудшения» является повышение или снижение рейтинга региона соответственно, составленного на основании скользящих средних показателей.
Обобщенный метод Аг-средних с неизвестным числом классов
В этом разделе осуществляется построение и исследование модификации метода -средних при неизвестном числе классов, общая схема которой предложена проф. С.А. Айвазяном. Этот метод не обладает указанными выше недостатками, присущими «классическому» методу, потому что, во-первых, в модифицированном методе используется адаптивная метрика Махаланобиса, во-вторых, меры точности и грубости (аномальности наблюдения и однородности классов) рассчитываются в алгоритме динамически.
Далее предполагается, что генеральная совокупность, из которой извлечены объекты, представляет собой смесь многомерных нормальных распределений с различными математическими ожиданиями и одинаковыми ковариационными матрицами. В процедуре кластеризации используется адаптивная метрика Махаланобиса. Классы, которые образуются в результате выполнения процедуры, обозначаются {S.}, і = 1,2,...,к, где к - число классов. Класс 5, характеризуется двумя величинами: центром (вектор размерности/?) е, ={eiti,ei2,...,e.p)T и весом w(. (скаляр). Центр класса характеризует «центр тяжести» наблюдений, отнесенных к соответствующему кластеру, а вес класса определяет количество таких наблюдений. Алгоритм кластеризации определяется следующей последовательностью действий.
1. Задается некое число классов к0. Из выборочной совокупности извлекается к0 точек9, и эти точки объявляются центрами классов. Вес каждого класса устанавливается равным единице: [w, =1, i = \,k.
2. Выполняется процедура проверки однородности классов. Для этого рассчитываются расстояния между каждой парой классов по формуле: dis S - k-eJ kjiet-e;), (3.1) п.+п.
При этом могут быть извлечены первые к0 точек выборки, либо из выборки случайным образом могут быть извлечены кй точек. где пк, еки 2(/,у) соответственно количество точек, попавших в класс Sk, центр тяжести этого класса и совместная ковариационная матрица классов S. и Sj . Величины {пк} и fc(i,j)} рассчитываются на основе «минимального дистанционного разбиения»10. После этого расстояние между двумя ближайшими классами (в смысле указанной метрики) сравнивается с мерой однородности классов: (п. +п,. -2)р c0(SltSj)= FAP +nj-p-l), (3.2) Пі+n.-p-l где Fa{vvv2) - ІООаг - процентная точка F-распределения с v, и v2 степенями свободы числителя и знаменателя соответственно.
Если расстояние между ближайшими классами оказывается меньше c0(S.,Sj), то соответствующие классы объединяются, т.е. эти два класса 5,. и Sj удаляются и формируется новый класс Sk со следующими характеристиками: w .+w.ej ek=— W. + Wj W. =W; +W..
Процедура объединения классов повторяется до тех пор, пока расстояние между любыми двумя классами не будет превышать меру однородности классов с0 (S., S.). После объединения классов мы имеем к[ к0 классов. 3. Из выборочной совокупности извлекается очередная точка X и вычисляется расстояние от этой точки до каждого из классов по формуле и определяется ближайший до рассматриваемой точки в смысле указанной метрики класс S. . После этого расстояние до ближайшего класса сравнивается с мерой аномальности наблюдения: ,( ,) = 7. -/О- (3.4)
Если расстояние до ближайшего класса превышает величину ,( ,.), то рассматриваемая точка объявляется центром нового класса с весом, равным единице. Если же минимальное расстояние не превышает меру аномальности, то рассматриваемая точка присоединяется к ближайшему классу S., при этом характеристики этого класса пересчитываются по следующим формулам: 1 (ще,+Х) Є w,+\ W. = W, +1 Параметры других классов при этом не изменяются.
После этого алгоритм повторяется с шага 2, то есть производится процедура объединения близких классов с использованием меры однородности классов. Объекты поочередно рассматриваются до тех пор, пока не закончится выборка.
Для определения величин \пк) и {(/)}, используемых при расчете расстояний между парами классов, классом и точкой, а также при вычислении мер однородности классов и аномальности наблюдения, осуществляется процедура минимального дистанционного разбиения. Эта процедура заключается в разбиении всей выборочной совокупности наблюдений на классы с центрами, определенными на момент выполнения процедуры.