Содержание к диссертации
Введение
1. Анализ методов диагностики и стоимостной оценки минералов. пути повышения их качества .
1.1.. Актуальность использования компьютерных технологий в геммологическом исследовании 9
1.2. Анализ свойств минералов и методов их диагностики 10
1.3. Анализ особенностей ценообразования и определения стоимостной оценки минералов 31
1.4. Декомпозиция задачи геммологического исследования и ее формализация 43
1.5. Обзор математических методов диагностики, классификации и аппроксимации применительно к решаемой задаче 49
1.6. Выводы по главе 56
2. Модели и алгоритмы диагностики и стоимостной оценки минералов . 58
2.1. Многоэтапный алгоритм диагностики прозрачных минералов 58
2.2. Многоэтапный алгоритм диагностики непрозрачных минералов. 63
2.3. Исследование нейросетевых моделей процедур кластеризации минералов при их стоимостной оценке 73
2.4. Исследование нейросетевых моделей классификации минералов при их стоимостной оценке 82
2.5. Исследование нейросетевых моделей процедур аппроксимации стоимостных характеристик минералов 96
2.6. Выводы по главе 98
3. Архитектура интеллектуальной информационной системы и методика ее использования 100
3.1. Описание функций и структуры ИИС 100
3.2. Методические аспекты обучения нейронных сетей ИИС 104
3.3 Результаты моделирования
- Актуальность использования компьютерных технологий в геммологическом исследовании
- Обзор математических методов диагностики, классификации и аппроксимации применительно к решаемой задаче
- Многоэтапный алгоритм диагностики прозрачных минералов
- Описание функций и структуры ИИС
Введение к работе
Применение новых информационных технологий для поддержки различного рода задач принятия решений в ювелирной промышленности является важным фактором повышения ее эффективности. Одной из таких является задача диагностики и стоимостной оценки ювелирных (драгоценных и полудрагоценных) камней - задача геммологического исследования. Качество принимаемых в процессе геммологического исследования решений существенно влияет на эффективность операций по покупке и продаже ювелирных камней. Ошибка на каждом этапе этого процесса может обернуться риском потерь: при покупке — за счет переплаты из—за неверной диагностики или неверной оценки их стоимости, при продаже — за счет недополучения доходов по тем же причинам. Чтобы снизить риск возможных потерь необходимо иметь нормативную базу достаточную для проведения точной диагностики объекта и постоянно проводить тщательный анализ рынка ювелирных камней. При анализе имеющейся информации эксперт (авторизованный оценщик) должен сделать определенные выводы о совершенных ранее продажах, о свойствах проданных объектов, а также о характеристиках, которые могут влиять на изменение их стоимости. Правильность заключения, которое делает эксперт, зависит от его знаний, опыта, квалификации и той информации, которой он располагает по предыдущим продажам.
Существующие методики диагностики и стоимостной оценки ювелирных камней не позволяют провести формальный комплексный анализ, использующий всю доступную информацию, основанную на знаниях о предыдущих продажах. Это объясняется отсутствием моделей представления этих знаний, механизмов извлечения новых знаний, большим объемом обрабатываемой информации и постоянным ее нарастанием. Однако существующие методики могут служить основой для разработки таких моделей и создания на их основе интеллектуальной информационной системы
5 диагностики и стоимостной оценки ювелирных камней, позволяющей, путем обработки больших массивов информации, вырабатывать более качественные решения. Такая система, основанная на знаниях многих экспертов, может служить с одной стороны в качестве советующей системы при принятии решений экспертами, а с другой стороны — в качестве обучающей системы при подготовке авторизованных оценщиков ювелирных камней.
Важным и интенсивно развивающимся направлением искусственного интеллекта является построение компьютерных моделей эксперта, способных близко имитировать поведение специалиста при решении сложных практических задач. Подобные системы позволяют сохранять и воспроизводить знания опытного профессионала.
Во многих практически важных случаях задача создания компьютерной модели опытного специалиста может быть представлена как задача классификации, так как экспертное знание часто состоит в отнесении объектов к классам решений. Таким образом, данное исследование, направленное на разработку математических моделей и методики построения интеллектуальной информационной системы диагностики и стоимостной оценки ювелирных камней, является актуальным.
Цель диссертационной работы состоит в обеспечении более высокого качества принимаемых решений при диагностике и стоимостной оценке ювелирных камней и повышения их эффективности за счет использования интеллектуальной информационной системы.
Научная задача диссертации заключается в разработке математических моделей, алгоритмов и архитектуры интеллектуальной информационной системы диагностики и стоимостной оценки ювелирных камней
Для решения поставленной научной задачи в диссертации проведены:
Декомпозиция задачи диагностики и стоимостной оценки ювелирных камней в процессе геммологического исследования;
Анализ и классификация методов и показателей количественной оценки свойств минералов;
Разработка алгоритмов диагностики ювелирных камней;
Разработка и исследование нейросетевых моделей стоимостной оценки ювелирных камней;
Разработка архитектуры интеллектуальной информационной системы диагностики и стоимостной оценки ювелирных камней.
Методы исследования. В работе применялись методы теории принятия решений, системного анализа, искусственного интеллекта, искусственных нейронных сетей, численные методы решения экстремальных задач, статистического анализа, инженерии знаний и управления знаниями.
Научная „новизна положений и результатов диссертации определяется
*
следующим:
На основе отношения доминирования на множестве шкал критериев, используемых для оценки минералов, предложен принцип декомпозиции исходной задачи в виде набора отображений, определяющих последовательность геммалогической экспертизы;
Разработан и экспериментально проверен алгоритм многоступенчатой компьютерной диагностики прозрачных минералов, основанный на последовательном сравнении оптических свойств минералов и их рентгеновских спектров, с учетом интервального характера эталонного спектра и погрешности измерения;
Разработан и экспериментально проверен алгоритм многоступенчатой компьютерной диагностики непрозрачных минералов, основанный на последовательном сравнении оптических свойств минералов, микротвердости, качественного химического состава и их рентгеновских спектров, с учетом интервального характера эталонного спектра и погрешности измерения;
Разработаны и исследованы нейросетевые модели для проведения стоимостной оценки минералов в соответствии с предложенной схемой декомпозиции задачи геммологического исследования, определена их оптимальная структура;
Предложена архитектура интеллектуальной информационной системы, базирующейся на использовании информации об основных показателях качества ювелирных минералов, и включающую разработанные алгоритмы и модели в качестве инструментария для проведения комплексного геммологического исследования стоимостной оценки
Достоверность и обоснованность работы подтверждена проведенными теоретическими исследованиями, а также результатами практического использования разработанной методики.
Практическая значимость работы. В результате проведенных в рамках данной диссертационной работы исследований сформирована алгоритмическая и методическая основа компьютерной диагностики и стоимостной оценки минералов на методов искусственного интеллекта. Разработан программный комплекс, реализующий алгоритмы и модели комплексной оценки минералов в процессе геммалогического исследования ювелирных камней и обеспечивающий эффективное решение задач их диагностики и стоимостной оценки.
Использование программного комплекса позволяет повысить эффективность и оперативность принимаемых решений и снизить риск возможных потерь.
Внедрение результатов работы. Разработанные модели, алгоритмы и программное обеспечение, а также методика его использования внедрены в ООО «Тверьгеологоразведка».
Апробация работы. Основные положения и результаты, полученные в диссертации, докладывались и обсуждались на следующих научных конференциях и семинарах; Международная научно-техническая конференция
8 "Компьютерные технологии в управлении, диагностике и образовании" (3-5 декабря, Тверь, ТГТУ. 2002 г.); 3-я Международная научно-техническая конференция "Современные сложные системы управления - HTCS" (26 — 28 мая, Воронеж, ВГСУ, 2003 г.); Международная научно-техническая конференция ";40 лет биотехнических систем", (12 - 15 марта ЛЭТИ, С.Петербург, 2004 г.); 4-я Международная научно-техническая конференция "Современные сложные системы управления - HTCS" (24 - 27 мая, Тверь, ТГТУ,2004 г.).
Публикации. По результатам исследования опубликовано 7 печатных работ.
Диссертационная работа изложена на 126 страницах и включает в себя введение, три главы основного материала, заключение, приложения, библиографический список из 97 наименований.
Актуальность использования компьютерных технологий в геммологическом исследовании
Применение новых информационных технологий для поддержки различного рода задач принятия решений в ювелирной промышленности является важным фактором повышения ее эффективности. Одной из таких является задача диагностики и стоимостной оценки ювелирных (драгоценных и полудрагоценных) камней - задача геммологического исследования. Качество принимаемых в процессе геммологического исследования решений существенно влияет на эффективность операций по покупке и продаже ювелирных камней. Ошибка на каждом этапе этого процесса может обернуться риском потерь: при покупке - за счет переплаты из-за неверной диагностики или неверной оценки их стоимости, при продаже - за счет недополучения доходов по тем же причинам. Чтобы снизить риск возможных потерь необходимо иметь нормативную базу достаточную для проведения точной диагностики объекта и постоянно проводить тщательный анализ рынка ювелирных камней. При анализе имеющейся информации эксперт (авторизованный оценщик) должен сделать определенные выводы о совершенных ранее продажах, о свойствах проданных объектов, а также о характеристиках, которые могут влиять на изменение их стоимости. Правильность заключения, которое делает эксперт, зависит от его знаний, опыта, квалификации и той информации, которой он располагает по предыдущим продажам.
Существующие методики диагностики и стоимостной оценки ювелирных камней не позволяют провести формальный комплексный анализ, использующий всю доступную информацию, основанную на знаниях о предыдущих продажах. Это объясняется отсутствием моделей представления этих знаний, механизмов извлечения новых знаний, большим объемом обрабатываемой информации и постоянным ее нарастанием. Однако существующие методики могут служить основой для разработки таких моделей и создания на их основе интеллектуальной информационной системы диагностики и стоимостной оценки ювелирных камней, позволяющей, путем ,. обработки больших массивов информации, вырабатывать более качественные решения. Такая система, основанная на знаниях многих экспертов, может служить с одной стороны в качестве советующей системы при принятии решений экспертами, а с другой стороны — в качестве обучающей системы при подготовке авторизованных оценщиков ювелирных камней.
Важным и интенсивно развивающимся направлением искусственного интеллекта является построение компьютерных моделей эксперта, способных близко имитировать поведение специалиста при решении сложных практических задач. Подобные системы позволяют сохранять и воспроизводить знания опытного профессионала. Во многих практически важных случаях задача создания компьютерной модели опытного специалиста может быть представлена как задача классификации, так как экспертное знание часто состоит в отнесении объектов к классам решений. Таким образом, данное исследование, направленное на разработку математических моделей и методики построения интеллектуальной информационной системы диагностики и стоимостной оценки ювелирных камней, является актуальным. Кристаллографические свойства. Многие свойства минералов определяются условиями их образования и внутренним строением, то есть структурой [7,19]. Из структуры минералов вытекают те свойства, которые служат внешним выражением их внутреннего строения, то есть особенности форм их кристаллов. Структурные и кристаллографические особенности взаимосвязаны с химическими и физическими свойствами и оказывают на них определенное влияние Механические свойства (твердость, спайность и плотность). Твердость для драгоценных камней является весьма важным свойством, так как в ювелирных изделиях они не должны изнашиваться. Различают твердость при шлифовке, при давлении и; при царапанье. Применительно к драгоценным камням представляет интерес, как правило, твердость при царапанье, которая оценивается по шкале Мооса и характеризует сопротивление, которое оказывают царапанью соответствующие минералы. Вследствие анизотропии кристаллов у отдельных минералов твердость в разных направлениях бывает резко отличной. Спайностью называют способность минерала легко раскалываться в одном или нескольких определенных направлениях, причем появляющиеся при этом более или менее многочисленные плоскости спайности имеют взаимно параллельную ориентировку. При давлении или ударе минералы с хорошей спайностью легко раскалываются. Плотность, или удельный вес, — масса 1 см3 данного вещества в граммах. Эта. величина является характерной постоянной минерала и широко используется при диагностике минералов. Камни одинаковых размеров, представленные разными минералами, которые сильно различаются по плотности, будут весьма существенно отличаться по массе, а вследствие этого — и по цене. Масса драгоценных камней измеряется в каратах. 1 метрический карат (общепринятая в настоящее время единица массы) соответствует 200 мг, то есть 0,2 г. Оптические свойства Драгоценные камни характеризуются окраской и блеском. И то и другое относится к оптическим — свойствам драгоценных камней. К ним добавляются также поглощение света (абсорбция) и плеохроизм, чистота и особые световые явления, часто вызываемые присутствием включений. Лишь очень немногие минералы имеют окраску, определяемую основными элементами их состава, которые фиксируются химической формулой, как, например, бирюза и малахит, окрашенные медью в голубой или зеленый цвет, синий азурит, также окрашенный медью, и зеленый гранат— уваровит, цвет которого обусловлен присутствием хрома. Эти немногие минералы, обладающие собственной окраской, называют идиохроматическими. Но гораздо больше минералов, в которых окраска обусловлена не основными компонентами состава (то есть элементами, входящими в их химическую формулу), а примесями — обычно случайными.
Обзор математических методов диагностики, классификации и аппроксимации применительно к решаемой задаче
Оценка минералов в геммологическом исследовании является сложной задачей, в которой должно быть учтено много факторов как объективных, так и субъективных, в том числе физические константы, экономические показатели, психологические характеристики. Начальным этапом исследования является диагностика, построенная на формальной классификации минералов. Решение о принадлежности диагностируемого образца к тому или иному классу принимается исходя из условий отклонения значений измеряемых переменных от нормативных границ. Те переменные, на основании анализа которых принимается решение об отнесении образца к тому или иному классу, будем называть диагностическими переменными. Признаком несоответствия исследуемого образца эталону является выход значения диагностической переменной за допустимые границы. Непостоянство химического состава и связанных с ним свойств существенно усложняет диагностику минералов, поскольку границы, в которых изменяются диагностические переменные, у различных минералов зачастую пересекаются. При этом сами диагностические переменные измеряются с некоторой погрешностью, т.е. носят интервальный характер.
Важной особенностью процесса диагностики минералов является и то, что у эксперта часто имеется неполный набор значений диагностических переменных. Это связано с тем, что процесс получения значений многих диагностических переменных является трудоемким, требует использования специального оборудования и больших временных и денежных затрат.
Кроме того, множество эталонных значений диагностических переменных может быть неполным.
В этих условиях процедура диагностики разбивается на отдельные этапы. На начальном этапе, при минимуме диагностической информации определяется ограниченный набор минералов, среди которых находится опознаваемый и определяется минимальное подмножество дополнительных диагностических переменных, значение которых необходимо определить. Это позволяет оптимально проводить дальнейшее поэтапное изучение минерала для уточнения его диагностики. Продолжение процесса геммологического исследования заключается в определении стоимостной оценки минерала. Среди экспертов существует несколько подходов к определению стоимостной оценки минералов.
Наиболее распространенным является подход, основанный на сопоставимости продаж. Такой подход основывается на прямом сравнении оцениваемого объекта с другими, теми которые были проданы или выставлены на продажу. Когда эксперт располагает информацией по достаточному количеству сопоставимых продаж и предложений, ему сравнительно легко определить ценовые тенденции, служащие своеобразным индикатором рыночной стоимости.
При таком подходе можно выделить задачи: 1) оптимального выбора эталонных групп минералов со сходными (пересекающимися) свойствами; 2) получения достоверной оценки стоимости минералов в эталонных группах; 1) наилучшей аппроксимации (экстраполяции) стоимостных оценок минералов в эталонных группах на оцениваемый образец.
Начальным этапом исследования является диагностика ювелирных камней, построенная на формальной классификации минералов. Основная задача этого этапа состоит в том, чтобы выяснить, к какому минеральному виду он относится. В общем случае для этого необходимо измерить определенный набор физических параметров, характеризующих свойства испытуемого образца и сравнить их с эталонным значением. Обозначим через J число видов (классов) ювелирных камней (минералов), а через К число индексов физических свойств этих минералов. Пусть вектор (I\)j определяет эталонный набор свойств j — го класса минерала, j — номер класса (j є {l,...,J}). Будем называть диагностическими переменными те переменные, на основании анализа которых принимается решение об отнесении образца к тому или иному классу. Если (dk) = (Dk)j, где о - измеренное значение к. -ой диагностической переменной тестируемого образца, то испытуемый образец однозначно относится к і - ому классу. В действительности, эталонный набор свойств минерала характеризуется не вектором (D ), а множеством интервальных значений каждой диагностической переменной АГЛ = [D D ], т.е. множеством {ДО АОгх.-.хАОк}. Решение о принадлежности диагностируемого образца к j — ому классу принимается исходя из условия: (d(){AD1xAD2X...xAD[c}j, Vk. Признаком несоответствия исследуемого образца эталону является выход значения диагностической переменной за допустимые границы. Следует также учесть, что сами диагностические переменные измеряются с некоторой погрешностью, т.е. носят интервальный характер. В этот случае оценка свойств исследуемого образца определяется множеством Ad = {AdxAd2x...xAdK}, где Adt = [d d , d d, -соответственно нижняя и верхняя границы измеряемой диагностической переменной. Тогда условие принадлежности диагностируемого образца к j — ому классу имеет следующий вид: Ad с {AD1XAD2X.„XADK}J.
Однако многие ювелирные камни характеризуются одинаковыми или сходными признаками, что затрудняет их диагностику. Непостоянство химического состава и связанных с ним свойств существенно усложняет диагностику минералов, поскольку границы, в которых изменяются диагностические переменные, у различных минералов зачастую пересекаются.
Многоэтапный алгоритм диагностики прозрачных минералов
Непостоянство состава и функционально связанных с ним свойств — главная особенность минералов [11,20]. Она существенно усложняет диагностику минералов, так как у многих из них происходит пересечение интервалов изменения свойств. В противном случае было бы достаточно с необходимой точностью измерить ограниченный комплекс или даже одну физическую константу» чтобы отличить любой минерал от всех остальных. Даже при использовании такого относительно индивидуального для твердых веществ свойства, как рентген-дифракционный спектр, автоматическая диагностика веществ переменного состава игнорировалась как более сложная задача.
Важной особенностью процесса диагностики минералов является и то, что. у исследователя часто имеется неполный набор диагностических констант диагностируемого минерала, ограниченность которого обусловлена недостаточной однородностью материала для исследований и в большей степени невозможностью использования всех возможных методов исследования, из-за их высокой стоимости.
Поэтому представляется целесообразным проводить диагностику минералов по этапам. На первом этапе, на основании ограниченного набора констант выявляется предварительный список подозреваемых минералов, сходных с данным образцом. Это позволяет определить дополнительный набор констант, по которым их лучше всего различить. Это позволяет оптимизировать процесс диагностики.
Для диагностики прозрачных минералов предлагается использовать следующий алгоритм трехэтапной диагностики. На первом этапе в качестве диагностических переменных используются оптические константы, такие как максимальный (ng) и минимальный (пр) показатели преломления для оптически анизотропных минералов, величина двупреломления (ng - пр) и угол между двумя оптическими осями у оптически двуосных минералов ромбической, моноклинной и триклинной сингонии. Эти константы являются наиболее информативными для прозрачных минералов и наиболее часто используются для их диагностики.
Диагностика ведется по диапазонной схеме. Опознаваемый диапазонный спектр сравнивается с эталонным спектральным каналом с учетом доверительного интервала, определяемого реальной точностью измерения соответствующих констант. Точность измерения в соответствии с [1] определяется как функция от величины светопреломления , определяемой наиболее распространенным иммерсионным методом: где Д - величина погрешности измерения светопреломления, а = 0,5(п — 1,3), п - уровень измеряемого светопреломления.
Погрешность измерения величины ng — пр, определяемой чаще всего по разнице между ng и пр, берется такая же, как и для светопреломления. Погрешность измерения угла 2V ,берется равной 1 град. Для определенности всегда сравниваются углы ( — ) 2V. Так как задача начального этапа — провести предварительную ориентировочную разбраковку эталонных минералов по близости к опознаваемому для того, чтобы на последующих этапах более точной диагностики не тратить много времени на сравнение со всеми эталонными минералами, то главная задача этапа I - не пропустить опознаваемый минерал, т. е. включить его в число подозреваемых. Для этого доверительный интервал спектрального канала еще более расширяется: погрешность измерения светопреломления и двупреломления увеличивается в 3 раза, а измерения угла 2V — в 10 раз. Сравнение признаков для каждого эталона ведется по проверке неравенств где Xjmax, X;mj„ - — максимальное и минимальное значение i-oro признака j - ого эталонного минерала; х; — величина i-oro признака опознаваемого минерала; ДІ - — погрешность i-oro признака; (3j — коэффициент увеличения погрешности i-oro признака. Если хотя бы одно неравенство для эталона не выполняется, то этот эталон игнорируется, и переходят к сравнению со следующим эталоном. При выполнении всех неравенств в соответствии с имеющимися парами сравниваемых признаков, название соответствующего эталона запоминается. В итоге получается набор (список) эталонных минералов, подозреваемых в тождестве с опознаваемым. Передается список для работы по алгоритму этапа II. Если это единственный минерал, то его диагностика может быть закончена на этапе I, но может быть подтверждена на этапах II или III, Если этап не выявил ни одного совпадающего эталонного минерала, то возможен переход к этапу III, минуя этап II.
Описание функций и структуры ИИС
Сеть типа радиальной базисной функции (RBF) имеет промежуточный слой из радиальных элементов, каждый из которых воспроизводит гауссову поверхность отклика. Поскольку эти функции нелинейны, для моделирования произвольной функции нет необходимости брать более одного промежуточного слоя. Для моделирования любой функции необходимо лишь взять достаточное число радиальных элементов. Остается решить вопрос о том, как следует скомбинировать выходы скрытых радиальных элементов, чтобы получить из них выход сети. Оказывается, что достаточно взять их линейную комбинацию (т.е. взвешенную сумму гауссовых функций). Сети RBF имеют ряд преимуществ перед сетями MLP. Во-первых, как уже сказано, они моделируют произвольную нелинейную функцию с помощью всего одного промежуточного слоя, и тем самым избавляют нас от необходимости решать вопрос о числе слоев. Во-вторых, параметры линейной комбинации в выходном слое можно полностью оптимизировать с помощью хорошо известных методов линейного моделирования, которые работают быстро и не испытывают трудностей с локальными минимумами, так мешающими при обучении MLP. Поэтому сеть RBF обучается очень быстро (на порядок быстрее MLP).
С другой стороны, до того, как применять линейную оптимизацию в выходном слое сети RBF, необходимо определить число радиальных элементов, положение их центров и величины отклонений. Соответствующие алгоритмы, хотя и работают быстрее алгоритмов обучения MLP, в меньшей степени пригодны для отыскания субоптимальных решений. Другие отличия работы RBF от MLP связаны с различным представлением пространства модели: "групповым" в RBF и "плоскостным" в MLP.
Опыт показывает, что для правильного моделирования типичной функции сеть RBF, с ее более эксцентричной поверхностью отклика, требует несколько большего числа элементов. Конечно, можно специально придумать форму поверхности, которая будет хорошо представляться первым или, наоборот, вторым способом, но общий итог оказывается не в пользу RBF. Следовательно, модель, основанная на RBF, будет работать медленнее и потребует больше памяти, чем соответствующий MLP (однако она гораздо быстрее обучается, а в некоторых случаях это важнее).
С "групповым" подходом связано и неумение сетей RBF экстраполировать свои выводы за область известных данных. При удалении от обучающего множества значение функции отклика быстро спадает до нуля. Напротив, сеть MLP выдает более определенные решения при обработке сильно отклоняющихся данных. Достоинство это или недостаток - зависит от конкретной задачи, однако в целом склонность MLP к некритическому экстраполированию результата считается его слабостью. Экстраполяция на данные, лежащие далеко от обучающего множества, - вещь, как правило, опасная и необоснованная. Сети RBF более чувствительны к "проклятию размерности" и испытывают значительные трудности, когда число входов велико. Мы обсудим этот вопрос ниже. Как уже говорилось, обучение RBF-сети происходит в несколько этапов. Сначала определяются центры и отклонения для радиальных элементов; после этого оптимизируются параметры линейного выходного слоя. Расположение центров должно соответствовать кластерам, реально присутствующим в исходных данных. Рассмотрим два наиболее часто используемых метода. Расположение центров должно соответствовать кластерам, реально присутствующим в исходных данных. Рассмотрим два наиболее часто используемых метода. Выборка из выборки. В качестве центров радиальных элементов берутся несколько случайно выбранных точек обучающего множества. В силу случайности выбора они "представляют" распределение обучающих данных в статистическом смысле. Однако, если число радиальных элементов невелико, такое представление может быть неудовлетворительным. Алгоритм К-средних. Этот алгоритм стремится выбрать оптимальное множество точек, являющихся центроидами кластеров в обучающих данных. При К радиальных элементах их центры располагаются таким образом, чтобы: Каждая обучающая точка "относилась" к одному центру кластера и лежала к нему ближе, чем к любому другому центру; Каждый центр кластера был центроидом множества обучающих точек, относящихся к этому кластеру. После того, как определено расположение центров, нужно найти отклонения. Величина отклонения (ее также называют сглаживающим фактором) определяет, насколько "острой" будет гауссова функция. Если эти функции выбраны слишком острыми, сеть не будет интерполировать данные между известными точками и потеряет способность к обобщению. Если же гауссовы функции взяты чересчур широкими, сеть не будет воспринимать мелкие детали. На самом деле сказанное - еще одна форма проявления дилеммы пере/недообучения. Как правило, отклонения выбираются таким образом, чтобы колпак каждой гауссовой функций захватывал "несколько" соседних центров. Для этого имеется несколько методов: Явный. Отклонения задаются пользователем.
Изотропный. Отклонение берется одинаковым для всех элементов и определяется эвристически с учетом количества радиальных элементов и объема покрываемого пространства.
К ближайших соседей. Отклонение каждого элемента устанавливается (индивидуально) равным среднему расстоянию до его К ближайших соседей. Тем самым отклонения будут меньше в тех частях пространства, где точки расположены густо, - здесь будут хорошо учитываться детали, - а там, где точек мало, отклонения будут большими (и будет производится интерполяция). После того, как выбраны центры и отклонения, параметры выходного слоя оптимизируются с помощью стандартного метода линейной оптимизации -алгоритма псевдообратных матриц (сингулярного разложения).