Алгоритмы градуировки БИК анализаторов с применением методов многомерного анализа Скутин Илья Владимирович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Скутин Илья Владимирович. Алгоритмы градуировки БИК анализаторов с применением методов многомерного анализа: диссертация ... кандидата технических наук: 05.02.13, 05.11.13 / Скутин Илья Владимирович;[Место защиты: Санкт-Петербургский государственный технологический институт (технический университет)].- Санкт-Петербург, 2014.- 138 с.

Содержание к диссертации

Введение

1 Аналитический обзор алгоритмов многомерной градуировки 9

1.1 Общие принципы градуировки 9

1.2 Методы снижения размерности исходных данных

1.2.1 Метод главных компонент 16

1.2.2 Описание спектральных данных с помощью ряда Фурье 22

1.3 Методы создания многомерных градуировочных моделей 24

1.3.1 Множественная линейная регрессия 24

1.3.2 Регрессия на главных компонентах 26

1.3.3 Проекция на латентные структуры 29

1.3.4 Математическое программирование 33

1.3.5 Искусственные нейронные сети 40

1.3.6 Метод опорных векторов 46

1.4 Статистические характеристики для оценки предсказательной способности градуировочных моделей 56

Выводы к главе 1. Постановка задачи 59

2 Общие принципы расчета многомерных градуировочных моделей для БИК - анализаторов 63

2.1 Особенности БИК - анализаторов 63

2.1.1 Общий принцип работы БИК - анализаторов типа ИнфраЛЮМ ФТ-10 63

2.1.2 Использование предварительных обработок спектров 69

2.2 Особенности расчета многомерных градуировочных моделей для БИК анализаторов 79

2.2.1 Общие принципы расчета многомерных градуировочных моделей для БИК - анализаторов 79

2.2.2 Основные этапы, влияющие на качество многомерных градуировочных моделей для БИК - анализаторов 80

Выводы к главе 2 86

3 Декомпозиция исходных данных, перед расчетом регрессионных коэффициентов, как способ повышения точности анализа 88

3.1 Особенности применения декомпозиции исходных данных 89

3.1.1 Декомпозиция с помощью МГК 89

3.1.2 Декомпозиция с помощью преобразования Фурье 89

3.2 Введение дополнительных этапов декомпозиции данных, перед расчетом регрессионных коэффициентов с помощью МП и МОВ 90

Выводы к главе 3 92

4 Экспериментальная проверка предложенной методики градуировки на БИК - анализаторе ИнфраЛЮМ ФТ-10 94

4.1 Формирование набора данных для расчета градуировочной модели 94

4.1.1 Регистрация первичных свойств и ввод данных о вторичных свойствах образцов 94

4.1.2 Формирование градуировочного и валидационного набора образцов 96

4.2 Процесс расчета градуировочной модели 97

4.2.1 Оптимизация количества и порядка применения предварительных математических обработок 97

4.2.2 Оптимизация параметров алгоритмов обучения градуировочной модели 98

4.2.3 Оптимизация прочих параметров 99

4.2.4 Обучение градуировочной модели

4.3 Образцы, используемые в экспериментах 101

4.4 Результаты проверки рассчитанных градуировочных моделей 102

4.5 Анализ полученных результатов 114

Выводы к главе 4 117

5 Методика создания многомерных градуировочных моделей для БИК анализаторов обеспечивающих более высокую точность анализа 120

5.1 Алгоритм расчета регрессионных коэффициентов с использованием математического программирования и предварительной декомпозицией исходных с помощью преобразования Фурье 120

5.2 Методика градуировки анализаторов с использованием математического программирования и предварительной декомпозицией исходных данных с помощью преобразования Фурье 124

Научная новизна 129

Практическая ценность 129

Выводы 129

Список литературы

Методы создания многомерных градуировочных моделей
Особенности расчета многомерных градуировочных моделей для БИК анализаторов
Введение дополнительных этапов декомпозиции данных, перед расчетом регрессионных коэффициентов с помощью МП и МОВ
Оптимизация количества и порядка применения предварительных математических обработок

Методы создания многомерных градуировочных моделей

Таким образом, из формулы (1.1) следует, что, зная оптическую плотность, коэффициент пропорциональности и длину слоя, можно определить концентрацию компонента [22]. В такой форме закон поглощения используется в ближней инфракрасной спектроскопии при измерении пропускания излучения анализируемым объектом.

Теоретически все просто: для определения концентрации поглощающего вещества необходимо определить длину волны, соответствующую максимуму поглощения вещества, измерить оптическую плотность и по формуле (1.1) вычислить результат. Однако идеальный случай, когда объект оптически однороден и среда прозрачна, требующий однократного измерения оптической плотности при определенной длине волны, встречается очень редко. В большинстве случаев среда поглощает пропускаемый свет, и полосы поглощения перекрываются, что заставляет проводить измерения при нескольких длинах волн. В основе этих способов лежит свойство аддитивности оптической плотности [12]:

Если коэффициенты поглощения Є известны или их можно определить экспериментально, а / имеет постоянное значение, например, при использовании одной и той же кюветы, для определения концентрации компонента достаточно П измерений при f длинах волн. Поэтому практически все спектральные приборы, в том числе и использовавшийся для исследований в данной работе, проводят измерения не на какой-то конкретной длине волны, а осуществляет регистрацию в диапазоне длин волн [23]. Прибор «ИНФРАЛЮМ ФТ-10», используемый для исследований, осуществляет регистрацию на довольно большом количестве длин волн. Диапазон работы анализатора 0.7-1.2мкм (8000- 14000 см" с шагом 16см"1).

Результаты измерения оптической плотности вещества, соответствующие формулам (1.3) и (1.5), представляются в виде спектра, характеризующего величину оптической плотности в данном диапазоне длин волн. Это позволяет определять концентрации нескольких компонентов, если указанные компоненты имеют свои характерные полосы поглощения.

Однако спектры в ближней инфракрасной области содержат множество широких, перекрывающихся полос, так как свет в этой части спектра поглощается широким спектром компонентов, которые содержаться в образцах, в том числе и исследуемым. На рисунке 1.1 представлен пример спектра пропускания зерна пшеницы, на характер которого влияют различные показатели (протеин, жир, клейковина, влага, фосфор, кальций и т.д.).

В связи с тем, что в БИК-диапазоне нет узких характеристичных полос поглощения, при анализе сложных по составу материалов, анализ проводится по спектральным особенностям [24]. Проведение такого анализа требует процедуры градуировки БИК-анализатора. Упрощенно, процедуру можно описать следующим образом. Для каждого образца, участвующего в градуировке, измеряется величина оптической плотности на каждой длине волны. В результате чего получается массив спектральных данных размерностью [их/]. Полученный массив спектральных данных, необходимо связать с матрицей известных значений вторичных свойств размерностью [пхк], с помощью специально разработанных для этого математических алгоритмов.

Где к - количество исследуемых свойств Математическое описание того, как изменения вторичных свойств отражается в первичных, в БИК-спектроскопии называют многомерной градуировочной моделью. Градуировку спектральных анализаторов и подобных приборов можно пред ставить в следующем виде. Множество объектов Х = (х1,х2...хи) - первичные свой ства, П - ого количества образцов, каждый образец измерен с помощью БИК - анали затора на f - длинах волн, л, а множество объектов X является матрицей размерностью [их/]. Множество объектов Y = (у1,у2...уп) вторичные свойства, измеренные с помощью стандартизированных прямых методов П - ого количества образцов. Вторичные свойства каждого образца могут содержать данные о нескольких исследуемых свойствах, т.е. у. ={yl,y2...ys), і = \...п, где s - количество исследуемых свойств. Однако на практике, градуировочные модели, рассчитываются для каждого исследуемого свойства по отдельности, поэтому под вторичными свойствами, далее будем подразумевать вектор у размерностью [/7x1] . Расчет градуировочной модели представляет собой задачу восстановления зависимости Ф: X — у, где Ф - решающая функция, которая приближает искомую зависимость, причем, не только для имеющихся первичных свойств, но и для любых возможных объектов на множестве X [25]. Записать задачу градуировки можно следующим образом: (у1,у2..у„) = Ф(х1,х2...хп\Ь1,Ь2...Ь/) + е (1.6) где є - погрешности (ошибки) которые всегда присутствуют в градуировочной зависимости, их природа - конечное число объектов первичных и вторичных свойств, погрешности измерений, ошибки при пробоотборе и многое другое;

Исходя из того, что оптическая плотность линейно связана с концентрацией вещества, согласно формуле (1.1), при градуировке спектральных анализаторов и подобных приборов чаще всего полагают, что первичные свойства связаны с вторичными линейной зависимостью. Тем более, известно, что разработчики методик чаще всего сводят градуировку к нахождению линейной зависимости (ограничивая интервал в котором строится градуировочная зависимость линейным участком или переходят к координатам, в которых эта зависимость линейна [6]). Поэтому решающая функция для задачи многомерной линейной регрессии может быть представлена в виде:

Произвести оценку вектора неизвестных регрессионных коэффициентов {Ь(І,ЬІ..ЬЛ сложнее. Для восстановления зависимости Ф:Х— у, по имеющейся выборке первичных свойств с известными вторичными свойствами, необходимо построить математическую модель, способную обучатся, и обучить ее с помощью выбранного алгоритма по имеющейся выборке исходных данных. Такая задача называется задачей обучения по прецедентам [27]. В теории искусственного интеллекта есть обширный раздел, изучающий алгоритмы обучения подобных математических моделей. Существуют разные способы машинного обучения, но в БИК - спектроскопии, как правило, все модели обучаются с помощью способа «обучение с учителем». Согласно данному способу система принудительно обучается, с помощью конечного числа примеров «стимул - реакция». После обучения, рассчитываются определенные статистические характеристики, позволяющие исследователю принять решение о перспективах модели, для любого объекта, из множества возможных первичных свойств, выдать ответ необходимой точности [28].

Для того, чтобы оценить вектор искомых регрессионных коэффициентов (Ь Ь2..Ьу), представим самый простой случай - нам известна длина волны /, при которой наблюдается наиболее тесная связь между первичными и вторичными свойствами. Перепишем уравнение (1.6) в более компактной форме, учитывая принятые допущения.

Особенности расчета многомерных градуировочных моделей для БИК анализаторов

В качестве исходных данных мы имеем первичные X и вторичные у свойства градуировочного набора образцов (блок 1.30).

Задачей метода ПЛС, так же как и методов РГК и МЛР, является нахождение такого вектора Ь, что бы величина ошибки е, уравнения (1.17) была минимальна. Метод ПЛС, так же как и метод РГК, можно разделить на два шага.

На первом шаге проводится декомпозиция не только матрицы первичных свойств X на счета Т и нагрузки Р, но и вектора вторичных свойств у на счета и и нагрузки q с помощью МГК. Следует отметить, что декомпозиция выполняется не в два независимых друг от друга разложения, а происходит в одном процессе, связывая у и X в одном пространстве главных компонент. После того как исследователь определился с количеством главных компонент (блок 1.31), начинается процесс декомпозиции данных. В блоке 1.32 в качестве начальных значений вектора счетов ta первой компоненты выбирается столбец йа матрицы первичных свойств X, который имеет наибольшую сумму квадратов отклонений от среднего значения. Вектор йа используется для определения взвешенных нагрузок wa матрицы X. Нахождение вектора wa (блок 1.33) осуществляется методом МНК для уравнения Ха = uawa +е. В блоке 1.34 представлено решение метода МНК по определению счетов ta на основа нии уравнения Ха =taWa +Є- В бл0КЄ 135 вьшисляются нагрузки р а методом МНК из уравнения Ха = tapa + е. Далее вьшисляются нагрузки для матрицы вторичных свойств у, увязывая их со счетами, определенными в блоке 1.34. В блоке 1.36 представлено решение методом МНК по нахождению нагрузок qa из уравнения У я =Кяа + В блоке 1.37 уточняется вектор счетов йа путем решения методом

МНК уравнения уя =uaqa + g. После того как рассчитаны счета и нагрузки для первичных и вторичных свойств, вклад данной главной компоненты вьшитается (блок 1.38). В блоке 1.39 выполняется проверка: рассчитаны ли все главные компоненты. Если нет, то процесс повторяется заново, начиная с блока 1.32, предварительно подставив вместо новых первичных и вторичных свойств остатки (блок 1.40). Остатки вычислены в блоке 1.38. Если все главные компоненты определены, то исходные данные разделяются на шумовую составляющую: X —ТР для матрицы первичных свойств; у—uqr для вектора вторичных свойств, и полезную составляющую: ТР для матрицы первичных свойств; uq для вектора вторичных свойств (блоки 1.41). После чего вычисленные данные сохраняются в память ЭВМ (блок 1.42).

На втором шаге алгоритма вычисляется вектор регрессионных коэффициентов b (блок 1.43) с помощью МНК и сохраняется в память ЭВМ (блок 1.44) для последующего анализа неизвестных вторичных свойств образцов по измеренным первичным свойствам [45].

За счет того, что декомпозиция первичных и вторичных свойств происходит в одном пространстве главных компонент, повышается точность градуировочной модели. В данном алгоритме при построении модели используется меньшее число главных компонент, чем в РГК. Однако метод ПЛС, так же, как и РГК, не идеален. При декомпозиции данных с помощью МГК отбрасывается часть информации, которая может быть полезна при построении модели. Метод ПЛС требует значительной квалификации исследователя, так как сложен в обращении. Необходимо вручную подбирать количество главных компонент, а так же снижается интрпретируемость исходных данных после выполнения процедуры декомпозиции с помощью МГК [46]. 1.3.4 Математическое программирование

Известны также методы математического программирования (МП), которые могут быть использованы для поиска регрессионных коэффициентов, связывающих два массива данных, при минимизации значения ошибки регрессионного уравнения [47].

Известны решения задач квадратичного математического программирования [48], которые можно использовать для расчета градуировочной модели, если целевую функцию представить в виде: Ф = (у-ХЬ/(у-ХЬ) (1.19) где, у - вектор размерности [п х 1], который описывает вторичные свойства X - матрица размерности [ИХ/], которая описывает первичные свойства; b - вектор размерности [1 х f] искомых коэффициентов регрессии;

Область поиска, экстремальных значений целевой функции, определяется некими ограничениями. Коэффициенты регрессии b должны находиться внутри пространства гиперкуба. Гиперкуб - фигура в Евклидовом f - мерном пространстве (f число переменных в первичных свойствах). Например, если / = 3, то гиперкуб - это куб в трехмерном евклидовом пространстве, имеющий длину ребра равную d. Оптимальные размеры гиперкуба могут определяться с помощью процедуры валидации. Т.е. размерность гиперкуба можно считать оптимальной, если критерии оценки качества градуировочной модели удовлетворяют необходимым условиям. Целевую функцию необходимо привести к каноническому виду [49] для последующего поиска коэффициентов регрессии. Для этого производится замена переменных в уравнении для целевой функции: С = 2(ХТХ) (1.20) D = -2(Хту) Тогда целевая функция, записанная в уравнении (1.19) может быть представлена в следующем каноническом виде: Ф(Ь) = DTb + bTCb - min (1.21)

Существует много конечных методов решения данной задачи. Например, в качестве эффективного и простого метода решения, может быть применен метод решения задач о дополнительности, разработанный Лемке [50].

Упрощенная схема алгоритма построения градуировочной модели, с использованием техники математического программирования представлена на рисунке 1.7, в котором задача математического программирования сводится к задаче о дополнительности.

Введение дополнительных этапов декомпозиции данных, перед расчетом регрессионных коэффициентов с помощью МП и МОВ

Третья группа алгоритмов для расчета многомерной градуировочной модели применяет теорию математического программирования. Вычисление модели с помощью данного метода не использует нестабильных операций, поэтому коллинеарность анализируемых данных не влияет на полученные результаты. Так же модели, построенные с помощью данной техники, обладают значительной устойчивостью. В отличии от МНК, точность которого можно повысить только за счет повышения качества подготовки входных данных, в МП существует много приемов настройки путем внесения изменений в сам процесс МП для повышения его точности. Данные, используемые на любом этапе расчетов, хорошо интерпретируемы, следовательно, их можно анализировать на любом этапе вычислений. Алгоритмы, разработанные с помощью теории математического программирования, зачастую дают результаты, даже лучшие чем искусственные нейронные сети и с ними проще работать. Однако, нахождение решения линейной задачи о дополнительности гарантировано только при определенных условиях [55]. Кроме того, данные методы эффективны в основном на задачах малой и средней размерности. С ростом размерности задачи резко увеличивается количество перебираемых вершин. Так же некоторые из алгоритмов, например, МОВ, очень зависимы от шума в исходных данных, что в БИК - спектроскопии не редкость.

Рассчитанная градуировочная модель подлежит обязательной проверке. В качестве основных критериев для оценки качества (точности предсказаний) и выбора оптимальной градуировочной модели используются статистические характеристики, ре комендованные в [79], как наиболее простые и информативные: ST - среднеквадрати-ческое отклонение измерений образцов градуировочного набора при использовании созданной градуировочной модели, Snn - среднеквадратическое отклонение измерений образцов градуировочного набора при перекрестной проверке и Sn - среднеквадратическое отклонение измерений образцов дополнительного (валидационного) набора при использовании созданной градуировочной модели. ST дает оценку того, насколько свойства образцов, полученные при помощи данной градуировочной модели, согласуются со свойствами, определенными стандартным химическим методом. Snn позволяет выбрать оптимальное число переменных величин для расчета градуировочной модели, а также может быть использован в качестве критерия для определения выпадающих образцов. Sn характеризует ошибку предсказания неизвестных образцов по созданной градуировочной модели. Все описанные алгоритмы, представляют собой мощные методы машинного обучения и восстановления регрессии. Однако, каждый из представленных алгоритмов используемый напрямую, без какой- либо определенной стратегии проведения процедуры расчета градуировки, может дать неплохие результаты для определенных наборов образцов. Но в общем случае, качественные характеристики такой модели могут быть улучшены, если выполнять расчет по определенным методикам.

Поэтому при проведении данной работы была поставлена задача - разработать методику для создания многомерных градуировочных моделей для приборов конкретного типа (спектральных БИК-анализаторов зерновых культур, использующих принципы Фурье-спектроскопии). Использование методики должно обеспечить: универсальность создаваемых моделей, методика должна успешно работать с любыми возможными образцами, выбранными для анализа; требуемую точность определения анализируемых свойств образцов; снижение трудоемкости и длительности выполняемых операций по сравнению с существующими подобными методами. 2 Общие принципы расчета многомерных градуировочных моделей для БИК - анализаторов

Для проведения экспериментальной части данной работы использовался БИК -анализатор ИнфраЛЮМ ФТ-10, выпускаемых компанией «Люмэкс». Это современный стационарный лабораторный прибор, предназначенный для количественного анализа показателей качества различных продуктов, а также для идентификации продукции с помощью предварительно созданных градуировочных моделей. Прибор позволяет проводить измерения различных крупно- и мелкодисперсных твердых и жидких веществ. Основная область применения - анализ зерна и продуктов его переработки.

ИнфраЛЮМ ФТ-10 - инфракрасный спектрометр, регистрирующий непрерывные спектры поглощения (или пропускания) в диапазоне длин волн в ближней инфракрасной области. Эти спектры представляют собой отношение интенсивностей линий двух спектров: линии спектра образца к интенсивности линии фонового спектра. Под фоновым спектром в анализаторе ИнфраЛЮМ ФТ-10 понимается энергетический спектр встроенного в прибор стандарта. В ИнфраЛЮМ ФТ-10 реализована однолучевая схема измерения, в которой сначала регистрируется фоновый спектр, затем спектр образца, потом при помощи персонального компьютера рассчитывается спектр поглощения (пропускания) образца [81].

Основой оптического блока Фурье-спектрометра является оригинальный кольцевой интерферометр, в котором при движении светоделителя происходит изменение разности хода между интерферирующими лучами. Прибор непосредственно регистрирует световой поток на выходе интерферометра в зависимости от разности хода (интерферограмму). Управление процессом измерения осуществляется от внутреннего контроллера и IBM PC - совместимого компьютера. Оптический спектр (в шкале волновых чисел) получается после обратного преобразования Фурье зарегистрированной интерферограммы в связанном с прибором персональном компьютере [81].

Характерной особенностью спектрометров ИнфраЛЮМ ФТ-10, использующих принцип Фурье спектроскопии, является то, что из-за конструктивных особенностей приборов измеряемые спектры имеют одинаковые постоянные значения длин волн (волновых чисел), при которых проводятся измерения, что обеспечивается синхронизующим лазером [82].

Оптимизация количества и порядка применения предварительных математических обработок

Модели, при построении которых применялась предварительная декомпозиция исходных данных с помощью МГК с последующим применением алгоритма математического программирования, в 7 случаях из 12 показывали результат хуже, чем результаты, полученные моделями с алгоритмом МП без декомпозиции. В 3 случаях результаты этих двух алгоритмов были соизмеримы. И лишь в 2 случаях из 12, результат по модели с алгоритмом «МП+МГК» превзошел модели с алгоритмом «МП». Но модель с алгоритмом «МП+МГК» ни разу не показала лучший результат среди всех рассматриваемых алгоритмов. Возможно, это связано с особенностями декомпозиции исходных данных с помощью МГК. МГК устраняет коллинеарность в исходных данных, но может сильно искажать исходные данные. Вероятно, для данного типа объектов, данные искажения более чувствительны при применении алгоритма «МП».

Классические методы, такие как РГК и ПЛС, которые широко используются для построения многомерных градуировочных моделей, показали наилучший результат, в сравнении с остальными алгоритмами в 17% случаев. МЛР, как и ожидалось, в силу своих ограничений на размер матрицы исходных данных, не справляется с объемами данных, которые способны генерировать современные БИК анализаторы.

Если сравнивать модели с алгоритмами «МОВ», «МОВ+МГК» и «МОВ+Фурье» между собой, то можно сформулировать следующее. Метод опорных векторов без предварительной декомпозицией и методы опорных векторов с предварительной декомпозицией данных, как с помощью МГК, так и Фурье преобразования, в большинстве своем дают близкие ошибки предсказания для большинства анализируемых объектов. Т.е. предварительная декомпозиция данных перед применением МОВ не вносит существенного вклада в повышение точности анализа. Однако, «МОВ», «МОВ+МГК» и «МОВ+Фурье» один раз показали наименьшее значения ошибок результатов анализа среди всех применяемых алгоритмов.

Поскольку, алгоритмы МОВ для решения задач регрессии очень чувствительны к влиянию шумов в исходных данных, точность предсказаний по моделям с алгоритмом МОВ часто получалась хуже на ряде объектов, чем при использовании других алгоритмов

Применение искусственной нейронной сети при построении градуировочных моделей для рассматриваемых объектов, показало посредственные результаты. Наихудший результат в сравнении с остальными алгоритмами был получен в 50% случаев (для 6 объектов из 12). При этом 3 раза результат был близок к худшим данным, полученным другими алгоритмами. Наилучший результат с помощью ИНС не был получен ни разу. Вероятно, данный метод построения многомерной градуиро-вочной модели может работать намного лучше, но это требует более глубоких исследований нейронных сетей и индивидуальной настройки метода под каждый из показателей.

Исследования в данной работе проводились на изготавливаемом в России БИК-анализаторе ИнфраЛЮМ ФТ-10, использующем принцип Фурье-спектроскопии. Прибор представляет собой однолучевой спектрометр, регистрирующий непрерыв 117 ные спектры поглощения (или пропускания) в диапазоне длин волн в ближней инфракрасной области.

Для исследуемого прибора были созданы градуировочные модели для 12 типов сельскохозяйственной продукции на различные показатели качества. Для создания градуировочных моделей использовались градуировочные наборы, содержащие не менее 50 образцов. Для проверки градуировочных моделей использовался дополнительный набор, состоящий из 10 образцов. Для каждого из показателей многомерная градуировочная модель создавалась с помощью методов рассматриваемых в п. 1.3., а так же с помощью методов, предложенных в п.3.1.

Была проведена оценка изменения качества градуировочных моделей, а соответственно и точности анализа, в зависимости от выбранного алгоритма создания модели. Для выполнения исследований градуировочные модели для каждого из показателей рассчитывались с использованием одинаковых градуировочных наборов для каждого из исследуемых алгоритмов. Оптимизация настраиваемых параметров алгоритма и математических предобработок, производилась для каждого из алгоритмов в одинаковом объеме, с помощью программного обеспечения описанного выше. Проверка рассчитанных моделей, для каждого из показателей, выполнялась на одинаковых ва-лидационных наборах.

На основании проведенных экспериментов можно заключить следующее. Градуировочные модели, построенные на алгоритме математического программирования с предварительной декомпозицией исходных данных с помощью преобразования Фурье, обеспечивают в большинстве случаев лучшую точность, чем модели, основанные на других алгоритмах. Для 9 объектов из 12 данный алгоритм был лучшим по точности предсказания. Для оставшихся трех объектов модели на основе «МП+Фурье» также не сильно отличались по точности от лучших моделей на других алгоритмах.

Использование перед алгоритмом МП декомпозиции данных методом МГК нецелесообразно, так как точность анализа снижается, и как показали эксперименты, в некоторых случаях довольно сильно.

Использование для расчета регрессионных коэффициентов алгоритма МОВ, как с предварительной декомпозицией данных, так и без нее, не привело к какому-либо существенному повышению точности по сравнению с классическими алгоритмами ПЛС и РГК.

Градуировочные модели на базе искусственной нейронной сети для рассматриваемых объектов, чаще всего выдавали наибольшую величину ошибки предсказания по сравнению с другими применяемыми алгоритмами.

Поэтому, на основании полученных результатов, можно сказать, что, не отменяя общепринятые алгоритмы ПЛС и РГК, применяемые для градуировки БИК анализаторов, можно предложить дополнительную методику градуировки, основанную на алгоритме математического программирования с предварительной декомпозицией исходных данных, с помощью преобразования Фурье. Данная методика может обеспечить повышение точности анализа показателей качества ряда объектов (в первую очередь, сельскохозяйственной продукции).

Алгоритмы градуировки БИК анализаторов с применением методов многомерного анализа Скутин Илья Владимирович

Методы создания многомерных градуировочных моделей

Особенности расчета многомерных градуировочных моделей для БИК анализаторов

Введение дополнительных этапов декомпозиции данных, перед расчетом регрессионных коэффициентов с помощью МП и МОВ

Оптимизация количества и порядка применения предварительных математических обработок

Похожие диссертации на Алгоритмы градуировки БИК анализаторов с применением методов многомерного анализа