Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Цикин Алексей Максимович

Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации
<
Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Цикин Алексей Максимович. Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации: диссертация ... кандидата химических наук: 02.00.02 / Цикин Алексей Максимович;[Место защиты: Саратовский государственный университет имени Н.Г.Чернышевского].- Саратов, 2014.- 181 с.

Содержание к диссертации

Введение

1. Обзор литературы 11

1.1. Хемометрика в анализе спектральных данных, характеризующихся большой взаимной информацией 11

1.1.1. Инфракрасная спектроскопия 12

1.1.2. Спектроскопия ядерного магнитного резонанса 20

1.1.3. Рентгенофлуоресцентная спектроскопия 25

1.1.4. Совмещенные наборы данных 31

1.2.Характеристика хемометрических методов 32

1.2.1. Качественный анализ 32

1.2.1.1.Метод главных компонент 32

1.2.1.2.Линейный дискриминантный анализ 34

1.2.1.3.Анализ общих направлений и специфических весов 34

1.2.2. Количественный анализ 37

1.2.2.1.Регрессия на главные компоненты 37

1.2.2.2.Проекции на латентные структуры 39

1.2.2.3.Метод чередующихся наименьших квадратов 40

1.2.2.4.Метод независимых компонент 42

Заключение к 1 главе 48

2. Объекты и методы исследования 49

2.1.Обоснование выбора спектроскопических методов 49

2.2.Реактивы и аппаратура 52

2.3.Обработка сигналов 55

2.3.1. Определение числа независимых компонент 55

2.3.2. Хемометрический анализ 57

3. Хемометрическая обработка ик спектров 59

3.1.Сглаживание спектральных кривых 60

3.2.Шкалирование спектров 62

3.2.1. Автошкалирование 62

3.2.2. Парето шкалирование 63

3.3.Смоделированные смеси 65

3.4.Искусственные смеси 69

3.5.Реальные объекты 74

3.5.1. Товарные бензины 74

3.5.2. Клейкие ленты 84

3.5.3. Органическое вещество морской среды 90

Заключение к 3 главе 107

4. Хемометрические методы в рентгенофлуоресцентной спектроскопии 108

4.1.Смоделированные смеси 109

4.2.Искусственные смеси 112

4.3.Реальные объекты 115

Заключение к 4 главе 124

5. Хемометрический анализ данных ямр спектроскопии 125

5.1.Бакетинг 127

5.2.Искусственные смеси 129

5.2.1. Смеси кофеина и бензоата натрия 129

5.2.2. Компоненты меда 131

5.2.3. Компоненты электронных сигарет 134

5.2.4. Компоненты энергетических напитков 135

5.2.5. Компоненты молока 136

5.3.Реальные объекты 137

5.3.1. Безалкогольные напитки 137

5.3.2. Электронные сигареты 138

5.3.3. ComDim обработка соков и вин 139

Заключение к 5 главе 143

Выводы 144

Список использованной литературы 145

Введение к работе

Актуальность работы. Аналитическая спектроскопия способна предоставить необходимую информацию относительно состава и свойств различных объектов, таких как промышленные, сельскохозяйственные образцы и продукты питания. Тренд современной спектроскопии выражается в выполнении меньшего числа измерений, но получении большего объема данных из каждого из них. Быстрое совершенствование приложений спектроскопии для исследований и рутинного анализа было бы невозможно без параллельного развития хемометрических методов.

Спектр предлагаемых хемометрикой методов и алгоритмов обширен. Однако следует отметить, что подавляющее большинство работ посвящено апробации различных хемометрических подходов для анализа данных электронной спектроскопии. Несмотря на очевидную перспективность, число работ, посвященных анализу данных инфракрасной (ИК), рентгенофлуоресцентной (РФ) спектроскопии и спектроскопии ядерного магнитного резонанса (ЯМР), единично. Данные, получаемые с использованием этих спектроскопических методов анализа, характеризуются большим значением взаимной информации, а значит одновременно и трудны для хемометрической обработки, и перспективны для разработки методов анализа новых систем и товарных продуктов. Очевидна необходимость дополнительных исследований по практическому применению хемометрических методов для обработки спектральных данных, отличающихся большим значением взаимной информации, выявлению факторов, влияющих на качество декомпозиции, сравнительному анализу различных подходов и апробации на спектрах реальных объектов сложного состава.

Необходимо также отметить, что все спектральные методы качественного и количественного анализа основаны на использовании эталонов (образцов стандартного состава). Необходимость применения эталонов представляет большое ограничение в применении спектроскопии как таковой. Использование многомерных спектров открывает возможность перевести анализ на полностью безэталонную основу, тем самым исключив необходимость привлечения методов расчета спектров. Исследования в этой области, выполненные Грибовым Л.А., показывают несомненную перспективность этого направления.

Цель работы. Повышение эффективности ИК, ЯМР и рентгенофлуорес-центного спектрометрического анализа на основе методов хемометрики.

Для достижения поставленной цели решали следующие задачи: - априорное определение числа независимых компонент в спектральных данных;

апробация методов предварительной обработки спектров: ИК - сглаживание и шкалирование, ЯМР - бакетинг;

качественный и количественный ИК, ЯМР и РФ анализ смоделированных и искусственных смесей хемометрическими методами;

идентификация и количественное определение компонентов товарных продуктов (клейких лент, лакокрасочных покрытий, безалкогольных напитков, электронных сигарет, морских донных отложений) по данным ИК, ЯМР и РФ спектроскопии с использованием хемометрических методов;

применение новых хемометрических подходов к классификации сложных объектов: ICA и ComDim, позволяющий значительно улучшить результаты определений за счет использования совмещенных наборов данных разных инструментальных методов, а иногда стать единственно возможным методом анализа.

Научная новизна. Решена важная и перспективная задача использования методов ЯМР 1Н, ИК, РФ спектроскопии в сочетании с хемометрическими алгоритмами для идентификации и надежного экспрессного совместного количественного определения компонентов в смесях сложного состава.

Оценено влияние различных факторов на результаты математического разделения спектров смесей: число значимых компонентов в спектрах, агрегатное состояние системы, предварительная математическая обработка спектральных данных.

Апробирована работа разработанной на платформе MATLAB программы, позволяющей априори определять число независимых компонент в спектральных данных простых и сложных смесей.

Предложены новые методики анализа объектов окружающей среды и продуктов питания по данным ИК и ЯМР спектроскопии.

Показано превосходство новых хемометрических методов (ICA и ComDim) в классификации сложных объектов.

Практическая значимость. Выработаны практические рекомендации по применению хемометрических алгоритмов в ИК, РФ и ЯМР спектроскопических анализах. На их основе разработаны эффективные методики определения веществ в смесях, апробированные в анализе объектов сложного состава.

Решены важные задачи экспертизы клейких лент, лакокрасочных покрытий автомобилей, установления компонентного состава товарных бензинов. С помощью хемометрических подходов изучены процессы формирования морских донных отложений и установлен их компонентный состав.

Предложены новые методики идентификации и количественного определения компонентов меда, молока, электронных сигарет, энергетических и без-

алкогольных напитков. С использованием нового хемометрического метода ComDim решены задачи классификации сложных объектов анализа: соков и вин.

На защиту выносятся:

результаты качественного и количественного анализа смесей соединений различными алгоритмами метода независимых компонент по данным ИК, ЯМР и РФ спектроскопии, оценка и сравнение производительности используемых хемометрических алгоритмов;

влияние различных факторов (количество компонентов в объекте, агрегатное состояние системы, предварительная математическая обработка) на декомпозицию спектров с применением хемометрических методов обработки;

результаты применения новых классификационных методов (ICA и ComDim)для повышения производительности и качества классификации сложных объектов: лакокрасочных покрытий, соков и вин;

методики совместного определения веществ в реальных объектах на основе ИК, ЯМР и РФ спектров и хемометрики.

Личный вклад соискателя заключается в постановке цели и задач исследования, выборе объектов, подходов к анализу и количественному описанию экспериментальных данных, непосредственном проведении эксперимента и математической обработки данных, обобщении полученных результатов, формулировании научных положений и выводов.

Публикации. По теме диссертации опубликовано 11 печатных работ: 4 статьи в журналах, рекомендованных ВАК, 7 тезисов докладов, из них 5 - на международных конференциях.

Апробация работы. Основные результаты диссертационной работы доложены на VIII Международном симпозиуме по хемометрике (Дракино, 2012), VI и VII Всероссийских конференциях молодых ученых, аспирантов и студентов Mendeleev-2012 и Mendeleev-2013 (Санкт-Петербург, 2012-2013), IV Европейском конгрессе по химии (Чехия, Прага, 2012), Всероссийской школе-конференции «Химия биологически активных веществ» молодых учёных, аспирантов и студентов с международным участием «ХимБиоАктив-2012» (Саратов, 2012), II Съезде аналитиков России (Москва, 2013).

Структура и объем диссертации. Диссертация состоит из введения, пяти глав, выводов и списка использованной литературы. Библиография включает 292 источника. Диссертационная работа изложена на 181 странице машинописного текста, содержит 42 рисунка и 22 таблицы.

Хемометрика в анализе спектральных данных, характеризующихся большой взаимной информацией

Сванте Волд ввел термин хемометрика в 1972 году, после чего началось стремительное развитие этой дисциплины [9]. Область приложения хе-мометрики огромна, кроме того, применяемые в ней математические и статистические инструменты часто используются и в других областях знания, например, в биометрике и экономике [10,11]. Хемометрика предлагает методы, которые позволяют химикам эффективнее двигаться от экстенсивного роста числа измерений к качественному увеличению информации, извлекаемой из каждого измерения. Последние обзоры, которые иллюстрируют чрезвычайно большое число приложений хемометрики, можно найти в нескольких специализированных журналах [12-15].

Главная часть хемометрики – это анализ многомерных данных, который необходим для улучшения качества качественных и количественных исследований. Термин «многомерный» используется как синоним «многофакторного» или «многоканального», последний часто используется в спектроскопии. Многомерные методы количественного и качественного анализа подробно рассмотрены в нескольких книгах [16-19].

Классификация многомерных методов, которые используются для анализа многокомпонентных систем, базирующаяся на различном объеме информации, доступной по спектрам компонентов и концентрациям, представлена в статье Лианга и др. [20]. Авторы классифицировали «белые» многомерные системы как системы, для которых спектры химических компонентов образца известны и этот набор может определить концентрации всех анали-тов. «Серые» многокомпонентные системы характеризуются неполным знанием о спектрах и концентрациях компонентов. Системы называются «черными», если априорная информация о составе системы отсутствует. В случае таких систем применяют так называемое автомодельное разделение кривых, целью которого является разрешение спектральных данных, полученных, например, во время мониторинга реакции, в концентрационные профили и спектры поглощения чистых компонент без априорной информации о наблюдаемой системе [21].

Инфракрасные спектры твердых и жидких образцов характеризуются большим числом полос поглощения. Происхождение полос объясняется обертонами и комбинациями фундаментальных вибраций, и даже спектры химически простых образцов отличаются высокой степенью перекрывания полос поглощения. Их идентификация и соотнесение с вибрациями отдельных молекулярных групп со специфическими связями часто бывают сложны.

Современный ИК спектроскопический анализ далек от своего классического варианта [22]. Сегодня мы используем данный метод для анализа сложных композиционных материалов различной морфологии. Получаемый спектр часто, на первый взгляд, достаточно неинформативен, и идентификация полос и их прямое использование для количественной оценки невозможны. Более того, сигналы могут быть подвержены воздействию дополнительных эффектов от взаимодействия излучения с физической структурой вещества, что приводит к усложнению анализа.

Указанные недостатки можно преодолеть, привлекая методы хемомет-рики для моделирования данных. Используя возможности хемометрической обработки, Лин и Браун [23] применили ИК спектроскопию как универсальный метод определения физических и химических свойств воды и нахождения их функций от температуры. РГК и МЛР модели разработаны и применены для соотнесения спектров со свойствами воды в температурном диапазоне от 5 до 65оС. Среди рассматриваемых свойств были плотность, коэффициент рефракции, диэлектрическая постоянная, относительная вязкость, поверхностное натяжение и др. Авторы показали, что набор из пятнадцати свойств можно определить одновременно, измеряя набор ИК спектров воды [23]. Полученные исследователями результаты демонстрируют линейную корреляцию между РГК предсказанными и действительными значениями. Между ними найдена хорошая линейная корреляция: коэффициенты детерминации, как правило, были больше 0.9978.

Хемометрика полезна также для улучшения разрешения ИК спектров [24]. График нагрузок, или регрессионных коэффициентов, играет важную роль в этом процессе. Авторы приводят ИК спектр раствора втор-бутанола (0.3 М) в тетрахлориде углерода, измеренный в температурном диапазоне от 10 до 60оС. Наблюдаемая интенсивная полоса при 7081 см-1 может быть отнесена к первому обертону удлинения связи ОН в мономере. Известно, что спирты образуют ассоциаты друг с другом. В тетрахлориде углерода спирты образуют также слабые водородные связи с растворителем. Полоса при 7081 см-1 должна состоять, по меньшей мере, из четырех удлиняющих связь ОН составляющих: две полосы от вращательных изомеров спирта, одна полоса от свободной ОН группы водородсвязанных образцов и одна – от водорода ОН группы, связанного с тетрахлоридом углерода. Для того чтобы сделать полосы этих компонентов наблюдаемыми, найдена спектральная разница путем вычитания спектра, измеренного при 10оС из спектров, полученных при более высоких температурах.

Аналогичные результаты были получены из графика нагрузок (коэффициентов регрессии) модели, базирующейся на ИК данных в том же температурном интервале. Модель была получена при помощи ПЛС регрессии [24]. Следует отметить, что внешний вид кривой, полученной по первому и второму методам, оказался очень похожим. Таким образом, не только дифференциальные спектры могут предоставить информацию о реальном составе полос, но и более быстрые и дешевые хемометрические подходы. Указанный пример наглядно иллюстрирует пригодность хемометрики даже для такой сложной области анализа, как изучение структур молекулярных комплексов.

Дополнительные возможности улучшения качества ИК спектроскопического анализа дает использование метода чередующихся наименьших квадратов. Несмотря на существующие недостатки (необходимость предварительной оценки концентраций или спектров чистых компонентов, итеративный характер вычислений), он нашел достаточно широкое применение в анализе данных ИК спектроскопии. Обработка данных ИК спектроскопии методом чередующихся наименьших квадратов позволила установить содержание воды и белка в образцах растительного происхождения [25]. В данном случае MCR-ALS доказал свою производительность, несмотря на то, что вклад воды и белков в суммарный спектр образцов очень невелик. Наложение корреляционных ограничений в MCR-ALS модель позволило количественно определить компонентный состав биодизельного топлива [26], изучить процессы старения растительных масел [27], идентифицировать и количественно оценить содержание углеводов, спиртов и органических кислот в винах [28]. Можно выделить следующие основные объекты анализа: медицинские препараты [29-32] и пищевые продукты [33,34]. MCR-ALS также часто применяли для оценки загрязнения окружающей среды [35] и контроля технологических процессов [36]. Оценивая спектр применения метода чередующихся наименьших квадратов на сегодняшний день, можно заключить, что этот метод находит весьма широкое применение.

Определение числа независимых компонент

Предварительное определение числа независимых компонент в спектральных данных чрезвычайно важно в хемометрической практике, т.к. позволяет опираться на рассчитанное значение параметра, а не подбирать его вручную. Для каждой из анализируемых систем число независимых компонент вычисляли априорно при помощи специально разработанной программы, базирующейся на методе «ICA-by-Blocks» [203]. Суть данного метода состоит в разделении экспериментальных данных на несколько массивов, их независимом анализе при заданном значении независимых компонент и нахождении коэффициентов корреляции для пар выделенных индивидуальных сигналов. Значение числа независимых компонент i, при котором следует остановить итерационный процесс, находят по резкому снижению коэффициента корреляции после i-го компонента (рис. 2.3). В случае сложных объектов анализа резкое снижение коэффициента взаимной корреляции можно и не наблюдать. В данном случае число независимых компонент находят по точке пересечения прямой, параллельной оси абсцисс с ординатой 0.9 (рис. 2.4).

К преимуществам данного алгоритма можно отнести возможность определения числа независимых компонент в системе без априорных сведений о ней, к недостаткам – уменьшение выборки минимум в два раза и необходимость наличия уверенности в высоком качестве работы алгоритма декомпозиции в заданных условиях. Существуют и другие подобные алгоритмы, например, определение числа независимых компонент по DW-критерию [203], однако метод «ICA-by-Blocks» отличает значительно более простая программная реализация. 2.3.2. Хемометрический анализ

Программы, реализующие алгоритмы MILCA, SNICA, а также алгоритм вычисления взаимной информации свободно доступны в виде независимых исполняемых модулей для платформ Windows и Linux и с MATLAB (The MathWorks, Natick, MA, USA) интерфейсами. Необходимые пакеты с примерами использования и исходными текстами программ доступны на вебсайте http://www.uclac.uk/ion/departments/sobell/Research/RLemon/MILCA/MILCA. Другие методы ICA можно найти на сайтах:

SIMPLISMA (http://read.pudn.com/downloads6/sourcecode/math/22123/image_mva_0/simplis ma.m_.htm),

JADE (http://perso.telecom-paristech.fr/ cardoso/guidesepsou.html),

RADICAL (http://www.cs.umass.edu/ elm/ICA/),

FastICA (http://cis.hut.fi/projects/ica/fastica/).

Алгоритм MCR-ALS (http://www.cid.csic.es/homes/rtaqam/) работает с использованием программы PLSoolbox v.5.2 (Eigenvector research, Wenatchee, WA, USA). В качестве начальных условий для работы MCR-ALS использовали спектры индивидуальных соединений, полученных при расчете алгоритмом MILCA. Во всех случаях, где это позволяли приближения методов, использовали производные второго порядка и подбирали оптимальные параметры ICA алгоритма для декомпозиции (число шагов в Монте-Карло оптимизации (Т) для метода SNICA, поправочный коэффициент (offset) для низких интенсивностей в алгоритме SIMPLISMA). Для алгоритма FastICA выбирали одновременный (symmetric) и поочередный (deflation) подход к расчету независимых компонент, метод учета интенсивности (nonlinearity), а также необходимость использования стабилизированной версии алгоритма (stabilization). Проекции на латентные структуры и регрессия на главные компоненты выполнены с использованием программного комплекса Unscrambler X 10.0.1 (Camo Software AS, Осло, Норвегия). Метод полной кросс-валидации использован для проверки моделей.

Дискриминантный анализ и анализ с использованием метода ComDim выполнены с использованием программного комплекса SAISIR c MATLAB интерфейсом, доступный на веб-странице: http://www.chimiometrie.fr/saisir_webpage.html/. Метод расчета коэффициента корреляции (R, интервал [-1,1]) реализован в виде алгоритма в программе MATLAB, позволяющего проводить расчет этого параметра автоматически и идентифицировать выделенные сигналы. Для расчета сходства экспериментальной и расчетной матриц концентраций использовали Амари индекс [204]: где . Амари индекс равен нулю только в том случае, если расчетная матрица отличается от истинной только перестановкой столбцов или на постоянный множитель и увеличивается, если качество декомпозиции ухудшается. При практическом использовании данного индекса считается, что декомпозиция прошла успешно, если численное значение индекса Амари меньше 0.05, в то время как значение индекса больше 0.2 характеризует неприемлемое качество декомпозиции.

Органическое вещество морской среды

Органическое вещество морской среды (МС) представляет собой сложную смесь углеводов, белков и жиров, подвергнутую полимеризационным и надмолекулярным взаимодействиям [228]. Из-за этого изучение химических и структурных характеристик МС чрезвычайно важно для описания биогеохимических циклов МС, изучения специфических аспектов химических механизмов, вовлеченных в агрегацию МС и для сравнения образцов МС, полученных из различных зон.

Подобные исследования требуют использования таких инструментальных методов, как флуоресценция [229] или вибрационная спектроскопия [228,230], которые способны выполнить такие задачи, но в любом случае химическая гетерогенность МС иногда требует помощи многомерных статистических методов для улучшения спектральной интерпретации. Фактически, как показано на рисунке 3.16, ИК спектр образцов МС, собранных по мере накопления осадков, структурно изменяются, что не позволяют четко установить вовлеченные химические реакции (например, полимеризацию и деградацию). Кроме того, присутствие перекрывающихся сигналов в ИК спектре может скрыть специфические компоненты и/или структурные особенности, накопленные в процессе агрегации. Отнесение полос ИК спектров образцов МС дает возможность проводить простую идентификацию химических компонентов, присутствующих в матрице, но не представляет более точную идентификацию химических путей, присутствующих в этом процессе.

В таком типе исследований многомерные методы (МГК, МНК, ПЛС и МРК) оказывают ценную помощь в изучении механизмов агрегации МС благодаря возможности наблюдать латентные структуры, присутствующие в сложных природных процессах [231]. Однако, используя многомерные методы интерпретации спектров, мы должны принимать в расчет специфические характеристики, которые различают эффективность каждого метода для выполнения химических и структурных исследований.

Известно, что различные хемометрические подходы (МГК, ПЛС, МНК и МРК) имеют различную статистическую основу и, соответственно, разные свойства. На основе исходной матрицы Х МГК вычисляет новые латентные переменные (главные компоненты ГК), описывающие информацию, присутствующую в наборе данных. Благодаря этому МГК используют для классификации образцов МС, на основе их взаимного сходства [231]. Однако ГК – это комбинация неопределенных сигналов, они не описывают химических реалий, и иногда физическое значение счетов и нагрузок тяжело интерпретировать [232]. Аналогичные рассуждения справедливы и для ПЛС.

МНК принадлежит к методам слепого разделения, и его цель состоит в идентификации чистых и скрытых источников, называемых независимые компоненты (НК), декомпозицией исходной матрицы Х перекрывающихся сигналов. Благодаря этому НК имеют определенный физический смысл [232,233].

Как и МНК, МРК выполняет декомпозицию матрицы Х на чистые и латентные образцы, однако МРК восстанавливает концентрационные профили на основе значимых физически или химически ограничений вместо статистических ограничений, используемых в МНК [234].

Для идентификации чистых компонентов (например, структурных характеристик) в образцах МС МНК и МРК потенциально лучше, чем МГК, и в этом исследовании мы использовали только эти два метода. Насколько нам известно, подход использования МНК и МРК ранее не использовался для изучения сложных ИК спектров МС. Мы протестировали МНК для декомпозиции различных наборов данных. В качестве примера на рисунке 3.17 приведены спектры фракции фуль-вокислот до МНК моделирования. Этот набор данных обработан тремя МНК алгоритмами: FastICA (рис. 3.18), JADE (рис. 3.19) и MILCA (рис. 3.20). Принимая во внимание, что ИК спектры требуют стандартизации, следует в любом случае применить Парето обработку или центрирование. Для данного случая (набор данных для фракции фульвокислот) полученные спектры предварительно обработаны Парето шкалированием (среди остальных этот метод показал лучшую производительность в обработке аналогичных наборов данных).

Рисунки 3.18-3.20 показывают три разрешенные НК для каждого используемого хемометрического метода. Можно видеть, что спектральная информация, полученная алгоритмом MILCA, значительно более детализирована и определенна, чем полученная с помощью FastICA (рис. 3.18) и JADE (рис. 3.19). В то время как первый НК хорошо разрешен всеми тремя используемыми методами, FastICA и JADE дают одновременно положительные и отрицательные сигналы во втором и третьем НК, затрудняя идентификацию и отнесение спектральных полос. Напротив, применение MILCA не приводит к такой неопределенности: все НК характеризуются положительными значениями и позволяют точно проводить идентификацию и отнесение полос. Таким образом становится возможной интерпретация специфических аспектов агрегации МС. Установлено, что неопределенность знака не важна в большинстве МНК приложений для обработки сигналов [235]. Однако базируясь на нашем опыте, мы можем заключить, что знак выделенных НК важен не только для лучшей визуальной оценки спектров, но также он может рассматриваться как эмпирический критерий успешной декомпозиции [236,237]. Часто мы наблюдали, что меняющийся знак выделенных спектральных кривых свидетельствует о неполной декомпозиции, приводящей к появлению отрицательных и положительных концентраций для некоторых компонентов [236,237].

Электронные сигареты

Хемометрика использована для анализа электронных сигарет. Объектами анализа стали электронные никотинпродуцирующие системы, которые переводят никотин в аэрозоль и производят пар, имитирующий дым традиционных сигарет, но содержащий значительно меньшее число вредных компонентов. Выбраны растворители, для которых классический анализ не может быть выполнен ввиду высокой степени перекрывания спектров индивидуальных компонентов. Спектры индивидуальных компонентов (1,2-пропандиол, этиленгликоль, глицерол и 1,3-пропандиол) выделены со значениями коэффициентов корреляции не ниже 0.95. Концентрации компонентов электронных сигарет получены и подвергнуты сравнению с данными газовой хроматографии (таблица 5.8). Другие возможные компоненты электронных сигарет (1,3-бутандиол и диэтиленгликоль) не обнаружены ни одним из рассматриваемых методов. Результаты двух рассматриваемых экспериментальных методов хорошо коррелируют друг с другом.

Несмотря на большой объем информации, получаемый при использовании современных методов анализа, использование набора данных только одного аналитического метода может быть недостаточно для получения полной картины изучаемого явления. Поэтому в течение последних нескольких лет использование гибридных аналитических методов все больше возрастает, многочисленные измерения одних и тех же образцов проводят, используя разные методы.

Относительно анализа пищевых продуктов методы обработки совмещенных наборов данных применяли ранее, например, для дискриминации 96 образцов вина, выдержанных в дубовых бочках, емкостях из нержавеющей стали с и без дубовых щепок, по данным ИК спектроскопии в ближней и средней области [284]. Информация, предоставляемая данными методами, базируется на одном физическом явлении (колебании связей), и поэтому легко может быть совмещена. В другом исследовании феноловые экстракты вин трех регионов анализировали двумерной 1Н-13С гетероядерной ЯМР спектроскопией. Результирующий многомерный тензор можно рассматривать как многоблоковый набор данных с матрицей 81 образца и 625 переменных (1Н измерение), измеренной по 413 блокам данных (13С измерение) [285]. Лучшая модель показала 87.6% правильных классификаций.

Сегодня наиболее производительными аналитическими методами, известными для вин и соков, являются изотопный анализ и 1Н ЯМР спектроскопия. Возможности ЯМР спектроскопии показаны в нескольких работах [272,286,287].

Второй метод, изотопный анализ, в настоящее время является официальным и стандартным методом установления аутентичности некоторых продуктов питания в Европе и Северной Америке [288-290]. Метод базируется на измерении содержания стабильных изотопов (2Н, 13С, 18О) продукта или специфического компонента, например, ингредиента или целевой молекулы.

Измерения обычно проводят с помощью масс-спектрометрии, полученные данные позволяют проводить идентификацию биологического или географического происхождения пищевого продукта [288,289]. Главная идея этих методов состоит в том, что у каждого растения есть характеристический диапазон содержания природных изотопов углерода (12С, 13С), водорода (1Н, 2Н) и кислорода (16О, 18О), распределение которых объясняется набором физических и биохимических факторов.

Главное приложение анализа стабильных изотопов в анализе соков и вин – это установление их аутентичности, т.е. определение нерегламентиро-ванных добавок сахаров, спирта и воды, а также верификация географического происхождения или года изготовления. Изначально отношение 2Н/1Н использовали для определения добавок сахара [291]. Затем было показано, что стабильные изотопы вина отражают географическое происхождение, год выпуска и сорт используемого винограда [288,289,292]. Таким образом, можно ожидать, что данные по стабильным изотопам улучшат хемометрические модели, базирующиеся только на 1Н ЯМР спектроскопии.

Наши исследования подтвердили сделанные предположения. Мы использовали как классический МГК, так и новый для классификации МНК. Однако полученные результаты не отличала большая точность (таблица 5.9). При использовании как факторного, так и линейного дискриминантного анализа процент правильных классификаций не превысил 86%. Применение метода анализа совмещенных наборов данных ComDim позволило увеличить процент правильных классификаций как в калибровочном, так и в тестовом наборах данных (табл. 5.9). В качестве данных, дополняющих ЯМР спектры, выступили данные по содержанию стабильных изотопов 18О, полученные методом масс-спектрометрии.

Похожие диссертации на Хемометрика в анализе многокомпонентных объектов на основе данных ИК, ЯМР и рентгенофлуоресцентной спектроскопии, отличающихся большим значением взаимной информации