Содержание к диссертации
Введение
1. Проблемы мобильного мониторинга гестационного сахарного диабета 13
1.1 Актуальность проблемы удаленного мониторинга пациентов с гестационным сахарным диабетом 13
1.2 Проблемы методического и информационного обеспечения системы информационной поддержки больных сахарным диабетом 15
1.3 Проблемы технического обеспечения системы мониторинга сахарного диабета 18
1.4 Проблемы информационной поддержки пациента – больного сахарным диабетом 20
1.5 Постановка цели и задач исследования 25
2. Система удаленного мониторинга гестационного сахарного диабета и оказания медицинского сопровождения пациента 28
2.1 Концепция построения системы удаленного мониторинга гестационного сахарного диабета 28
2.2 Обоснование выбора и формирование пространства диагностически значимых показателей мониторинга 37
2.3 Структура информационного обеспечения системы информационной поддержки больного гестационным сахарным диабетом 44
2.4 Выводы по главе 50
3. Модели, алгоритмы и решающие правила для оценки состояния пациента с гестационным сахарным диабетом 52
3.1 Алгоритм обработки данных 52
3.2 Разработка модели для прогнозирования гликемии 60
3.3 Разработка решающих правил для информационной поддержки пациента 76
3.4 Выводы по главе 81
4. Техническая реализация и экспериментальная апробация системы мониторинга 82
4.1 Техническая реализация системы мониторинга 82
4.2 Клиническая апробация разработанной системы 96
4.3 Выводы по главе 110
Заключение 111
Список сокращений и условных обозначений 113
Список использованной литературы 115
Приложение А. Данные недельного мониторования CGMS для некоторых испытуемых 128
- Проблемы информационной поддержки пациента – больного сахарным диабетом
- Обоснование выбора и формирование пространства диагностически значимых показателей мониторинга
- Разработка модели для прогнозирования гликемии
- Техническая реализация системы мониторинга
Введение к работе
Актуальность темы
В практике лечения сахарного диабета ключевой задачей, решаемой
пациентом и лечащим врачом, является нормализация гликемии и
предотвращение гипо- и гипергликемических состояний. Это особенно актуально для начальных сроков после диагностирования заболевания, когда у пациента отсутствует опыт поддержания нормогликемии. При этом особого внимания требует гестационный сахарный диабет (ГСД), при котором выход уровня сахара в крови (УСК) за пределы допустимой нормы, может привести к патологии плода и осложнениям беременности.
Для решения задачи стабилизации гликемического профиля больного на ранних этапах лечения заболевания необходим строгий контроль над программой компенсации диабета, что возможно сделать только при осуществлении удаленного мониторинга состояния пациента с применением системы информационной поддержки пациента. Выбор данного подхода делает необходимым разработку технического инструментария, алгоритмического и программного обеспечения.
Принцип дистанционного мониторинга пациентов накладывает ряд
ограничений и обуславливает множество требований к разрабатываемой системе
информационной поддержки пациента. В частности, для своевременного
выявления риска гипо- и гипергликемических состояний необходимо
осуществлять предсказание будущих значений уровня сахара в крови с учетом
информации о питании, физических нагрузках и инъекциях инсулина. В текущей
практике лечения сахарного диабета применяются формулы расчета
компенсаторных доз инсулина, основанные на простейших эмпирических
закономерностях, связывающих потребляемое количество углеводов и требуемые
инъекции инсулина. Лучшее представление о характере гликемической кривой
позволяют составить тренажеры и разрабатываемые математические модели, но
существующие на текущий момент в практике лечения заболевания методы
недостаточно полно отражают динамику изменения состояния пациента. Для
разработки динамической модели метаболизма глюкозы пациента и
прогнозирования уровней гликемии и выработки рекомендаций для больного могут быть успешно применены методы машинного обучения, основанные на использовании больших массивов получаемых в ходе мониторинга данных.
Для сбора, анализа и обработки данных пациента, прогнозирования его состояния и выработки рекомендаций по нормализации гликемии, необходимо разработать технологию удаленного мониторинга пациентов с ГСД, методическое и информационное обеспечение системы, технические и программные средства.
Цель исследования: разработка мобильной системы информационной поддержки больных гестационным сахарным диабетом, обеспечивающей повышение эффективности контроля уровня сахара в крови у пациентов.
Объектом исследования является мобильная система информационной поддержки больных гестационным сахарным диабетом.
Предметом исследования являются компоненты информационного,
методического, алгоритмического и программного обеспечения мобильной системы информационной поддержки больных гестационным сахарным диабетом.
Задачи исследования
-
Обоснование и формирование комплекса показателей для удаленного мониторинга состояния пациента, позволяющих в динамике оценивать метаболизм глюкозы в организме человека и прогнозировать состояние пациента.
-
Разработка динамической модели метаболизма глюкозы, позволяющей прогнозировать изменяющееся во времени значение уровня сахара в крови больных ГСД и здоровых людей.
3. Разработка метода оказания удаленной информационной поддержки
больных ГСД на основе методик обработки и анализа информации, позволяющих
сформировать комплекс распределенных во времени показателей для оценки
текущего состояния и прогнозирования состояния больного ГСД.
4. Обоснование и разработка структуры системы информационной поддержки
больного ГСД.
5. Разработка экспериментального образца мобильной системы
информационной поддержки больного ГСД и его клиническая апробация.
Научную новизну работы составляют
1. Комплекс показателей для удаленного мониторинга состояния пациента,
позволяющих в динамике оценивать метаболизм глюкозы в организме человека и
прогнозировать состояние пациента.
-
Динамическая модель метаболизма глюкозы, позволяющая прогнозировать изменяющееся во времени значение уровня сахара в крови больных ГСД и здоровых людей.
-
Методики обработки и анализа информации, позволяющие сформировать комплекс распределенных во времени показателей для оценки текущего состояния и прогнозирования состояния человека, и метод оказания удаленной информационной поддержки больного ГСД на основе анализа динамически изменяющихся показателей.
4. Структура мобильной системы удаленной информационной поддержки
больного ГСД, обеспечивающая повышение эффективности контроля уровня
сахара в крови у пациентов на основе предложенных прогностической модели и
ретроспективных методов анализа изменения состояния больных.
Методы исследования
В работе использованы методы системного анализа, математического
моделирования, математической статистики, обработки и анализа
экспериментальных данных, методы машинного обучения и глубинного анализа данных, реализованные в специализированном программном обеспечении.
Научные положения, выносимые на защиту
При построении системы удаленной информационной поддержки больных с ГСД для повышения эффективности оценки текущего состояния и прогнозирования состояния пациента необходимо использовать:
– комплекс показателей, позволяющих в динамике отражать состояние пациента,
– прогностическую модель метаболизма глюкозы, основанную на уравнении линейной регрессии с комплексом диагностически значимых показателей, коэффициенты при которых определяются путем сравнения прогнозируемого гликемического ответа с реальным,
– методики обработки и анализа распределенных во времени биомедицинских данных, основанных на автоматическом сопряжении данных из различных источников, их приведение к необходимому виду для оценки и контроля изменяющегося состояния пациента.
Степень достоверности
Достоверность результатов работы обеспечивается проведением клинической апробации разработанной системы в медицинской практике, получением высокой точности прогнозирования показателей гликемического ответа при сопоставлении с реальными значениями в ходе экспериментального исследования.
Апробация результатов работы
Основные положения и результаты диссертационной работы представлялись и
докладывались на следующих международных научно-практических
конференциях и семинарах: 53rd Annual Meeting of the European Association for the Study of Diabetes (Lisbon, Portugal, 2017), 5th ENEA Workshop: Hyperprolactinemia and other endocrine causes of infertility (Saint Petersburg, 2017), 10th International Conference on Advanced Technologies & Treatments for Diabetes ATTD 2017 (Paris, France, 2016), International Festival of Social Entrepreneurship "IFSE" (Saint Petersburg, 2016), 4th European young endocrine scientists meeting "EYES" (Moscow, 2016), 14th International conference on informatics, management, and technology in healthcare "ICIMTH" (Athens, Greece, 2016), XII Russian-German conference on biomedical engineering "RGC BME" (Suzdal, 2016), XII международная научная конференция Физика и радиоэлектроника в медицине и экологии “ФРЭМЭ” (Суздаль, 2016), Seminar for 2015 DAAD Lomonosov and Kant Scholars (Москва, 2016), Seminar for 2015 DAAD Lomonosov and Kant Scholars (Bohn, Germany, 2015), X Russian-German conference on biomedical engineering (Saint Petersburg, 2014), SPITSE 2014 Symposium (Ilmenau, Germany, 2014), IX, X, XI, XII Международный славянский Конгресс «Кардиостим» (Санкт-Петербург, 2010, 2012, 2014, 2016), XIV Международная конференция по мягким вычислениям и измерениям SCM (Санкт-Петербург, 2011), всероссийских научно-технических конференциях: 65, 66, 67, 68, 69, 70, 71, 72, 73 научно-техническая конференция НТОРЭС, посвященная Дню радио (Санкт-Петербург, 2010-2017), Всероссийская конференция с международным участием «Командный подход в современной эндокринологии» (Санкт-Петербург, 2016), IV, V Научно-практическая конференция с международным участием «Наука настоящего и будущего» (Санкт-Петербург, 2015, 2016), XXIV, XXVIII Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы» (Рязань, 2011, 2015), Научная сессия «От трансляционных исследований — к инновациям» (Санкт-Петербург, 2015), 3-я всероссийская молодежная школа-семинар "Инновации и
перспективы медицинских информационных систем" ИПМИС (Таганрог, 2013), Всероссийская молодежная научная конференция «Актуальные вопросы биомедицинской инженерии» (Саратов, 2013), Всероссийская научная школа молодых ученых, преподавателей, аспирантов, специалистов “Биомедицинская инженерия» (Санкт-Петербург, 2009, 2010), ведомственных конференциях: 63-70-я конференция профессорско-преподавательского состава СПбГЭТУ «ЛЭТИ» (Санкт-Петербург, 2010-2017).
Внедрение результатов работы
Разработанная система внедрена в лечебный процесс Института
Эндокринологии Национального медицинского исследовательского центра им. В.А. Алмазова при ведении больных ГСД. Разработанное в ходе исследований мобильное приложение для сбора данных о течении заболевания используется для мониторинга пациентов с заболеваниями ГСД, сахарного диабета 1 типа и синдрома поликистозных яичников в Институте Эндокринологии НМИЦ им. В.А. Алмазова и в СПб ГБУЗ «Центр планирования семьи и репродукции» Санкт-Петербурга.
Результаты диссертационной работы Пустозерова Е.А. внедрены и используются в учебном процессе при реализации бакалаврской образовательной программы по направлению «Биотехнические системы и технологии» в рамках дисциплины «Моделирование биологических процессов и систем» и магистерских образовательных программ «Биотехнические системы и технологии в протезировании и реабилитации» и «Информационные системы и технологии в лечебных учреждениях» по направлению «Биотехнические системы и технологии» в рамках дисциплины «Моделирование в биотехнических системах», а также в практике научных исследований кафедры Биотехнических систем СПбГЭТУ «ЛЭТИ».
Основные результаты работы получены в рамках НИР и НИОКР:
1. Грант РФФИ № 16-07-00599 «Модели, методы и система интеллектуального
телемедицинского мониторинга состояния здоровья человека и прогнозирования
обострения заболеваний».
2. Грант по приоритетному направлению деятельности РНФ №15-14-30012,
наименование «Изучение молекулярно-генетических и эпигенетических
механизмов развития гестационного сахарного диабета и его влияния на плод».
3. НИР ММС/БЭС-136, наименование «Разработка мобильной системы
информационной поддержки для удаленного мониторинга пациентов»
(госзадание Министерства образования и науки РФ, проект № 3722: Проведение
научно-исследовательских работ в рамках международного научно-
образовательного сотрудничества по программе «Михаил Ломоносов»).
4. Гранты Санкт-Петербурга для студентов, аспирантов, молодых ученых,
молодых кандидатов наук 2010, 2011, 2013 гг. Дипломы ПСП № 10564, 11467,
13388.
Публикации по теме исследования
По теме диссертации опубликовано 54 научные работы, из них 8 статей в ведущих рецензируемых научных журналах и изданиях, определенных ВАК, 4 – в изданиях Web of Science и Scopus, 15 - в трудах международных научных и
научно-технических конференций, 21 – в трудах всероссийских научно-технических и медицинских конференций, 1 свидетельство о регистрации программы для ЭВМ.
Структура и объем диссертации
Диссертация состоит из введения, 4 глав, заключения, списка литературы из 101 наименования. Основное содержание диссертации изложено на 127 листах, содержит 45 рисунков, 9 таблиц и 1 приложение.
Проблемы информационной поддержки пациента – больного сахарным диабетом
Для выработки рекомендаций о нормализации гликемии необходимым является прогнозирование уровня сахара в крови в краткосрочной (от 30 минут до 2 часов) и долгосрочной (оценка рисков для данного пациента в течении недели) перспективе. Разработка метода точного прогнозирования УСК является одной из ключевых проблем исследования и лечения сахарного диабета. На основе точного алгоритма прогнозирования уровня сахара в крови может быть построена рекомендательная система, осуществляющая информационную поддержку пациента.
Существуют различные подходы к моделированию гликемической кривой. В работе [20] выделяются два типа математических моделей, используемых для предсказания УСК и выработки рекомендаций по компенсации:
– на основе фактических данных (эмпирические модели);
– на основе физиологических и патофизиологических принципов (теоретические модели).
Многие исследователи также выделяют гибридные модели, которые используют простейшие физиологические модели для обработки данных о питании и инсулинотерапии, а затем настраивают основанные на данных (data-driven) модели на будущие уровни гликемии [21].
При этом эмпирические модели создаются на основе анализа данных, используемых для обучения модели, практически без учета физиологических механизмов, стоящих за изменением уровня гликемии. Как правило, на выходе этих моделей получают концентрацию сахара в крови, а входными данными могут служить как множество ранее измеренных значений УСК, так и другая информация (приемы пищи, инъекции инсулина, физическая активность, уровень кетонурии и т.д.).
С другой стороны, априорное знание физиологических закономерностей регуляции системы инсулин–глюкоза является основой для создания теоретических моделей. Некоторые модели этого класса содержат минимальное число уравнений, которые сосредоточены только на основных физиологических аспектах, в то время как другие модели (с большим числом уравнений) детально отражают физиологические закономерности регуляции уровня гликемии. Разработаны математические модели, характеризующие скорость всасывания глюкозы из пищи в плазму крови, описывающие фармакокинетику и фармакодинамику инсулина, а также учитывающие влияние физических нагрузок.
Наиболее часто встречающиеся подходы к прогнозированию УСК на основе фактических данных:
– Модели временных рядов (модели авторегрессии, авторегрессии – скользящего среднего);
– Искусственные нейронные сети;
– Модели на основе опорных векторов;
– Вероятностные сети Байеса;
– Фильтр Калмана.
При этом используются, как правило, следующие входные переменные: уровень глюкозы, инсулин, приемы пищи, физическая активность.
Среди теоретических моделей можно выделить:
– смешанные модели, базирующихся на основных физиологических закономерностях регуляции углеводного обмена;
– полные модели, рассчитанные на максимальный учет всех доступных знаний о механизмах регуляции метаболизма глюкозы в большой нелинейной модели высокого порядка с большим числом параметров.
Наиболее популярной моделью в исследованиях диабета является минимальная модель, предложенная Бергманом [22]. Минимальная модель включает 3 обыкновенных дифференциальных уравнения, описывающих изменения концентрации сахара и инсулина в плазме крови, а также элиминацию инсулина в организме (не рассматривая внешних воздействий). Ключевым преимуществом данной модели является ее простота, дающая возможность производить расчет важных физиологических параметров, используя значения уровня сахара и инсулина в плазме крови, которые можно получить из клинических тестов.
Большая работа была сделана в направлении разработки математических моделей для прогнозирования уровня сахара в крови. Определенные результаты были получены в ходе мультидисциплинарного проекта DIAdvisor [23], целью которого была разработка программы для выработки onhe-point советов для больных СД-1 и СД-2. В рамках проекта были разработаны: физиологическая модель взаимодействия инсулина и глюкозы в организме, основанная на данных прогностическая модель глюкозы, приложение-советчик для пациента и врача, проведено исследование на небольшой группе пациентов в условиях медицинского учреждения. Несмотря на полученные результаты, система не была внедрена в медицинскую практику и проект был закрыт.
В диссертационных исследованиях [24] и [25] осуществляется прогнозирование уровня сахара в крови по данным CGMS сигналов и данных о концентрации инсулина в крови при помощи линейных прогностических моделей: авторегрессии – скользящего среднего (ARMAX) и моделями, основанными на пространстве состояний (state-space models). Ни одна из рассмотренных моделей не обеспечила приемлемую точность при прогнозировании на 60 минут и больше. Также в работе было показано, что учет ЧСС и физической активности не приводит к повышению точности прогнозируемых моделей. С другой стороны существуют исследования, показавшие эффективность учета ЧСС [26].Существуют работы, использующие модель авторегрессии – скользящего среднего для предупреждения гипогликемии [27].
В работе, посвященной построению индивидуальных предсказательных моделей для прогнозирования УСК у пациентов с СД-1 по сигналам CGMS [28] была использована комбинация из двух моделей с постоянными параметрами, основанными на дифференциальных уравнениях, имитирующих процессы усвоения глюкозы, инсулина и построенной на данных линейной модели инсулин глюкозного взаимодействия. Полученная модель показала точность, сопоставимую с моделями, предложенными в предыдущих исследованиях. Была получена статистически значимая разница между пациентами, использующими инсулиновые помпы и единовременные инъекции инсулина. В работе также была представлена расширенная модель, которая учитывала задержку показаний сенсора глюкозы. Динамика УСК и уровня сахара в крови описывалась в виде авторегрессионного процесса с внешними параметрами (ARX). Однако, расширенная модель не была протестирована на достаточно большой выборке.
Для прогнозирования уровня сахара в крови в литературе часто упоминаются модели, осуществляющие прогнозирование только по серии отсчетов сигналов систем непрерывного мониторирования уровня сахара в крови (CGMS), например, модели авторегрессии, авторегрессии-скользящего среднего, модель Grey GM (1, 1) [29], адаптивные фильтры [30], фильтр Кальмана [31]. Однако данные модели в целом показали недостаточную для практического применения точность.
Многие исследователи применяют для прогнозирования гликемии нейронные сети различной конфигурации. Так в работе [32] была использована параллельная запись сигнала CGMS и событий в электронных дневниках наблюдения, при этом, для каждого пациента использовались только его данные для прогноза.
Результирующая средняя относительная ошибка предсказания при прогнозировании УСК 2 часа после текущего момента составила 14,5%. В работе [33] для этой цели применялись самообучающиеся нейросетевые модели с применением статических карт Кохонена и получен корень среднеквадратической ошибки RMSE = 0,521.
Существуют различные подходы к оценке эффективности прогнозирования гликемии. В качестве референтной оценки уровня сахара в крови различными исследователями принимается среднее значение уровня сахара в крови за весь период исследования, текущее значение уровня сахара в крови, значение предсказанное авторегрессионной моделью и в некоторых случаях предсказания экспертов [34].
Обоснование выбора и формирование пространства диагностически значимых показателей мониторинга
Для проектирования системы удаленного мониторинга состояния пациента необходимо определить пространство диагностически значимых признаков, в полной мере характеризующих состояние больного. Существуют различные подходы к выбору показателей для мониторинга, в простейших системах решение об успешности терапии производится на основе одного показателя – уровня сахара в крови. Пространство показателей мониторинга должно объективно и достоверно оценивать текущее состояние больного ГСД. Рассмотрим систему взаимодействия глюкозы и инсулина в организме человека – рисунок 2.6. Уровень сахара в крови является ключевым показателем, характеризующим состояние больного сахарным диабетом. Основным источником поступления в кровь глюкозы является пищеварительная система. Под действием инсулина происходит депонирование глюкозы в печени в виде глюкагона и его обратное расщепление до глюкозы в процессе гликогенолиза. Инсулин также влияет на потребление глюкозы в инсулин-зависимых тканях. Активность рецепторов инсулина в клетках зависит от потребности клеток в глюкозе, определяемой большим рядом различных факторов, в первую очередь, физической активностью.
Таким образом, ключевыми факторами, влияющими на уровень гликемии, являются приемы пищи, инъекции инсулина и физические нагрузки. Также ряд исследований направлено на изучение влияния на УСК эмоционального стресса и характера сна. В качестве ключевого критерия выбора факторов, влияющих на УСК, являются в первую очередь физическая реализуемость и простота учета параметров, наряду с их диагностической информативностью.
Для получения достоверной информации о состоянии больного ГСД предлагается использование системы показателей и сигналов, представленных в таблице 2.1. Из всех клинических показателей, фиксируемых в ходе наблюдения за беременными с ГСД (более 600 параметров имелось для больных, полученных в ходе 6 визитов в лечебное учреждение и 140 фиксировалось при удаленном мониторинге) были выделены показатели, имеющие значение для прогнозирования состояния пациента ГСД и потенциально вносящие вклад при прогнозировании гликемии, включающие 38 показателей для оценки текущего состояния пациента и 59 показателей для прототипирования пациента, которые могут быть представлены в виде трех групп показателей. Данная система показателей разработана совместно с врачами-эндокринологами НМИЦ им. В.А. Алмазова и отражает основные факторы, влияющие на уровень сахара в крови человека.
Пространство показателей включает: физиологические сигналы, показатели персональных дневников наблюдения пациентов и показатели, характеризующие индивидуальные особенности пациентов.
При этом параметры, характеризующие состояние конкретного пациента, следует разделить на две группы: относительно стабильные параметры, характеризующие индивидуальные особенности пациента и временные возмущения, играющие роль при оценке текущего состояния пациента. Временные возмущения являются внешними воздействиями, влияющие на уровень сахара в крови: например, объем инъекции инсулина и количество потребляемых в процессе питания углеводов [45, 46].
Также следует учитывать наличие факторов, оказывающих влияние на гликемическую кривую, но характер влияния которых в настоящее время тяжело оценить, таких как эмоциональный стресс и климатические условия. Вопросы влияния на организм больного природных явлений были рассмотрены нами в патенте [47].
Для оценки питания в большинстве описанных случаев в литературе используется характеристика количества углеводов или хлебных единиц. В некоторых исследованиях также приводится оценка влияния на УСК белков и жиров потребляемой пищи, а также гликемического индекса. В данной работе значительно расширено пространство признаков, характеризующих потребляемую пищу, всего было учтено 27 параметров, включая микро- и макроэлементы. Среди них: вода (г), энергетическая ценность (ккал), жиры (г), углеводы (г), пищевые волокна (г), сахара (г), кальций (мг), железо (мг), фосфор (мг), цинк (мг), медь (мг), рибофлавин (мг), ниацин (мг), тиамин (мг), витамин B6 (мг), фолат (мкг), фолиевая кислота (мкг), ретинол (мкг), ретиноловый эквивалент (мкн), альфа-каротин (мкг), бета-каротин (мкг), витамин С (мг), витамин E (мг), витамин D (мг). База данных включает в себя 2153 основных позиции и 8619 дополнительных. Продукты питания и блюда разделены на 37 категорий. В подготовке базы данных были использованы источники в отечественной [48, 49, 50] и зарубежной [51] литературе. Была получена уникальная, не имеющая аналогов в мире база данных продуктов питания, которая позволила производить точный учет состава питания для оценки его влияния на УСК в ходе исследований для построения предсказательных моделей. В дальнейшем планируется включение в базу данных информации о гликемическом индексе продуктов и блюд, для чего может быть использована специальная методика определения гликемического индекса по составу входящих в блюдо продуктов [52].
В разработке данной модели было также впервые в практике использовано большое количество показателей для прототипирования пациентов. Была проведена работа для выделения наиболее значимых характеристик человека, оказывающих влияние на характер гомеостазиса глюкозы. Были использованы данные лабораторных исследований, анамнеза, генетических тестов, биометрические характеристики и др. (всего 97 параметров в финальном анализе). Из этих показателей алгоритмами машинного обучения были выделены наиболее существенные для задачи предсказания гликемической кривой характеристики.
Мы предлагали для построения модели различные переменные, характеризующие пациентов, которые потенциально могут быть предикторами гликемического ответа: уровень гликемии натощак и после нагрузки глюкозой через 1 и 2 часа в оральном глюкозотолерантном тесте (ОГТТ), возраст, данные анамнеза (наличие нарушения толерантности к глюкозе (НТГ), синдрома поликистозных яичников (СПКЯ), ГСД (да/нет), количество беременностей, родов, эпизодов невынашивания в анамнезе, длительности приема комбинированных оральных контрацептивов до беременности, семейный анамнез СД (да/нет)), антропометрические данные (рост, вес и ИМТ до беременности, уровень систолического и диастолического АД на момент начала исследования), параметры образа жизни по данным анкетирования (частота приема в пищу основных продуктов питания в неделю (фрукты, выпечка, молочные продукты, бобовые, мясо, колбасные продукты, сушеные фрукты, рыба, цельнозерновой хлеб, соусы, овощи, алкоголь, газированные напитки, кофе), физическая активность (ходьба, 30 мин./день, 30–60 мин./день, 60 мин./день; частота подъемов по ступеням, 4 пролетов/день, 4–16 пролетов/день, или 16 пролетов/день; частота занятия спортом, 30 мин./день, 30–60 мин./день, 60 мин./неделя), курение до и во время беременности), 8 SNPs в 7 генах, ассоциированных с риском ГСД (MTNR1B (rs10830963 and rs1387153), GCK (rs1799884), KCNJ11 (rs5219), IGF2BP2 (rs4402960), TCF7L2 (rs7903146), CDKAL1 (rs7754840), and IRS1 (rs1801278)), и биохимические параметры на момент включения в исследование (инсулин, индекс НОМА, гликированный гемоглобин НЬАІС, фруктозамин, лептин, холестерин, триглицериды, липопротеины низкой плотности, липопротеины высокой плотности).
Таким образом, в ходе работы было сформулировано пространство значимых показателей, включающих две группы показателей: характеризующие особенности метаболизма глюкозы конкретного человека и описывающие текущее состояние пациента. Совокупность данных показателей позволяет в полной мере описать пациента, осуществлять прогноз гликемической кривой и в дальнейшем вырабатывать рекомендации врачу и пациенту.
Разработка модели для прогнозирования гликемии
Для выработки рекомендаций пациенту – больному сахарным диабетом применяется прогностическая модель постпрандиального гликемического ответа.
Важным этапом перед разработкой модели является определение выходной переменной, на основе которой будет осуществляться выработка рекомендаций. В большинстве случаев, это значение УСК через определенное время после еды. Модели, имеющие в качестве входной переменной непрерывный сигнал гликемии, полученный от систем CGMS, часто строятся для осуществления прогнозирования гликемии на диапазоне от 5 минут до 6 часов. Также существуют модели для прогнозирования гликемии натощак [58].
Для полноценного принятия решения о компенсации гликемии необходимо достаточное количество показателей, поэтому было принято решение для пациентов с CGMS использовать совокупность моделей, каждая из которых осуществляет прогнозирование одного из пяти наиболее существенных для выработки рекомендаций по компенсации гликемии в постпрандиальном периоде параметров (таблица 3.1).
В дальнейшем выработка рекомендаций для пациентов с CGMS осуществляется на основе совокупности данных выходных показателей, полученных при помощи ансамбля предсказательных моделей.
Для пациентов без CGMS осуществляется прогноз гликемии через час после еды и натощак утром следующего дня.
Важным аспектом при построении предсказательных моделей является подход к разделению данных от ряда пациентов, при этом можно выделить два подхода: построение общей модели, входные параметры которой включают индивидуальные характеристики пациентов, либо построение индивидуализированных моделей для каждого пациента только по данным конкретного больного. Примером такой модели может быть основанная на данных модель, имеющая на входе предварительно обработанные индивидуализированными регрессионными моделями, описывающими динамику влияния на гликемическую кривую инъекций инсулина, приемов пищи, физической нагрузки [59].
В настоящее время существует различные модели метаболизма глюкозы и инсулина, тем не менее, наилучший результат в литературе был получен для эмпирических моделей, построенных на данных.
В дальнейшем в данной работе был сделан выбор в пользу эмпирических моделей, основанных на знаниях, осуществляющих прогноз гликемии на основе данных о текущем состоянии пациента и введенных в систему характеристик самого пациента. Схема на рисунке 3.7 демонстрирует данный подход. Имея достаточное количество данных, описывающих совокупность существенных для метаболизма глюкозы индивидуальных характеристик пациентов, и различных ситуаций, описываемых совокупностью предшествующих измерений гликемии, приемов пищи, инъекций инсулина и т.д., можно для конкретного пациента в конкретной ситуации адекватно спрогнозировать показатели гликемического ответа. Эффективность прогнозирования в данном случае, во многом определяется качеством данных, на которых строится модель.
Для построения прогностических моделей для определения гликемического ответа по CGMS были использованы данные о 909 приемах пищи и соответствующих записях сигнала, полученных входе недельного мониторирования 62 испытуемых (38 пациенток с ГСД и 14 испытуемых контрольной группы). Всего для анализа было выделено 97 переменных, включая качественные. Качественные переменные с более чем 2 принимаемыми значениями были преобразованы в несколько фиктивных переменных (dummy variable) для использования их в построении регрессионных моделей, всего было выделено 127 переменных, описанных в разделе 2.2 диссертационного исследования.
Алгоритм исследования пациента включает следующие этапы: включение пациента в исследование, мониторинг пациента с использованием электронных дневников наблюдения, серия из 5 визитов, включающих лабораторные исследования, наблюдение за пациентом с использованием непрерывной системы мониторинга.
В ходе работы было апробировано большое множество основанных на данных моделей и алгоритмов машинного обучения для построения моделей, включая нейронные сети, метод опорных векторов, деревья решений, Random Forest [65], C4.5 [66] и др. В итоге была использована совокупность многопараметрических линейных регрессионных моделей [67]. Выбор в пользу линейной регрессионной модели был сделан ввиду высокой интерпретируемости данных и удовлетворительной прогностической способности, а также высокой скорости настройки коэффициентов данной модели, что является необходимым условием для автоматического динамического обновления коэффициентов в ходе работы системы.
Ввиду большого количества входных переменных, потенциально влияющих на прогнозируемую переменную, для данной задачи высокое значение имеет преодоление проблемы переобучения, при которой случайные явления в обучающей выборке, отсутствующие в генеральной совокупности, описываются в коэффициентах модели и снижают предсказательную способность модели на тестовой выборке. По этой причине на первом этапе построения модели решалась задача сокращения размерности массива входных переменных.
Первоначально для снижения количества признаков нами был использован метод последовательного включения входных переменных с оценкой коэффициента детерминации R2 модели после каждой итерации (stepwise regression).
Таким образом были рассчитаны коэффициенты всех моделей (AUC60, AUC120, BG60, BGPeak, BGRise). Характеристики коэффициентов модели для прогнозирования AUC120 представлены в таблице 3.3.
Для оценки полученных моделей на тестовой выборке из данных 20% пациентов, принявших участие в исследовании, были использованы оценки коэффициента корреляции Пирсона (R), корня среднеквадратической ошибки (RMSE), средней абсолютной ошибки (MAE), средней относительной ошибка (MAPE), в соответствии с которыми принималось решение об адекватности предсказания разработанных моделей.
Для прогнозирования других характеристик гликемического ответа были построены аналогичные линейные регрессионные модели, в которые вошли характеристики, дающие наилучшую точность прогноза на валидационной выборке в каждом случае. В виду недостаточной точности прогнозирования разработанной модели на тестовой выборке (R 0,5; МАРЕ 15%), что могло быть обусловлено высокими абсолютными значениями коэффициентов в финальной модели, реализованной в разрабатываемой системе, для выбора переменных была применена линейная регрессионная модель с регуляризацией. Выбор значимых входных переменных и подбор коэффициентов осуществлялся методом L1-регуляризации (лассо-регуляризация) [68] с минимизацией среднеквадратической ошибки (при этом для каждой модели выбирался индивидуальный параметр А).
Техническая реализация системы мониторинга
Для технической реализации системы мониторинга были сформулированы следующие требования:
– необходим выбор подходящей архитектуры;
– должна быть гарантирована простота использования системы пользователями без компьютерной грамотности;
– необходимо обеспечить простые в реализации средства сбора всех необходимых данных и пересылка их врачу.
Кроме того, система должна обеспечивать следующие возможности:
– систематизированный сбор и хранение измерительной информации и данных пациента локально на устройстве больного и централизованно на сервере;
– экспорт данных в различные форматы и осуществление доступа врача и пациента к данным;
– предупреждение в краткосрочной перспективе острых состояний на основе анализа и обработки измерительной информации;
– статистический анализ данных и выработка рекомендаций пациенту в долгосрочной перспективе;
– осуществление связи врача с пациентом для оказания экстренной медицинской помощи;
– мотивация пациента для проведения мероприятий по самоконтролю диабета.
Экспериментальный комплекс включает мобильное приложение пациента, программное обеспечение врача и удаленного сервера [83]. Для записи непрерывных сигналов гликемии использовалась система MiniMed iPro.
Важным этапом в разработке системы была проработка экспорта и представления собранных данных в форме удобной для дальнейшего статистического анализа и контроля лечащим врачом. По указаниям специалистов медицинского центра были подготовлены алгоритмы для автоматизированного наполнения специальных таблиц с дневниками наблюдения пациентов, пригодных для визуализации данных и дальнейшей обработки [84]. В настоящее время реализована пересылка данных наблюдения врачу посредством электронной почты и передача данных напрямую при непосредственном приеме врача.
Приложение ДиаКомпаньон [85, 86] было разработано для ведения электронных дневников наблюдения на стороне пациентов. Были разработаны версии для мобильных устройств на базе ОС Android (рисунок 4.1) и ПК на базе ОС Windows, Mac OS, Linux (рисунок 4.2).
Результаты сбора данных собирались в стандартизованном отчете в виде таблиц MS Excel и пересылались лечащим врачам, а также использовались для построения прогностических моделей. В отчете данные представлены на 5 листах: «Измерения сахара и инсулин» (рисунок 4.3), «Приемы пищи» (рисунок 4.4), «Физическая нагрузка и сон», «Кетоны в моче», «Удаленные записи», каждый из которых представлен в удобной для анализа и дальнейшей статистической обработки форме.
На рисунках 4.5 – 4.12 представлены некоторые экранные формы разработанного приложения для мобильных устройств с ОС Android и для ПК (ОС Windows, Mac OS, Linux). На главном экране пациент может выбрать тип записи, который необходимо сделать («Измерение сахара», «Введение инсулина», ««Физ. активность и сон»), посмотреть историю записей, либо экспортировать данные (рисунок 4.5).
В меню главного экрана (рисунок 4.6) есть возможность добавить запить о кетонурии (относительно редкая запись), отредактировать данные пациента, настроить синхронизацию данных приложения с сервером RuHealth.net (интегрированным с медицинской информационной системой НМИЦ им. В.А. Алмазова), отметить дни, когда данные были заполнены максимально полно (используется лечащим врачом) и обратиться к помощи при работе с приложением (включая дистанционную техническую поддержку).
Окна для добавления записей имеют стандартизованный вид и позволяет пациенту быстро добавлять нужные записи, при этом по умолчанию устанавливаются наиболее вероятные значения (например, текущее время и дата), редко изменяемые параметры записей убраны в меню. На рисунке 4.8 показано окно для добавления записей об инъекциях инсулина.