Содержание к диссертации
Введение
Глава 1. Энтропийные методы и модели исследования многомерных стохастических систем 12
1.1. Энтропия как общесистемный параметр 12
1.2. Энтропийное моделирование в задачах диагностики 17
1.3. Многомерная энтропийная модель гауссовских систем 22
1.4. Методы непараметрической оценки индекса детерминации 25
1.5. Выводы и результаты 34
Глава 2. Разработка энтропийной математической модели динамики многомерных стохастических систем 35
2.1. Дифференциальная энтропия многомерных случайных векторов... 35
2.2. Энтропийная модель динамики многомерных стохастических систем 53
2.3. Свойство симметрии теоретических значений корреляционных отношений 57
2.4. Выводы и результаты 60
Глава 3. Численные методы и алгоритмы идентификации энтропийных моделей многомерных стохастических систем 61
3.1. Алгоритмы идентификации энтропийной модели многомерных стохастических систем 61
3.1.1. Модифицированный алгоритм группировки данных на основе алгоритма FOREL 62
3.1.2. Ядерное сглаживание 69
3.1.3. Алгоритм на основе сглаживания линейной регрессией
3.2. Сравнение алгоритмов непараметрического оценивания индекса детерминации 83
3.3. Устойчивость алгоритма на основе сглаживания линейной регрессией к большим выбросам 92
3.4. Алгоритм диагностики и контроля состояний энтропийной модели динамики многомерных стохастических систем 96
3.5. Выводы и результаты 100
Глава 4 . Практическое применение разработанных моделей, методов и алгоритмов 102
4.1. Область применения энтропийной модели динамики 102
4.2. Моделирование динамики системы автотранспортного предприятия ООО «Курганавтотранс» 104
4.3. Анализ энтропии популяции при профилактики неинфекционных заболеваний 107
4.4. Анализ энтропийной модели динамики в экономике 116
4.5. Выводы и результаты 121
Заключение 123
Список литературы
- Многомерная энтропийная модель гауссовских систем
- Свойство симметрии теоретических значений корреляционных отношений
- Алгоритм на основе сглаживания линейной регрессией
- Моделирование динамики системы автотранспортного предприятия ООО «Курганавтотранс»
Многомерная энтропийная модель гауссовских систем
Одним из перспективных направлений моделирования многомерных стохастических систем является использование энтропии, которая может выступать в роли универсального параметра и идеально подходит для решения задач о поведении многомерных стохастических систем. К ним можно отнести оптимизационные задачи эффективного управления системами на основе увеличения и уменьшения ее энтропии, а также задачи диагностики и контроля состояний стохастической системы. Рассмотрим более подробно последний класс задач.
Для решения диагностической задачи необходимо построить диагностическую модель. В диагностической модели должна в определенной форме выражаться связь измеряемого вектора признаков х с тестируемым свойством, которое в дальнейшем будет обозначаться как у [6].
Основные требования, предъявляемые к диагностическим моделям [6]: 1. конечный результат должен быть максимально точным и надежным; 2. лаконичность и интерпретируемость способа получения конечного результата. Таким образом, диагностическая модель не требует максимального описания исследуемого объекта в целом. Она предназначена для описания степени отклонения состояния объекта от нормы [84].
Задача построения диагностической модели заключается в определении вида функции у =f(x). В зависимости от специфики, эта задача может называться структурной идентификацией [24, 68, 114], качественной идентификацией [27], непараметрической идентификацией [33] и др. Если вид математической модели объекта известен, то решают задачу определения неизвестных параметров модели, которая, в зависимости от специфики, называется оцениванием модели [3], параметрической идентификацией [45]. Рассмотрим примеры использования энтропийных моделей для задач диагностики и контроля состояния сложных систем.
Организм человека может быть представлен в виде сложной системы с вероятностной природой его развития. Это приводит к необходимости поиска «системообразующих факторов», к которым относится энтропия. В [41] показано, что энтропия является информативной характеристикой состояния организма и может использоваться для оценки его состояния и определения направления терапии больных.
За основу исследования в [41] было использовано основное свойство стационарного состояния открытых систем, сформулированное И. Пригожиным [54]: при фиксированных внешних параметрах скорость воспроизведения энтропии, обусловленная протеканием необратимых процессов, постоянна во времени и минимальная по величине. Для живых систем это положение было сформулировано так [41]: «поддержание гомеостазиса требует минимального потребления энергии, т.е. здоровый организм стремится работать в самом экономном энергетическом режиме. Заболевания организма связаны с дополнительными энергетическими затратами для компенсации приобретенных или врожденных биологических дефектов и с ростом энтропии».
В [41] показано, что в динамической системе может быть несколько стационарных состояний, отличающихся уровнем воспроизведения энтропии, поэтому состояние организма может быть описано в виде набора энергетических уровней, некоторые из которых устойчивы (уровни 1 и 4), другие нестабильные (уровни 2, 3, 5). При наличие внешнего или внутреннего возмущения происходит скачкообразный переход из одного состояния в другое [41]. Любое изменение характеризуется увеличенным потреблением энергии: температура тела повышается или увеличивается скорость обменных процессов. Отклонение от стационарного состояния (с минимальными энергозатратами) вызывает развитие внутренних процессов, стремящихся вернуть систему обратно, к уровню 1. При длительных действиях факторов система может перейти к уровню 3, в точку бифуркации, из которой возможно несколько исходов [41]: 1. возвращение на стабильный уровень 1; 2. переход в другое устойчивое равновесное состояние 4, характеризующееся новым энергоинформационным уровнем; 3. скачок на более высокий, нестабильный уровень 5. Для организма это соответствует нескольким адаптационным уровням [41]: «Острое заболевание соответствует нестационарному состоянию с повышенным воспроизведением энтропии, т.е. неэкономному типу функционирования организма. При острых заболеваниях необходимо скачком перевести организм из «плохого» устойчивого состояния в «хорошее». При этом используют большие дозы лекарственных препаратов. В фазе затухающего обострения болезней возрастает роль малых воздействий, например, акупунктуры и гомеопатических средств, оказывающих положительное воздействие».
Рассмотренная энтропийная модель была использована в [41] при газоразрядной визуализации биологических объектов.
Оценка изменения энтропии также применяется в психологии при моделировании психического развития в энтропийно-негэнтропийном подходе [71]. Здесь психическое развитие ребенка рассматривается как самоорганизация открытой нелинейной системы, последовательно увеличивающей свой негэнтропийный показатель при внешних воздействиях. За обобщенную меру динамики психического развития принимается характер изменения энтропийного состояния системы - скорость увеличения негэнтропии dS , причем S = 1 - S.
Тогда, учитывая, что «базовая структурная организация психического» состоит из регулярного обеспечения психической активности г, структуры когнитивного обеспечения р и аффективной организации поведения сознания а, описывается психическое развитие, как увеличение негэнтропии, уравнением в частных производных [71]:
Свойство симметрии теоретических значений корреляционных отношений
На основе теорем, представленных в главе 1, построим энтропийную модель динамики многомерных стохастических систем [87, 91].
Представим стохастическую систему S в виде многомерной случайной величины Y = (7 ...,7 ). Будем считать, что данное представление является адекватной математической моделью системы S. Каждый элемент 7г вектора Y является одномерной случайной величиной, которая характеризует функционирование соответствующего элемента исследуемой системы. Элементы могут быть как линейно, так и нелинейно коррелированными.
Аддитивные представления (2.17) и (2.13) в виде двух компонент, как самой энтропии, так и ее изменения показывают ее дуализм. Изменение энтропии происходит аддитивным образом: с одной стороны - за счет изменения дисперсий, а с другой стороны - из-за изменения индексов детерминации случайных величин Y1,Y2,...Jm (рис. 2.1).
Первое слагаемое отражает изменение неопределенности системы, а второе - изменение ее определенности (степени взаимосвязей между элементами системы). Кроме того, выражение (2.13) и (2.17) имеет ясную интерпретацию через общесистемные закономерности аддитивности и целостности [80]. А именно, приращение A//(Y)E определяет предельное изменение энтропии, соответствующее полной независимости элементов системы, и характеризует рассмотрение целостного объекта как состоящего из частей (аддитивность). Приращение A//(Y)R отражает изменение степени взаимосвязей между элементами системы, характеризуя свойства системы как целого (целостность). Таким образом, модель (2.10) объясняет причину энтропийного дуализма в развитии открытых стохастических систем.
Следует заметить, что установленный соотношением (2.13) дуализм энтропии в том или ином виде отмечался в ряде публикаций. Например, И. Пригожий и Г. Николис, исследуя влияние энтропии на эволюцию открытых систем, указывали, что процесс изменения открытых систем может вести либо к деградации, либо представлять собой процесс самоорганизации, при котором возникают более сложные и совершенные структуры [54].
Поэтому с учетом сказанного выше представляется возможным назвать A//(Y)E приращением (динамикой) энтропии хаотичности, a A//(Y)R приращением (динамикой) энтропии самоорганизации.
Приращение энтропии АН(\) согласно (2.10) может быть конечным или бесконечным. Приращение энтропии АН(\) конечно, если все дисперсии у(2) 0, к = \,2,...,т и все индексы детерминации Ryk lWi Yki 1, к = 2,3,...,т. Если хотя бы одна дисперсия а2(2) = 0 или хотя бы один индекс детерминации /77 7 = 1, то прирост энтропии AH(Y) = - х . Оба эти условия являются вырожденными и не возможны в реальных условиях. Равенство з2(2) =0 означает, что k-и элемент системы перешел в состояние абсолютного покоя, а условие /77 7 =1 представляет собой строгую функциональную зависимость случайной величины Гк от случайных величин Y1,Y2,..,Ylc_1. Модель (2.10) по сравнению с традиционным подходом, основанным на использовании информационной энтропии, обладает некоторыми существенными преимуществами. Во-первых, здесь не требуется оценивать вероятностей pt пребывания системы в соответствующем состоянии [93, 132]. Это делает возможным ее применять на малых выборках данных.
Во-вторых, она легко реализуема на практике, поскольку требует проведения стандартных процедур оценивания дисперсий и индексов детерминации регрессионных моделей.
В-третьих, эта модель позволяет обнаружить причину изменения энтропии системы и оценить его количественно. Это делает возможным использование модели для различных задач. Например, к ним можно отнести рассмотренные в [98] оптимизационные задачи эффективного управления системами на основе увеличения или уменьшения ее энтропии, а также задачи диагностики и контроля состояния стохастических систем.
Для решения задач диагностики и контроля состояния системы используется представление энтропийной модели в виде (2.10). Будем считать, что две системы непрерывных случайных величин Y(1) и Y(2) соответствуют предыдущему и текущему периодам функционирования системы. Тогда, отслеживая изменение A//(Y) энтропии в целом и ее компонент AH(Y)1.,AH(Y)R, можно сделать выводы о состоянии системы и происходящих в ней изменениях [88, 90].
Для интерпретации энтропии и ее составляющих, необходимо понять, как можно охарактеризовать эти понятия. Энтропия мыслится как хаос, непредсказуемость, беспорядок, тогда справедливым будет, что изменение энтропии системы отражает изменение ее стабильности. Тогда изменение энтропии стохастической системы можно интерпретировать следующим образом: если A/7(Y)«0, то в течение исследуемого периода в системе не происходило изменений, система стабильна (устойчива, упорядочена); если AH(Y) 0, то в течение исследуемого периода происходящие в системе изменения привели к увеличению стабильности; если AH(Y) 0, то в течение исследуемого периода происходящие в системе изменения привели к увеличению нестабильности.
Для того чтобы обнаружить причину изменения энтропии необходимо исследовать ее составляющие: динамику энтропии хаотичности и динамику энтропии самоорганизации. В энтропийной модели эти параметры можно интерпретировать следующим образом: если A//(Y)S 0, то в течение исследуемого периода происходящие в системе изменения привели к увеличению хаотичности (увеличился разброс данных); если A//(Y)S 0, то в течение исследуемого периода происходящие в системе изменения привели к уменьшению хаотичности (уменьшился разброс данных); если AH(Y)R 0, то в течение исследуемого периода происходящие в системе изменения привели к уменьшению взаимозависимости (уменьшилась степень взаимодействия между элементами системы); если AH(Y)R 0, то в течение исследуемого периода происходящие в системе изменения привели к увеличению взаимозависимости (увеличилась степень взаимодействия между элементами системы). Для того чтобы оценить вклад произвольного /-го элемента в изменение энтропии хаотичности необходимо рассматривать A//(7/)s.
Алгоритм на основе сглаживания линейной регрессией
Программа «Непараметрическое оценивание индекса детерминации регрессионных зависимостей» разработана на основе предложенного алгоритма сглаживания регрессией и имеет своей целью нахождение оценки объясняющей переменной (без заданных априорных условий апертуры сглаживающего фильтра) и вычисление множественного индекса детерминации. Программа реализована на Embarcadero Delphi 2010.
Входными данными является документ Microsoft Office Excel, в котором первый столбец должен соответствовать объясняющей переменной.
Выходными данными является выводимое на экран сообщение - значение индекса детерминации. Программа содержит следующие дополнительные модули: 1. модуль, предназначенный для вычисления индекса детерминации с помощью алгоритма группировки данных на произвольное количество интервалов (выбираемое пользователем); 2. модуль, предназначенный для вычисления индекса детерминации с помощью ядерного сглаживания с гауссовским ядром (ширина окна выбирается пользователем); 3. модуль, предназначенный для вычисления индекса детерминации с помощью алгоритма основанного на сглаживании регрессией, где оценки коэффициентов детерминации вычисляются с помощью обобщенного метода наименьших модулей; 4. модуль, предназначенный для вычисления индекса детерминации с помощью алгоритма на основе сглаживания нелинейной (параболической) регрессией.
Представленные модули использовались для сравнения алгоритмов непараметрического оценивания индекса детерминации. Листинг программы представлен в Приложении 3. Данный алгоритм и реализующая его программа были зарегистрированы [22] в Объединенном фонде электронных ресурсов «Наука и образование» при Российской Академии Образования (Приложение 2).
Сравнение алгоритмов непараметрического оценивания индекса детерминации На модельных данных выполним сравнение известных алгоритмов непараметрического оценивания индекса детерминации и предложенного алгоритма на основе сглаживания линейной регрессией. Воспользуемся методом статистического моделирования Монте-Карло.
Пример 3.5. Рассмотрим двумерную стохастическую систему (X, Y). Пусть у = 1-х- е-200 -1/2)2 + s s где х R[-\, 1], s N(0,1), объем выборки N = 100. Данный пример был рассмотрен в [105] и показано, что такая модель отражает некоторый «крайний» случай, поскольку «практически весь сигнал забит шумом». Однако этот пример показывает, что реально может происходить на практике.
Для рассмотрения сглаживающего алгоритма воспользуемся ядерной оценкой с шириной окна h = 0,05 и гауссовским ядром К (и) = , е и . В [105] показано, что более сильное сглаживание должно существенно «размывать» структуру зависимости, а меньшая ширина окна должна давать слишком грубую кривую. Если бы использовалось другое ядро, например, ядро с компактным носителем, картина была бы иной при этой же ширине окна, так как различные ядра по-разному нормированы [105].
Результаты вычисления теоретического индекса детерминации, индекса детерминации с использованием алгоритма группирования, сглаживания и предложенного алгоритма на основе сглаживания линейной регрессией представлены в таблицах. Проведено М= 1000 испытаний.
Пусть R2m - теоретическое значение индекса детерминации, R2zp - индекс детерминации, полученный с помощью алгоритма группирования, R2z - индекс детерминации, полученный с помощью алгоритма сглаживания, R2ez - индекс детерминации, полученный с помощью алгоритма на основе сглаживания линейной регрессией. DR - дисперсия индекса детерминации. R2 - индекс детерминации.
Анализ результатов, представленных в табл. 3.3-3.5, свидетельствует о следующем. В предложенном алгоритме на основе сглаживания линейной регрессией при малых значениях индекса детерминации наблюдается отклонение R2ez от R2meo на небольших апертурах (объем локальной сглаживающей выборки), так как случайная компонента подавляется не полностью. Это означает, что часть ее дисперсии переходит в дисперсию регрессионной зависимости. В результате оценка индекса детерминации искусственно завышается. С увеличением апертуры случайная компонента подавляется все больше и больше, в результате оценка индекса детерминации постепенно уменьшается, приближаясь к своему теоретическому значению.
Пунктирная линия на рис. 3.13-3.15 показывает 90%-й доверительный интервал наблюдений. На рис. 3.13 представлено сравнение теоретической линии регрессии и оценки, полученной при выполнении алгоритма на основе сглаживания регрессией.
По рис. 3.13 можно сделать вывод, что оценки, полученные с помощью алгоритма на основе сглаживания регрессией, не выходят за пределы довертельного интервала и близки к теоретической линии регресси.
На рис. 3.14 (а, б, в) представлено сравнение средних значений в группах, полученных при выполнении алгоритма группировки с теоретической линией регрессии при различном разбиении выборки на группы.
Моделирование динамики системы автотранспортного предприятия ООО «Курганавтотранс»
По мере ухудшения состояния здоровья популяции происходит увеличение общей, объединенной по всем ФР, энтропии. Так, популяционная энтропия в группе практически здоровых лиц выше, чем у здоровых, а у больных выше, чем у практически здоровых. Это заключение имеет практическое значение, поскольку, если у нескольких обследованных популяций в какой-то одной будет выше уровень энтропии, то без проведения дорогостоящих и продолжительных исследований предварительно можно сказать о худшем состоянии здоровья данной группы и выделить ее для продолжения обследования.
Рост энтропии от «Здоровых» к «Практически здоровым» объясняется неблагоприятным воздействием таких патологических факторов как курение и низкая физическая активность, заболеваемость частыми простудными и другими острыми заболеваниями, наличием заболеваний в состоянии длительной ремиссии и др.
Энтропия в группе «Больных» выше, чем в группе «Практически здоровых» и значительно выше, чем в группе «Здоровых", т.е. в целом стабильность популяционной системы снижается, и существенный рост энтропии по мере ухудшения состояния здоровья объясняется тем, что к патологическому влиянию ФР на человеческий организм в отдельности и на всю популяцию в целом добавляется дополнительное повреждающее воздействие самих ХНИЗ.
Следует отметить, что энтропия у здоровых лиц в более молодой по возрасту группе (18-24 г. в сравнении с 25-34 г.) выше. Это происходит из-за того, что окончательный рост и формирование человеческого организма происходит до 25 лет и, поэтому у молодых лиц наблюдается больший разброс биологических показателей.
Энтропия самоорганизации «Практически здоровых» лиц выше, чем «Здоровых» и «Больных» во всех возрастных группах. Это означает, что взаимодействие между подсистемами организма в группе «Практически здоровых» лиц слабее (см. табл. 4.1), так как в этом состоянии организм, с одной стороны, оказывает меньшее сопротивление болезням в сравнении с группой
«Здоровых» лиц, с другой стороны, пациенты в группе «Больных» лиц уже имеют хронические заболевания, к которым организм приспособился и, следовательно, взаимодействие между подсистемами в группе «Больных» лиц сильнее, чем у «Практически здоровых» лиц.
Для того чтобы использовать энтропийную модель динамики, проверим однотипность данных по описанному в параграфе 4.1 алгоритму. Тогда, согласно алгоритму, для каждой подсистемы в два этапа проведем проверку гипотез однородности с помощью критерия Смирнова на уровне значимости а = 0,05.
1. Вероятность ошибочного отклонения нулевой гипотезы на первом этапе во всех статистических тестах / 0,1, что значительно больше уровня значимости а = 0,05. Следовательно, гипотеза Но принимается.
2. Вероятность ошибочного отклонения нулевой гипотезы на втором этапе во всех статистических тестах р 0,001, что значительно меньше уровня значимости а = 0,05. Следовательно, гипотеза Но отвергается. Так как одна из гипотез верна, то рассматриваемые данные являются однотипными.
Далее рассмотрим динамику энтропии во всех возрастных группах при переходе от здорового состояния к практически здоровому, от практически здорового состояния к больному.
Максимальное увеличение энтропии наблюдается при переходе от здорового состояния к практически здоровому в возрастной группе 25-34 г. Из табл. 4.2 видно, что в наибольшей степени на это изменение повлияла энтропия хаотичности, следовательно, увеличение энтропии произошло в результате увеличения степени разброса данных.
Таким образом, при анализе энтропии по основным измеримым модифицируемым ФР ХНИЗ (подсистемы артериальное давление, уровень общего холестерина, индекс массы тела, глюкоза крови) в комплексе с оценкой популяционного здоровья по критериям «здоров», «практически здоров», «больной» установлено: 1. у больных лиц в сравнении с практически здоровыми, а у практически здоровых в сравнении со здоровыми выше уровень популяционной энтропии; 2. взаимодействие между подсистемами (артериальное давление, уровень общего холестерина, индекс массы тела, глюкоза крови) наиболее слабо выражено в группе практически здоровых лиц. 3. максимальное увеличение популяционной энтропии происходит у возрастной группы 25-34 г. при переходе от здорового состояния к практически здоровому, в результате действия подсистемы «Глюкоза». Это говорит о том, что в этой возрастной группе необходимо особое внимание уделять уровню глюкозы в крови, так как изменение именно этого ФР ХНИЗ оказало наибольшее влияние на переход от здорового состояния к практически здоровому.
Использование энтропийного анализа при профилактике хронических неинфекционных заболеваний в комплексе с оценкой популяционного здоровья позволяет определить наиболее критичное изменение состояния здоровья популяции и выяснить, какая подсистема организма человека повлияла на это изменение.
Положения и выводы диссертационной работы, а также разработанный комплекс программ был использован в клинике ГБОУ ВПО Южно-Уральского государственного медицинского университета, справка об использовании результатов прилагается (Приложение 1).