Содержание к диссертации
Введение
1. Современное состояние заболеваемости кариесом и пути повышения эффективности стоматологической помощи 11
1.1. Современное состояние проблемы заболеваемости кариесом 11
1.2. Проблемы применение минералогических лечебных факторов для лечения и профилактики неосложненного кариеса 31
1.3. Использование высоких медицинских и информационных технологий в современной стоматологии 34
1.4. Цель и задачи исследования 38
2. Анализ состояния и прогнозирование развития за болеваемости кариесом в регионе 40
2.1. Исследование заболеваемости кариесом в регионе на основе визуализации и трансформации информации 40
2.2. Оценка динамики и прогнозирование развития заболеваемости кариесом в регионе 47
Выводы второй главы 64
3. Интеллектуализация процесса лечения неосложненного кариеса на основе неиросетевого и статистического моделирования 65
3.1. Построение регрессионных моделей выбора тактики лечения неосложненного кариеса 65
3.2. Применение нейросетевого моделирования для выбора тактики лечения неосложненного кариеса 77
Выводы третьей главы 90
4. Реализация методов интеллектуальной поддержки принятия решений при выборе тактики лечения не осложненного кариеса 91
Заключение 102
Список литературы 104
Приложение
- Современное состояние проблемы заболеваемости кариесом
- Проблемы применение минералогических лечебных факторов для лечения и профилактики неосложненного кариеса
- Исследование заболеваемости кариесом в регионе на основе визуализации и трансформации информации
- Построение регрессионных моделей выбора тактики лечения неосложненного кариеса
Введение к работе
Актуальность темы. Кариозные поражения твердых тканей зуба представляют актуальную проблему современной стоматологии, в значи-тельной'мере определяемую медицинским и социальным аспектами: высокая распространенность (от 68% до 98%) и увеличивающаяся интенсивность, склонность к прогрессированию, многостороннее воздействие на зубочелю-стную систему и организм в целом.
Современные подходы к пониманию основных тенденций возникновения и развития заболеваний твердых тканей зуба в значительной мере стали доступными благодаря внедрению в стоматологию важнейших научных методологий, таких как: знания по теории систем, статистического анализа, математического моделирования и теории управления. Особое место среди новых технологий занимают геоинформационные технологии, приоритетным направлением которых является рассмотрение данных по анализируемым проблемам относительно их пространственных взаимоотношений, что позволяет проводить комплексную оценку ситуации и создает основу для принятия более точных и разумных решений в процессе управления.
Повсеместное высокое распространение практически среди всех возрастных групп населения, различающихся по экономико-географическим, этническим, профессиональным, экологическим и другим особенностям, в то же время индивидуальная предрасположенность, уникальность каждого организма, обуславливают необходимость разработок как достаточно быстрой и точной диагностики, так и методик прогнозирования и выбора лечебной тактики, применительно к каждому пациенту.
В настоящее время в стоматологии для профилактики и лечения кариеса широко применяются минерализирующие лечебные воздействия. Используется ряд препаратов и продуктов питания, в состав которых входят ионы кальция, фтора, магния и других элементов, обуславливающих полноценную
реминерализацию твердых тканей.
Однако, несмотря на успехи в профилактике и лечения кариеса, применяемые методики ионного воздействия являются стандартными и в недостаточной мере учитывают индивидуальные особенности организма. До настоящего времени не исследованы механизмы противокариесного действия фторидов на течение кариозного процесса с точки зрения методов математического моделирования. /
Таким образом, актуальность темы исследования обусловлена необходимостью разработки принципов анализа и прогнозирования развития заболеваемости неосложненным кариесом в территориально распределенной системе региона, методов интеллектуальной поддержки принятия решений при лечении кариозного процесса на основе математических моделей, алгоритмов и современных компьютерных технологий.
Работа выполнена в соответствии с основными научными направлениями ГОУВПО «Воронежский государственный технический университет» «Биомедкибернетика, компьютеризация в медицине» и «Проблемно-ориентированные системы управления» при выполнении научно-исследовательской работы ГБ 2007.27 «Интеллектуализация принятия управленческих решений в медицинских системах при диагностике и лечении».
Цель и задачи исследования. Целью диссертационной работы является разработка методов и моделей лечения неосложенного кариеса с учетом минерализирующих факторов на основе высоких медицинских и информационных технологий и их дальнейшее использование в клинической практике.
Для достижения поставленной цели необходимо решить следующие задачи:
провести анализ состояния заболеваемости неосложненным кариесом в регионе и построить прогностические модели развития заболеваемости по административно территориальным единицам;
исследовать и обосновать рациональный выбор тактики лечения неосложенного кариеса в условиях неполной априорной информации с учетом минеральных компонентов;
проанализировать взаимосвязь между наиболее информативными клиническими показателями лечения начальных форм кариеса на основе корреляционно-регрессионного анализа;
разработать метод интеллектуальной поддержки принятия решений при выборе тактики лечения неосложненного кариеса на основе нейросетево-го моделирования;
создать и апробировать информационно-программный комплекс для обеспечения рациональной терапии неосложенного кариеса для повышения эффективности лечебного процесса в клинических условиях.
Методы исследования. Для решения поставленных задач в работе были использованы методы системного анализа, теории управления, основные положения теории вероятностей и математической статистики, нейросетево-го моделирования, ГИС-технологий.
Научная новизна результатов исследования. В работе получены следующие основные результаты, характеризующиеся научной новизной:
математические модели, ориентированные на формирование прогноза заболеваемости неосложненным кариесом по административно-территориальным единицам региона, позволяющие разрабатывать и осуществлять планирование мероприятий в системе оказания стоматологической помощи населению региона;
методика логического моделирования диагностики и выбора рациональной схемы лечения неосложненного кариеса, ориентированная на уточненную классификацию и обеспечивающая повышение эффективности диагностического процесса и выбор рациональной тактики лечения;
статистические модели выбора тактики лечения неосложненного кариеса позволяющие учитывать индивидуальные клинические особенности пациентов при планировании лечебного процесса;
метод интеллектуальной поддержки принятия решений при выборе тактики лечения неосложненного кариеса, позволяющий оценить влияние реминерализирующего фактора на основе нейросетевого моделирования;
структура и информационное обеспечение автоматизированной системы выбора тактики лечения неосложненного кариеса, обеспечивающие повышение эффективности лечебно-диагностического процесса на основе прогнозирования исхода и выбора оптимальных параметров лечения.
Практическая значимость и результаты внедрения. Разработана методика визуализации информации о заболеваемости неосложненным кариесом в территориально распределенной системе региона на основе геоин-формациионных технологий. Предложенная методика обработки ретроспективной и текущей информации о заболеваемости неосложненным кариесом позволят оценить динамику, прогнозировать развитие заболеваемости и планировать лечебно-профилактические мероприятия в регионе. Разработана комплексная методика интеллектуальной поддержки процесса лечения неосложненного кариеса с учетом минерализирующих факторов на основе созданных математических моделей.
Разработанная автоматизированная система поддержки принятия решений при выборе тактики лечения неосложненного кариеса на основе статистического и нейросетевого моделирования апробирована в стоматологической клинике ГОУ ВПО «Воронежская государственная медицинская академия им. Н.Н. Бурденко».
Материалы диссертации внедрены в учебный процесс на кафедре пропедевтической стоматологии ГОУ ВПО «Воронежская государственная медицинская академия им. Н.Н. Бурденко» на кафедре системного анализа и управления в медицинских системах ГОУ ВПО «Воронежский государствен-
ный технический университет».
Апробация работы. Основные положения и научные результаты диссертационной работы докладывались и обсуждались на следующих конференциях, семинарах и совещаниях: Всероссийской конференции «Интеллектуализация управления в социальных и экономических системах» (Воронеж, 2008, 2009); Всероссийской конференции «Интеллектуальные информационные системы» (Воронеж, 2008); научно-тематическом семинаре «Проблемно-ориентированные системы управления» (Воронеж, 2007-2009); научно-методическом семинаре кафедры «Системный анализ и управление в медицинских системах» ВГТУ (Воронеж, 2007-2009).
Публикации. По материалам диссертации опубликовано 9 научных работ, в том числе 2 - в изданиях, рекомендованных ВАК РФ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и приложения, списка литературы из 113 наименований, изложена на 103 страницах и содержит 34 рисунка и 10 таблиц.
Во введении обосновывается актуальность темы диссертационной работы, сформулированы цель и задачи исследования, изложены основные научные положения, определена практическая значимость, приведены сведения об апробации и внедрении работы.
В первой главе приводится краткий обзор современных методов исследования и управления процессом лечения неосложненного кариеса, позволяющих рациональным образом осуществлять выбор тактики лечения заболеваний с учетом минералогических факторов.
Для повышения эффективности лечения заболеваний возникает задача управления этим процессом на основе экспертной, архивной, текущей, информации. Значительный объем информации при управлении процессами диагностики и лечения заболеваний, при управлении системой здравоохранения требует применения средств вычислительной техники и математических методов, автоматизированных и компьютерных интеллектуальных сие-
тем управления.
При выборе рациональных реабилитационных мероприятий в условиях неполной априорной информации требуется интеллектуальная поддержка принимаемых решений ЛВ.
Для интеллектуальной поддержки выбора тактики лечения заболеваний в условиях неполной априорной информации и ряда неопределенностей рекомендуется использовать для повышения эффективности принимаемых решений, следующие приемы и подходы: методы формализации априорной информации, поступающей от лечащего врача; применение математических моделей процессов лечения заболеваний для организации и реализации имитационного эксперимента; комплексная диагностическая визуализация; принятие решений на логического моделирования.
Вторая глава посвящена анализу состояния заболеваемости неослож-ненным кариесом в регионе и интеллектуализации управления на верхнем уровне и уровне территориальных единиц стоматологической помощи для формирования управленческих решений.
Для оценки состояния заболеваемости неосложненным кариесом в регионе на основе статистических данных с применением ГИС-технологий, получена картографическая информация об уровне заболеваемости в регионе по всем территориальным единицам.
На основе трансформации информации и геоинформационной статистики проведена оценка динамики развития заболеваемости неосложненным кариесом по территориальным единицам региона. Для прогнозирования развития заболеваемости методом экспоненциального сглаживания получены прогностические модели по территориальным единицам.
По полученным результатам геиофнмационного моделирования и прогнозирования административными органами производится распределение ресурсов, и формируются целевые комплексные программы по реализации лечебно-профилактических мероприятий по оказанию стоматологической
помощи населению региона.
В третьей главе рассматривается интегрированная процедура интеллектуальной поддержки рационального выбора лечения неосложненного кариеса с учетом минералогических факторов.
С учетом особенностей процесса лечения неосложненного кариеса обоснованы и исследованы методы принятия решений в условиях вероятностного характера процесса лечения, неполной априорной информации и ряда неопределенностей. Представлены результаты выбора рациональной тактики лечения неосложенного кариеса на основе статистического и неиросетевого моделирования.
В четвертой главе приведены структура интеллектуальной компьютерной системы выбора лечения неосложненного кариеса с учетом минералогических факторов и результаты апробации и внедрения.
В заключении приведены основные результаты работы.
В приложении представлены акты внедрения.
Современное состояние проблемы заболеваемости кариесом
Кариес зубов является узловой проблемой стоматологии, весьма интересной в теоретической и исключительно важной в практическом отношении. Кариес зубов (Caries dentis) - это патологический процесс, проявляющийся после прорезывания зубов, при котором происходит деминерализация и размягчение твёрдых тканей зубов с последующим образованием дефекта в виде полости [6].
Согласно номенклатуре ВОЗ для оценки поражённости зубов кариесом используют три основных показателя: 1) Распространённость заболевания. Это индекс, определяющимся процентом лиц, имеющих кариозные, пломбированные и удалённые зубы в том или ином населённом пункте, районе, городе, области. 2) Интенсивность поражения зубов кариесом определяется по числу поражённых кариесом зубов. Для этой цели комитет экспертов ВОЗ по стоматологии (1962) предложили для взрослых использовать индекс КПУ (К -кариозный зуб, П - пломбированный, У — удалённый зуб); для детей с временным или молочным прикусом - кп (к - кариозный, п — пломбированный); для детей со сменным прикусом - КПУ+кп. Чтобы облегчить сравнительную оценку заболеваемости кариесом на разных контингентах мира, ВОЗ в 1980 году предложила выделять 5 степеней поражённости в зависимости от КПУ у детей 12 лет: 1) очень низкая - от 0 до 1,1; 2) низкая - 1,2 — 2,6; 3) умеренная - 2,7-4,4; 4) высокая-4,5-6,5; 5) очень высокая - 6,6 и выше.
Для получения достоверных данных при определении распространённости и интенсивности кариеса зубов должны осматриваться группы населения с учётом возраста и пола, климатогеографических и социально-экономических условий. Обычно обследуются дети в возрасте 5-6 лет, 12 лет, 15 лет, взрослые 35-44 и 65 лет. Наиболее показательными возрастными группами населения являются 12- и 15- летние дети.
3) Прирост интенсивности или заболеваемости. Определяется у одного и того же лица или контингента через определённый срок (1, 3, 5, 10 лет). Различие в значении показателя между первым и вторым осмотрами и составляет прирост интенсивности кариеса [6].
С помощью эпидемиологического стоматологического обследования можно определить распространённость и интенсивность основных стоматологических заболеваний, качество санации полости рта, эффективности профилактики кариеса зубов и болезней пародонта, уровень гигиенического состояния полости рта, а также выявить потребность каждого обследуемого в лечении кариеса зубов, болезней пародонта и слизистой полости рта. Такое обследование позволяет составить индивидуальный план лечебных и профилактических мероприятий для каждого пациента.
Для объяснения этиологии и патогенеза кариеса зубов предложено около 400 теорий, самые известные из которых способствовали накоплению сведений, позволивших высказывать определенное завершённое суждение по этой проблеме.
Общепризнанным механизмом возникновения кариеса является прогрессирующая деминерализация твёрдых тканей зубов под действием органических кислот, образование которых связано с деятельностью микроорганизмов. В возникновении кариозного процесса принимают участие множество этиологических факторов, что позволяет считать кариес полиэтиологическим заболеванием. Основными этиологическими факторами являются: 1) микрофлора полости рта; 2) характер и режим питания, содержание фтора в воде; 3) количество и качество слюноотделения; 4) общее состояние организма; 5) экстремальные воздействия на организм.
Все вышеперечисленные факторы были названы кариесогенными и подразделены на общие и местные, играющие важную роль в возникновении кариеса. Общие факторы: 1) Неполноценная диета и питьевая вода; 2) Соматические заболевания, сдвиг в функциональном состоянии органов и систем в период формирования и созревания тканей зуба. 3) Экстремальные воздействия на организм; 4) Наследственность, обуславливающая полноценность структуры и химический состав тканей зуба. Неблагоприятный генетический код. Местные факторы: 1) Зубная бляшка и зубной налёт, изолирующие микроорганизмами; 2) Нарушение состава и свойств ротовой жидкости; 3) Углеводистые липкие пищевые остатки полости рта; 4) Резистентность зубных тканей, обусловленная полноценной структурой и химическим составом твёрдых тканей зуба; 5) Отклонения в биохимическом составе твёрдых тканей зуба и неполноценная структура тканей зуба; 6) Состояние пульпы зуба; 7) Состояние зубочелюстной системы в период закладки, развития и прорезывания постоянных зубов. Кариесогенная ситуация создаётся тогда, когда любой кариесогенный фактор или их группа, действуя на зуб, делают его восприимчивым к воздействию кислот. Конечно, пусковым механизмом является микрофлора полости рта при обязательном наличии углеводов и контакте двух факторов с тканями зуба [6, 83].
Проблемы применение минералогических лечебных факторов для лечения и профилактики неосложненного кариеса
Стоматологические заболевания носят вероятностный характер, большинство диагностических признаков выражаются качественными показателями. Недостаток априорной информации приводит к тому, что принятие решений врачом на всех этапах лечения осуществляется в условиях ряда неопределенностей, а характеристики больного являются индивидуальными.
Поэтому для повышения эффективности лечения в стоматологической практике в настоящее время всё больше используются высокие медицинские технологии лечения, компьютерные технологии и математические методы выбора тактики лечения.
Среди актуальных проблем современной стоматологии кариес зубов занимает одно из ведущих мест. Это связано с наибольшей распространенностью этих заболеваний в мире, а также (при отсутствии своевременной диагностики и адекватного лечения) с угрозой развития различных одонто-генных осложнений, появления очагов хронической инфекции, оказывающих огромное влияние на состояние здоровья пациента в целом.
При лечении кариеса активность его развития у каждого конкретного человека при использовании одного и того же лечебного препарата с оптимальной дозой складывается неоднозначно, отражая уровень устойчивости к кариесу данного пациента, поэтому возникает проблема индивидуального подбора дозы лечебного воздействия в зависимости от уровня кариесрези-стентности зубов [64].
Для профилактики и лечения неосложненного кариеса, в настоящее время, часто применяют различные реминерализующие вещества. К ним относятся фториды, натриуммонофторфосфат, ксилитол, натриумлаурилсуль-фат, триклозан, экстракты растений для предотвращения воспаления десен, цитрат цинка, пирофосфаты, бикарбонат натрия, нитрат калия, хлорид стронция, нитрат калия и др.
Из многочисленных элементов, поступающих в организм человека с пищевыми продуктами и питьевой водой, выраженным противокариозным действием обладает фтор. Фторид является эффективным средством предотвращения кариеса зубов. Поступление оптимального количества фторида очень важно для стоматологического здоровья ребенка, поскольку от этого зависит резистентность эмали зубов к кариозному поражению и способствует правильному развитию зуба. В естественном виде фторид может быть обнаружен в различных концентрациях в воде, материнским и коровьем молоке.
Самым распространенным методом профилактики кариеса, в настоящее время, является искусственное фторирование продуктов питания, а также назначение препаратов фторида натрия [64].
Однако необходимо отметить, что, несмотря на видимые успехи в профилактике и лечении кариеса, применяемые обычно методики фтороте-рапии являются стандартными для всех пациентов и не учитывают их индивидуальных особенностей.
Таким образом, необходимо разработать методы количественной оценки влияния реминерализующих факторов на химический состав зубов, позволяющих определять дозу лечебного воздействия для каждого конкретного пациента и осуществлять прогнозирование исхода лечения. Следовательно, проблема повышения эффективности лечения и профилактики стоматологических заболеваний на основе реминерализующих факторов, остается актуальной.
Кариозный процесс как объект управления имеет ряд особенностей. Большинство клинических показателей относятся к качественным факторам и не имеют количественных оценок (характер поверхности эмали, болевые ощущения и т.д). Кроме того, эти показатели являются неравноценными, т.е. характеризуют кариозный процесс в разной степени. Отсутствуют математические модели лечения неосложненного кариеса с учетом минералогических факторов.
Применение современных компьютерных технологий, математических методов решения задач диагностики предоставляет возможность осуществления рационального выбора лечебных мероприятий при лечении стоматологических заболеваний с учетом индивидуального подхода к пациенту.
Таким образом, современное распространение информационных технологий, методов системного анализа, теории управления оказывают существенное влияние на развитие и применение новых медицинских технологий, в частности, в стоматологии. Для осуществления более эффективной и рациональной диагностики и лечения стоматологических заболеваний, учитывая индивидуальные особенности организма пациента, необходимо применять, наряду с традиционными, современные методы диагностики и рационального управления процессом лечения. Эти методы являются более информативными и наглядными, позволяют получить более точную и объективную диагностику, оптимизировать выбор тактики лечения и обеспечить прогнозирование развития процесса заболевания, используя методы теории управления, статистической обработки информации, а также методы графической визуализации полученных результатов.
Исследование заболеваемости кариесом в регионе на основе визуализации и трансформации информации
Использование мониторинговых подходов при анализе заболеваемости населения, как одного из аспектов медико-экологической ситуации, в последнее время приобрело особую актуальность.
Проводимые исследования как на областном, городском уровнях, так и в отдельно взятом районе показали необходимость изучения и анализа временных рядов, отражающих динамику, а также возможность получения краткосрочного прогноза уровня заболеваемости кариесом, использование результатов которых позволяет более эффективно управлять лечебно-профилактической и организационной деятельностью стоматологических учреждений в целом. На основе данного подхода в диссертационной работе были проведены исследования заболеваемости кариесом по данным Воронежской области [41].
На первом этапе было проведено исследование заболеваемости осложненным (пульпит, периодонтит) и неосложенным кариесом среди населения Воронежской области. Показатели рассматривались по административным территориям Воронежской области.
Соотношения различных форм кариеса по Воронежской области, городу Воронежу и районам области представлены на рис. 2.1. Из полученной гистограммы видно, что высокий уровень наблюдается по неосложненному кариесу.
Анализируя полученные данные можно сделать вывод, что по заболеваемости неосложненным кариесом выделяется Грибановский район, где отмечается наибольший уровень данной формы заболевания, а по осложненному кариесу - Эртильский район [26, 29, 41].
При изучении заболеваемости населения в целом, наряду со статистическими методами исследования, целесообразным является применение медико-географических методов. Это обусловлено тем, что одни статистические выводы, без учета картографического анализа, не всегда раскрывают роль факторов внешней среды в распространении болезней, особенно применительно к конкретным территориям [16, 79].
Применение метода картографического анализа не только позволяет показать пространственное положение тех или иных явлений, но и помогает раскрывать смысл и значение этих явлений в их взаимосвязях, исходя из целей медико-экологических исследований. Важную роль в изучении пространственно-распределенной информации по заболеваемости имеет картографический анализ. Специальная карта дает возможность видеть взаимосвязи между распространением заболевания и определенными географическими факторами данной местности.
Специальная медико-географическая карта обеспечивает с одной стороны - необходимую объективность и глубину анализа имеющихся взаимосвязей, а с другой - синтез рассматриваемых явлений применительно к конкретной территории. Использование метода картографического анализа в медико-экологических исследованиях, а также внедрение его в другие отрасли позволяет предвидеть на строго научной основе многие явления, которые могут оказываться неблагоприятными для здоровья населения в пределах конкретной местности, и тем самым обеспечить заблаговременное проведение необходимых профилактических мероприятий.
Взаимодействие статистического моделирования с картографическим анализом предлагается решать с использованием геоинформационных систем. ГИС являются современными средствами интеграции статистического анализа и математического моделирования со средствами управления базами данных для исследования пространственно-организационных данных [79].
Для автоматизации задач визуального моделирования в медицине необходимо решить следующие задачи [79, 99]: - выбрать адекватную графическую модель; - создать атрибутивное описание объектов модели; - выбрать или разработать средства отображения, хранения и редактирования графических и атрибутивных данных; - связать в единую интегрированную модель графические объекты и их атрибутивные описания, т.е. создать «технологическую» модель, с которой будет работать создаваемая система; - обеспечить эффективный переход между описаниями исследуемых объектов, принятыми в предметной области, и их описаниями в «технологической» модели; - создать средства анализа и обработки данных, представленных в модели; - обеспечить ввод визуальных данных в систему, интерпретацию и вывод результатов обработки данных по модели.
Использование ГИС позволяет установить новые зависимости между сборами медицинских, экологических и географических данных, их пространственного анализа, и представляет пользователю возможность оптимизировать процесс выбора стратегий в составлении плана лечебно-профилактических мероприятий. Геоинформационное моделирование проводилось с использованием пакета Arc View 3.0. Применение ГИС-вьювера Arc View 3.0 позволило более наглядно представить ситуацию по заболеваемости кариесом.
Построение регрессионных моделей выбора тактики лечения неосложненного кариеса
В практических исследованиях возникает необходимость аппроксимировать (описать приблизительно) диаграмму рассеяния математическим уравнением. То есть зависимость между переменными величинами Y и X можно выразить аналитически с помощью формул и уравнений и графически в виде геометрического места точек в системе прямоугольных координат. График корреляционной зависимости строится по уравнениям функции У Ях)и х? j(y), которые называются регрессией (термин "регрессия" происходит от лат. regressio — движение назад). Здесь Ум - — средние арифметические из числовых значений зависимых переменных Y и X. Для выражения регрессии служат эмпирические и теоретические ряды, их графики — линии регрессии, а также корреляционные уравнения (уравнения регрессии) и коэффициент линейной регрессии [33, 42]. Цели регрессионного анализа: 1. Определение наличия и характера (математического уравнения, описывающего зависимость) связи между переменными. 2. Определение степени детерминированности вариации критераль-ной переменной предикторами. 3. Предсказать значение зависимой переменной с помощью независимой. 4. Определить вклад независимых переменных в вариацию зависимой.
В регрессионном анализе изучается связь и определяется количественная зависимость между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная Y зависит от одной переменной х. При этом предполагается, что переменная х принимает заданные фиксированные значения, а зависимая переменная Y имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению х соответствует некоторый закон распределения вероятностей случайной величины Y. Предположим, что Y в «среднем» линейно зависит от значений переменной х. Это означает, что условное математическое ожидание случайной величины Г при заданном значении х имеет вид [68]: M{Ylx)=a0+ а1Х (3.1)
Данная функция называется линейной теоретической функцией регрессии Y на х, а параметры #о и &\ - параметрами линейной регрессии (коэффициенты регрессии). На практике параметры регрессии определяются по результатам наблюдений переменных Y и х, связь между которыми можно записать Y=a0+ аіХ+є (3.2) где є - случайная ошибка наблюдений.
Эмпирические ряды регрессии Y по X и X по Y изображаются в виде линейного графика, при построении которого наиболее точным является использование способа наименьших квадратов, предложенного в 1806 г. К. Гауссом и независимо от него А. Лежандром. В основу этого способа положена теорема, согласно которой сумма квадратов отклонений вариант (хг) от средней арифметической (х) есть величина наименьшая, т. е. 2-, (хг ) = . Отсюда и название метода, который нашел широкое применение не только в биологии, но и в технике. Мы уже говорили об этом методе и применяли его, когда находили параметры а и Ъ линейной регрессии, отыскивая эмпирическое уравнение.
Последовательность проведения регрессионного анализа заключается в следующем [93]: - Формулировка задачи - Идентификация переменных (определение входных и выходных переменных) - Сбор статистических данных - Спецификация функции регрессии (определение вида модели) - Оценивание параметров функции регрессии - Оценка точности регрессионного анализа: 1) Проверка адекватности всей модели, т.е. согласуются ли предсказанные значения выходной величины с наблюдаемыми данными; 2) Проверка значимости параметров модели , т.е. значимо они отличаются от нуля или нет. - Интерпретация результатов, анализ, оптимизация и прогнозирование. Предпосылками к проведению регрессионного анализа являются: - Случайные ошибки наблюдений имеют нормальный закон распреде ления є - N(0,6), М(є)=0, D(S)=S2 = const. (3.3) - Отсутствие автокорреляции между ошибками наблюдений, т.е. по следовательные значения ех не зависят друг от друга.
На практике линия регрессии чаще всего ищется в виде линейной функции 7= bo + b\X\ + bjX2 + ... + + bj X (линейная регрессия), наилучшим образом приближающей искомую кривую. Делается это с помощью метода наименьших квадратов, когда минимизируется сумма квадратов отклонений реально наблюдаемых Y от их оценок У (имеются в виду оценки с помощью прямой линии, претендующей на то, чтобы представлять искомую регрессионную зависимость): Л/ k=i (3.4) (M - объем выборки). Этот подход основан на том известном факте, что фигурирующая в приведенном выражении сумма принимает минимальное значение именно для того случая, когда Г = ( 1 2,--- )- Метод наименьших квадратов заключается в поиске наиболее подходящей линии зависимости, чтобы таким образом минимизировать разность значений искомой функции и фактического значения. Для решения задачи регрессионного анализа методом наименьших квадратов вводится понятие функции невязки (3.5): 1 м 0) = 9 Е ( - )2 1 к=і (3.5)
Применение метода наименьших квадратов при линейном регрессионном анализе для оценивания параметров модели возможно при выполнении следующих условий [68, 93]: — использовании метрических переменных - равенства условных дисперсий: D{YIX) = const; - независимости ошибок от предикторов и нормального их распределения с нулевым средним и постоянной дисперсией; - попарного нормального распределения всех признаков модели; - независимости предикторов между собой - достаточном количестве наблюдений (обычно 15, в зависимости от конкретного характера распределений наблюдений и сложности искомой зависимости) Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициентов регрессии осуществляется с помощью t-критерия Стьюдента: параметр модели признается статистически значимым, если tp tep. Наиболее сложным в этом выражении является определение дисперсии, которая может быть рассчитана двояким способом. Наиболее простой способ, выработанный методикой экспериментирования, заключается в том, что величина дисперсии коэффициента регрессии может быть приближенно определена по выражению дисперсии результативного признака. Для проверки на однородность дисперсии целесообразно воспользоваться методом Гольфельда. Последовательность значений случайной величины У разбивается на две последовательности объемом пі и п2 (nl+n2=n. Для каждой последовательности вычисляются дисперсии воспроизводимости Я,2 и S22. Тогда отношение F= (3.6) при ,2 S22 будет иметь распределение Фишера со степенями свободы /, = л, - к -1, f2=n2-k-l. Если значение F, то гипотеза об однородности дисперсии отклоняется.