Введение к работе
Актуальность темы исследования. Во многих областях медицины и биологии (фармакологии, токсикологии, радиобиологии, биохимии и др.) фундаментальной проблемой является изучение механизмов действия лекарственных средств, токсических веществ, ионизирующей радиации на биологические, экологические объекты. Наиболее востребовано решение данной проблемы в фармакологии при создании новых лекарственных средств (т.е. фармакологических средств, прошедших клинические испытания), поэтому при разработке новых лекарств анализ связи между дозой и эффектом и их количественное определение имеет большое значение для практики. Несмотря на то, что спектр проявлений токсического процесса определяется строением токсиканта, тем не менее, выраженность развивающегося эффекта является функцией количества действующего агента. Для обозначения количества вещества, воздействующего на биологический объект, используется понятие «доза». Под дозой понимается некоторое количественное значение агента (фактора), изменяющее состояние исследуемого объекта, а под эффектом - наблюдаемый качественный (альтернативный) или количественный отклик объекта на введенную дозу. В некоторых случаях, например, при статистической оценке возраста менархе или возраста менопаузы, когда фиксируется возраст пациента и наличие или нет интересующего нас события, отсутствует понятие дозы, в вышеопределенном смысле, тем не менее, задача оценки возраста менархе или оценки возраста менопаузы укладывается в рассматриваемую в диссертации модель доза-эффект и может быть решена предложенными в ней методами.
Основу решения проблемы количественного оценивания связи между наблюдаемым эффектом и введенной дозой составляет способ построения и анализа функции эффективности по результатам наблюдаемых данных: введенной дозы и наличия или отсутствия эффекта, по которым можно вычислить, например, среднеэффективную дозу ED5Q (доза препарата ED50 дает эффект в 50% случаев), а также другие дозы EDa, 0 < а < 100. На современном этапе в токсикометрии востребованными являются величины доз, которые вызывают появление эффекта, учитываемого в экспериментальной группе тест-объектов с заданной вероятностью 0,01; 0,05; 0,1; 0,16; 0,5; 0,84; 0,9; 0,95; 0,99. Такие дозы получили название доз EDt, EDS, EDl0, EDl6, EDt4,EDg0, EDgs, EDm. Поэтому как среднеэффективная доза EDia, так и другие категории доз: малые (>,, EDS, EDlQ, EDl6) и большие дозы (Dg4,D90, EDgs, ED99), должны в полной мере отвечать максимально жестким критериям корректности, надежности, адекватности и состоятельности. В предложенной диссертации нас интересует проблема нахождения функции эффективности, под которой мы будем понимать зависимость вероятности наблюдения эффекта от воздействия данного значения введенной дозы (зависимость доза-эффект) по результатам наблюдений и статистические выводы, касающиеся найденной функции эффективности.
Для построения функции эффективности и расчета D50 обычно применяется официальная методика пробит-анализа в модификациях Литчфилда-Вилкоксона и Финни (включена в Фармакопею СССР, 1987). Иногда для оценки среднеэффективных доз (называемых также медианными эффективными дозами) используются модели бинарного выбора как замена линейной модели нелинейной (в основном используются пробит- и логит-модели, т.е. нормальная или логистическая функции распределения). В некоторых случаях для построения ФЭ используется сплайн-интерполяция. Однако как при пробит-анализе, так и при использовании других моделей, например, модели бинарного выбора эти функции распределения рассматриваемых случайных величин аппроксимируются линейными функциями, но только в окрестности медианы, ценой больших ошибок на краях распределения, особенно если реальная модель распределения отличается от нормального или логистического распределений. Кроме того, при практической реализации пробит-анализа или его модификаций отсутствует возможность проведения единичных испытаний, эти методы ориентируются, в основном, на оценку среднеэффекгивной дозы EDS0 или близкой к ней и не позволяют состоятельно оценивать малые (EDX, ED5, EDl0, EDl6) или большие (EDM, ED90,EDgs,EDw) дозы, а эти дозы являются востребованными для практических нужд при оценке количества антидота, где требуется умение адекватно определять указанные уровни доз; для оценки границ безопасности или терапевтического индекса препарата, (ввиду того, что эти границы является эффективными дозами EDa для небольших значений 0<а<10). В ряде случаев, например, при исследовании эффектов сверхмалых доз характерны немонотонные функции эффективности, а пробит-анализ или модели бинарного выбора не позволяют оценивать такие ситуации.
Ввиду того, что случайная величина - минимальная граница, с которой начинается реакция организма, ненаблюдаема, мы не можем использовать эмпирическую функцию распределения для оценки категорий эффективных доз, поэтому в работах: Криштопенко СВ., Тихое М.С, Попова Е.Б. Токсикометрия эффективных доз, 1997; Парадоксальная токсичность, 2003; Доза-эффект, изд-во Медицина, 2008, был предложен метод, который задачу оценки функции эффективности (функции распределения) сводит к задаче оценивания функции регрессии с использованием непараметрических (ядерных) оценок регрессии. Это позволяет по результатам единичных испытаний оценивать среднеэффек-тивную дозу ED50 не хуже, чем методы пробит-анализа, а малые и большие дозы, близкие к 0% или к 100%, оценивать эффективнее, чем с помощью пробит-анализа. Метод, предложенный в работах, Криштопенко СВ. и Тихова М.С. позволяет оценивать и немонотонные функции эффективности.
В первой главе диссертации строится математическая модель зависимости доза-эффект, адекватная условиям воздействия вещества на организм человека, и рассматривается как задача статистического анализа для случая прямых и непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некото-
рой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу, что отличает ее от подхода Криштопенко СВ. и Тихова М.С. Рассмотрены также случаи фиксированного плана (вводимая доза выбирается заранее и является неслучайной величиной) и случайного плана эксперимента (вводимая доза является случайной величиной). Таким образом, рассмотренные постановки охватывают широкий спектр разнообразных практических ситуаций в проблеме доза-эффект. Если задачи оценки плотности для свертки распределений рассматривались и исследовались в литературе {Parzen Е. On estimation a probability density function and mode. - Ann. Math. Statist. 1962, v. 33, No.3, p. 1065-1076; Rozenblatt V. Remarks on some nonparametric estimates of a density function. -Ann. Math. Statist. 1956, v. 27, No.3, p. 832-837), то задача оценки функции распределения в модели непрямых наблюдений в зависимости доза-эффект рассмотрена впервые. Предложенная модель дает возможность использовать для решения проблем дозозависимых эффектов весь набор мощных средств математической статистики. Построена математическая модель, которая дает возможность решать задачи проверки гипотез и построения соответствующих критериев - задачи, которые ранее не рассматривались в зависимости доза-эффект.
Задача асимптотического поведения непараметрических оценок функции регресии была изучена впервые в работе Конакова В.Д. Об одной глобальной мере отклонения оценки линии регрессии. - Теор. вероятн. и ее примен., 1977, т.22, в.4, с.879-891, где была доказана асимптотическая нормальность интегрированной квадратичной ошибки (ИКО) с весовой функцией, равной квадрату плотности, для статистики Надарая-Ватсона (Надарая Е.А. Об оценке регрессии. — Теор. вероятн. и ее примен., 1964, т. 9, с. 157-159; Watson G.S. Smooth regression analysis. Sankhya, 1964, v. 26, p. 359-372). Доказательство В.Д. Конакова опиралось на асимптотические свойства эмпирических процессов. П. Холл (Hall P. Central limit theorem for integrated square error properties of multivariate nonparametric density estimators. - J. Multivariate Anal., 1984, v. 14, p. 1-16), используя центральные предельные теоремы для мартингалов и вырожденных (/-статистик, доказал асимптотическую нормальность как для точечных квадратичных ошибок, так и для интегрированных квадратичных ошибок на базе статистик Надарая-Ватсона в L2-норме уклонения при более слабых ограничениях, чем в работе Д. Конакова.
Мы рассматриваем и исследуем асимптотическое поведение интегрированных квадратичных ошибок (ИКО) оценок в зависимости доза-эффект в L2~ норме с весом, как для прямых, так и для непрямых наблюдений, как при проверяемой гипотезе, так и при альтернативах, что отличается от постановок В.Д.Конакова и П.Холла. На основе полученных теоретических результатов нами построены конкретные тесты для проверки гипотез согласия и однородности в зависимости доза-эффект. Если у Конакова и Холла в качестве меры отклонения использовалась только ИКО, то в диссертации в качестве мер отклонения мы рассматриваем также суммируемые квадратичные уклонения (СКУ). Это связано с тем, что при компьютерной реализации критериев про-
верки гипотез в некоторых случаях предпочтительней рассматривать СКУ вместо ИКО. На основе асимптотических распределений СКУ и ИКО (на базе статистик типа Надарая-Ватсона и асимптотически несмещенных оценок) мы строим статистические критерии проверки гипотез согласия и однородности двух выборок в рассматриваемых математических моделях зависимости доза-эффект. Такие задачи для исследуемой в диссертации постановки являются новыми. Новыми являются и полученные результаты.
При изучении вопросов, связанных с конкретным применением критериев проверки гипотез согласия и однородности, возникает проблема выбора оптимального значения параметра сглаживания, который присутствует в рассматриваемых оценках функции эффективности. Решением этой проблемы в диссертации является адаптивный алгоритм кросс-проверки выбора параметра сглаживания. В условиях каждой из рассматриваемых ситуаций он является состоятельным и приводит к асимптотически нормальным оценкам оптимального значения параметра сглаживания.
Цели и задачи исследования. Целью диссертационной работы является разработка статистических критериев согласия проверки гипотез о виде неизвестной функции распределения, однородности двух выборок и монотонности функции эффективности в зависимости доза-эффект, анализ результатов их практического применения по реальным данным.
Задачами исследования являются:
-
построение и анализ статистических критериев проверки гипотез согласия о виде функции эффективности и однородности двух выборок на основе асимптотического поведения теоретически построенных ИКО и СКУ и применение тестов для анализа реальных данных;
-
разработка алгоритма оптимального выбора параметра сглаживания в построенных критериях и рассматриваемых оценках функции эффективности;
-
построение критерия проверки гипотезы о монотонности неизвестной функции эффективности и его применение для анализа реальных данных;
-
исследование свойств построенных критериев численными методами при альтернативных гипотезах;
-
создание ActiveX компонента, позволяющего строить оценку функции эффективности, проверять гипотезу о виде ФЭ и гипотезу о монотонности ФЭ в диалоговом режиме и который может быть использован для написания плагинов для MatLab и др. математических пакетов.
Объект исследования. Объектом исследования являются математические модели зависимости доза-эффект и критерии проверки гипотез согласия и однородности. В качестве примера применения полученных результатов анализируются реальные данные, взятые из работы СВ. Криштопенко и др. Доза-эффект. М.: изд-во Медицина, 2008, с. 285 о результатах клинической эффективности аллок-сима в комплексном лечении отравлений фосфорорганическими инсектицидами. Методы проведенного исследования, достоверность и обоснованность результатов. Для доказательства теоретических результатов диссертационной
работы использовались методы теории вероятностей, математического и функционального анализа, теории мартингалов и распределений U-статистик, классические и функциональные предельные теоремы, методы имитационного моделирования. Инструментом исследования являются асимптотические методы математической статистики и численные методы компьютерного моделирования, а также асимптотические методы математического и функционального анализа. Достоверность полученных результатов подтверждается корректностью разработанных математических моделей, использованием фундаментальных результатов математической статистики, строгостью рассуждений, адекватностью полученных теоретических результатов с экспериментальными данными, а также с результатами численного моделирования. Научная новизна и научная значимость полученных результатов.
Все основные результаты диссертационной работы являются новыми и впервые опубликованы в работах диссертанта.
Впервые рассмотрена задача проверки гипотез согласия, однородности и монотонности в зависимости доза-эффект. Построены критерии проверки гипотез согласия о виде функции эффективности, однородности двух выборок. Разработан алгоритм выбора параметра сглаживания, минимизирующий СКУ на базе рассматриваемых оценок. Построен критерий монотонности неизвестной функции эффективности на основе комбинации прямой и обратной оценок, который применен для анализа реальных данных (СВ. Криштопенко и др. Доза-эффект. М.: изд-во Медицина, 2008, с. 285) о проведенных испытаниях аллок-сима в комплексном лечении острых отравлений фосфорорганическими инсектицидами. Численными методами показано, что мощность построенных критериев не ниже 0.3 при уровне значимости 0.05 для реальных данных. Создан ActiveX компонент, позволяющий строить оценку функции эффективности, проверять гипотезу о ее виде и гипотезу о монотонности ФЭ по построенным критериям.
Основной теоретический результат состоит в получении асимптотических распределений ИКО и СКУ рассматриваемых статистик для построения критериев согласия проверки гипотез о виде функции эффективности и гипотезы однородности двух выборок при фиксированном и случайном планах эксперимента для прямых и непрямых наблюдений, а также критерия проверки строгой монотонности неизвестной функции эффективности в рассматриваемых математических моделях по исходным статистическим данным. Практическая значимость полученных результатов.
В токсикометрии важное значение отводится методам определения эффективных доз, так как они являются теми решающими факторами, от которых зависит способ планирования экспериментов, порядок формирования и объем исходных данных, а в конечном итоге качество, эффективность и достоверность искомых показателей токсичности. По этим признакам проблему токсикометри-ческой оценки показателей токсичности можно рассматривать как важнейшую
проблему теоретической токсикологии, имеющей прикладное значение для различных разделов биологии и медицины.
Результаты, полученные в диссертационной работе, были применены для анализа поведения неизвестной функции эффективности и проверки адекватности исходных данных, полученных в результате проведенных испытаний аллок-сима в комплексном лечении острых отравлений фосфорорганическими инсектицидами (СВ. Криштопенко и др. Доза-эффект. М.: изд-во Медицина, 2008, с. 285). Были обработаны результаты исследований чувствительности к адреналину у людей по тесту капельной накожной пробы (СВ. Криштопенко, М.С Тихое, Е.Б. Попова. Парадоксальная токсичность, НГМА, 2001, с. 163).
Показано, что применение построенного критерия однородности для гипотезы о принадлежности двух выборок к одному предельному распределению приводит к тому, что данная гипотеза не отвергается при уровне значимости 0,05. Это дает основание объединить результаты двух экспериментов и по двум выборкам построить одну функцию эффективности, для которой был применен критерий проверки монотонности.
Теоретические результаты, полученные в диссертационной работе, могут быть использованы при планировании клинических испытаний новых лекарственных средств и анализа эффективности их действия, а также в курсах математической и прикладной статистики. На защиту выносятся:
Математическая модель как статистическая проблема проверки гипотез согласия, однородности и монотонности в зависимости доза-эффект.
Критерии проверки гипотез согласия о виде функции эффективности, однородности двух выборок, их асимптотические свойства, а также численные исследования мощности построенных критериев.
Алгоритм выбора параметра сглаживания и его асимптотические свойства.
Критерий монотонности неизвестной функции эффективности на основе комбинации прямой и обратной оценок.
ActiveX компонент, позволяющий строить оценку функции эффективности, проверять гипотезу о ее виде и гипотезу о монотонности функции эффективности по экспериментальным данным с использованием построенных критериев в диалоговом режиме.
Основной теоретический результат состоит в получении асимптотических распределений ИКО и СКУ, на базе которых строятся критерии согласия проверки гипотез о виде функции эффективности, критерий проверки гипотезы однородности двух выборок, а также критерий проверки строгой монотонности неизвестной функции эффективности.
Апробация результатов. Основные результаты диссертации докладывались на: V международной конференции «Предельные теоремы теории вероятностей и их приложения» (Ташкент, 2005 г.); 12-й Всероссийской школе-коллоквиуме по стохастическим методам (ВШКСМ) (Сочи, 2005); 9,h International Vilnius Conference on Probability Theory and Mathematical Statistics (Vilnus, 2006); 7-м Bcepoc-
списком симпозиуме по прикладной и промышленной математике (ВСППМ) (Йошкар-Ола, 2006); XVII всероссийской научно-технической конференции «Современные проблемы математики и естествознания» (Н. Новгород, 2007); Международной междисциплинарной научной конференции «Синергетика в естественных науках» (Тверь, 2007); XIV международной конференции «Математика. Компьютер. Образование» (Пущино, 2007); III межвузовской научно-практической конференции «Математическое моделирование и информационные технологии в сфере обслуживания потребителей» (Сочи, 2007); XII International Conference on Applied Stochastic Models and Data Analysis (Greece, Chania, 2007); 8-й международной междисциплинарной научно-практической конференции «Современные проблемы науки и образования» (Алушта, 2007); XX международной научной конференции «Математические методы в технике и технологиях» (Ярославль, 2007); 8th International Conference «Computer Data Analysis and Modeling» (Minsk, 2007); 14-й Всероссийской школе-коллоквиуме по стохастическим методам (Адлер, 2007); IV всероссийской научно-практической конференции «Актуальные задачи математического моделирования и информационных технологий» (Сочи, 2008); Международной научной конференции «Современные проблемы математики, механики и информационных технологий» (Ташкент, 2008); XVI международной конференции «Математика. Компьютер. Образование» (Пущино, 2008); International Science Conference «Probability Theory, Random Processes, Mathematical Statistics and Applications» (Minsk, 2008); 7-й Международной конференции «Вероятностные методы в дискретной математике» (ВМДМ) (Петрозаводск, 2008 г.); 15-й Всероссийской школе-коллоквиуме по стохастическим методам (Волгоград, 2008 г.); Международной научной конференции «Вычислительные технологии и математическое моделирование» (Ташкент, 2009); IV всероссийской научной конференции «Проектирование инженерных и научных приложений в среде MATLAB» (Астрахань, 2009); Международной научной конференции «Теория вероятностей, случайные процессы, математическая статистика и приложения» (Минск, 2010).
Диссертация докладывалась на научных семинарах кафедры прикладной теории вероятностей и кафедры теории статистических решений ННГУ им. Н.И. Лобачевского.
Структура и объем диссертации. Работа состоит из введения, шести глав, заключения, списка литературы и приложений. Основное содержание изложено на 149 страницах машинописного текста и иллюстрировано 16 рисунками. Список литературы содержит 129 наименований. Опублнкованность результатов и личный вклад соискателя.