Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка и реализация численных методов исследования зависимости категориальных переменных на основе таблиц сопряженности Бакаева, Ольга Александровна

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бакаева, Ольга Александровна. Разработка и реализация численных методов исследования зависимости категориальных переменных на основе таблиц сопряженности : диссертация ... кандидата технических наук : 05.13.18 / Бакаева Ольга Александровна; [Место защиты: Воронеж. гос. техн. ун-т].- Воронеж, 2013.- 177 с.: ил. РГБ ОД, 61 13-5/1926

Введение к работе

Актуальность темы. Особенности традиционного подхода к исследованию проблемы зависимости переменных требует четко определенного вероятностного пространства и случайного эксперимента. В действительности же имеется эксперимент, характеризующийся конечным числом условно упорядоченных значений переменной. Поэтому для любого исследователя важно не числовое выражение степени зависимости и его обоснование, а более грубые понятия - «практически независимы», «практически зависимы», а также вид зависимости - «возрастающая», «убывающая». В связи с этим существует необходимость разработки численных методов исследования зависимости, способных практически оценивать наличие связи.

В результате использования численных методов исследования зависимости происходит анализ и выбор факторов, т.е. отличительных особенностей объектов. При обработке такого рода информации особую роль играют категориальные переменные, то есть те, которые принимают качественные значения, и бинарные переменные с двумя альтернативными значениями. Такие переменные встречаются достаточно часто в технических, социальных и биомедицинских системах, что приводит к необходимости их исследования. Эффективным, наглядным и универсальным инструментом обработки таких данных являются таблицы сопряженности.

Для категориальных переменных существует достаточно много способов выявления связи с помощью аппарата таблиц сопряженности, но среди них нет универсального. В связи с этим в зависимости от расположения и значений частот приходится использовать тот или иной критерий проверки связи. Следовательно, актуальность проявляется и в назревшей проблеме анализа и классификации всех способов выявления связи между категориальными переменными, модификации некоторых из них и выборе рацио - нального способа проверки наличия зависимости.

Отдельно различным методам исследования связи между категориальными переменными уделяли внимание ряд авторов (П.Н. Бабич, А.В. Чубен- ко, С.Н. Лапач, Ю.Н. Толстова), но, к сожалению, в данной области нет комплексного подхода, который бы четко скоординировал работу всех критериев проверки связи, и тем самым повысил уровень оперативности, достоверности и обоснованности выводов о ее наличии.

Таким образом, существует необходимость разработки эффективных численных методов определения вида и степени зависимости. Поэтому разработка и реализации численных методов исследования зависимости категориальных переменных с помощью таблиц сопряженности, является актуальной.

Работа выполнена в соответствии с научным направлением «Разработка методов систематизации результатов измерений» ФГБОУ ВПО «Мордовский государственный университет им. Н.П.Огарева».

Целью диссертационной работы является разработка новых численных методов исследования зависимости категориальных переменных на основе таблиц сопряженности и их практическая реализация.

Поставленная цель определила необходимость решения следующего комплекса взаимосвязанных задач:

  1. классификация и анализ известных способов исследования зависимости категориальных переменных;

  2. разработка новых аналитических и численных методов исследования зависимости категориальных переменных на основе таблиц сопряженности;

  3. алгоритмизация выбора рациональных методов выявления закономерностей для категориальных переменных на основе предложенных численных методов исследования зависимости;

  4. алгоритмизация выявления групп населения, потенциально подверженных повышенному риску нового заболевания на основе численного анализа зависимости категориальных переменных;

  5. программная реализация средств для выявления связи между категориальными переменными при возникновении нового заболевания в целях предотвращения его распространения на основе предложенных алгоритмов и модели объекта, описываемого категориальными переменными.

Методы исследования. В работе использовались аналитические методы исследований из аналитической геометрии, вычислительные методы линейной алгебры, теории вероятностей, математической и прикладной статистики, численных методов, системного анализа, математического моделирования, методы объектно-ориентированного и визуального программирования.

Тематика работы соответствует п.3 «Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий», п.4 «Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента», п.5 «Комплексные исследования научных и технических проблем с применением ... вычислительного эксперимента» паспорта специальности 05.13.18 - «Математическое моделирование, численные методы и комплексы программ».

Научная новизна. В работе получены следующие результаты, характеризующиеся научной новизной:

  1. формализованное описание и классификация известных методов исследования зависимости категориальных переменных, основанная на учете значений и расположения частот в таблице сопряженности, что повышает эффективность использования критериев;

  2. численный метод получения оценок теоретических частот, характеризующийся использованием предложенных идеально независимой и идеально зависимой таблиц, ближайших к наблюдаемой, позволяющий проверять гипотезу о зависимости переменных;

  3. численные методы исследования вида и степени зависимости между категориальными переменными, основанные на идеальных таблицах сопряженности и позволяющие строить адекватные модели объектов, описываемых категориальными переменными;

  4. алгоритм выбора рационального способа численной проверки наличия связи между переменными, характеризующийся совместным использованием известных и предложенных критериев, позволяющий устанавливать наличие и степень связи с учетом значений и расположения частот в таблице сопряженности;

- алгоритм выявления групп населения, потенциально подверженных повышенному риску нового заболевания, позволяющий осуществить комплексное исследование методов распространения и лечения заболевания различных категорий людей.

Практическая значимость и результаты внедрения.

Разработан программный комплекс по выявлению групп населения, потенциально подверженных повышенному риску нового заболевания, позволяющий автоматизировать расчеты, уменьшить время принятия решения и увеличить достоверность выводов о наличии связи между бинарными категориальными переменными. Элементы программного комплекса прошли государственную регистрацию в ФГНУ ЦИТИС.

С использованием предложенных программных средств проведены комплексные исследования распространения вируса А(Н1Ш)09 и определены существенные и несущественные факторы риска данного заболевания. Результаты внедрения отражены в деятельности отдела статистики ГБУЗ РМ «Республиканская инфекционная клиническая больница» г. Саранск Республики Мордовия, что подтверждается актом внедрения.

Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях: Международной научно-практической конференции «Перспективные инновации в науке, образовании, производстве и транспорте '2010» (Одесса, 2010); XIV научной конференции молодых ученых, аспирантов и студентов Мордовского государственного университета имени Н.П. Огарева (Саранск, 2010-2012); Международной научной конференции «Научное лето - 2011» (Киев, 2011); Международной заочной научно-практической конференции «Современные тенденции в науке: новый взгляд» (Тамбов, 2011); Международной научно-практической конференции студентов, аспирантов и молодых ученых «Современные задачи прикладной статистики, промышленной, актуарной и финансовой математики» (Донецк, 2012); Международной научно-практической конференции «Научные исследования и их практическое применение. Современное состояние и пути развития '2012» (Одесса, 2012); IX Международном семинаре «Физико- математическое моделирование систем» (Воронеж, 2012); Открытой конференции молодых ученых по математическому моделированию и информационным технологиям ИВМ СО РАН (Красноярск, 2013).

Публикации. По материалам диссертации опубликована 21 научная работа, в том числе 6 - в изданиях, рекомендованных ВАК РФ. В работах, опубликованных в соавторстве, лично соискателю принадлежит: [8] - сравнительный анализ использования существующих критериев проверки связи между качественными переменными; [2, 6, 7, 8] - анализ использования различных методов исследования связи между категориальными переменными с помощью таблиц сопряженности; [1, 3] - сформулированные и доказанные условия независимости категориальных переменных; [4] - особенности исследования зависимости между категориальными переменными при работе с предложенными «идеальными» таблицами сопряженности.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников и приложений.

Похожие диссертации на Разработка и реализация численных методов исследования зависимости категориальных переменных на основе таблиц сопряженности