Введение к работе
Актуальность темы. Возрастающая потребность в применении методов математической статистики в самых разных областях человеческой деятельности привела к интенсивному развитию нового ее направления - методов анализа данных, которые в последние годы находят очень широкое практическое применение. Ускоренное развитие вычислительной техники как средства обработки больших массивов данных также стимулировало в последние годы проведение широких комплексных исследований сложных технических объектов, социально-экономических, медицинских, биологических и других процессов и систем, которые непосредственно связаны с человеческим фактором.
Широкое оаспространение таких объектов и явлений и присущая им разнотипность характеристик, т. е. наличие в их описаниях не только количественных, но и качественных и других прианаков, делает актуальной разработку методов и алгоритмов статистического анализа такого рода данных.
Цель и задачи работы. Целью работы является разработка методов и алгоритмов прогнозирования качественной выходной переменной' при качественных или разнотипных входных признаках.
В диссертации решаются следующие задачи:
разработка и экспериментальное исследование методов и алгоритмов статистического анализа качественных или разнотипных экспериментальных данных;
выбор, обоснование подхода и разработка алгоритма для решения задачи прогнозирования качественного отклика;
разработка методических рекомендаций по практическому применению предложенных алгоритмов;
разработка программного обеспечения для решения указанных задач на ЭВМ и представление его в форме удобной для экплуатации;
решение задач медицинской диагностики и прогнозирования исхода биотехнологического процесса
Научная новизна работы. Автором получены следующие результаты:
-
Предложен и разработан модифицированный метод факторного анализа для обработки качественных статистических данных в условиях коррелированности входных воздействий и метод выделения информативных признаков, обладающих наибольшей диагностической силой для классификации объектов.
-
С использованием модельных примеров исследораны четыре типа коэффициентов связи. Показана возможность их эффективного примене-
- 4 -ния вместо коэффициентов корреляций (ковариаций) в алгоритмах факт..., торного анализа.
Предложен критерий для отбора значимого признака-представителя из множества однородных признаков.
-
На основе обобщения одномерного подхода предложен метод прогнозирования качественных ситуаций с помощью модифицированной процедуры Вальда на основе критерия отношения вероятностей. Получены необходимые математические формулы.
-
На основе проведенных исследований доказана возможность эффективного практического использования предложенных алгоритмов.
-
Разработанные в работе методы и алгоритмы реализованы в виде программного комплекса для статистического анализа качественних данных на ЭВМ.
Практическая значимость работы.
-
На основе полученных теоретических результатов разработаны алгоритмы статистического анализа разнотипных данных. Эти алгоритмы реализованы в виде программного комплекса и могут быть применены для широкого класса задач, связанных с исследованием сложных многомерных объектов.
-
Разработанное программное обеспечение имеет диалоговый характер, рассчитано на неподготовленного пользователя и может служить инструментальным средством для использования в научно-исследовательской и практической работе специалистов разного профиля с использованием ЭВМ, в том числе, в таких областях, как социология, психология, техника, экология и др.
-
Разработаны подробные методические рекомендации по применению указанных методов и алгоритмов в практических задачах.
-
Программные средства, разработанные в диссертационной работе, были использованы при решении задачи прогнозирования невынашивания беременности на ранних сроках. Построенное для этой задачи диагностическое правило реализовано на персональном компьютере во Всесоюзном научно-исследовательском центре по охране здоровья матери и ребенка МЗ СССР (ВНВД ОЗМ и Р, г. Москва) и используется при диспансеризации и профилактике беременных женшин.
Решена задача прогнозирования биотехнологического процесса синтеза антибиотиков. Полученное классификационное правило, включающее информативные входшк признаки, относит результат процесса
к "хорошему" или " плохому".
Основные итоги внедрения результатов работы подтверждены документами, приведенными в приложении.
Апробация работы. Основные результаты диссертационной работы докладывались и обсуждались на IX Всесоюзной конференции по планированию эекперимента в научных исследованиях ( Москва, 1989 г. ), на научных семинарах МЭИ, на семинаре во ВНИЦ ОЗМ и Р по результатам анализа статистических данных по проблеме невынашивания беременности, а также демонстрировались на ВДНХ СССР.
Публикации. По результатам диссертационной работы опубликованы 4 печатных работы.
Структура работы. Диссертация состоит из введения, 4-х глав, списка литературы, включающего 86 наименований, приложения. Работа содержит 124 страниц машинописного текста, 4 рисунка, 20 таблиц.