Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Логико-статистические алгоритмы анализа причинно-следственных связей при наличии категоризованных данных Кузбменков, Вячеслав Витальевич

Данная диссертационная работа должна поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Кузбменков, Вячеслав Витальевич. Логико-статистические алгоритмы анализа причинно-следственных связей при наличии категоризованных данных : автореферат дис. ... кандидата физико-математических наук : 05.13.16.- Москва, 1992.- 18 с.: ил.

Введение к работе

uHIriiill;.

Задача построения моделей исследуемого объекта по разнотипным данным и принятие решений по ним является классической задачей, находящей свое применение в различных областях человеческого знания : технике, медицине, социологии, биологии, информатике и т.п. В зависимости от постановки задачи это могут быть задачи диагностики, классификации, распознавания образов, сжатия информации (компактификации данных с целью представления их в виде знаний о предметной области).

' Актуальность задачи. Быстрое развитие методов анализа дан
ных, измеренных в порядковых шкалах, или катетеризованных
данных, в последнее время связано с бурным развитием вычислительной
техники. Тем не менее, научно обоснованных методов анализа
категоризованных данных насчитывается чрезвычайно мало и
применение их для- построения моделей затруднено в силу большой
сложности соответствующих алгоритмов (анализ таблиц

сопряженности, логические методы), в тех случаях, когда значения факторов, составляющих выборку, измерялись в разнотипных шкалах, применение обеих груш методов объективно затруднено. Одним из перспективных подходов к решению подобных задач является логико-статистический метод, так как при этом подходе не накладываются какие-либо ограничения на вид закона распределения по каждому фактору. Особое значение эти методы приобретают в областях техники, где исследуемые параметры измеряются в неколичественных шкалах (например, при оценке надежности системы).

Кроме того, актуальность решаемых в диссертационной работе задач объясняется тем- фактом, что в последнее время проявился особый интерес к созданию проблемноч>риентированных экспертных систем ОС). Основой любой ЭС является набор знаний, составляющий ее базу знаний. Причем, чем достовернее и многочисленнее знания, включенные в базу знаний, тем качественнее советы и рекомендации экспертной системы.

Главной трудностью при разработке ЭС является проблема извлечения знаний о предметной области. В настоящее время основным источником таких знаний является эксперт в рассматриваемой области. Знания эксперта всегда являются квинтэссенцией его практического опыта в данной области, которые получены им в ходе много-

летней работы. Вместе с тем, эксперимент, как важный источник

элементарных знаний, в настоящее время игнорируется при получении знаний для ЭС ввиду недостаточной разработанности методик извлечения и обобщения знаний из выборок, характеризующих предметную область. Трудности, с которыми сталкиваются попытки создания таких методик, являются общими для задач обработки данных: алгоритмическая трудоемкость получения знаний и отсутствие практически пригодных методов (сильные допущения к их применению, не выполняемые на практике).

В силу сказанного выше, разработка алгоритмов логико-статистического анализа причинно-следственных связей является актуальным этапом в создании объективных методов извлечения знаний из экспериментальной выборки.

Целью работы является разработка методики предварительного анализа данных смешанной природы, обеспечивающей адекватность представления наблюдаемых причинно-следственных связей на основе комплексного учета структуры модели и эмпирической структуры данных за счет использования машинно-ориентированных методов исследования.

Научная новизна. В диссертации разработан метод распознавания образов для объектов, имеющих структурное представление, по результатам наблюдения за элементами (факторами), составляющими объект с учетом статистической повторяемости наблюдений.

Автором рассмотрен способ образования таблицы сопряженности 2x2 из исходной матрицы наблюдений типа "объект-свойство", показывающий статистическую неэквивалентность ячеек формируемой таблицы сопряженности 2x2. Для устранения этой неэквивалентности предложено использовать теорему Байеса с целью получения апостериорных оценок частот в таблице сопряженности 2x2, где в качестве априорной информации выбираются вероятности, зависящие от структурных особенностей рассматриваемых моделей. Предлагаемый способ учета априорной информации позволяет учитывать неэквивалентность ячеек таблицы сопряженности 2x2 и делать достаточно эффективной проверку гипотезы о наличии зависимости между предполагаемой причиной и следствием даже в случае нулевых значений в ячейках.

Рассмотрены статистические критерии, пригодные для установления положительной ассоциации в случае апостериорных

нецелых оценок частостей (аналог точного критерия Фишера и

критерия на основе отношения правдоподобий).

С целью сокращения числа отбираемых эмпирически истинных высказываний автором предложен способ формирования семейства альтернативных гипотез о независимости, которые позволяют учитывать степень доверия к матрице наблюдений, т.е. учитывать возможную противоречивость причин и отклика, что особенно важно при наблюдении реальных объектов.

Исследованы логические и статистические правила обобщения конъюнктивных высказываний. Доказана их эквивалентность для матриц наблюдения, реализующих все возможные комбинации значений, принимаемых факторами при бесповторных наблюдениях. Показано, что статистические правила, основанные на отношении правдоподобий, обладают рядом преимуществ при решении задач установления внутренней структуры при пассивных наблюдениях за объектом. Предложены алгоритмы последовательной селекции для поиска минимальной дизъюнктивно-нормальной фора, описывающей структуру объекта на основе статистического критерия. При этом численное значение статистического критерия может служить эффективным критерием сравнения качества логических моделей.

Автором разработан также способ представления объекта исследования в виде графа возможных связей, основное назначение которого состоит в алгоритмическом поддержании способа формирования проверяемых высказываний.

Практическая ценность диссертации заключается в создании программного комплекса (ПК) по установлению причинно-следственных связей при наличии катетеризованных данных и подтверждение его эффективности при анализе структурных схем надежности сложных технических систем и анализе работоспособности изделий.

Полученные в диссертационной работе результаты были использованы:

-НИИ Специального Машиностроения для установления причин разрушения баллонов из композиционных материалов и отражены в отчете

ПО ТЄМЄ Э69888"В", № ГОС. РЄГИСТР. 029848., СОИСШЛНИТЄЛЄМ КОТОРОЙ

являлся автор, а также в договоре №148 "Разработка пакета программ обработки неоднородной информации";

-при проведении сравнительного анализа возможностей предложенных алгоритмов и аналогичных алгоритмов (логических - [Блох

- 4 -А.Ш..Орлов В.А.] и логико-статистических, реализованных в пакете

ОТЭКС [Лбов Г.С.].

Апробация работы. Результаты работы докладывались на:

і) Семинаре по статистическому анализу данных (sda-89)

(Г. Варна (НРБ). Сентябрь 1989 Г.);

2) Всесоюзной НТК с международным участием стран членов СЭВ
"Применение статистических методов в производстве и управлении"

(Г.ПерМЬ, сентябрь 1990 Г.);

3) НТК "Системы управления бездефектностью производства".

(Г.ВИННИЦа, Май 1991 Г.);

4)i\/ Всесоюзной школе-семинаре "Программно-алгоритмическое обеспечение прикладного многомерного статистического анализа", (пос.Цахкадзор, октябрь 1991 г.).

Публикации. По теме диссертации опубликовано пять научных работ. В том числе две работы на английском языке.

Структура работы и объем диссертации. Работа состоит из Введения. 4-х разделов основного текста. Заключения общим объемом 14о машинописных страниц, в том числе 14 таблиц, 24 рисунка и 4-х приложений объемом 41 страница.

Похожие диссертации на Логико-статистические алгоритмы анализа причинно-следственных связей при наличии категоризованных данных