Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Принципы и логические средства интеллектуального анализа социологических данных Михеенкова, Мария Анатольевна

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Михеенкова, Мария Анатольевна. Принципы и логические средства интеллектуального анализа социологических данных : диссертация ... доктора технических наук : 05.13.17 / Михеенкова Мария Анатольевна; [Место защиты: Всероссийский институт научной и технической информации].- Москва, 2011.- 217 с.: ил. РГБ ОД, 71 13-5/49

Введение к работе

Актуальность темы диссертации

Интеллектуальный анализ данных является одним из приоритетных направлений исследований в области искусственного интеллекта. Его возможности в области представления данных и знаний, создания методов обнаружения новых знаний и извлечения закономерностей особенно востребованы в областях с обширными массивами исходных фактов, нуждающихся в структурировании, упорядочении и систематизации. Широкое распространение качественных методов анализа социологических данных в сочетании с отсутствием развитых инструментов преобразования плохо структурированных данных в знания свидетельствуют о назревшей потребности интеллектуализации исследовательских эвристик, принятых в этой области, с последующей реализацией в современных компьютерных системах.

Развитие социологии как эмпирической науки неотделимо от перманентных дискуссий о соотношении теоретического, концептуального подхода к изучению социальных явлений и феноменологической составляющей этого процесса. Стремление придать социальным исследованиям по возможности объективный характер и исходное представление об общности естественнонаучного и социально-исторического познания отразилось в намерении исследователей использовать методы, обладающие достаточно развитым формальным аппаратом и принятые в естественных науках. Массовый характер многих социальных явлений и очевидные трудности учёта множества влияющих на них факторов привели к тотальному доминированию количественных и, прежде всего, статистических методов изучения социальной действительности.

Однако представление о единстве теоретико-методологических моделей естествознания и социальных наук и соответствующее ему отношение к субъекту поведения как обезличенной типической модели трудно совместимо с интересом к изучению взаимодействия мотивированных, целенаправленно действующих, учитывающих важные для них факторы индивидуумов. Отсюда естественно возникает восприятие социологии как науки, «...стремящейся, истолковывая, понять социальное действие и тем самым каузально объяснить его процесс и воздействие»1, а социального действия - как осмысленного, соотносящегося с действием других людей и ориентирующегося на него.

Стремление к развитию «понимающей» социологии (не просто воспринимающей и описывающей непосредственно эмпирические явления, но и объясняющей смысловые связи в этих явлениях), анализу форм человеческих взаимодействий, не являющихся простым проявлением воздействия социальной структуры, привело к развитию качественных - в противоположность количественным - методов, концентрирующихся на

1 М Вебер. Избранное: протестантская этика и дух капитализма. М: РОССПЭН, 2006, с. 453.

социальных взаимодействиях, личностном повседневном опыте действующего субъекта. Фундаментальной слабостью качественного анализа, рассматриваемого широко как исследование, не использующее формальных средств, оказалась прямая зависимость от способностей, здравого смысла и воображения исследователя, а порождаемые эмпирические теории заслужили статус уникальных и невоспроизводимых. С развитием компьютерной техники объективизация качественных исследований первоначально пошла по пути усовершенствования обработки, структурирования и управления данными, и здесь возможности современной генерации пакетов CAQDAS2 (Computer-Assisted Qualitative Data Analysis Software) выглядят достаточно впечатляющими.

Вызванный этим сдвиг стандартов в качественном анализе в сторону строгости заставил социологов обратиться к специалистам в области искусственного интеллекта (ИИ) с призывом к развитию средств, формализующих аналитические индуктивные стратегии создания теорий и связанные с этим когнитивные процессы абдукции. С точки зрения эпистемологического содержания качественный анализ видится как «восходящая» стратегия «доказательного и последовательного» построения теории на основе эмпирических фактов. Таким образом, речь идёт о получении нового знания из эмпирического материала. Формализация этой стратегии - формализованный качественный анализ социологических данных (ФКАСД) - предполагает создание инструмента для анализа нечисловых отношений и установление причин эффектов на основе этого анализа. Использование методов искусственного интеллекта (ИИ) в этом процессе позволяет говорить об интеллектуальном анализе социологических данных (ИАСД, knowledge discovery в социологии).

Целью диссертационной работы является создание логических средств для формализованного качественного анализа социологических данных с использованием методов искусственного интеллекта, а также разработка понятийного и логического аппарата для поддержки социологических исследований. Это означает, в частности, формализацию эвристик качественного анализа социологических данных для решения задач когнитивной социологии -направления в современной социологии, использующего когнитивные средства анализа данных, - и их реализацию средствами современных компьютерных интеллектуальных систем.

Вдохновляющим основанием для такой постановки является фундаментальный тезис об основной задаче интеллектуальных систем (ИС) как задаче конструктивной имитации (возможно, лишь до некоторой степени) познавательных способностей человека. Реализация таких способностей в ИС предполагает наличие средств извлечения знаний из баз

2 Lewins A., Silver С. Using Software in Qualitative Research: A Step by Step Guide. London: Sage Publications,
2007.

3 См. Финн В.К. К структурной когнитологии: феноменология сознания с точки зрения искусственного
интеллекта // Вопросы философии, 2009, № 1, с. 4 - 20.

фактов (БФ), автоматического порождения гипотез и объяснения имеющихся фактов на основании порожденных гипотез, а также способность осуществлять дедуктивный вывод из исходных и полученных знаний (баз знаний, БЗ).

Таким образом, интеллектуальный анализ социологических данных (ИАСД) - автоматическое извлечение интерпретируемых зависимостей, неявно содержащихся в массивах эмпирических данных, между различными факторами - позволяет говорить о возможности построения теории на основе эмпирических фактов средствами формализованных познавательных процедур в компьютерных системах высокого уровня. Такой анализ требует более высокого, чем это принято в качественном анализе, уровня формализации изучаемых психосоциальных явлений и нуждается в первичном структурировании данных и знаний и формировании системы отношений для них. Следующим шагом оказывается выбор адекватных предложенному представлению формальных средств анализа. В совокупности это означает создание формального языка с дескриптивной и аргументативной функциями - для представления данных и знаний (с возможностью определения их сходства) и формализации рассуждений (и выдвижения гипотез), соответственно.

Для реализации этих целей в диссертации решены следующие задачи:

первичная структуризация данных и знаний о социальном субъекте и его поведении (действиях, поведенческих установках, мнениях);

разработка логических и понятийных средств для формализации правдоподобных рассуждений в базах эмпирических социологических фактов с нечисловыми параметрами;

логическая формализация принципа ситуационного детерминизма, позволяющего включать контекст поведения в структуру анализа;

задание формальной структуры закрытых опросов - теоретической основы для представления предсказательных опросов;

формулирование логических принципов анализа рациональности мнений;

создание архитектуры интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных, включающей средства распознавания рациональности мнений.

Методы исследования

В работе используются методы математической логики и интеллектуального анализа данных - ДСМ-метод автоматического порождения гипотез, прежде всего. Для создания архитектуры Интеллектуальных систем для качественного анализа социологических данных используются методологические принципы конструирования интеллектуальных систем типа ДСМ (ИС-ДСМ). При этом практические исследования требуют препроцессинга данных для настройки на класс решаемых задач, осуществляемого в рамках инженерии знаний в диалоге ИС и эксперта-социолога. Для подготовки эмпирических социологических

данных используются различные качественные методологии, а также традиционное анкетирование.

Научная новизна работы состоит в формализации исследовательских эвристик социолога современными логическими средствами, позволяющими осуществлять каузальный анализ социального действия, решая, тем самым, задачи классической «понимающей социологии». Основным инструментом такого анализа является ДСМ-метод автоматического порождения гипотез, являющийся синтезом познавательных процедур4 - эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля), структурной аналогии и абдукции (принятия гипотез на основе объяснения исходных данных) Ч.С. Пирса. Источником детерминаций поведения при этом является сходство субъектов поведения, что требует разработки принципов представления знаний о субъекте поведения и самом поведении.

Формализация и уточнение указанных процедур для использования их при анализе эмпирических социологических данных является пионерской и не имеет прецедентов в современной практике - как социологической, так и в области исследований Искусственный интеллект. Заметим, что неформальное использование методов Д.С. Милля составляет многолетний тренд в качественном анализе социологических данных. При этом очевидной подразумевается невозможность их формализации, а даже минимальное использование логических средств (булевой алгебры) в таком анализе воспринимается как «революция»5.

Расширение класса социологических задач - рассмотрение такой специфической формы поведения как мнение - потребовало адекватного расширения языка представления данных о мнениях индивидуумов и создания процедур для рассуждения «от причины - к следствию» (от сходства мнений - к сходству индивидуумов) - обратного ДСМ-метода. Включение ситуационных параметров реализации поведения (контекста поведения) также потребовало создания новых формальных средств их адекватного представления и учёта - ситуационной версии ДСМ-метода.

Существенным расширением имеющихся логических средств является реализация познавательной активности «анализ данных - предсказание -объяснение» в форме эвристики «алгебра логики - аналогия - абдукция» с использованием булевой алгебры для порождения гипотез о причинных зависимостях. При этом предлагаемые средства значительно превосходят по своим познавательным возможностям известный в мировой социологический практике инструмент качественного анализа данных - Качественный Сравнительный Анализ (Qualitative Comparative Analysis6, QCA) американского социолога Ч. Рейджина, где используется лишь одна

4 Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ, Сер.2, 1999, № 1-2, с. 8 - 45.

5 Vaisey S. QCA 3.0: The "Ragin Revolution" Continues II Contemporary Sociology: A Journal of Reviews, 2009,
vol. 38, No 4, p. 308-312.

6 Rihoux В., Ragin C.C. (eds). Configurational Comparative Methods. Qualitative Comparative Analysis (QCA) and
related techniques (Applied Social Research Methods). Thousand Oaks. CA and London: SAGE Publications, Inc.
2009.

составляющая предлагаемой схемы: анализ сходства примеров социальных явлений средствами алгебры логики.

Другим новым направлением является точное определение закрытых опросов посредством задания формальной структуры. Предлагаемая теоретическая концепция предусматривает использование средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов. В рамках этой структуры создаются логические и процедурные средства распознавания и предсказания рациональности результатов опроса, понимаемой как выбор вариантов ответов на основе аргументационной схемы. Использование средств формальной аргументации для автоматического формирования мнений меняет традиционную опросную схему и позволяет объективизировать социологические данные, являющиеся исходными для формализованных процедур рассуждений. Интеллектуальный анализ данных осуществляется, таким образом, для целого класса закрытых опросов со стабилизированным множеством ответов (при расширении множества респондентов новые варианты ответов не появляются) и формализацией когнитивных рассуждений.

Развитые теоретические принципы и логический аппарат формализации закрытых опросов позволяют охарактеризовать идеальный тип опроса, выражающий концептуализацию технологии анализа и прогнозирования мнений. Идеальный тип составляет каркас новой технологии социологического опроса - с использованием аргументационной семантики и логической структуры опроса, - допускающий реальные технологические приближения.

Наконец, формализация качественного анализа средствами ИИ, т. е. интеллектуальный анализ социологических данных, может рассматриваться как новый когнитивный инструмент - формализованная оболочка для решения проблем когнитивной социологии, - который реализуется в современных интеллектуальных системах (ИС типа ДСМ).

Теоретическая и практическая значимость работы

Теоретическая значимость работы состоит в разработке средств представления и объективизации фактов (результатов эмпирических наблюдений) и знаний (результатов применения когнитивных процедур) о социальном поведении и мнении, создании концептуального и логического аппарата формализованного качественного анализа социологических данных, использующего правдоподобные (нестатистические) рассуждения - ДСМ-метод автоматического порождения гипотез. Формальный аппарат может служить не только логическим средством анализа эмпирических социологических данных о поведении социальных субъектов (как индивидов, так и социальных общностей), но и даёт возможность приближения к логической реконструкции идей классической «понимающей» социологии, в частности построения формальной теории каузального объяснения социального поведения. Разработка теоретических принципов и логического аппарата для формализации закрытых опросов, анализа мнений и логических

средств распознавания рациональности мнений, включающих средства формальной аргументации, также имеет несомненную ценность для развития объективных подходов в субъективной области социальных исследований.

Практическая ценность работы заключается в разработке научных основ технологии интеллектуального анализа социологических данных, в частности технологии социологического опроса и нестатистического изучения мнений. Для реализации технологий такого рода предусмотрена специальная архитектура Интеллектуальной системы типа ДСМ, включающей как средства предварительной обработки эмпирических социологических данных, так и специфические процедуры для их анализа. Система дополняется инструментами анализа рациональности мнений на основе аргументационной семантики и ДСМ-рассуждений. Предложенные подходы могут быть использованы для анализа и предсказания результатов реальных опросов.

Достоверность и обоснованность результатов определяется использованием комплекса методов математической логики и интеллектуального анализа данных - ДСМ-метода автоматического порождения гипотез, прежде всего. Подтверждением этого являются практические исследования - изучение поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН), а также анализ электоральных предпочтений и рациональности электорального выбора студентов (совместно с РГГУ).

Основные результаты и положения, выносимые на защиту:

разработка средств представления и объективизации фактов и знаний о социальном поведении и мнении для решения задач социологии и социальной психологии;

создание концептуального и логического аппарата формализованного качественного анализа мнений;

формальное представление синтеза познавательных процедур, использующих алгебру логики для порождения гипотез о причинных зависимостях;

создание новых логических средств для порождения детерминаций с учётом контекста социального поведения - ситуационного ДСМ-метода;

задание формальной структуры закрытых Tw-значных (т>2) опросов и предсказательных опросов;

создание логических и процедурных средств распознавания и предсказания рациональности результатов опроса;

предложение новой технологии опроса (с учётом некоммутативности различных видов опросов) с использованием средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов;

создание архитектуры новых когнитивных инструментов - ИС-ДСМ для формализованного качественного анализа социологических данных,

формализованной оболочки для решения проблем когнитивной социологии (с предварительной содержательной работой социолога).

Личный вклад автора диссертации в совместных работах с другими авторами был существенным, а во многих случаях и решающим. Автору диссертации принадлежит разработка принципов представления знаний о социальном субъекте и его поведении, формулировка основных процедур анализа данных - обратного ДСМ-метода и ДСМ-метода с параметром ситуации, а также формализация синтеза познавательных процедур с использованием алгебры логики. Автор самостоятельно проводил экспериментальные исследования (разумеется, в кооперации с экспертами-социологами для предоставления эмпирического материала) поведения и анализа электоральных мнений. В последнем, в частности, вычислялись предложенные автором критерии рациональности мнений. Автором развиты предложения по внедрению средств логики аргументации в опросные технологии для объективного формирования мнений. Формирование концепции формализованного качественного анализа социологических данных и его применения к задачам когнитивной социологии также принадлежит автору. То же от носится к разработке принципов архитектуры обучающей интеллектуальной системы для анализа социологических данных, а также принципов создания информационной среды и интеллектуального интерфейса для ИС-ДСМ, реализующей ФКАСД. Реализация этих принципов осуществлена в ИС, созданных по руководством автора диссертации.

Апробация работы

Основные положения и результаты работы докладывались и обсуждались на всероссийских и международных конференциях, конгрессах, чтениях:

  1. 4-я международная конференция «Интеграция. Информационные технологии. Телекоммуникации. НТИ-99», Москва, Март 17-19, 1999.

  2. VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 24-26, 2000.

  3. VIII Национальная конференция с международным участием «Искусственный интеллект-2002», Коломна, Октябрь 8-11, 2002.

  4. 6-я Международная конференция «НТИ-2002»: «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 16-18 октября, 2002.

  5. Сорокинские чтения-2002, «Актуальные проблемы социологической науки и социальной практики», Москва, Декабрь 17-18, 2002.

  6. II Всероссийский социологический конгресс «Российское общество и социология в XXI веке: социальные вызовы и альтернативы», Москва, 30 сентября - 2 октября, 2003.

  1. Международная конференция «Математическое моделирование социальной и экономической динамики (MMSED-2004)», Москва, 23 -25 июня, 2004.

  2. IX Национальная конференция с международным участием «Искусственный интеллект-2004», Тверь, Сентябрь 8-11, 2004.

  3. I Всероссийская научная конференция Сорокинские чтения-2004: "Российское общество и вызовы глобализации», Москва, 7-8 декабря 2004.

  4. Всероссийская междисциплинарная конференция «Философия искусственного интеллекта», Москва, 17-19 января, 2005.

  5. Первая международная конференция «Системный анализ и информационные технологии» САИТ-2005, Переславль-Залесский, 12-16 сентября 2005 г.

  6. X Национальная конференция с международным участием «Искусственный интеллект-2006», Обнинск, Сентябрь 26-28, 2006.

  7. III Всероссийский социологический конгресс «Глобализация и социальные изменения в современной России», Москва, 3-5 октября,

2006 г.

14. Вторая международная конференция «Системный анализ и
информационные технологии» САИТ-2007, Обнинск, 10 - 14 сентября

2007 г.

  1. 7-ая международная конференция НТИ-2007 «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 24-26 октября 2007 г., Москва, ВИНИТИ.

  2. III Всероссийская научная конференция Сорокинские чтения: "Социальные процессы в современной России: традиции и инновации» в 5 томах, Москва, 4-5 декабря 2007.

  3. XI Национальная конференция с международным участием «Искусственный интеллект-2008», Дубна, 29 сентября - 2 октября

2008 г.

  1. III Всероссийский социологический конгресс «Социология и общество: проблемы и пути взаимодействия», Москва, 21-24 октября 2008 г.

  2. Международная научная конференция - Первые Санкт-Петербургские социологические чтения «Питирим Александрович Сорокин и современные проблемы социологии», С.-Пб., 16-17 апреля 2009 г.

  3. Третья международная конференция «Системный анализ и информационные технологии» САИТ-2009, Звенигород, 14-18 сентября

2009 г.

  1. Гуманитарные чтения РГГУ-2010, Москва, 26 марта - 2 апреля 2010 г.

  2. Четвертая международная конференция по когнитивной науке, Томск, 22 -26 июня 2010 г.

  3. XII Национальная конференция с международным участием «Искусственный интеллект-2010», Тверь, 20 - 24 Сентября 2010 г.

  4. Российско-британская конференция «Идеи Д.С. Милля об индукции и логике наук о человеке и обществе в когнитивных исследованиях и

системах искусственного интеллекта», Москва, РГГУ, 15 - 17 июня 2011г. 25. V Поспеловские чтения «Искусственный интеллект: проблемы и перспективы», Москва, Политехнический музей, 29 - 30 ноября 2011 г.

Под руководством автора диссертации и по тематике исследования аспиранткой ВИНИТИ РАН Ж.И. Бурковской была защищена диссертация по специальности 05.25.05 - информационные системы и процессы - по теме «Создание информационной среды для Интеллектуальной системы анализа социологических данных». Содержание работы включено в лекционные курсы, читаемые автором в Отделении интеллектуальных систем Института лингвистики РГГУ и на факультете Социологии НИУ-ВШЭ.

Публикации

Похожие диссертации на Принципы и логические средства интеллектуального анализа социологических данных