Введение к работе
Актуальность темы исследования. В области анализа социологических данных широко используются различные классы математических методов. Арсенал инструментальных средств обработки информации постоянно расширяется, пополняясь новыми подходами, позволяющими решать содержательные задачи, возникающие в самых разнообразных областях эмпирической социологии. Многообразие методов анализа данных, с одной стороны, предоставляет исследователю богатый выбор и открывает широкие возможности. С другой стороны, порождает своего рода «методологическую травму» - «растерянность исследователей перед обилием социологических теорий, методологий, методов в процессе принятия решений о выборе средств познавательной деятельности». В этой связи возникает потребность и в систематизации методического знания, и в осмыслении возможностей и ограничений тех классов математических методов, которые являются для социологического анализа относительно новыми.
К одному из таких классов относятся так называемые логико-комбинаторные методы, основанные на использовании средств математической логики и предназначенные для анализа взаимосвязи признаков на «локальном уровне». Базовыми методами этого класса являются: 1) метод СКА («сравнительный качественный анализ», qualitative comparative analysis, QCA) ; 2) ДСМ-метод (названный в честь Джона Стюарта Миля, JSM-method) . Оба эти метода разрабатываются с 1980-х годов. Первый из них был предложен Ч. Рейджином, второй – отечественным исследователем В.К. Финном.
Актуальность изучения эвристического потенциала и особенностей применения логико-комбинаторных методов обусловлена несколькими причинами: отсутствием достаточно конструктивных описаний технологии применения этих методов, несмотря на существование немалого числа научных публикаций, в которых делается упор на подробное описание математических алгоритмов и не отражаются этапы построения концептуальных схем анализа, технологии его проведения. Каждый из этих методов обладает различными познавательными возможностями и ограничениями, ориентирован на решение вполне определённых содержательных задач. В основе каждого метода лежит теоретическая модель представления данных, особые модельные ограничения, которые должны выполняться на данных. Соответственно возникают задачи изучения адекватности методов в различных исследовательских ситуациях. Кроме того, возникают проблемы совместного использования этих методов с целью достаточно полного извлечения эмпирических закономерностей в рамках решения одной и той же задачи. Рассматриваемые методы развивались независимо друг от друга, что требует не только выявления преимуществ и ограничений каждого из них, но и изучения возможностей их последовательного применения. Логико-комбинаторные методы реализуют достаточно новый для социологии подход к анализу данных. Вследствие этого, необходимо соотнесение и сопоставление их с другими математическими методами и обозначение классов задач, для решения которых они являются эффективным способом анализа данных.
Степень научной разработанности проблемы. Логико-комбинаторные методы неразрывно связаны с методологией и методами анализа данных в социологии. В этой связи диссертационное исследование опирается на работы по методологии социологического исследования, в которых в той или иной степени затрагивалась проблематика анализа данных (Г.С. Батыгин, И.Ф. Девятко, Г.Г. Татарова, Ю.Н. Толстова, В.А. Ядов и др.); по методам многомерного анализа, разработка и применение которых имеет длительную традицию, как в России, так и за рубежом (М.Дж. Кендалл, А. Стьюарт, Дж.-О. Ким, Ч.У. Мьюллер, У.Р. Клекка, М.С. Олдендерфер, Р.К. Блэшфилд, Г. Крамер, Д. Хейс, С.Д. Хайтун и др.); по методическим проблемам анализа социологических данных, в частности, на работы отечественных исследователей (Э.П. Андреев, Г.В. Осипов, В.Г. Андреенков, Ю.Н. Толстова, К.Д. Аргунова, Г.Г. Татарова, И.И. Елисеева, В.О. Рукавишников, Ф.М. Бородкин, Ю.Н. Гаврилец, П.С. Ростовцев, И.Б. Мучник, Б.Г. Миркин, В.А. Малахов, М.С. Косолапов и др.); по логико-комбинаторным методам, которые начали разрабатываться в конце 1970-х – начале 1980-х гг.
За рубежом начало исследованиям по применению средств и языка математической логики в социологических и политических исследованиях положили работы американского социолога Ч. Рейджина. Он изучал возможности использования булевой алгебры для формализации сравнительного анализа небольшого количества объектов. Первая публикация, описывающая метод «сравнительного качественного анализа» (СКА), вышла в 1987 г. Позже в двух монографиях Ч. Рейджин предложил модификацию метода, а также сопоставил его со статистическим подходом к анализу социологических данных.
Особенности метода СКА и результаты его применения на практике активно обсуждались в научной периодике. По данным Б. Риу, в 2003 г. насчитывалось уже около 230 публикаций, посвящённых «сравнительному качественному анализу». Сфера применения этого метода оказалась достаточно широкой: он использовался для изучения стилей административного управления в городах, анализа динамики убийств, проявлений рабочего сопротивления, причин, приводящим к злоупотреблениям наркотиками и алкоголем и прочего. Со временем сложилась группа исследователей, которые занимаются разработкой, применением и продвижением СКА, изучением его методологических оснований и методических особенностей (Ч. Рейджин, Б. Риу, Ж. Де Мер, А. Берг-Шлоссер, Л. Кронквист, Дж. Квист, К. Шнайдер, Б. Вис и др.).
В отечественной научной литературе представлены переводы всего трёх статей Ч. Рейджина и его последователей. Метод СКА кратко описан в качестве метода анализа данных в области исторической макросоциологии Н.С. Розовым и упоминается в статьях А.В. Стрельниковой, П.В. Романова и Е.Р. Ярской-Смирновой.
В России исследования, посвященные использованию логико-комбинаторных методов для анализа социологических данных, связаны в первую очередь с именем В.К. Финна. Предложенный им в конце 1970х - начале 1980-х гг. ДСМ-метод продолжает разрабатываться и применяться под его руководством научно-исследовательским коллективом ВИНИТИ РАН в различных областях науки, включая социологию. Результаты многолетних исследований по разработке и применению ДСМ-метода представлены в коллективных монографиях.
Первая версия интеллектуальной системы типа ДСМ для анализа именно социологических данных была разработана М.А. Михеенковой, а ее программная реализация осуществлена С.С. Московским. Этой проблематикой занимались Ж.И. Бурковская, С.М. Гусакова, Д.В. Панкратов, Т.В. Феофантова. Использование ДСМ-метода в социологических исследованиях представлено в статьях Е.Н. Даниловой, С.Г. Климовой, А.А. Земскова.
Другие методы поиска взаимодействий, установления закономерностей в виде комбинаций значений переменных (признаков) - алгоритмы деревьев решений, детерминационный анализ (основанный на анализе условных распределений), предложенный С.В. Чесноковым, разработки Н.Г. Загоруйко и Г.С. Лбова - не могут быть отнесены к классу логико-комбинаторных методов, поскольку используют лишь незначительные элементы математической логики.
Несмотря на наличие ряда монографий, сборников, статей, посвящённых двум основным видам логико-комбинаторных методов, недостаточно освещёнными остаются вопросы, связанные с их эвристическим потенциалом, местом в ряду других средств анализа данных, с методическими особенностями применения. Работы зарубежных авторов остаются неизвестными широкому кругу российских исследователей, а труды отечественных специалистов освещают в большей степени теоретические основания логико-комбинаторных методов, нежели технологии применения.
Не изученной остается проблематика совместного использования логико-комбинаторных методов в рамках решения одной и той же задачи, не проводились исследования с последовательным или параллельным применением логико-комбинаторных методов на практике, хотя с теоретической точки зрения М.А. Михеенковой проведен сравнительный анализ рассматриваемых нами методов.
Объектом диссертационного исследования являются логико-комбинаторные методы как особый класс математических методов многомерного анализа социологических данных.
Предметом диссертационного исследования выступают познавательные возможности логико-комбинаторных методов и методические особенности их применения.
Цель исследования заключается в разработке технологии использования логико-комбинаторных методов (включая и их последовательное применение) на примере решения двух классов содержательных задач: сравнительного анализа стран по совокупности типообразующих признаков; измерения гомогенности, непротиворечивости и близости групповых предпочтений.
Для достижения этой цели предполагалось решение следующих исследовательских задач:
-
Предложить основания для сравнения математических методов многомерного анализа жестко формализованных социологических данных.
-
Обосновать необходимость выделения логико-комбинаторных методов в особый класс математических методов на основе сопоставления их с широко распространенными средствами многомерного анализа.
-
Проанализировать методические особенности базовых логико-комбинаторных методов.
-
Разработать модель изучения отношения к протестному поведению в разных странах, опираясь на вторичную концептуализацию данных, полученных в рамках «Международной программы социальных исследований – 2006».
-
Определить преимущества и недостатки логико-комбинаторного подхода для типологического анализа стран (базовым типообразующий признак - одобрение / неодобрение населением протестного поведения).
-
Проанализировать познавательные возможности ДСМ-метода для измерения гомогенности, непротиворечивости и близости установок респондентов (на примере анализа политических предпочтений студентов, принадлежащих к электоратам разных партий).
Теоретико-методологическая основа исследования.
Для обоснования логико-комбинаторных методов как особого класса методов автор опирается на основные положения в области методологии и методов многомерного анализа социологических данных. Для выявления теоретико-методологических предпосылок их применимости и разработки технологии их использования - на упоминавшиеся выше труды авторов, предложивших СКА и ДСМ-метод: Ч. Рейджина, Д. Берг-Шлоссера, В.К. Финна, М.А. Михеенковой и др.
Для постановки задачи сравнительного анализа стран и ее решения использовались языковая и логическая структуры типологического анализа как метаметодики, предложенные Г.Г. Татаровой. Концептуализация исходных данных Международного проекта социальных исследований и работа с эмпирической базой проводились с учётом принципов вторичного анализа данных, опираясь на разработки В.С. Сычевой, В.П. Горяинова, А.В. Стрельниковой.
Эмпирическая база диссертационного исследования.
-
Данные исследования «Роль правительства в государстве», проведенного в 2006 г. в рамках Международной программы социальных исследований. Опрос проводился в 32 странах. Использовался жёстко формализованный унифицированный для всех стран вопросник. Выборка многоуровневая, стратифицированная, формировалась в каждой стране по существующим статистическим показателям. Общий объём выборочной совокупности составил 48 641 чел. Первичные (полевые) данные подвергались вторичному анализу и в процессе вторичной концептуализация были преобразованы посредством вычисления различных индексов – производных показателей, отражающих мнение населения разных стран, т.е. был осуществлен переход с уровня индивидуальных измерений к групповым.
-
Данные, полученные в исследовании «Электоральные предпочтения студентов РГГУ». Первый этап: рук. Р.И. Анисимов, анкетный опрос студентов 4-5 курсов, ноябрь 2003 г., число участников опроса – 272 респондента. Второй этап: рук. А.В. Стрельникова, анкетный опрос студентов 4-5 курсов, ноябрь 2007 г., число участников опроса – 267 респондентов. Выборочная совокупность формировалась на основе двух признаков: курс (4 и 5), факультет. Автор принимал непосредственное участие на втором этапе исследования в процессе сбора и анализа данных.
Научная новизна исследования заключается в следующем:
- в качестве средства систематизации знаний о математических методах многомерного анализа в социологии предложен ряд оснований для их сравнения (возможность получения статистических оценок, требуемый уровень измерения переменных, форма представления данных «на входе», структура результата «на выходе» и др.);
- опираясь на выделенные основания для сравнения математических средств многомерного анализа, определено место логико-комбинаторных методов в их структуре;
- предложена и апробирована методика вторичной концептуализации данных «Международного проекта социальных исследований» для сравнительного анализа стран по одобрению населением протестного поведения. В частности, осуществлен переход от индивидуального к групповому уровню измерения на основе введения интегральных показателей;
- определены преимущества и ограничения использования логико-комбинаторных методов для типологического анализа стран (по одобрению / неодобрению населением протестного поведения, по особенностям политической культуры, и т.д.);
- выявлены возможности использования методики измерения с помощью ДСМ-метода непротиворечивости, гомогенности и близости установок респондентов (на примере анализа политических предпочтений студентов, принадлежащих к электоратам разных партий).
Положения, выносимые на защиту
-
Способом обобщения информации о разнообразных методах многомерного анализа данных является их классификация по различным основаниям. Несмотря на невозможность предложить универсального критерия для сравнения методов, можно ввести несколько оснований для соотнесения достаточно новых для социологии алгоритмов анализа данных с широко распространенными методами. Наиболее эффективными из них являются так называемая метаметодика анализа данных (виды анализа: типологический, факторный (факториальный) и причинный), на реализацию которой направлены методы; определенный уровень измерения переменных; возможность получения статистических оценок.
-
Двумя базовыми логико-комбинаторными методами имеет смысл считать СКА (метод «сравнительного качественного анализа») Ч. Рейджина и ДСМ-метод В.К. Финна, которые разрабатывались в одно время и независимо друг от друга. Несмотря на то, что они опираются на различные алгоритмы поиска эмпирических закономерностей, оба метода используют в качестве языка формализации данных математическую логику. Эти инструментальные средства многомерного анализа данных основаны на индуктивном выводе и позволяют выявлять различные эмпирические закономерности, отыскивая и устанавливая сходства в характеристиках объектов в виде комбинаций значений переменных.
-
Специфика логико-комбинаторных методов по отношению к другим средствам многомерного анализа данных заключается в следующем: а) они предназначены для реализации метаметодики причинного анализа; б) направлены на решение задачи поиска взаимодействий, т.е. анализа взаимосвязи переменных на «локальном» уровне»; в) ориентированы на использование переменных, измеренных на номинальном и порядковом уровнях; г) могут использоваться для анализа выборок небольшого объема; д) не позволяют переносить выводы на генеральную совокупность, при этом не требуют выполнения условий, связанных с распределением значений переменных; е) соотносятся с «интеллектуальным анализом данных», так как направлены на отыскание максимального количества закономерностей в данных; ж) относятся к методам «формализованного качественного анализа», реализуя «восходящую», индуктивную стратегию анализа данных.
-
Большинство методов многомерного анализа данных направлено на изучение взаимосвязи между признаками на «глобальном» уровне. Однако в социологических исследованиях сложно обнаружить детерминанты того или иного явления, оказывающие на него сильное влияние вне зависимости друг от друга. При этом более значимое воздействие на целевой показатель могут иметь комбинации ряда характеристик, различные взаимодействия признаков. Для установления и изучения подобного вида закономерностей на «локальном» уровне адекватными являются именно логико-комбинаторные методы.
-
Преимущество использования логико-комбинаторных методов при проведении типологического анализа заключается в возможности выделения пересекающихся подгрупп объектов, часть характеристик которых полностью совпадает; в отличие, например, от кластерного анализа, в результате применения которого получают описание кластерных профилей, типичных представителей подгруппы, и каждый объект не полностью, но в большой или меньшей степени соответствует этому описанию (в зависимости от того, ближе он к центру кластера или дальше от него). С учетом указанных особенностей логико-комбинаторные методы целесообразнее использовать для типологизации небольшого количества объектов, в случае если необходимо получить не просто описания подгрупп схожих объектов в целом, а обладать при этом характеристиками каждого.
К недостаткам использования логико-комбинаторных методов для реализации типологического анализа относится дробное деление совокупности объектов на большое количество пересекающихся подгрупп, а также выявление закономерностей в виде длинных комбинаций значений признаков, что затрудняет восприятие, описание и интерпретацию результатов.
-
Последовательное использование различных логико-комбинаторных методов для выделения типологических групп стран, отличающихся по уровню одобрения населением протестного поведения и основным характеристикам политической культуры, позволило сопоставить СКА и ДСМ-метод между собой. СКА, рассматривая по отдельности две группы объектов с противоположными значениями целевого показателя, позволяет выделять среди каждой из них подгруппы объектов, обладающих одинаковыми характеристиками (комбинациями значений независимых признаков). В отличие от него, ДСМ-метод определяет подгруппы объектов, обладающих уникальной, присущей только им комбинацией характеристик, не встречающейся у объектов с противоположным значением целевого показателя. Тем самым выделяются подгруппы объектов и схожих между собой, и отличающихся от объектов с противоположным значением зависимого признака. Вследствие этого ДСМ-метод эффективно использовать для уточнения результатов применения СКА и выделения наиболее устойчивых закономерностей.
-
В случае большого количества исходных для анализа переменных целесообразнее применение ДСМ-метода, возможности которого были продемонстрированы в ходе сравнительного анализа стран с разным уровнем поддержки населением протестного поведения в широком контексте политических, экономических установок населения, объективных показателей развития стран.
-
Измерение непротиворечивости, гомогенности и близости установок респондентов с помощью ДСМ-метода позволяет получить групповые оценки и соответственно сравнивать группы. Методика измерения может использоваться для изучения установок опрашиваемых в различных сферах.
Теоретическая и практическая значимость работы. Результаты диссертационного исследования могут быть использованы:
- в теоретико-методологических исследованиях – для сопоставления новых методов анализа данных с другими алгоритмами поиска эмпирических закономерностей; совместного использования различных методов;
- в эмпирических исследованиях - для применения логико-комбинаторных методов в различных областях, для разработки концептуальной модели исследования; для анализа данных, полученных на «малых» и «средних» выборках;
- в преподавании дисциплин «методология и методика социологического исследования», «анализ данных в социологии».
Апробация работы. Основные положения и результаты диссертационного исследования отражены в 13 публикациях автора общим объемом 6 п.л. Они были представлены на 10 научных конференциях: Х конференция Европейской социологической ассоциации (Женева, 2011), Весенняя методологическая конференция Американской социологической ассоциации (Тилбург, 2011), V научно-практическая конференция памяти А.О. Крыштановского «Социологические методы в современной исследовательской практике» (Москва, НИУ ВШЭ, 2011), «Гуманитарные чтения» (Москва, РГГУ, 2010), «Наша социология: исследовательские практики и перспективы» (Москва, РГГУ, 2011, 2010, 2009, 2008), Международный молодежный научный форум «Ломоносов» (Москва, МГУ, 2011, 2010).
Структура диссертационного исследования. Работа состоит из введения, двух глав, заключения, списка использованной литературы и приложений.