Введение к работе
Актуальность. Быстрое развитие различных элементов информационного общества ставит перед социологией задачу создания новых методов изучения социальной реальности, адекватных произошедшим социальным, культурным и технологическим изменениям. Все это требует от российской эмпирической социологии активного использования современных компьютерных систем для анализа, моделирования и прогнозирования различных социальных явлений и процессов. Однако, недостаточная разработанность методологии и методики разработки социологического программного обеспечения сдерживает развитие и применение компьютерных систем в отечественной социологии.
Научная разработанность проблемы. В современной западной социологии компьютерные системы рассматриваются как весьма важный элемент теоретической и эмпирической деятельности, необходимость разработки которых вызывается требованиями времени и сложностью изучаемых социальных явлений и процессов. Многие исследователи предлагают заменить двухкомпонентную модель социологии (теоретические разработки и эмпирические исследования) на трехкомпонентную, добавив третий, компьютерный, компонент. Большое внимание, уделяемое в зарубежной социологии вычислительным экспериментам и построению компьютерных моделей, привело к появлению нового направления - "computational sociology" или "компьютерная социология" '.
В современной социологии активно разрабатываются и используются различные типы компьютерных систем. Для анализа количественных данных применяется более 100 различных статистических пакетов. Наиболее часто используются мощные
1 Ниттоп N.P., Fararo T.J. The Emergence of Computational Sociology // The Journal of Mathematical Sociology, 1995, 20, 2-3, p. 79-87.
универсальные пакеты BMDP, SPSS, SAS, Statgraphics, Systat, Statistica, Stadia и т.д. Анализ временных рядов осуществляется с помощью пакетов Эвриста, Олимп, Мезозавр, Forecast Expert и многих других.
Однако, возможности универсальных статистических пакетов не полностью соответствуют специфике социологии, так как они не предназначены для анализа качественной социальной информации. В связи с этим в современной зарубежной социологии возник специальный тип программного обеспечения для анализа качественных данных -CAQDAS (computer-assisted qualitative data analysis software). К этому типу относятся системы для контент-анализа текстовой информации, автоматического реферирования и рубрицирования документов, текстовые базы данных. В настоящее время активно создаются новые системы CAQDAS, например, пакеты HyperRESEARCH, MAX, ATLAS, Aquad, EDP и многие другие1.
В современной социологии компьютерное моделирование стало одним из базовых методов изучения социума2. Оно используется как при проведении эмпирических исследований, так и для проверки и уточнения теоретических гипотез. Используются различные виды
1 Evans W. Computer-Supported Content Analysis: Trends, Tools and
Techniques // Social Science Computer Review, 1996,-14, 3, p. 269-279.
Jacques J. Analyses de contenu et de discours dans la recherche sociologique
franaise: pratiques microinformatiques actueles et potentielles // Current
Sociology I La Sosiologie Contemporaine, 1996, 44, 3, p. 279-290.
Udo K. Computer-Assisted Qualitative Data Analysis Software in Germany // Current Sociology I La Sosiologie Contemporaine, 1996, 44, 3, p. 225-241. Miles M.B., Weitvnan E.A. The State of Qualitative Analysis Software: What Do We Need? II Current Sociology / La Sosiologie Contemporaine, 1996, 44, 3, p. 206-224.
2 Gilbert N. Using Computer Simulation to Study Social Phenomena //
Bulletin de Methodologi Socioloque, 1995, 47, p. 99-111.
моделей, в том числе нелинейные причинные, графовые, нейронные сети и т.д.
Особое место в компьютерной социологии занимают системы искусственного интеллекта1. Сети фреймов используются для конструирования отдельных правил социальных взаимодействий, ассоциативные сети применяются для контент-анализа текстовой информации и построения компьютерных моделей, экспертные системы позволяют строить объяснительные модели, а также накапливать и обобщать полученные знания.
Активное использование вычислительной техники для решения социологических проблем вызвало разработку специальных алгоритмов для исследования процессов социальной самоорганизации, выяснения природы социальных закономерностей, извлечения социологических фактов из индивидуальных наблюдений, изучения вербальных взаимодействий2.
Процесс разработки социологического программного обеспечения можно также рассматривать с позиций программирования. Если методология создания отдельных программ и пакетов достаточно подробно исследована в программировании, то вопрос разработки компьютерных систем, базирующихся на развивающейся научной теории, практически не рассматривается. Это связано с тем, что в этом случае происходит качественное изменение методологии разработки программного обеспечения.
Активно развивающаяся в настоящее время инженерия программного обеспечения в основном базируется на системном подходе к разработке больших программных комплексов и определяется как конструирование (создание сложного продукта из простых) плюс
1 Carky KM. Artificial Intelligence within Sociology // Sociological Methods
and Research, 1996, 25, 1, p. 3-30.
2 Heise D.R. Sociological Algorithmns: Preface // The Journal of Mathematical
Sociology, 1995, 20, 2-3, p. 73-77.
управление окружением (выбор средств и технологий реализации). При этом создание программного обеспечения рассматривается как типично инженерная задача разработки продукта с известными ограничениями для требуемых запросов. Оптимизирующие преобразования, повышающие качество программ при сохранении их смысла, получают все большее распространение как эффективное средство автоматизации построения качественных программ. Методы анализа программ позволяют во многих случаях доказать завершимость и частичную правильность программ.
В современном программировании рассматривается ряд подходов, например, системный, систематический, объектно-ориентированный, позволяющих уменьшить количество ошибок и ускорить процесс разработки компьютерных систем. Конечная цель этого процесса -расширяемое программирование. Под ним понимается возможность конструирования таких иерархий модулей, когда каждый модуль добавляет новую функциональность в систему. Расширяемое программирование подразумевает, что добавление модуля возможно без необходимости вносить какие-либо изменения в существующие модули -не должно быть необходимости их перекомпилировать. Новые модули не только добавляют новые процедуры, но - что более важно - добавляют также новые (расширенные) типы данных.
В то же время в доступной автору социологической и компьютерной литературе не удалось обнаружить описания методологии и методики разработки компьютерных систем в социологии, что определило выбор темы исследования.
Объект исследования - компьютерные системы в социологии.
Предмет исследования - методология и методика разработки компьютерных систем в социологии.
Цель исследования - разработка компьютерных систем в социологии.
Задачи исследования: 1. Выявление методологии и методики разработки компьютерных систем в социологии.
-
Разработка компьютерной системы для контент-анализа текстовых материалов.
-
Разработка экспертно-диагностической системы для анализа и моделирования социальных систем.
Методологическая база исследования - компьютерная социология, включающая современные социологические теории, технологии разработки программного обеспечения, программную инженерию, компьютерное моделирование.
Организационная база исследования. Исследования проводились автором в Институте социологии РАН в 1993-1998 гг. в рамках академических научно-исследовательских проектов "Структурная гармония и дисгармония социальных систем" и "Законы социальных систем".
Новизна полученных результатов. Выявлена и практически реализована методология и методика разработки компьютерных систем в социологии. Разработаны две оригинальные компьютерные системы для контент-анализа текстовых материалов и модульного анализа и моделирования социальных систем.
Положения, выносимые на зашиту:
-
Выявленная и практически реализованная диссертантом методология и методика разработки компьютерных систем в социологии, которую диссертант обозначает как "social software engineering" или "инженерия социологического программного обеспечения".
-
Разработанная диссертантом на основе "social software engineering" компьютерная система Контент-анализ Про 1.6, которая позволяет проводить частотный и смысловой анализ текста с автоматическим построением смысловых групп, определение тематической направленности текста, нахождение синонимичных выражений, поиск связей для данного термина в тексте, анализ совместной встречаемости словоформ, поиск фрагментов, содержащих заданные смысловые выражения, построение карт текстов и сравнение их между собой, вычисление стандартных коэффициентов (число слов, предложений, средняя длина предложения и т.п.) и интегральных характеристик
текста (лексическое разнообразие, структурная и грамматическая сложность), сравнение текстов по грамматическим, общесистемным и смысловым характеристикам с вычислением интегрального индекса идентичности, а также выполнять интервальное сравнение текстов. 3. Разработанная диссертантом на основе "social software engineering" экспертно-диагностическая система МАКС 3.0. В данной системе реализованы различные виды модульного, статистического, геоинформационного, геометрического, иерархического анализов в статике и динамике; имеется возможность моделирования социума в целом и его отдельных частей в режиме реального времени; реализованы процедуры сравнения различных социальных систем как между собой, так и с эталонами из базы знаний или пользовательскими эталонами," реализован автоматический поиск закономерностей; имеются возможности обучения системы, пополнения и уточнения ее базы знаний; автоматически генерируются прогнозы и т.д. Имеется возможность автоматической диагностики социальной системы, в результате которой система МАКС самостоятельно генерирует отчет на русском языке, содержащий диагностику системы, таблицы, графики и прогнозы, выявляет «слабые» и «сильные» стороны анализируемой системы, находит структурно-функциональные закономерности системы в статике и динамике.
Апробация результатов исследования. Методология, методика разработки и результаты применения компьютерных систем Контент-анализ и МАКС были доложены на ряде международных конференций, обсуждались на семинарах в научно-исследовательском комитете "Теория социальных систем" Российского общества социологов и семинарах по математическому моделированию социальных процессов на факультете социологии МГУ. Разработанные диссертантом компьютерные системы Контент-анализ и МАКС используются в различных организациях Российской Федерации, среди них:
Научные учреждения РАН - Институт социологии РАН, Институт системного анализа РАН, Институт философии РАН, Институт социально-политических исследований РАН.
Органы государственного управления РФ - Аналитическое управление администрации Президента РФ, Аналитическое управление Московской Городской Думы, аналитические центры глав администраций Нефтеюганска, Новгорода, Тольятти, Красноярска.
Высшие учебные заведения - факультет социологии МГУ, кафедра социологии МГИМО (У) МИД РФ, факультет социологии удмуртского государственного университета, факультет социологии красноярского государственного университета.
Коммерческие предприятия - телекомпания ОРТ, Акционерная компания "Алмазы России-Саха", Фонд "Общественное мнение", Московское предприятие МИГ, рекламное агентство "Партнер" и 25 других коммерческих фирм в городах: Калининград, Нижневартовск, Екатеринбург, Минск, Алма-Ата.
Структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений.