Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Модели порогового конформного коллективного поведения Бреер, Владимир Валентинович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бреер, Владимир Валентинович. Модели порогового конформного коллективного поведения : диссертация ... кандидата технических наук : 05.13.10 / Бреер Владимир Валентинович; [Место защиты: Ин-т проблем упр. им. В.А. Трапезникова РАН].- Москва, 2013.- 156 с.: ил. РГБ ОД, 61 14-5/439

Содержание к диссертации

Введение

1. Проблемы моделирования и управления конформным поведением 9

1.1. Гуманитарные исследования конформного поведения 12

1.2. Конформное поведение в прикладной психологии 14

1.3. Математические модели конформного поведения 17

1 А. Возможные приложения математических моделей конформного поведения 39

2. Общие модели порогового конформного коллективного поведения 41

2.1. Теоретико-игровые модели поведения конформистов и антиконформистов

2.1.1. Общая теоретико-игровая пороговая модель конформного коллективного поведения 44

2.1.2. Взаимное влияние агентов 49

2.1.3. Репутация агентов 50

2.1.4. Анонимное взаимодействие однородных агентов 55

2.2. Стохастические модели социальных сетей 57

2.2.1. Вырожденная социальная сеть 63

2.2.2. Невырожденная социальная сеть с конечным числом агентов 70

2.2.3. Двоичная невырожденная конечная социальная сеть 74

2.2.4. Двоичная невырожденная бесконечная социальная сеть 78

2.3. Стохастическая пороговая модель 82

2.3.1. Вероятность выхода из области для конечного числа агентов 84

2.3.2. Асимптотическая оценка. Связь с энтропией 94

3. Прикладные модели управления пороговым конформным коллективным поведением 102

3.1. Модели управления толпой 103

3.1.1. Пороговая модель поведения толпы 103

3.1.2. Постановка задачи управления 106

3.1.3. Управление порогами в анонимном случае 107

3.1.4. Управление репутацией 114

3.1.5. Рефлексивное управление 115

3.2. Пороговые модели взаимного страхования 116

3.2.1. Модель взаимного страхования 119

3.2.2. Теоретико-игровой анализ поведения анонимных страхователей 124

3.2.3. Теоретико-игровой анализ поведения неанонимных страхователей 126

3.2.4. Идентификация порогов

3.3. Пороговые модели коррупционного поведения 130

3.4. Идентификация порогового поведения в социальной сети «Живой Журнал» 134

Заключение 137

Литература

Введение к работе

Актуальность темы. Для описания многих явлений и процессов в социально-экономических системах необходимо учитывать «локальные» изменения в переменных коллективного поведения большого количества агентов, приводящие в конечном итоге к тем или иным макро-эффектам. Модели, использующие такой подход, называются моделями социального взаимодействия. В них поведение каждого конкретного агента зависит, наряду с другими факторами, от выбора других агентов во всей социальной группе, или в ее части, являющейся «окружением» данного агента. Макро-эффект возникает тогда, когда значительная доля агентов придерживается одного и того же выбора.

В рамках математических моделей социального взаимодействия значительную долю составляют исследования конформного поведения, при котором индивидуальное поведение во многом мотивируется так называемыми социальными факторами, такими как потребности престижа, уважения, популярности, или желание быть принятым в различные социальные группы. Социологические и психологические исследования подтверждают, что эти факторы широко распространены и приводят к конформному поведению.

Значительную долю математических моделей конформного поведения составляют пороговые модели, в которых изменение выбора поведения агента происходит вследствие превышения одним из параметров некоторого порога, присущего этому агенту. Объектом изучения при этом является распределение порогов агентов, свойства которого могут быть описаны методами теории игр, теории динамических систем, статистической физики и теории вероятностей.

Разработка моделей и методов исследования распределения порогов, предложенных в настоящей работе в рамках теоретико-игровой модели порогового конформного коллективного поведения, стохастической модели социальной сети и стохастической модели Грановеттера, является актуальной, поскольку позволяет не только формально описать макро-эффекты, происходящие в социальной группе конформных агентов, но и решать задачи управления: толпой, взаимным страхованием, коррупционным поведением и др.

Цель диссертационной работы состоит в разработке и исследовании моделей описания и методов эффективного управления пороговым конформным поведением коллективов агентов.

Достижение поставленной цели потребовало решения следующих основных задач:

  1. Проведение аналитического обзора современных подходов и результатов изучения конформного коллективного поведения.

  2. Разработка и исследование общей теоретико-игровой некооперативной модели, для которой конформное или анти-конформное поведение являются частными случаями; исследование задач управления в рамках этой модели.

  3. Построение статфизической модели социальной сети и исследование в ее рамках макро-эффектов (являющихся аналогами фазового перехода) изменения равновесного состояния.

  4. Обобщение классической пороговой модели Грановеттера на стохастический случай и оценка редких событий выхода системы из области притяжения положения равновесия.

  5. Постановка и решение (на основе результатов исследования предложенных моделей описания порогового конформного коллективного поведения) прикладных задач управления: толпой, взаимным страхованием, коррупционным поведением и др.

Методы исследования. Основным методом исследования является математическое моделирование, то есть разработка и исследование теоретико-игровых и оптимизационных моделей конформного коллективного поведения с использованием подходов и результатов теории игр, теории коллективного поведения, статистической физики и теории вероятностей.

Связь с планом. Исследования по теме диссертационной работы проводились в соответствии с плановой тематикой работ ИПУ РАН в рамках координационных планов РАН.

Научная новизна. В результате проведенных исследований:

  1. На основе проведенного обзора гуманитарных и формальных исследований конформного коллективного поведения выявлены его характеристические особенности, классифицированы (по описываемым свойствам, используемому математическому аппарату и областям возможных приложений) соответствующие математические модели.

  2. Впервые предложена общая некооперативная теоретико-игровая модель конформного поведения, которая позволяет:

с точки зрения теории игр - расширить класс моделей порогового коллективного поведения агентов, осуществляющих совместную деятельность в условиях социального давления и индивидуальных факторов противодействия этому давлению;

с дескриптивной точки зрения - расширить множество ситуаций, которые в рамках предложенной модели могут быть «объясне-

ны» как устойчивые исходы взаимодействия агентов; соответственно, в рамках задач управления - расширить область управляемости;

- с нормативной точки зрения - ставить и решать задачи управле
ния пороговым конформным поведением коллективов агентов, в том
числе - за счет выбора эффективного разбиения агентов по значениям
их порогов.

3. Предложена статфизическая модель социальной сети и методы
оценки ее «ценности». Установлено соответствие между описаниями
коллективного поведения агентов в социальной сети в терминах
теории игр и в терминах статистической физики (энтропия, относи
тельная энтропия, температура, гамильтониан, свободная энергия),
что позволило:

исследовать резкие изменения состояний социальной сети, имеющие характер фазовых переходов.

выделить параметры, воздействием на которые можно осуществлять управление социальной сетью.

4. На базе методов теории вероятностей и больших уклонений
разработана стохастическая динамическая модель порогового кон
формного коллективного поведения (обобщающая модель Грановет-
тера), которая позволяет:

исследовать области притяжения равновесий, а также оценивать вероятности и времена случайного выхода системы из этих областей;

описать асимптотические флуктуации состояний системы, включающей большое число агентов, в терминах функционала действия, который имеет аналогии в вариационном исчислении и теоретической механике.

  1. Разработана модель порогового поведения толпы, в рамках которой исследовано изменение равновесных состояний за счет управления порогами агентов, управления репутацией или рефлексивного управления.

  2. Построены прикладные теоретико-игровые модели порогового конформного поведения, которые позволяют:

исследовать равновесия Нэша в теоретико-игровых моделях взаимного страхования;

провести идентификацию порогов на основании экспериментального исследования склонности агентов-страхователей к риску;

ставить и решать задачи управления пороговым коррупционным поведением агентов.

Практическая значимость работы определяется разработанными автором методами построения и исследования математических

моделей порогового конформного поведения агентов, адаптированными для решения широкого круга практически важных задач управления: взаимным страхованием, коррупционным поведением и поведением толпы.

Реализация результатов работы. Результаты исследования моделей порогового конформного коллективного поведения агентов использовались в: Академии управления МВД, ЗАО «Авиахэлпгрупп» и НП «Новые стратегии».

Личный вклад. Все основные результаты получены автором.

Апробация работы. Результаты диссертационной работы докладывались на: семинарах ИЛУ РАН, научных конференциях Московского физико-технического института (Долгопрудный, 2009-2011), Международной научно-практической конференции «Теория активных систем» (Москва, 2011), XIII Международной конференции «Проблемы управления и моделирования в сложных системах» (Самара, 2011), Международных конференциях «Теория игр и менеджмент» (Санкт-Петербург, 2011, 2012), International Workshop "Networking Games and Management" (Петрозаводск 2012, 2013), X Всероссийской школе-конференции молодых учёных "Управление большими системами" (Уфа, 2013).

Публикации. По теме диссертационной работы автором опубликовано 19 печатных работ общим объемом 12,8 п.л. (личный вклад составляет 11,7 п.л.), в том числе - 6 статей в ведущих рецензируемых журналах.

Объем и структура работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы и приложения. Диссертация изложена на 155 страницах, список литературы включает 189 наименований. Приложение содержит акты и справки, подтверждающие внедрение результатов диссертационной работы.

Конформное поведение в прикладной психологии

В настоящем разделе рассматриваются теоретико-игровые модели, описывающие поведение; членов социальной группы, которое заключается в подражании действиям окружающих, с одной стороны, или/и осуществляется под воздействием на агента так называемого социального давления со стороны остальной группы. Для обозначения этого явления обычно используют термин конформизм1 - см. обзор в первой главе, а также работы по психологии [35,40] и описание многочисленных психологических экспериментов в [75,77]. (

В бытовом использовании термин «конформизм» имеет, чаще всего, отрицательную окраску, акцентирующую внимание на негативной роли этого явления. Из-за образующейся ложной дилеммы нонконформизму часто приписывают отсутствие негативных качеств, присущих конформизму, и положительные качества, отсутствующие у конформизма. Чтобы избежать этих критических оценок, в дальнейшем будем использовать нейтральный термин — конформность (conformity) [35, 86].

Конформностью будем называть такое явление, возникающее в процессе взаимодействия в социальной группе, когда поведение ее члена — агента — подвергается влиянию со стороны других членов группы (социальному давлению), и этот агент полностью или частично подчиняется этому влиянию. Частным случаем конформности является негативизм — поведение, когда.агент, подвергаясь воздействию со стороны других членов группы, всегда действует вопреки им. Негативизм можно рассматривать, как «конформность наоборот».: Агентов, проявляющих конформное поведение, будем называть конформистами, а тех, кто проявляет негативизм — анти-конформистами. .

Описание многих социальных процессов, в том числе моделей конформного поведе-. ния, с точки зрения системного анализа и когнитологии содержится в работе [55]. Вероят і ностные (неигровые) модели конформного поведения рассматриваются в работах [36, 37]. В них, учитываются два фактора - автономность агента и его зависимость от коллектива, и рассматриваются различные частные случаи соотношений между этими факторами. В работе [28] рассматривается динамическая (опять же, неигровая) модель, и в ней кроме собственного мнения и «подражательного эффекта» (конформности) добавляется еще один фактор — внешний стандарт (или навязанная традиция).

В ставшей хрестоматийной работе [121] предложена модель так называемого порогового поведения агентов, которая является наиболее близкой к рассматриваемым в настоящей работе моделям конформного поведения. Пороговое поведение определяется следующим образом. Каждый агент осуществляет выбор одной из двух альтернатив («действовать» или «бездействовать»), например, участвовать или не участвовать в забастовке. Выбор агента зависит от того, сколько окружающих его агентов приняли решение действовать. Если доля действующих агентов превышает характерную для агента величину - его, внутренний порог — то агент действует. Если же доля действующих агентов меньше внутреннего порога агента, то последний бездействует. Рассматривая динамику поведения. агентов, М. Грановеттер находит условие равновесия, как равенство между долей-дей-; ствующих агентов х и значением функции распределения порогов агентов F: x = F(x).

Этот факт послужил для нас отправной точкой в поиске подобных условий для равновесия Нэша в соответствующей игре в нормальной форме. Ниже такие условия найдены. Аналогичный вопрос в эквивалентности некоторого типа равновесия с равновесием Нэша возникает в эволюционных играх. Более того, уравнение динамики, использованное в работе [121] является частным случаем уравнения динамики репликаторов [24]. В работе [121] указывалась перспективность исследований равновесий для неодно родных агентов, т.е. таких, влияния которых на данного агента неодинаковы. В данной работе так же представлены условия равновесий Нэша для игры с неоднородными агента

В отличие от модели [121] и других перечисленных в первой главе работ, ниже при водится общая формулировка теоретико-игровой модели (в рамках игры в нормальной форме) конформного поведения. В рамках этой общей модели, кроме исследования соб ственно конформного поведения, удается получить результаты для ряда ее содержательно интерпретируемых вариаций и исследовать свойства соответствующих равновесий Нэша. Изложение материала настоящего раздела имеет следующую структуру. В подразделе 2.1.1 формулируется теоретико-игровая модель общего вида для бинарного поведения, где агенты производят выбор одного из двух допустимых действий. Целевая функция, соответствующая этому поведению, представляет собой сумму из двух слагаемых, каждое из которых соответствует действию или бездействию агента. Конформное и антиконформное поведение получаются как частный случай этой модели при введении некоторого упорядочения игровых обстановок и монотонности слагаемых целевой функции. Пороговое поведение выводится как частный случай, когда одно из слагаемых целевой функции равно константе (характерному для данного агента порогу). Далее .вводятся ограничения на слагаемые целевых функций агентов, которые используются для частных і моделей. Исследуются вопросы существования и единственности равновесия Нэша для частных случаев, и для общего случая выводится характеристика равновесия Нэша (Утверждение 2.1.2). В подразделе 2.1.2 формулируется модель со взаимным попарным влиянием агентов друг на друга. Эта модель предназначена, в основном, для перехода в дальнейшем к более частным моделям с репутацией и с однородными агентами. Линейная форма социального давления позволяет воспользоваться результатами подраздела 2.1.1 - сформулировать результат, аналогичный Утверждению 2.1.2, то есть характеризовать равновесие Нэша системой неравенств, линейных по стратегиям игроков.

В подразделе 2.1.3 исследуется теоретико-игровая модель, в которой учитывается репутация агентов, определяемая как средняя степень их влияния на других агентов. Это усреднение имеет смысл в тех случаях, когда агенты «не знакомы лично друг с другом». Утверждение 2.1.3, доказанное в подразделе 2.1.3, позволяют описать структуру соответ-ствующеп) равновесия Нэша. Основным параметром структуры этого равновесия является суммарная! репутация некоторого множества агентов. Агент-конформист, для которого сумма его порога и его репутации меньше общей репутации действующих агентов, в равновесии Нэша действует. Если же порог агента больше этой суммарной репутации, то он в равновесии Нэша бездействует (Утверждение 2.1.4). Аналогичное условие доказано и для анти-конформистов.

Еще одна конструктивная характеризация равновесия Нэша (Следствия 2.1.1 и 2.1.2 для конформистов и анти-конформистов соответственно), приведенная в подразделе 2.1.3, позволяет найти равновесие Нэша, решая алгебраическое уравнение, в котором фигурируют функция распределения суммы порогов агентов и их репутации.

В подразделе 2.1.4 рассматривается частная теоретико-игровая модель анонимного взаимодействия однородных агентов. Предположения относительно величин порогов, введенные;в этой части, позволяют упростить описание структуры равновесия Нэша и способ его нахождения (Утверждение 2.1.4 и Следствие 2.1.3, которые согласуются с при-знаком устойчивого исхода коллективного порогового взаимодействия конформистов, описанного в работе [24,121]).

Возможные приложения математических моделей конформного поведения

Пусть сеть состоит из п агентов. Перенумеруем всех агентов сети. Предположим, что конфигурация сети определяется тем, какой агент от какого получает информацию. Например, агент 1 получает информацию от агента 2, агент 2 получает от агента 3 и т.д. Агент п получает информацию от агента 1. Остальные конфигурации получаются пере становками агентов в описанной исходной конфигурации. Комбинаторными методами можно показать, что существует т = п\ таких конфигураций сети. Воспользовавшись упрощенной формулой Стерлинга [57, 112], можно показать, что для большого количе ства агентов п ценность (в смысле энтропии) социальной сети равна: (2.2.6) 1п(и!) л1щ»-л.

Таким образом, получиен закон еще более умеренного роста ценности сети по срав-нению с законом Ципфа - л1п(и). Например, для сети «В контаткте», различие между приведенным законом (2.2.6) и законом Ципфа составляет около 13 %. Для меньших сетей это различие будет увеличиваться.

Что же касается практической реализации, то в настоящее время определился целый класс социальных сетей, существующих в интернете, которые объединены единой технологией Web 2.0 [91]. Web 2.0 (определение О Рейли) — методика проектирования систем, которые путем учета сетевых взаимодействий становятся тем лучше, чем больше людей ими пользуются. Особенностью Web 2.0 является принцип привлечения пользователей к наполнению и многократной выверке содержания (контента). В этом определении, как и в приведенных выше законах, существенным фактором является большое количество агентов (современные социальные сети могут охватывать десятки миллионов пользователей), взаимодействие которых в сети увеличивает ее ценность. Исходя из этого, целесообразно использовать развитый аппарат статистической физики и теории информации, который позволяет описывать поведение больших систем на языке теории вероятностей. Подробнее аналогии между социальными сетями и двумя этими дисциплинами приведены в конце подраздела 2.2.2.

Примем, что поведение агента в социальной сети может зависеть от следующих факторов: — индивидуального — внутренней склонности (предпочтений) агента выбрать то или иное действие; — социального - взаимодействия (взаимовлияния) с другими агентами сети; — административного — воздействия (влияния) на него — управления - со стороны управляющего органа — центра.

Агентов, которые подвержены описанным факторам, будем называть зависимыми (от одного или нескольких из этих факторов). Если на агентов действует, как минимум, социальный фактор, то объединяющую их сеть будем называть социальной сетью или невырожденной социальной сетью. Не подверженных перечисленным факторам агентов будем называть независимыми. Если у агентов отсутствует зависимость от социального фактора, то такую сеть будем называть вырожденной социальной сетью.

Проводя условно аналогии с моделями термодинамики и статистической физики [57], вырожденная социальная сеть с независимыми агентами соответствует идеальному газу. Вырожденная социальная сеть с зависимыми агентами соответствует многоатомному газу. Невырожденная социальная сеть соответствует другим веществам, где присутствует взаимодействие между частицами (взаимовлияние между агентами). Сеть с/без управле-ни(ем)/я соответствует наличию или отсутствию воздействия, например, внешнего поля (влияние центра).

Для теории информации [62] можно привести следующие сопоставления. Вырож-денной социальной сети соответствует кодирование сообщения без штрафов, а невырожденной социальной сети — кодирование со штрафами. Неаддитивные штрафы соответствуют взаимовлиянию между агентами, аддитивные - влиянию центра.

В подразделе 2.2.1 рассмативаются два варианта вырожденной социальной сети — с зависимыми и независимыми агентами. Множество допустимых действий агентов конечно. Склонность агента к выбору отражается неравномерностью распределения вероятно-ста того или иного действия. Частным случаем вырожденной социальной сети является сеть с однородными зависимыми агентами, обладающими одинаковыми распределениями вероятностей выбора тех или иных действий.

Отсутствие социального фактора взаимовлияния агентов отражается тем, что состояние всей социальной сети выражается через меру, которая представляет собой произведение индивидуальных распределений вероятностей агентов.

вероятностей.

Далее Неопределенность поведения агента, связанная со стохастическим характером пер вого, определяется через энтропию распределения вероятностей его действий. Наиболее неопределенным поведением (максимальной энтропией) обладает агент с равномерным распределением вводится понятие зависимости агента, как разность между значением энтро-пии независимого поведения и значением энтропии для распределения вероятности действий этотб агента.

Рассматривается понятие конечной вырожденной социальной сети, характеризуемой своей энтропией, которая, в силу вырожденности, представляется в виде суммы энтропии поведения агентов. Такие же рассуждения проводятся для «зависимости» всей вырожденной социальной сети.

Рассматривается пример двоичной счетной социальной сети, в которой счетной количество агентов принимающих одно из возможных действий. Для этого случая можно найти явный вид зависимости агента. Введя понятие частичного среднего действия, как суммы действий первых п агентов, нормированной на их количество, можно показать, что при большом п подавляющее число состояний этой социальной сети будет сосредоточено вблизи состояния с нулевым частичным средним. При этом флуктуации будут экспоненциально убывать. Во подразделе 2.2.2 рассматривается невырожденная социальная сеть с конечным числом агентов. Здесь вводится понятие полезности всей сети как суммы индивидуальных полезностей ее членов. Далее вводится понятие математического ожидания этой полезно сти. Распределение, которое определяет это математическое ожидание, заранее не извест но и должно быть определено с помощь дополнительных условий. По аналогии с подразделом 2.2.1 вводится понятие зависимости невырожденной со-циальной сети через относительную энтропию. Далее с помощью математического ожидания полезности, цены автономности и относительной энтропии вводится понятие потенциальной ценности социальной сети, которая в статистической физике является аналогом свободной энергии. Нахождение максимума потенциальной ценности определяет то стационарное распределение (распределение Гиббса), которое вначале не было известно.

Репутация агентов

Итак, в этом разделе была предложена и исследована стохастическая модель, явля-ющаяся расширением пороговой модели Грановеттера [121] и соответствующей теоретико-игровой модели [5]. Полученные результаты позволяют вычислить вероятности выхода из области і притяжения за конечное число шагов для конечного числа агентов и получить асимптотическую оценку для этой вероятности при стремлении числа агентов к бесконечности. Полученная асимптотическая оценка, которая носит название функционала действия, может интерпретироваться в терминах вариационного исчисления, статистической физики и теории информации (относительной энтропия).

Перспективными направлениями дальнейших исследований является вывод более общего принципа больших уклонений [26, 108,112] на основании принципа максимума энтропии (2.3.38). Это позволит вычислить не только такие параметры, как число шагов выхода и экстремальную траекторию, но и другие функционалы системы, такие как, например, инвариантная мера или среднее время выхода6.

Изложение материала настоящей главы имеет следующую структуру. В разделе 3.1 рассмотрены модели управления толпой, а именно задачи управления порогами в анонимном случае, управление репутацией и рефлексивное управление. В разделе 3.2 рассмотрены пороговые модели взаимного страхования и приведена идентификация порогов на примере опроса о величине несклонности агентов к риску. В разделе 3.3 приведены модели коррупционного поведения и различные методы управления такого рода поведением. В разделе 3.4 описана идентификация связей и порогового поведения для пользователей социальной сети «Живой Журнал».

Относительно среднего времени выхода из области можно предположить следующее: среднее число шагов выхода, по-видимому, бесконечно, поэтому нужно перейти в непрерывную систему, к вводя параметр «медленного времени» t= — , которое замедляется при п - оо.

Настоящий раздел посвящен моделям управления толпой. Термин «управление тол-пой» (crowd control, group navigation) в научной литературе имеет несколько устойчивых и распространенных значений:

1) Управление движением множества агентов (достижение цели, избежание столк-новений, обход препятствий, сохранение формации и т.д.): flock, herd (стадо, стая, толпа) control; formation (строй, формация) control. Данное направление группового управления активно развивается с начала 2000-х годов и включает в себя две обширные области -аналитические и имитационные (агентные) модели. По каждой из этих областей существуют тысячи статей и десятки обзоров.

2) Управление поведением (принятием решений7) толпы. Здесь можно выделить два больших направления — гуманитарные дескриптивные исследования (в рамках социальной психологии, точнее ее раздела - психологии толпы) и математическое моделирование (см., например, краткий обзор [202]). В последнем можно также выделить два основных направления. Первое - модели команд (совместного адаптивного принятия решений группами людей на основе поступающей информации о неопределенных факторах - см. обзор в [46]). Классической работой здесь является [79]. Второе направление, которому принадлежит и настоящая работа, инициированы ставшими классическими статьей [121] и монографией [181], породившими целую лавину исследований в области математического моделирования порогового поведения (см. обзор [2]) и, в частности, поведения толпы. Тем не менее, на сегодняшний день формальные постановки задач управления толпой практически отсутствуют.

Структура изложения материала настоящего раздела такова: в подразделе 3.1.1 описывается пороговая модель поведения толпы, на базе которой в подразделе 3.1.2 формулируется задача управления. Подразделы 3.1.3 и 3.1.4 содержат некоторые результаты решения задач управления соответственно порогами агентов и их репутацией; подраздел 3.1.5 посвящен моделям рефлексивного управления.

Рассмотрим модель толпы - множество N= {1,2,..., ri) агентов, каждый из которых выбирает одно из двух решений — "1" (действовать, например, принимать участие в беспорядках) или "0" (бездействовать). Агент / є N характеризуется, во-первых, своим влиянием 7 Отдельный аспект - выбор набора мероприятий по «физическим» мерам воздействия на толпу (в целях предотвращения давки, массовых беспорядков и т.д.,) — также является предметом многочисленных исследований, но здесь рассматриваться не будет. на другого агента t$ 0 — тем "весом" с которым к его мнению прислушивается или его действия учитывает другой агенту. Будем считать, что для каждого агента/ выполнены следующие условия нормировки tj, - 1, tn = 0. Во-вторых - своим решением х, є {0; 1}. I J В-третьих - своим порогом 0,е[О;1], определяющим, будет ли агент действовать при той или иной обстановке (векторе x решений всех остальных агентов). Формально, действие xi г -го агента определим как наилучший ответ (BR - best response) на сложившуюся обстановку: 1, если 2Х ; 0„ (3.1.1) x,=BR,(x.l)= Otecjm ityxJ 0r Поведение, описываемое выражением (1), называется пороговым. Равновесием Нэша будет вектор XN действий агентов, такой, что XN — BR(XN) [ЗІ].

Рассмотрим по аналогии с работой [4] следующую модель динамики коллективного поведения: в начальный момент времени все агенты бездействуют, далее в каждый из последующих моментов времени агенты одновременно и независимо действуют в соответствии с процедурой (3.1.1).

Постановка задачи управления

Обозначим/? ) = min {/ є N\ mi q, тм q}. Из структуры равновесия Нэша (3.3.5) следует справедливость следующего утверждения.

Утверждение 3.3.2. При решении задачи управления уровнем коррупционности (3.3.7) достаточно ограничиться воздействием на агентов, имеющих пороги, лежащие в диапазоне [mq;

Следовательно, в силу монотонности затрат получаем следующее решение задачи управления. Утверждение 3.3.3. В квази-оптимальном12 решении задачи управления уровнем коррупционности, пороги агентов с номерами от q до р(д), должны быть снижены до величины q, что потребует следующих затрат на управление: (33.S)C(q,k)=2c(mj Следствие. Оптимальное управление не зависит от начального равновесия Нэша. Отметим, что аналогичные утверждению 3.3.3 и следствию из него результаты были получены в [6] для моделей управления толпой. В указанной работе для непрерывного случая получено аналитическое выражение для минимальных затрат на управление.

Имея оценку (3.3.8) затрат на управление, можно ставить и другие задачи - например, нахождения допустимого с точки зрения бюджетного ограничения на затраты (3.3.8) оптимального (по дополнительным критериям) уровня коррупционности q, и т.д. - подобные задачи будут достаточно простыми оптимизационными задачами.

В заключение вернемся к вопросу о выборе вида управления - институционального, мотивационного и/или информационного. Для этого вспомним, что выше предполагалось, что заданы затраты с(/я; mj) на снижение порога у-го агента с т до mj. Но эти затраты в общем случае могут складываться из затрат на изменение каждого из параметров, входящих в правую часть выражения (3.3.3). Обозначая сД/?, Д) - затраты на изменение параметра р є {h, Н, х, #, яг} задачу (3.3.8) можно детализировать следующим образом

О квазиоптимальности речь идет потому, что предполагается, что при сумме действий других агентов, равном порогу, данный агент выбирает «действовать». Для того чтобы он бездействовал, порог должен быть дополнительно снижен на сколь угодно малюю величину. Качественные свойства решения задачи (3.3.9) в существенной степени определяются свойствами зависимости (3.3.3) величины порога агента от других параметров. Например, фиксируем произвольного агента (номер будем в дальнейшем опускать). Пусть О, h = уН, %= Л Н, где у є (0; 1], А 1. Тогда из выражения (3.3.3) следует, что (3.3.10) ш = 1 \7 ч.

Величина порога (3.3.10) простым образом зависит от значений трех безразмерных параметров (/, Л), соответствующих различным видам управления. Анализ свойств задачи (3.3.9) в каждом конкретном прикладном случае дает возможность выбирать оптимальную комбинацию управлений различных видов и/или качественно судить о сравнительной эффективности институционального, мотивационного и информационного управления для реализации требуемого равновесия.

В современных моделях социальных сетей можно выделить два больших направления- моделирование поведения агентов (берущее начало с [121,180]) и моделирование связей влияния между агентами (например [73]). В первом направлении объектом исследования является распределение порогов агентов. Порогом является индивидуальный показатель агента, при превышении которого агент меняет свое поведение на противоположное. При моделировании связей влияния, объектом исследования является распределение количества входящих или исходящих связей агента. Как правило, пороги идентифицировать намного сложнее по сравнению с идентификацией распределения связей.

В настоящем разделе делается попытка связать эти две модели, что позволяет от идентификации связей перейти к идентификации функции распределения F{q) порогов модели Грановеттера, где q - количество действующих агентов. Главной идеей является описание поведения социальной сети в виде динамической системы (3.4.1) qM = F(qk). Соотношение (3.4.1) показывает, что если на предыдущем шаге действовало qk агентов, то на последующем шаге будет действовать qk+l. Таким образом, найдя значения qk+l для различных значений qk, можно идентифицировать функцию F(-).

Рассмотрим социальную сеть, состоящую из множества агентов N = {1,2,...,«}, каждый из которых имеет две альтернативные возможности- действовать или бездействовать. Выбор агента і обозначим через х{ е{0;1}, где xt =1 означает, что агент действует,!а л:,. =0 бездействует. Пусть на агента / влияет множество Dt:iDt N других агентов— его соседей. Обозначим количество соседей агента і через =Д.

Будем считать, что влияние каждого из соседей агента / одинаково в следующем смысле. Все агенты характеризуются единым показателем 0 0 1. Этот показатель означает, что, если доля 0 влияющих на данного агента соседей действует, то он тоже действует. Такое поведение описывается, например, следующим наилучшим ответом (см. подраздел 3.1.1):

Рассмотрим вероятностное описание социальной сети. Будем считать, что количество соседей агента ieN - это целое случайное число dt:\ dt :n-\. Мы не рассматриваем агентов, не имеющих соседей, т.к. в этом случае такой агент согласно (3.4.2) будет всегда бездействовать. Пусть Mn{d) вероятность того, что произвольно взятый агент имеет ровно d связей. Рассмотрим динамику взаимодействия агентов в дискретном времени. Изучим зависимость среднего количества действующих агентов на следующем шаге от количества действующих на предыдущем шаге.

Зафиксируем произвольного агента /, имеющего d, влияющих на него соседей. Пусть известно, что из оставшихся и-1 агентов q действуют, a n—\—q бездействуют. Необходимо вычислить вероятности Gn событий, заключающихся в том, что к соседей агента / действует. Всего существует С%_х вариантов того, что агент / имеет d, влияющих на него соседей. Число таких вариантов, что среди этих соседей будет ровно & действующих (из q действующих во всей сети агентов) равно С , а число вариантов того, что среди этих соседей будет dt-k из n—1—q бездействующих равно Cdn t4- Таким образом, искомая вероятность характеризуется следующим гипергеометрическим распределением: