Содержание к диссертации
Введение
Глава 1. Модели поведения фирм на рынке олигополии 10
1.1. Место и роль стратегии фирмы на современном олигополистическом рынке 10
1.2. Модели поведения фирм в условиях олигополии 17
1.3. Метод интеллектуальных агентов 44
Глава 2. Модель взаимодействия пар интеллектуальных агентов в условиях дуополии 66
2.1. Структура интеллектуального агента модели 66
2.2. Процесс принятия решений интеллектуальным агентом 84
2.3. Апробация модели взаимодействий интеллектуальных агентов на рынке олигополии 93
Глава 3. Результаты моделирования дуополий с помощью интеллектуальных агентов 102
3.1. Анализ влияние типов стратегий интеллектуальных агентов 102
3.2. Влияние объема памяти 110
3.3. Влияние типа платежной матрицы 117
3.4. Эволюция взаимодействий 128
Заключение 136
Литература 138
Приложения 148
- Модели поведения фирм в условиях олигополии
- Процесс принятия решений интеллектуальным агентом
- Апробация модели взаимодействий интеллектуальных агентов на рынке олигополии
- Влияние типа платежной матрицы
Введение к работе
Актуальность работы. В современной экономике отчетливо прослежи-
* ваются тенденции укрупнения участников рынка, являющиеся следствием гло-
бализации экономического пространства. Объемы производства экономического агента во многом определяются долей рынка, которую он занимает по сравнению с конкурентами. В отдельных отраслях на рынке наблюдается доминирование трех-пяти крупных предприятий, что является явным признаком олигополии. В России отчетливо олигополистический характер носят сырьевые отрасли, черная и цветная металлургия, подотрасли химии и машиностроения (производство удобрений, автомобилестроение, аэрокосмическая промышленность и др.).
Каждый из участников олигополистического рынка потенциально имеет возможность расширения занимаемой доли рынка за счет конкурентов. Перед руководителями олигополистических фирм стоит выбор: скоординировать действия относительно друг друга или следовать независимой стратегии конкуренции.
В случае выбора кооперативной стратегии взаимодействия олигополисты
стараются избегать прямого конфликта с конкурентами, особенно в сфере цены
и объемов производства. Но если избирается стратегия независимой максими
зации прибыли, то фирмы, скорее всего, обнаружат себя в агрессивной конку
рентной среде. Таким образом, модели олигополии строятся либо на коопера
тивном, либо некооперативном характере взаимодействий между фирмами.
> Крайними случаями для олигополии являются открытый сговор и «ценовая»
война.
4 Российская специфика конкурентных отношений проявляется в широком
распространении нетипичных для западного мира ценовых схваток (на рынках сотовой связи, авиаперевозок, фармацевтики, автомобилестроении и др.). Конкурентные войны между крупными фирмами носят перманентный характер, во многих отраслях достигнута лишь промежуточная расстановка сил. В этом случае моделирование стратегии поведения экономических агентов в изменяющихся условиях хозяйствования на олигополистических рынках является несомненно актуальной задачей.
Следует различать понятия «экономический агент» и «интеллектуальный агент». Под экономическим агентом понимается реальный хозяйствующий субъект. Интеллектуальный агент — «автономная обучаемая программная сущность, способная адаптивно действовать в интересах достижения поставленных перед ней целей» [108, с.116]. Или говоря иначе, интеллектуальный агент - это некий программный комплекс или система, описывающая взаимодействие субъектов моделирования.
В работе предлагается модель, описывающая взаимодействие участников рынка олигополии. Где в качестве экономических агентов рынка выступают интеллектуальные агенты.
Вопросы стратегического управления крупными предприятиями широко освещены в работах многих видных зарубежных и российских ученых. В традиционно известных неоклассических моделях олигополии А.Курно, Дж.Бертрана, Ф.Штакельберга степень воздействия одного участника рынка на другого задается в виде экзогенной величины.
В работах Дж.Неймана, О.Моргенштерна, Дж.Нэша обобщены результаты неоклассических моделей и предложен подход, основанный на теории игр и выборе стратегий, учитывающий влияние действий экономических агентов
5 друг на друга. Наибольший интерес, с точки зрения моделирования стратегии
поведения фирмы в рамках предложенного ими подхода представляет приложение теории игр - «дилемма заключенного». Она относится к классу игр с ненулевой суммой выигрыша.
Известный американский ученый Р.Аксельрод, рассматривая возможность решения «дилеммы заключенного», предложил изучать итерируемую версию игры. Это позволило игрокам учитывать последствия собственных и чужих действий при формировании стратегий. В рамках предложенной им модели был проведен широкий анализ и классификация типов стратегий, однако следует отметить, что Р.Аксельрод моделирует взаимодействие стратегий, а не экономических агентов, обладающих ими.
Анализ проблематики исследований позволяет утверждать, что возникает необходимость развития рассматриваемых методов с позиции участников хозяйственной деятельности, с учетом их индивидуальных характеристик и степени их влияния на принимаемое решение. Отсутствуют в экономической литературе практические рекомендации по формированию конкурентных преимуществ, позволяющие постоянно анализировать и диагностировать рыночную ситуацию, чутко реагировать на конъюнктуру рынка.
В связи с изложенным, разработка экономико-математической модели и инструментальных средств, позволяющих анализировать и прогнозировать ситуацию на рынке олигополии, является актуальной научной проблемой, что и определило выбор темы, цель и задачи настоящего диссертационного исследования.
Цель исследования. Основной целью работы является исследование влияния стратегий поведения экономических агентов на результаты рыночных олигополистических взаимодействий.
В ходе исследования поставлены и решены следующие задачи:
анализ процессов принятия решений экономическими агентами по стратегии поведения в условиях олигополии;
анализ существующих моделей интеллектуальных агентов и поддерживающих их инструментальных средств;
построение модели взаимодействия экономических интеллектуальных агентов на олигополистическом рынке в условиях итерируемой «дилеммы заключенного»;
разработка структуры интеллектуального агента в рамках рассматриваемой модели и комплекса инструментальных средств, поддерживающих эту модель;
разработка алгоритма и реализация компьютерной программы, моделирующей взаимодействие интеллектуальных агентов на рынке олигополии;
выявление и описание влияния свойств интеллектуальных агентов (стратегии, памяти, платежной матрицы и способности к обучению) на экономическую составляющую задачи.
Объектом исследования выступают экономические интеллектуальные агенты на олигополистическом рынке.
Предметом исследования являются средства и методы формализованного представления и экономико-математического моделирования поведения экономических агентов на рынке олигополии.
Теоретический и методический аппарат исследования. Теоретической и методологической основой диссертационной работы являются разработки, выполненные научными коллективами и отдельными учеными — Института экономики РАН, Финансовой академии при Правительстве РФ, Мое-
7 ковского государственного университета им. М.В.Ломоносова, Российского
НИИ Искусственного интеллекта.
В этих работах важное место отводится вопросам, связанным с анализом эволюционных процессов общества, с изменениями в характере средств труда, информационными составляющими этих процессов, количественными моделями эволюционной динамики.
Работа базируется на использовании теории игр, теории искусственного интеллекта, теории интеллектуальных агентов, также применялись методы экономико-математического моделирования, имитационного моделирования, использованы инструментальные средства компьютерного моделирования Delphi, Microsoft Excel, Visual Basic, Maple.
Работа выполнена в соответствии с пунктом 1.4 Паспорта специальности 08.00.13 -Математические и инструментальные методы экономики.
Научная новизна исследования заключается в построении модели взаимодействий экономических интеллектуальных агентов на рынке олигополии.
Элементы новизны содержат следующие результаты:
построена мультиагентная модель, позволяющая описать поведение крупных предприятий на реальном олигополистическом рынке;
в рамках этой модели разработана структура интеллектуального агента, включающая такие параметры как стратегия, память, платежная матрица, обучаемость;
разработан методический аппарат, позволяющий оценить влияние качественных и количественных характеристик интеллектуальных агентов на принятие решений участниками рынка олигополии;
разработаны методики качественного и количественного анализа
8 взаимодействий интеллектуальных агентов на олигополистическом
рынке.
Практическая значимость диссертационной работы заключаются в том, что ее основные положения, результаты, разработанные методики и рекомендации ориентированы на широкое использование предприятиями, действующими на рынке в условиях олигополии.
Самостоятельное практическое значение имеют:
алгоритм программы и инструментальное средство, моделирующее взаимодействия интеллектуальных агентов на рынке дуополий;
методика задания стратегии, памяти и платежной матрицы интеллектуального агента в рамках разработанного алгоритма
рршршщщии к анализу свойств интеллектуальных агентов, позволяющие оценить их влияние на принятие агентом экономических решений.
Апробация и внедрение результатов. Основные положения диссертационного исследования докладывались на 4-й Международной научно-практической конференции «Экономика, экология и общество России в 21-м столетии» (21-23 мая 2002г., г.Санкт-Петербург), на IV Международной научно-практической конференции студентов, аспирантов и молодых ученых «Системный анализ и информационные технологии» (1-3 июля 2002 г., г.Киев), на VIII Международной конференции «Образование, Экология, Экономика, Информатика» серии «Нелинейный мир» (15-20 сентября 2003 г., г.Астрахань), на постоянно действующем научно-методическом семинаре кафедры математического моделирования экономических процессов Финансовой академии при Правительстве Российской Федерации.
Отдельные положения и результаты диссертационной работы применяются в научно-внедренческой организации «ФОРС-ХОЛДИНГ» при проектировании баз данных предприятий.
Полученные теоретические и методологические результаты используются в учебном процессе при преподавании дисциплин «Экономико-математическое моделирование» и «Эконометрика» на кафедре «Математического моделирования экономических процессов» Финансовой академии при Правительстве Российской Федерации.
Модели поведения фирм в условиях олигополии
Будем предполагать, что общая структура олигополистической отрасли (технология, количество производителей, тип конкуренции и т.д.) заданы эк-зогенно. Возможны разные гипотезы о поведении участников олигополии. Участники могут демонстрировать либо некооперативное, либо кооперативное поведение (сговор, картель). Нас, прежде всего, интересует некооперативное поведение олигополи стов. Для каждой из этих гипотез можно, предполагать, что стратегии всех участников или лидера сводятся к назначению либо цен, либо объемов выпуска. Таким образом, будем рассматривать три основные, в рамках экономической теории, модели олигополии: модель Курно; модель Бертрана; модели теории игр («дилемма заключенного»). Модель Курно впервые была сформулирована и предложена в 1838 г. французским экономистом Антуаном Опостьеном Курно1. Эта модель является стратегическим анализом взаимодействия двух фирм в условиях дуополии.
Модель Курно базируется на следующих предпосылках: 1) на рынке присутствуют только две фирмы; 2) обе фирмы производят однородный товар; 3) известна кривая рыночного спроса; 4) самостоятельное и независимое принятие решений фирм о производстве друг от друга; 5) каждая из фирм принимает объем производства и цену конкурента за постоянную величину; 6) отсутствие полноты информации. Каждая фирма должна решить, сколько продукции выпускать, и обе фирмы принимают свои решения в одно и тоже время. При принятии производственных решений каждая фирма должна помнить, что ее конкурент тоже принимает решение по объему производства и что конечная цена будет зависеть от совокупного объема производства обеих фирм. Рассмотрим частный случай, предположим, что фирма №2 принимает решение о приостановке производства.
Тогда кривая спроса i(0) фирмы №1 совпадет с кривой рыночного спроса (рис. 1.2). В этом случае фирма №1 фактически является монополией. Соответственно кривая предельного дохода займет некоторое положение (рис 1.2). Пользуясь обычным правилом равенства предельного дохода и предельных издержек МС\= MR\(0), фирма №1 установит оптимальный для себя объем производства в 50 единиц (рис. 1.2). График оптимизации объема производства фирмы №1 Л Если теперь фирма №2 будет производить 50 единиц, то кривая спроса фирмы №1 сместится влево на 50 единиц (Z i(50) и MR\(5Q) на рис 1.2). Сейчас максимизирующий прибыль объем производства фирмы №1 равен 25 единицам (точка MR\(5Qi)=MC\ на рис 1.2). В случае производства фирмой №2 75 единиц, оптимальный объем производства для фирмы №1 составит 12,5 единиц (MR\(75)=MCi). Наконец, пусть фирма №1 полагает, что фирма №2 будет производить 100 единиц продукции.
В этом случае фирма №1 не будет выпускать продукцию. Общий вывод из анализа краткосрочного равновесия в модели Курно (рис. 1.3) состоит в том, что каждому уровню выпуска одного из дуополистов соответствует особая кривая спроса на продукцию второго дуополиста. Иными словами, для любого олигополиста объем рынка не является постоянной величиной, а прямо зависит от решений конкурентов. Для максимизации прибыли каждая фирма прогнозирует объемы производства своих конкурентов. Определим объем выпуска продукции фирмой №1 как функцию от объема производства фирмой №2: Аналогично определим выпуск продукции для фирмы №2: Исследуем ситуации, демонстрирующие применение модели Курно на рынке дуополий. Пример 1. Пусть фирме №1 известно, что фирма №2 собирается выпустить 75 ед. продукции. Фирма №1 выпустит 12,5 ед. продукции (точка А, рис. 1.3). Но если фирма №1 действительно выпустит 12,5 ед., то следуя графику, фирма №2 в соответствии со своей кривой реакции должна выпустить не 75, а 42,5 ед. (точка В, рис. 1.3). Но такой уровень выпуска продукции конкурентом вынудит фирму №1 выпустить не 12,5 ед., а 29 ед. (точка С, рис. 1.3) и т.д.
Процесс принятия решений интеллектуальным агентом
Свойства автономности, активности, реактивности и коммуникативности интеллектуальных агентов составляют основу его структуры. Подробное описание свойств имеется в работах Вулдриджа (Wooldridge) [25,26] и Джен-нингса [46,47]. Зададим структуру модулей интеллектуального агента модели, опираясь на его классические свойства (рис. 2.6): 1. Модуль базовых характеристик агента. 2. Служба управления процессами. 3. Модуль оценки ситуаций. 4.
Модуль принятия решений. 5. Коммуникационный модуль. 1. Модуль базовых характеристик агента содержит первоначально за данные параметры интеллектуального агента. К ним относятся: уникальный идентификационный номер (ID): наименование агента, используемое при выводе графической информации (NAME); объем памяти (MEMORY); платежная матрица; тип стратегии (STRATEGYTYPE). 2. Служба управления процессами выступает в качестве диспетчера задач. Она распределяет поступающие задачи по соответствующим службам. Данный модуль разработан с учетом свойства автономности, т.е. независимости от внешних управляющих воздействий. 3. Модуль оценки ситуаций анализирует поступающие заявки и делает прогноз действий других агентов. В модуле отражено свойство реактивноemu интеллектуальных агентов. Оценка ситуации проводится на основе следующих характеристиках НА: память собственных действий (HISTORY 1); память действий противника (HISTORY2); текущий значение функции полезности (RESULT). 4. Модуль принятия решений основываясь на текущей оценке ситуации и стратегии агента принимает решение о характере взаимодействия с контр агентом. Свойство активности было определяющим при разработке модуля. Ключевыми параметрами модуля являются: текущая стратегия агента (STRATEGY); принятое НА решение (DECISION). 5. Коммуникационный модуль отвечает за связь с внешними агентами.
Модуль принимает поступающие от внешних агентов предложения и от правляет им принятые агентом решения. Основополагающим свойством мо дуля является коммуникативность, т.е. способность к приему и передаче информации. Пояснить работу модулей ИА можно на следующем примере. Первоначально поступающая заявка от внешних агентов попадает в коммуникационный модуль. Служба управления процессами фиксирует поступление заявки и направляет ее в модуль оценки ситуаций. В этом модуле, опираясь на информацию о прошлых взаимодействиях с этим агентом, делается прогноз действий контрагента. Полученная оценка попадает в модуль принятия решений, где на основе текущей стратегии агента принимается решение о характере взаимодействия. Принятое решение попадает в коммуникационный модуль и пересылается внешнему агенту. Реализованная в программе (см. Приложение №2) структура интеллектуального агента содержит следующие параметры: Предложенная структура интеллектуального агента реализована с использованием объектно-ориентированной среды программирования Delphi 7 (см. Приложение №2). Выбор среды программирования обоснован широким спектром возможностей предоставляемых системой. Данное программное средство позволяет задавать интуитивно-понятный и эргономичный интерфейс программы. Программа моделирует взаимодействие пар интеллектуальных агентов, используя различные типы стратегий (табл. 2.1), а также генетические алгоритмы, реализуя тем самым свойство обучаемости агентов. На рис. 2.7 приведен общий алгоритм программы.
Опишем каждый из блоков алгоритма. Первый блок (см. рис. 2.7) отвечает за ввод основных параметров среды моделирования таких, как: количество ИЛ, их свойства, продолжительность процесса моделирования. В этом блоке агенту присваиваются такие характеристик, как: Id, Name, Memory. Id- уникальный номер агента, дается автоматически. Name - имя агента, параметр необходим для обозначения на графиках. Характеристика Memory определяет размер временной памяти агента и является особенно важной, если выбрана стратегия учитывающая историю шагов. Второй блок программы «Выбор стратегии агента» отвечает за присвоению переменной Strategy Туре (см. Приложение №2) номера выбранной стратегии. Описание стратегий приведено в табл. 2.1. Далее следует цикл, инициирующий процесс взаимодействия интеллектуальных агентов. Процесс состоит из двух этапов: 1. Выбор контрагента. 2. Взаимодействие агентов.
После завершения процесса моделирования, полученные результаты с помощью процедуры ShowResults, отображаются на графиках. Программно реализована возможность автоматического сохранения полученных результатов, что позволяет работать программе в автономном режиме. Реализации данной способности программы является чрезвычайно актуальным при работе с генетическим алгоритмами. Рассмотрим более подробно процесс взаимодействия агентов. Для этого подробно проанализируем структуру процедуры Cooperation - взаимодействия выбранной пары агентов. Процедура имеет три входящих параметра - Ag, ContrAg, Step. Первые два параметра - это пара выбранных агентов, а третий - шаг на котором они взаимодействуют.
Апробация модели взаимодействий интеллектуальных агентов на рынке олигополии
Согласно модели Курно предположим, что на олигополистическом рынке имеется шесть фирм. Каждая из фирм самостоятельно определяет объемы продаж продукции. Рассмотрим развитие парные взаимодействия фирм с использованием метода интеллектуальных агентов. Пусть в качестве фирм выступают ИА. Зададим платежную матрицу игры следующим образом: Решение же агент принимает в соответствии с первоначально выбранной уникальной стратегией. Стратегии возьмем в соответствии с табл. 2.1. Агенты обладают определенным ограниченным объемом памяти М=3. Агенты взаимодействуют попарно каждый с каждым на протяжении 500 итераций. На рис. 2.9 показано как расположились выигрыши агентов после этапа моделирования. Анализ графика позволяет сказать, что наиболее результативны агенты №6, №3, №4, обладающие стратегиями: «непрощения» (1005 очков); «постоянного обмана» (530 очков); «око за око» (490 очков). Стратегии агентов №5, №1 и №2 оказались не эффективными: «периодическая» (-765 очков); «случайная» (-745 очков); «постоянного сотрудничества» (-539 очков). Проведем анализ действий каждого из агентов. Агент№1 Агенту №1 присвоена случайная стратегия.
Это значит, что в его действиях нет закономерности. На каждом шаге моделирования он равновероятно принимает любое решение. Рис. 2.10 состоит из двух графиков. Верхний график отражает попадание агента в каждый из четырех квадрантов платежной матрицы. В состояниях А и В агент сотрудничает с противником. В результате он получает 475 и -1522 очков соответственно (табл. 2.12). В случае А контрагент ведет себя честным образом, а в В — обманывает агента. В состояниях С и D агент не сотрудничает с оппонентом. В итоге в состоянии С, обманывая противника, он получает 1044 очка, а в D теряет -742 очка, так как противник также обманывает его.
Нижний график на рис. 2.10 отражает динамику получение выигрышей агента. В табл. 2.13. приведены результаты взаимодействий агента №1 с остальными пятью агентами. Анализируя график и таблицу можно сделать вывод, что интеллектуальный агент №1, обладающий «Случайной» стратегией, добился наилучшего результата (763 очка) при взаимодействии с агентом №2, со стратегией «Постоянного сотрудничества». Наихудший у агента №1 результат (-758 очков) был получен при сотрудничестве с агентом №3 (стратегия «Полного недоверия»). Агент№2 Агенту №2 присвоена стратегия постоянного сотрудничества. Агент всегда сотрудничает с оппонентом, независимо от его поведения. На рис. 2.11 верхний график отражает попадание агента в каждый из четырех квадрантов платежной матрицы. В состояниях А и В агент сотудничает с противником. В результате он получает 1487 и -2026 очков соответственно (табл. 2.14). В случаев контрагент ведет себя честным образом, а в В - обманывает агента. Состояния С и D в этом случае нулевые, что обусловлено выбранной стратегией. Нижний график на рис. 2.11 отражает динамику получение выигрышей агента. В табл. 2.15 приведены результаты взаимодействий агента №2 с остальными пятью агентами.
Влияние типа платежной матрицы
Оценим влияние разных типов платежных матриц на результат моделирования. Для этого рассмотрим четыре типа социальных дилемм: «дилемму заключенного» (The Prisoner s Dilemma); «страховую игру» (The Assurance Game); «игру трусов» (The Chicken Game); «согласованную игру» (The Coordination Game). Для сравнения влияния разных типов платежных матриц проведем серию экспериментов.
В них принимают участие семь интеллектуальных агентов, использующих стратегии приведенные в табл.3.12. Агенты попарно взаимодействуют на протяжении 500 итераций, влияние объема памяти не учитывается. Дилемма заключенного В первой части эксперимента используем симметричную для игроков матрицу ДЗ, во второй части оценим влияние несимметричной матрицы на игру. Зададим матрицу ДЗ (табл. 3.13) исходя из классического определения игры предложенного А.Рапопортом и А.Чеммом (A.Rapoport,A.Chammah) [98]. Результаты эксперимента во многом совпадают с результатами опыта, проведенного при сравнении разных типов стратегий (см. табл. 3.3). Было установлено, что наилучшей среди предложенных, является стратегия непрощения (Spiteful, рис. ЗЛО). Отличительной чертой проведенного эксперимента является кооперативный характер взаимодействий большинства стратегий. Третье место агента, использующего стратегию полного недоверия (A11D) объясняется удачным поведением при игре с агентами использующими стратегии (А11С и Random). В тоже время, агенты применяющие стратегии хранящие историю шагов не взаимодействовали с этим агентом, что отражено в табл. 3.15 В табл. 3.14 показано, как расположились стратегии агентов после процесса моделирования. Анализ результатов опыта показывает, что они примерно одинаковы для всех участников игры.
Это объясняется малым присутствием в эксперименте агентов, использующих стратегии периодического характера. Лучший результат агента применяющего стратегию непрощения «Spiteful» вытекает из его стремления к кооперации с другими агентами. Например, при игре с агентом применяющим стратегию постоянного сотрудничества (А11С), наблюдается 100% кооперативный характер взаимодействий (рис. 3.9). Анализ состояний платежной матрицы при взаимодействии агентов использующих стратегии непрощения и полного недоверия (Spiteful, A11D). Состояние «DD» - соответствует На рис. 3.11 демонстрируется пример игры агента с противником использующим стратегию «полного недоверия». В игре проявляется полностью некооперативный характер поведения ее участников. После первого обмана, агент, применяющий стратегию непрощения, на протяжении всей игры больше не вступал в сотрудничество с агентом, применяющим стратегию полного недоверия. Интересным представляется анализ действий ИА при игре с противником применяющим случайную стратегию. На рис. 3.12 показано как согласно платежной матрице игры распределились принятые участниками решения. В итоге 68% взаимодействий носят некооперативный характер, 32% -кооперативный. На рис. 3.13 и 3.14 отображена структура принимаемых агентами решений. Анализ состояний платежной матрицы при взаимодействии агентов использующих стратегию непрощения и случайную стратегию (Spiteful, Random). Состояния определяются в