Кристиан Монте Теория игр и стратегическое поведение

17.1. Введение*

Теория игр занимается анализом сознательных взаимодействий между агентами. Каждый игрок ведет себя стратегически в том смыс­ле, что при принятии решения о том, какую линию поведения он должен выбрать, он учитывает возможные влияния, которые эти дей­ствия могут оказать на других игроков, а также то, что последние ведут себя таким же образом. Экономическая жизнь полна ситуаций, удовлетворяющих такому описанию: это олигополистические рынки, внешнеторговая политика, проблемы торга, международные эффекты макроэкономической политики, взаимоотношения между правитель­ствами и частными агентами и т. д. К настоящему моменту использо­вание понятийного аппарата теории игр в экономической теории имеет уже довольно длительную историю.

Уже в 1838 г. Курно изучал ситуацию дуополии, используя кон­цепцию равновесия, которая стала ключевой в теории некооперативных игр после появления работы Нэша (Nash, 1951). «Контрактная кри­вая», предложенная Эджуортом в конце XIX в., может быть легко проинтерпретирована в терминах «ядра» — одной из концепций рав­новесия в современной теории кооперативных игр.

Однако самым великим событием в этой истории стала публи­кация в 1944 г. работы фон Неймана и Моргенштерна «Теория игр и экономическое поведение», в которой развивались идеи, выдвинутые фон Нейманом в 1928 г. Авторы этой книги провозгласили револю­цию в экономической мысли, утверждая, что «теория стратегических
 
----------------------------------------------------
 

* Я благодарен Майку Блини, Дэвиду Гринуэю и Даниелю Серра за полезные комментарии к предыдущему варианту данной главы. Я также многим обязан моему коллеге Дидье Лосселю за нашу совместную работу и дискуссии, связанные с этой темой. И наконец, я хочу поблагодарить моего бывшего студента Жана-Стефана Мишара за его вопросы по предмету статьи и курсовую работу, которые способствовали улучшению данного текста.

 

 

 

игр — это тот самый инструмент, с помощью которого будет разви­ваться теория экономического поведения» (von Neumann, Morgenstern, 1944 : 1-2).

Однако, несмотря на такие обещания, теория игр до определен­ной степени находилась в тени в течение последующих двух десяти­летий. В конце 1960-х гг. многие экономисты были разочарованы в новом подходе, причем настолько, что один автор в 1963 г. смог написать следующее: «До сегодняшнего дня не предпринималось серь­езных попыток применить теорию игр к проблемам рынка или к экономическим проблемам в целом» (Napoleoni, 1963 : 62). Такое утверждение звучит анахронизмом в 1991 г., после того повторного открытия, развития и теперешнего доминирования теории игр в эко­номической литературе.

В большинстве последних работ, посвященных теории отрасле­вых рынков, теории международной торговли, макроэкономической и денежной теории, теории государственных финансов используется аналитический аппарат теории игр (приведем лишь один пример: в книге «Advances in Economic Theory* под редакцией Трумэна Бью-ли (Bewley, 1987) только три главы из одиннадцати не имеют прямой связи с теорией игр.

Вероятно, большой интерес для будущих историков экономиче­ской мысли будет представлять вопрос о том, почему это плодотвор­ное слияние теории игр с экономической теорией не произошло раньше конца 1970-х гг.1 Мы можем сделать несколько предположений на этот счет. Во-первых, после Второй мировой воины перед парадиг­мой совершенной конкуренции все еще открывались возможности расширения и развития; эта перспектива привлекала внимание и уси­лия исследователей, работающих в областях теории общего равно­весия, теории международной торговли, теории роста и т. д. Во-вто­рых, теория игр довольно длительное время испытывала недостаток внимания вследствие того, что многие неправильно понимали некото­рые из ее базовых понятий, такие как равновесие Курно—Нэша,2 а также потому, что слишком большое внимание уделялось чисто техническим вопросам, таким, например, как игры с нулевой сум­мой, которые, вообще говоря, представляют мало интереса для эконо­мистов.

 

-----------------------------------------------------

 

1 Это не должно означать отрицания хороших работ, опубликованных в период с 1944 по 1970 г., таких как работы Шубика (Shubik, 1959), и в особенности работы, посвященные феномену «сжатия ядра» (когда возраста­ет количество агентов), которые, безусловно, стали одним из значительных достижений экономической теории после Второй мировой войны.

2 См. отличный комментарий Йохансена (Johansen, 1982) по этому вопросу.

 

 

 

В-третьих, множественность подходов и понятий равновесия, развитых в теории игр, не устраивала экономистов, привыкших к ясным и унифицированным моделям совершенной конкуренции. В-четвертых, многие сложные экономические вопросы стало возмож­ным трактовать в терминах теории игр только после недавнего разви­тия и распространения анализа динамических игр, а также совершен­ствования и уточнения понятий равновесия, таких, например, как совершенная субигра (subgame perfection).

В частности, предложенное Шеллингом (Schelling, 1960, 1965) тонкое понятие стратегических ходов сегодня применяется в реше­нии множества экономических проблем как элемент формального аппарата теории динамических игр. Кроме того, во многих вопросах приходится учитывать несовершенство информации, но только со­всем недавно была полностью признана и стала серьезно анализи­роваться роль информационной асимметрии в стратегическом по­ведении.

Таким образом, можно утверждать, что более ясное и более широкое понимание понятия равновесия по Нэшу, стимулирующие идеи Шеллинга о стратегическом поведении, последние достижения теории динамических игр, такие как разработанное Зельтеном поня­тие совершенного равновесия (perfect equilibrium) и прогресс теории игр с неполной или несовершенной информацией объясняют нынеш­ний подъем игрового анализа в экономической науке.

В данной главе мы иллюстрируем эти идеи, уделяя наиболь­шее внимание последним достижениям, нацеленным на примене­ние подхода Шеллинга к формальному моделированию. Мы попы­таемся представить основные положения с помощью примеров из различных областей экономической теории: теории отраслевых рынков, международной торговли и внешнеторговой политики, а также денежной политики. Такой широкий выбор различных при­меров дает понятие о множественности возможных применений новых моделей и в то же время показывает общую структуру мно­гих из этих применений.

Не отрицая важности теории кооперативных игр и теории торга (bargaining theory), мы, тем не менее, уделим больше внимания некоторым аспектам теории некооперативных игр. В разделе 17.2 мы даем краткое представление основных понятий и определений. В разделе 17.3 мы обсуждаем стратегические проблемы для случа­ев простого повторения однопериодной игры, а в разделе 17.4 за­трагиваем более тонкие аспекты в различных многопериодных иг­рах. В разделе 17.5 мы вводим понятие несовершенной информа­ции и указываем на ее влияние на равновесие. В последнем разделе мы даем краткое описание текущих проблем и перспектив разви­тия данного подхода.

 

 

17.2. Основные понятия и определения

Большинство понятий, которые мы представим в этом разделе, сегодня становятся стандартными инструментами для экономистов (как это случилось с математическим аппаратом несколько десятиле­тий назад). Таким образом, можно ожидать, что такого рода краткое знакомство с основными понятиями и методами теории игр вскоре перестанет быть необходимым. Тем не менее в настоящий момент такой экскурс необходим для того, чтобы читатель мог понять содер­жание последующих разделов. Конечно, полное изложение теории игр потребует целой книги, и мы отсылаем читателя к работам Бахараха (Bacharach, 1976), Шубика (Shubik, 1982), и в особенности Фридмэна (Friedman, 1986), за более детальным описанием.

Прежде чем обратиться к экономическим примерам, необходи­мо пояснить наиболее часто используемые понятия игры, стратегии и стратегического поведения, различных типов игр и различных поня­тий равновесия.

 

 

Описание игры

 

 

Игра — это ситуация, в которой каждый агент старается макси­мизировать свой выигрыш, выбирая наилучший план действий, учи­тывая зависимость результата от действий других игроков.

Описание действий, запланированных агентом для всех возмож­ных ситуаций, называется стратегией, и в общем смысле предполага­ется, что каждый агент ведет себя стратегически. Конкретная игра определена набором игроков, набором стратегий для каждого игро­ка, из которых каждый агент выберет ту, которая, по его мнению, является для него наилучшей, и функцией выплаты (pay-off) каждо­му игроку. Более детальное описание игры включает в себя порядок ходов (какой игрок когда осуществляет свои действия), набор дей­ствий и информацию, доступные игроку перед совершением очеред­ного хода. Так называемая нормальная форма описания игры объеди­няет все эти элементы и позволяет рассматривать выигрыш как функ­цию стратегий игроков.

В формальном виде каждый агент i выбирает стратегию ai из доступного набора стратегий Аi Функция выплаты агенту i — пi (а1,…, ai,…, ап), i=l,…, п, поскольку она зависит от стратегий

 

каждого из участвующих в игре агентов. В статической (однопериодной) игре стратегия является всего лишь действием в заданных условиях. В динамической игре, где время и история игры имеют значения, стратегия является планом действий для каждого периода игры.

Определение стратегий может быть расширено, если мы будем учитывать не только выбор действий, но также и выбор вероятност­ных распределений этих действий. В случае когда стратегии становятся стохастическими, можно говорить о смешанных стратегиях, как о случае, противоположном чистым стратегиям. В этой главе, руко­водствуясь соображениями как простоты, так и интуитивной привле­кательности, мы представим примеры только чистых стратегий.3

 

 

Различные классификации игр

 

 

Игры могут быть классифицированы в соответствии с разнооб­разными критериями: со степенью гармонии между игроками, влия­нием времени и условиями получения информации.

 

Гармония

 

Предполагается, что каждый игрок максимизирует свой выиг­рыш. Тем не менее эта общая цель может предполагать весьма раз­личные отношения к другим игрокам. В некоторых случаях все игро­ки имеют одну и ту же цель, и поэтому они склонны кооперировать­ся. В других случаях наблюдается ситуация прямого конфликта: один агент выигрывает то, что другие агенты проигрывают. В последнем варианте игра называется игрой с нулевой суммой (или в общем случае — игрой с постоянной суммой). Несмотря на то что в эконо­мической теории, начиная с работы фон Неймана и Моргенштерна и до традиционного изложения теории игр в учебниках по микроэконо­мике, использовались многочисленные примеры игр с нулевой сум­мой, большая часть экономических проблем включает в себя элемен­ты как конфликта, так и кооперации, т. е. представляет собой игры с ненулевой суммой.4 Игры с ненулевой суммой могут быть как ко-

 

 

-------------------------------------------------------------------------------

3  Однако мы должны признать, что смешанные стратегии могут пред­ставлять собой очень изощренные формы стратегического поведения. В не­которых типах игр неопределенность выбора может отчасти отвечать интере­сам самого игрока (например, в игре с нулевой суммой для двух игроков, в которой нет седловой точки, т. е. нет равновесия по принципу максимина: каждый игрок ожидает хода другого игрока, откладывая свое решение и сохраняя неопределенность относительно выбранной стратегии). В случае когда игроки имеют возможность провести переговоры перед началом игры, они располагают иными средствами для того, чтобы сделать свои решения случайными величинами. Они могут установить позитивную корреляцию меж­ду своими случайными стратегиями. И такие «скоррелированные стратегии» позволяют игрокам достичь более высоких ожидаемых выигрышей, чем в результате использования простых смешанных стратегий (Aumann, 1974, 1987).

4  Однако мы не должны упускать из виду тот факт, что игры с нулевой суммой позволяют решать некоторые проблемы конфликтов и в рамках бо­лее общих игр, имеющих аспекты конфликта и кооперации. В частности, если допустить возможность образования коалиции, игры с нулевой суммой помогают при оценивании относительной мощи различных коалиций.

 

 

оперативными, так и некооперативными. Они могут быть кооператив­ными, когда агенты имеют возможность заключать связывающие их соглашения перед началом игры, и некооперативными — в против­ном случае. Например, две фирмы в модели дуополии могут заклю­чить между собой соглашение не вредить друг другу, но если не существует правового института, который мог бы силой обеспечить выполнение соглашения, игра должна быть смоделирована как неко­оперативная.

Понятия равновесия, используемые в кооперативных и некоопе­ративных играх, значительно отличаются друг от друга. Мы будем рассматривать только равновесие для некооперативных игр, посколь­ку этот случай более подходит для изучения концепции стратегиче­ского поведения Шеллинга.

 

 

Время

 

Игра является по своей природе статической, если агенты встре­чаются только однажды и принимают решения для единственного периода игры. Определение динамической игры в общем смысле подразумевает, что время имеет значение, или поскольку однопе-риодная игра повторяется несколько раз (повторяемая игра), или поскольку игра разворачивается во времени как многопериодная. В условиях многопериодной сложной игры время может рассмат­риваться как дискретная или непрерывная переменная; последний подход более труден с технической точки зрения. Если количество периодов ограничено, то решение динамической игры определяется с помощью обратной индукции (backward induction), техники ана­лиза, разработанной в динамическом программировании (Bellman, 1957).

В большинстве случаев ситуации, встречающиеся в экономике, включают в себя многочисленные взаимодействия между агентами: фирмы, работающие на одном и том же рынке, знают, что они встре­тятся снова в последующих периодах, и из этого же предположения исходит правительство, определяя свою внешнеторговую политику. Более того, многие экономические переменные, такие как инвестиции в производственные мощности и расходы на рекламу, оказывают свое влияние на предложение и спрос лишь в будущем. Все эти особенно­сти экономической жизни позволяют понять, почему динамические игры образуют удобные рамки для изучения вопросов стратегическо­го поведения в экономической теории.

 

 

Информация

 

 

Важным этапом в описании игры является спецификация струк­туры информации, доступной каждому из игроков. В большинстве случаев применения теории предпосылка о том, что некоторая информация носит частный характер, является вполне естественной. Например, каждая фирма знает свою собственную функцию издер­жек, но не знает, какова эта функция для других игроков. Такая информационная асимметрия делает возможным осуществление це­лого спектра разновидностей стратегического поведения, таких, на­пример, как блеф или создание репутации.

Сегодня стало уже традиционным считать, что информация яв­ляется несовершенной, если агенты не знают о предыдущих действи­ях кого либо из игроков, и что информация является неполной, если агентам неизвестны функции выплаты оппонентам (например, пото­му, что они не знают какого-либо из элементов, необходимых для вычисления выплаты, такого, например, как издержки, необходимые для расчета прибыли фирмы-конкурента).

Важно отметить, что даже в играх с асимметричной информаци­ей значительная часть информации предполагается известной игро­кам как общее знание, доступное каждому, и что субъективная веро­ятность распределения частной информации между всеми агентами также известна всем (общей является также предпосылка, что каж­дый агент ведет себя рационально).

 

 

 

Понятия равновесия в некооперативных играх

 

 

Сначала рассмотрим однопериодную модель с совершенной (и полной) информацией. Для некооперативного равновесия наибо­лее сильным понятием является равновесие доминирующей стра­тегии, в котором существует только один выбор оптимальной стра­тегии для каждого игрока вне зависимости от действий других игроков. Дилемма заключенных — наиболее известный пример до­минирующей стратегии. Но, как бы ни было привлекательно такое понятие, тем не менее существует много примеров игр, где просто нет доминирующей стратегии.5 Менее сильным и фактически

более час­то применяемым в теории некооперативных игр понятием является равновесие по Нэшу. Грубо говоря, мы можем сказать, что в ситуа­ции равновесия по Нэшу каждый агент поступает наилучшим обра­зом при данных действиях других агентов. Описывая формально и оставляя обозначения, применявшиеся ранее для стратегии и функ-

 

 

----------------------------------------------------------------------

5 Это понятие очень важно с нормативной точки зрения. Для принятия решений в условиях идеальной децентрализации принятия решений доми­нирующие стратегии имеют особенное значение. Данное свойство объясняет, почему не поддающиеся манипулированию механизмы принятия решений, где доминирующие стратегии каждого агента выявляют его предпочтения, так широко изучаются в экономике общественного сектора (см., например, Laffont, Maskin, 1982).

 

 

 

 

 

 

 

 

 

 

В условиях равновесия по Нэшу набор ожиданий, определяю­щих выбор каждого агента, соответствует выбранным действиям и никто не желает изменять свое поведение. Понятие статического рав­новесия по Нэшу долгое время понималось неправильно. Многие критики решения проблемы дуополии, принадлежащего Курно, а это первый и наиболее известный пример равновесия по Нэшу, отмеча­ли, что в этой ситуации поведение фирм является довольно ирраци­ональным и, по всей видимости, недальновидным. Однако следует отметить, что поведение в соответствии с моделью Курно—Нэша только кажется иррациональным, если считать, что каждая фирма выбирает свой оптимальный выпуск при заданном выпуске фирмы-конкурен­та, и в то же самое время к статической модели добавить процесс динамической корректировки (как это часто делается в промежуточ­ных курсах микроэкономики). На самом деле это поведение вполне можно назвать рациональным. Во-первых, подлинная динамическая модель предполагает, что изменяется природа самой игры. Во-вто­рых, фирмы знают, каким будет лучший ответ конкурентов на то значение выпуска, который они для себя определят, и они также знают, что эта информация доступна их конкурентам. В том случае, если существует единственная пара значений выпуска, которая соот­ветствует лучшему выбору каждого из агентов, такой выбор будет сделан рациональными игроками (Johansen, 1982). Конечно, основ­ной недостаток понятия равновесия по Нэшу заключается в том, что может существовать множество таких точек равновесия. В этом слу­чае не существует ясного способа выбрать между различными возмож­ностями.

Понятие равновесия по Нэшу довольно естественно распростра­няется на теорию динамических игр. В этом случае каждый агент выбирает стратегию (т. е. план действий для каждого периода игры), которая максимизирует его выигрыш при заданных стратегиях дру­гих игроков. Основная проблема с динамическим равновесием по Нэшу заключается в том, что в последнем периоде игры игроки могут вести себя иррационально. В тот момент, когда становится ясно, что данный период игры является последним, ранее выбранное действие может показаться иррациональным (не максимизирующим полез­ность). Более сильное понятие равновесия, предложенное Зельтеном (Selten, 1975), позволяет нам избавиться от этих неправдоподобных предположений о стратегиях. Это понятие, носящее название совер­шенного равновесия по Нэшу или совершенного равновесия субигры  (subgame perfect equilibrium) предполагает, что стратегии, избранные игроками, являются равновесными по Нэшу в каждой субигре (т. е. в каждой однопериодной игре основной игры) вне зависимости от того, какие действия были предприняты ранее.6

 

Предполагается, что в том случае, когда информация являет­ся неполной или несовершенной, рациональные агенты используют субъективные вероятности, трансформированные в соответствии с правилом Байеса (Bayes's rule). Соответствующее понятие равновесия называется байесовским равновесием. Это понятие было предложено Харсаньи (Harsanyi, 1967-1968), который показал, что игра с непол­ной информацией всегда может быть описана как байесовская игра. В действительности игра с неполной информацией может быть пред­ставлена в виде игры с несовершенной информацией, если мы введем в игру нового игрока, называемого «природа», который выбирает характеристики каждого игрока. Байесовское равновесие описывает­ся как равновесие по Нэшу, в котором каждый игрок оценивает свой выигрыш как свою ожидаемую полезность, обусловленную его част­ной информацией о состоянии «природы». Тем не менее это понятие сталкивается с теми же самыми проблемами, что и равновесие по Нэшу. Понятие совершенного байесовского равновесия является рас­ширением понятия совершенного равновесия по Нэшу для игры с несовершенной (и неполной информацией). Оно соединяет в себе байесовское равновесие с динамической рациональностью, присущей совершенному равновесию по Нэшу (в каждой субигре).7

 

 

Определение стратегического поведения, предложенное Шеллингом

 

 

Слова «стратегия» или «стратегическое поведение» используют­ся в теории игр в основном тогда, когда необходимо передать идею зависимости агентов друг от друга в принятии решений. Тем не менее переориентация теории, произошедшая в основном благодаря рабо­там Шеллинга (Schelling, 1960, 1965), выделила более тонкие аспекты стратегического поведения.

 

 

--------------------------------------------------------------------------------

 

6 Cm. Van Damme, 1983 для более детального анализа последних усовер­шенствований понятия равновесия по Нэшу.

7              Вообще говоря, существует множество точек совершенного байесов­ского равновесия, зависящих от апостериорного отбора распределения веро­ятностей вне равновесных траекторий. В

 

 конкретных моделях для отбора разумных точек равновесия необходимы определенные критерии. В связи с этим можно упомянуть понятие «последовательного равновесия» sequential equilibrium*), предложенное Крепсом и Уилсоном (Kreps, Wilson, 1982b), или понятие «устойчивого равновесия» stable equilibrium*), обсуждаемое Колбергом и Мертенсом (Kohlberg, Mertens, 1986).

 

 

Шеллинг определяет стратегический ход как «(действие)... ко­торое влияет на выбор другого лица в сторону, благоприятную для данного игрока, воздействуя на ожидания, которые формируются у другого лица относительно того, как будет вести себя данный игрок» (Shelling 1960 : 160). Обязательства, угрозы и обещания являются ос­новными средствами, с помощью которых один человек влияет на выбор другого человека в своих собственных интересах. Тем не менее обязательства, угрозы или обещания могут изменить ожидания друго­го игрока относительно нашего поведения, только если они правдопо­добны. На самом деле основная трудность стратегического поведения заключается в достижении этой правдоподобности, поскольку часто выполнение обязательства или реализация угрозы в назначенное вре­мя не входит в интересы игрока.

Обычно правдоподобность достигается одновременным использо­ванием нескольких стратегических ходов. Правдоподобность обещания может быть обеспечена реальностью угрозы (такой пример дан в разде­ле 17.3). Правдоподобность последующих угроз может быть стимули­рована нерушимостью обязательства (см. раздел 17.4). В случае совер­шенной (и полной) информации правдоподобность может быть достиг­нута предварительными манипуляциями с капиталом, расходами на рекламу, выбором продукта и т. п. В том случае, когда информация частично является частной (и, следовательно, асимметричной), ожи­дания других агентов могут быть изменены под воздействием «инве­стиций в дезинформацию», т. е. ложными сигналами, блефом и т. д.

Исходя из вышеизложенного становится понятным, что исследо­вания стратегического поведения в том смысле, из которого исходит Шеллинг, предполагает, что игра имеет динамическую структуру. Понятие совершенного равновесия субигры, которое достигается в результате того, что удается избавиться от планов действий, не входя­щих в круг интересов игрока, позволяет создать довольно интерес­ную конструкцию для изучения стратегического поведения. Более того, возможности анализа расширяются в том случае, когда информация становится асимметричной.

Все эти рассуждения объясняют, почему теория игр стала широ­ко применяться в разнообразных областях экономической науки по­сле недавних достижений в области динамических игр и игр с асим­метричной информацией.

 

 

 

 

17.3. Угрозы и обещания в повторяемых играх

 

 

 

В этом разделе мы рассмотрим простую комбинацию угроз и обещаний, которые могут обеспечивать кооперативный результат в некооперативных играх. Начнем с рассмотрения стандартного приме­нения понятия равновесия по Нэшу к модели однопериодной игры; затем предположим, что подобная игра («конституирующая игра») повторяется в течение многих периодов. Мы обратимся к примеру так называемой игры тарифов, чтобы избежать так часто использу­емой модели дуополии Курно и показать многовариантность приме­нения понятия равновесия по Нэшу.

Игроками являются правительства двух больших стран, которые производят и обмениваются двумя видами товаров: товаром 1 и това­ром 2. Богатство каждой страны может быть увеличено посредством использования политики тарифов, которая в случае оптимального ее применения улучшает условия торговли.

В целях упрощения мы сперва предполагаем, что набор страте­гий каждого правительства состоит либо из свободной торговли (FREE), либо из применения оптимального тарифа (ОРТ). На рис. 17.1 представлена матрица выигрышей для этой однопериодной игры. Из таблицы видно, что вне зависимости от того, какую стратегию избирает конкурирующая страна, каждое правительство получит вы­игрыш, применяя стратегию ОРТ. Такая игра имеет доминирующую стратегию (которая, конечно, является также равновесной по Нэшу). Выбор условий свободной торговли является более эффективным для обеих стран, но он не представляет собой равновесие в некооператив­ных играх. Если бы перед началом игры между обоими игроками было заключено соответствующее соглашение, каждый из них был бы заинтересован в том, чтобы отказаться следовать ему и сделал бы это в отсутствие наднационального института, обладающего правом принуждения.

 

 

 

Таблица 17.1

 

FREE

ОРТ

Страна 1

FREE

 

(8,8)

(2,10)

  ОРТ

   (10,2)

(4,4)

   

 

 

 

 

 

 

   
Comments