|
КРИСТИАН МОНТЕ
ТЕОРИЯ ИГР И СТРАТЕГИЧЕСКОЕ ПОВЕДЕНИЕ
17.1. Введение* Теория игр занимается анализом сознательных взаимодействий между агентами. Каждый игрок ведет себя стратегически в том смысле, что при принятии решения о том, какую линию поведения он должен выбрать, он учитывает возможные влияния, которые эти действия могут оказать на других игроков, а также то, что последние ведут себя таким же образом. Экономическая жизнь полна ситуаций, удовлетворяющих такому описанию: это олигополистические рынки, внешнеторговая политика, проблемы торга, международные эффекты макроэкономической политики, взаимоотношения между правительствами и частными агентами и т. д. К настоящему моменту использование понятийного аппарата теории игр в экономической теории имеет уже довольно длительную историю. Уже в 1838 г. Курно изучал ситуацию дуополии, используя концепцию равновесия, которая стала ключевой в теории некооперативных игр после появления работы Нэша (Nash, 1951). «Контрактная кривая», предложенная Эджуортом в конце XIX в., может быть легко проинтерпретирована в терминах «ядра» — одной из концепций равновесия в современной теории кооперативных игр. Однако самым великим событием в этой истории стала публикация в 1944 г. работы фон Неймана и Моргенштерна «Теория игр и экономическое поведение», в которой развивались идеи, выдвинутые фон Нейманом в 1928 г. Авторы этой книги провозгласили революцию в экономической мысли, утверждая, что «теория стратегических
__________________________
* Я благодарен Майку Блини, Дэвиду Гринуэю и Даниелю Серра за полезные комментарии к предыдущему варианту данной главы. Я также многим обязан моему коллеге Дидье Лосселю за нашу совместную работу и дискуссии, связанные с этой темой. И наконец, я хочу поблагодарить моего бывшего студента Жана-Стефана Мишара за его вопросы по предмету статьи и курсовую работу, которые способствовали улучшению данного текста.
игр — это тот самый инструмент, с помощью которого будет развиваться теория экономического поведения» (von Neumann, Morgenstern, 1944 : 1-2). Однако, несмотря на такие обещания, теория игр до определенной степени находилась в тени в течение последующих двух десятилетий. В конце 1960-х гг. многие экономисты были разочарованы в новом подходе, причем настолько, что один автор в 1963 г. смог написать следующее: «До сегодняшнего дня не предпринималось серьезных попыток применить теорию игр к проблемам рынка или к экономическим проблемам в целом» (Napoleoni, 1963 : 62). Такое утверждение звучит анахронизмом в 1991 г., после того повторного открытия, развития и теперешнего доминирования теории игр в экономической литературе. В большинстве последних работ, посвященных теории отраслевых рынков, теории международной торговли, макроэкономической и денежной теории, теории государственных финансов используется аналитический аппарат теории игр (приведем лишь один пример: в книге «Advances in Economic Theory* под редакцией Трумэна Бью-ли (Bewley, 1987) только три главы из одиннадцати не имеют прямой связи с теорией игр. Вероятно, большой интерес для будущих историков экономической мысли будет представлять вопрос о том, почему это плодотворное слияние теории игр с экономической теорией не произошло раньше конца 1970-х гг.1 Мы можем сделать несколько предположений на этот счет. Во-первых, после Второй мировой воины перед парадигмой совершенной конкуренции все еще открывались возможности расширения и развития; эта перспектива привлекала внимание и усилия исследователей, работающих в областях теории общего равновесия, теории международной торговли, теории роста и т. д. Во-вторых, теория игр довольно длительное время испытывала недостаток внимания вследствие того, что многие неправильно понимали некоторые из ее базовых понятий, такие как равновесие Курно—Нэша,2 а также потому, что слишком большое внимание уделялось чисто техническим вопросам, таким, например, как игры с нулевой суммой, которые, вообще говоря, представляют мало интереса для экономистов.
_________________________________
1 Это не должно означать отрицания хороших работ, опубликованных в период с 1944 по 1970 г., таких как работы Шубика (Shubik, 1959), и в особенности работы, посвященные феномену «сжатия ядра» (когда возрастает количество агентов), которые, безусловно, стали одним из значительных достижений экономической теории после Второй мировой войны. 2 См. отличный комментарий Йохансена (Johansen, 1982) по этому вопросу.
В-третьих, множественность подходов и понятий равновесия, развитых в теории игр, не устраивала экономистов, привыкших к ясным и унифицированным моделям совершенной конкуренции. В-четвертых, многие сложные экономические вопросы стало возможным трактовать в терминах теории игр только после недавнего развития и распространения анализа динамических игр, а также совершенствования и уточнения понятий равновесия, таких, например, как совершенная субигра (subgame perfection). В частности, предложенное Шеллингом (Schelling, 1960, 1965) тонкое понятие стратегических ходов сегодня применяется в решении множества экономических проблем как элемент формального аппарата теории динамических игр. Кроме того, во многих вопросах приходится учитывать несовершенство информации, но только совсем недавно была полностью признана и стала серьезно анализироваться роль информационной асимметрии в стратегическом поведении. Таким образом, можно утверждать, что более ясное и более широкое понимание понятия равновесия по Нэшу, стимулирующие идеи Шеллинга о стратегическом поведении, последние достижения теории динамических игр, такие как разработанное Зельтеном понятие совершенного равновесия (perfect equilibrium) и прогресс теории игр с неполной или несовершенной информацией объясняют нынешний подъем игрового анализа в экономической науке. В данной главе мы иллюстрируем эти идеи, уделяя наибольшее внимание последним достижениям, нацеленным на применение подхода Шеллинга к формальному моделированию. Мы попытаемся представить основные положения с помощью примеров из различных областей экономической теории: теории отраслевых рынков, международной торговли и внешнеторговой политики, а также денежной политики. Такой широкий выбор различных примеров дает понятие о множественности возможных применений новых моделей и в то же время показывает общую структуру многих из этих применений. Не отрицая важности теории кооперативных игр и теории торга (bargaining theory), мы, тем не менее, уделим больше внимания некоторым аспектам теории некооперативных игр. В разделе 17.2 мы даем краткое представление основных понятий и определений. В разделе 17.3 мы обсуждаем стратегические проблемы для случаев простого повторения однопериодной игры, а в разделе 17.4 затрагиваем более тонкие аспекты в различных многопериодных играх. В разделе 17.5 мы вводим понятие несовершенной информации и указываем на ее влияние на равновесие. В последнем разделе мы даем краткое описание текущих проблем и перспектив развития данного подхода.
17.2. Основные понятия и определения Большинство понятий, которые мы представим в этом разделе, сегодня становятся стандартными инструментами для экономистов (как это случилось с математическим аппаратом несколько десятилетий назад). Таким образом, можно ожидать, что такого рода краткое знакомство с основными понятиями и методами теории игр вскоре перестанет быть необходимым. Тем не менее в настоящий момент такой экскурс необходим для того, чтобы читатель мог понять содержание последующих разделов. Конечно, полное изложение теории игр потребует целой книги, и мы отсылаем читателя к работам Бахараха (Bacharach, 1976), Шубика (Shubik, 1982), и в особенности Фридмэна (Friedman, 1986), за более детальным описанием. Прежде чем обратиться к экономическим примерам, необходимо пояснить наиболее часто используемые понятия игры, стратегии и стратегического поведения, различных типов игр и различных понятий равновесия.
Описание игры Игра — это ситуация, в которой каждый агент старается максимизировать свой выигрыш, выбирая наилучший план действий, учитывая зависимость результата от действий других игроков. Описание действий, запланированных агентом для всех возможных ситуаций, называется стратегией, и в общем смысле предполагается, что каждый агент ведет себя стратегически. Конкретная игра определена набором игроков, набором стратегий для каждого игрока, из которых каждый агент выберет ту, которая, по его мнению, является для него наилучшей, и функцией выплаты (pay-off) каждому игроку. Более детальное описание игры включает в себя порядок ходов (какой игрок когда осуществляет свои действия), набор действий и информацию, доступные игроку перед совершением очередного хода. Так называемая нормальная форма описания игры объединяет все эти элементы и позволяет рассматривать выигрыш как функцию стратегий игроков. В формальном виде каждый агент i выбирает стратегию ai из доступного набора стратегий Аi Функция выплаты агенту i — пi (а1,…, ai,…, ап), i=l,…, п, поскольку она зависит от стратегий
каждого из участвующих в игре агентов. В статической (однопериодной) игре стратегия является всего лишь действием в заданных условиях. В динамической игре, где время и история игры имеют значения, стратегия является планом действий для каждого периода игры. В случае когда стратегии становятся стохастическими, можно говорить о смешанных стратегиях, как о случае, противоположном чистым стратегиям. В этой главе, руководствуясь соображениями как простоты, так и интуитивной привлекательности, мы представим примеры только чистых стратегий.3
Различные классификации игр
Игры могут быть классифицированы в соответствии с разнообразными критериями: со степенью гармонии между игроками, влиянием времени и условиями получения информации.
Гармония
Предполагается, что каждый игрок максимизирует свой выигрыш. Тем не менее эта общая цель может предполагать весьма различные отношения к другим игрокам. В некоторых случаях все игроки имеют одну и ту же цель, и поэтому они склонны кооперироваться. В других случаях наблюдается ситуация прямого конфликта: один агент выигрывает то, что другие агенты проигрывают. В последнем варианте игра называется игрой с нулевой суммой (или в общем случае — игрой с постоянной суммой). Несмотря на то что в экономической теории, начиная с работы фон Неймана и Моргенштерна и до традиционного изложения теории игр в учебниках по микроэкономике, использовались многочисленные примеры игр с нулевой суммой, большая часть экономических проблем включает в себя элементы как конфликта, так и кооперации, т. е. представляет собой игры с ненулевой суммой.4 Игры с ненулевой суммой могут быть как ко-
__________________________________________
3 Однако мы должны признать, что смешанные стратегии могут представлять собой очень изощренные формы стратегического поведения. В некоторых типах игр неопределенность выбора может отчасти отвечать интересам самого игрока (например, в игре с нулевой суммой для двух игроков, в которой нет седловой точки, т. е. нет равновесия по принципу максимина: каждый игрок ожидает хода другого игрока, откладывая свое решение и сохраняя неопределенность относительно выбранной стратегии). В случае когда игроки имеют возможность провести переговоры перед началом игры, они располагают иными средствами для того, чтобы сделать свои решения случайными величинами. Они могут установить позитивную корреляцию между своими случайными стратегиями. И такие «скоррелированные стратегии» позволяют игрокам достичь более высоких ожидаемых выигрышей, чем в результате использования простых смешанных стратегий (Aumann, 1974, 1987). 4 Однако мы не должны упускать из виду тот факт, что игры с нулевой суммой позволяют решать некоторые проблемы конфликтов и в рамках более общих игр, имеющих аспекты конфликта и кооперации. В частности, если допустить возможность образования коалиции, игры с нулевой суммой помогают при оценивании относительной мощи различных коалиций.
оперативными, так и некооперативными. Они могут быть кооперативными, когда агенты имеют возможность заключать связывающие их соглашения перед началом игры, и некооперативными — в противном случае. Например, две фирмы в модели дуополии могут заключить между собой соглашение не вредить друг другу, но если не существует правового института, который мог бы силой обеспечить выполнение соглашения, игра должна быть смоделирована как некооперативная. Понятия равновесия, используемые в кооперативных и некооперативных играх, значительно отличаются друг от друга. Мы будем рассматривать только равновесие для некооперативных игр, поскольку этот случай более подходит для изучения концепции стратегического поведения Шеллинга.
Время Игра является по своей природе статической, если агенты встречаются только однажды и принимают решения для единственного периода игры. Определение динамической игры в общем смысле подразумевает, что время имеет значение, или поскольку однопе-риодная игра повторяется несколько раз (повторяемая игра), или поскольку игра разворачивается во времени как многопериодная. В условиях многопериодной сложной игры время может рассматриваться как дискретная или непрерывная переменная; последний подход более труден с технической точки зрения. Если количество периодов ограничено, то решение динамической игры определяется с помощью обратной индукции (backward induction), техники анализа, разработанной в динамическом программировании (Bellman, 1957). В большинстве случаев ситуации, встречающиеся в экономике, включают в себя многочисленные взаимодействия между агентами: фирмы, работающие на одном и том же рынке, знают, что они встретятся снова в последующих периодах, и из этого же предположения исходит правительство, определяя свою внешнеторговую политику. Более того, многие экономические переменные, такие как инвестиции в производственные мощности и расходы на рекламу, оказывают свое влияние на предложение и спрос лишь в будущем. Все эти особенности экономической жизни позволяют понять, почему динамические игры образуют удобные рамки для изучения вопросов стратегического поведения в экономической теории.
Информация
Важным этапом в описании игры является спецификация структуры информации, доступной каждому из игроков. В большинстве случаев применения теории предпосылка о том, что некоторая ин формация носит частный характер, является вполне естественной. Например, каждая фирма знает свою собственную функцию издержек, но не знает, какова эта функция для других игроков. Такая информационная асимметрия делает возможным осуществление целого спектра разновидностей стратегического поведения, таких, например, как блеф или создание репутации.
Сегодня стало уже традиционным считать, что информация является несовершенной, если агенты не знают о предыдущих действиях кого либо из игроков, и что информация является неполной, если агентам неизвестны функции выплаты оппонентам (например, потому, что они не знают какого-либо из элементов, необходимых для вычисления выплаты, такого, например, как издержки, необходимые для расчета прибыли фирмы-конкурента). Важно отметить, что даже в играх с асимметричной информацией значительная часть информации предполагается известной игрокам как общее знание, доступное каждому, и что субъективная вероятность распределения частной информации между всеми агентами также известна всем (общей является также предпосылка, что каждый агент ведет себя рационально).
Понятия равновесия в некооперативных играх
Сначала рассмотрим однопериодную модель с совершенной (и полной) информацией. Для некооперативного равновесия наиболее сильным понятием является равновесие доминирующей стратегии, в котором существует только один выбор оптимальной стратегии для каждого игрока вне зависимости от действий других игроков. Дилемма заключенных — наиболее известный пример доминирующей стратегии. Но, как бы ни было привлекательно такое понятие, тем не менее существует много примеров игр, где просто нет доминирующей стратегии.5 Менее сильным и фактически более часто применяемым в теории некооперативных игр понятием является равновесие по Нэшу. Грубо говоря, мы можем сказать, что в ситуации равновесия по Нэшу каждый агент поступает наилучшим образом при данных действиях других агентов. Описывая формально и оставляя обозначения, применявшиеся ранее для стратегии и функ-
____________________________________________
5 Это понятие очень важно с нормативной точки зрения. Для принятия решений в условиях идеальной децентрализации принятия решений доминирующие стратегии имеют особенное значение. Данное свойство объясняет, почему не поддающиеся манипулированию механизмы принятия решений, где доминирующие стратегии каждого агента выявляют его предпочтения, так широко изучаются в экономике общественного сектора (см., например, Laffont, Maskin, 1982). В условиях равновесия по Нэшу набор ожиданий, определяющих выбор каждого агента, соответствует выбранным действиям и никто не желает изменять свое поведение. Понятие статического равновесия по Нэшу долгое время понималось неправильно. Многие критики решения проблемы дуополии, принадлежащего Курно, а это первый и наиболее известный пример равновесия по Нэшу, отмечали, что в этой ситуации поведение фирм является довольно иррациональным и, по всей видимости, недальновидным. Однако следует отметить, что поведение в соответствии с моделью Курно—Нэша только кажется иррациональным, если считать, что каждая фирма выбирает свой оптимальный выпуск при заданном выпуске фирмы-конкурента, и в то же самое время к статической модели добавить процесс динамической корректировки (как это часто делается в промежуточных курсах микроэкономики). На самом деле это поведение вполне можно назвать рациональным. Во-первых, подлинная динамическая модель предполагает, что изменяется природа самой игры. Во-вторых, фирмы знают, каким будет лучший ответ конкурентов на то значение выпуска, который они для себя определят, и они также знают, что эта информация доступна их конкурентам. В том случае, если существует единственная пара значений выпуска, которая соответствует лучшему выбору каждого из агентов, такой выбор будет сделан рациональными игроками (Johansen, 1982). Конечно, основной недостаток понятия равновесия по Нэшу заключается в том, что может существовать множество таких точек равновесия. В этом случае не существует ясного способа выбрать между различными возможностями. Понятие равновесия по Нэшу довольно естественно распространяется на теорию динамических игр. В этом случае каждый агент выбирает стратегию (т. е. план действий для каждого периода игры), которая максимизирует его выигрыш при заданных стратегиях других игроков. Основная проблема с динамическим равновесием по Нэшу заключается в том, что в последнем периоде игры игроки могут вести себя иррационально. В тот момент, когда становится ясно, что данный период игры является последним, ранее выбранное действие может показаться иррациональным (не максимизирующим полезность). Более сильное понятие равновесия, предложенное Зельтеном (Selten, 1975), позволяет нам избавиться от этих неправдоподобных предположений о стратегиях. Это понятие, носящее название совершенного равновесия по Нэшу или совершенного равновесия субигры (subgame perfect equilibrium) предполагает, что стратегии, избранные игроками, являются равновесными по Нэшу в каждой субигре (т. е. в каждой однопериодной игре основной игры) вне зависимости от того, какие действия были предприняты ранее.6 Предполагается, что в том случае, когда информация является неполной или несовершенной, рациональные агенты используют субъективные вероятности, трансформированные в соответствии с правилом Байеса (Bayes's rule). Соответствующее понятие равновесия называется байесовским равновесием. Это понятие было предложено Харсаньи (Harsanyi, 1967-1968), который показал, что игра с неполной информацией всегда может быть описана как байесовская игра. В действительности игра с неполной информацией может быть представлена в виде игры с несовершенной информацией, если мы введем в игру нового игрока, называемого «природа», который выбирает характеристики каждого игрока. Байесовское равновесие описывается как равновесие по Нэшу, в котором каждый игрок оценивает свой выигрыш как свою ожидаемую полезность, обусловленную его частной информацией о состоянии «природы». Тем не менее это понятие сталкивается с теми же самыми проблемами, что и равновесие по Нэшу. Понятие совершенного байесовского равновесия является расширением понятия совершенного равновесия по Нэшу для игры с несовершенной (и неполной информацией). Оно соединяет в себе байесовское равновесие с динамической рациональностью, присущей совершенному равновесию по Нэшу (в каждой субигре).7
Определение стратегического поведения, предложенное Шеллингом Слова «стратегия» или «стратегическое поведение» используются в теории игр в основном тогда, когда необходимо передать идею зависимости агентов друг от друга в принятии решений. Тем не менее переориентация теории, произошедшая в основном благодаря работам Шеллинга (Schelling, 1960, 1965), выделила более тонкие аспекты стратегического поведения. ______________________ 6 Cm. Van Damme, 1983 для более детального анализа последних усовершенствований понятия равновесия по Нэшу. 7 Вообще говоря, существует множество точек совершенного байесовского равновесия, зависящих от апостериорного отбора распределения вероятностей вне равновесных траекторий. В конкретных моделях для отбора разумных точек равновесия необходимы определенные критерии. В связи с этим можно упомянуть понятие «последовательного равновесия» («sequential equilibrium*), предложенное Крепсом и Уилсоном (Kreps, Wilson, 1982b), или понятие «устойчивого равновесия» («stable equilibrium*), обсуждаемое Колбергом и Мертенсом (Kohlberg, Mertens, 1986). Шеллинг определяет стратегический ход как «(действие)... которое влияет на выбор другого лица в сторону, благоприятную для данного игрока, воздействуя на ожидания, которые формируются у другого лица относительно того, как будет вести себя данный игрок» (Shelling 1960 : 160). Обязательства, угрозы и обещания являются основными средствами, с помощью которых один человек влияет на выбор другого человека в своих собственных интересах. Тем не менее обязательства, угрозы или обещания могут изменить ожидания другого игрока относительно нашего поведения, только если они правдоподобны. На самом деле основная трудность стратегического поведения заключается в достижении этой правдоподобности, поскольку часто выполнение обязательства или реализация угрозы в назначенное время не входит в интересы игрока. Обычно правдоподобность достигается одновременным использованием нескольких стратегических ходов. Правдоподобность обещания может быть обеспечена реальностью угрозы (такой пример дан в разделе 17.3). Правдоподобность последующих угроз может быть стимулирована нерушимостью обязательства (см. раздел 17.4). В случае совершенной (и полной) информации правдоподобность может быть достигнута предварительными манипуляциями с капиталом, расходами на рекламу, выбором продукта и т. п. В том случае, когда информация частично является частной (и, следовательно, асимметричной), ожидания других агентов могут быть изменены под воздействием «инвестиций в дезинформацию», т. е. ложными сигналами, блефом и т. д. Исходя из вышеизложенного становится понятным, что исследования стратегического поведения в том смысле, из которого исходит Шеллинг, предполагает, что игра имеет динамическую структуру. Понятие совершенного равновесия субигры, которое достигается в результате того, что удается избавиться от планов действий, не входящих в круг интересов игрока, позволяет создать довольно интересную конструкцию для изучения стратегического поведения. Более того, возможности анализа расширяются в том случае, когда информация становится асимметричной. Все эти рассуждения объясняют, почему теория игр стала широко применяться в разнообразных областях экономической науки после недавних достижений в области динамических игр и игр с асимметричной информацией.
17.3. Угрозы и обещания в повторяемых играх В этом разделе мы рассмотрим простую комбинацию угроз и обещаний, которые могут обеспечивать кооперативный результат в некооперативных играх. Начнем с рассмотрения стандартного применения понятия равновесия по Нэшу к модели однопериодной игры; затем предположим, что подобная игра («конституирующая игра») повторяется в течение многих периодов. Мы обратимся к примеру так называемой игры тарифов, чтобы избежать так часто используемой модели дуополии Курно и показать многовариантность применения понятия равновесия по Нэшу. Игроками являются правительства двух больших стран, которые производят и обмениваются двумя видами товаров: товаром 1 и товаром 2. Богатство каждой страны может быть увеличено посредством использования политики тарифов, которая в случае оптимального ее применения улучшает условия торговли. В целях упрощения мы сперва предполагаем, что набор стратегий каждого правительства состоит либо из свободной торговли (FREE), либо из применения оптимального тарифа (ОРТ). На рис. 17.1 представлена матрица выигрышей для этой однопериодной игры. Из таблицы видно, что вне зависимости от того, какую стратегию избирает конкурирующая страна, каждое правительство получит выигрыш, применяя стратегию ОРТ. Такая игра имеет доминирующую стратегию (которая, конечно, является также равновесной по Нэшу). Выбор условий свободной торговли является более эффективным для обеих стран, но он не представляет собой равновесие в некооперативных играх. Если бы перед началом игры между обоими игроками было заключено соответствующее соглашение, каждый из них был бы заинтересован в том, чтобы отказаться следовать ему и сделал бы это в отсутствие наднационального института, обладающего правом принуждения. ны i как функцию, зависящую от условий торговли и уровня тарифов. Тогда торговый баланс будет определяться условием рМ1(р, t) = М2(р, t*). (17.1) Выигрыши в игре представляют собой значения, принимаемые коллективными функциями полезности U = U(p, t) и U* = U* (р, t*), которые на основе (17.1) могут быть переписаны в виде функций, зависящих только от t и t*: W(t, t*) и W*(t, t*) . В пространстве t - t* функции W и W* представляют собой наборы линий благосостояния, как это проиллюстрировано на рис. 17.1. При более пристальном рассмотрении мы обнаружим, что для того, чтобы получить подобные линии, нам необходимы более строгие предпосылки (см. McMillan, 1986; Dixit, 1987 для более детального изучения). Читатель, ближе знакомый с теорией отраслевых рынков, отметит, что линии благосостояния являются прямыми аналогами изопро-фитных линий в анализе олигополии. Благосостояние страны 1 увеличивается, если двигаться вниз, а благосостояние страны 2 увеличивается, если двигаться влево в данной системе координат. Линия RR на рис. 17.1 проходит через точки максимума линий благосостояния для страны 1, т. е. эти точки отвечают условию ∂W/∂t = 0. Эту линию называют графиком функции реакции страны 1 (как написал Диксит (Dixit, 1987), термин «геометрическое место точек равновесия» здесь более применим, так как в однопериодной игре, строго говоря, отсутствует понятие реакции). Подобным местом точек равновесия для страны 2 является R*R*. Предполагается, что эти линии имеют отрицательный наклон и пересекаются только один раз (конечно, эти свойства соответствуют очень строгим предпосылкам). Точка N, находящаяся на их пересечении, представляет собой точку равновесия по Нэшу в данной игре (на самом деле автаркия может быть другим равновесием по Нэшу (см. Dixit, 1987)).
|


