Spilteori omhandler matematisk modellering af dilemmaer – ”spil”, hvor to eller flere parter/spillere skal vælge mellem flere forskellige strategier – og målet er at vinde en form for gevinst. Gevinsten kan være at man ikke kommer i fængsel, at ens parti får en borgmesterpost, eller at verden får mindre CO2-udledning. Som alle andre spil må man også kalkulere med, at man kan tabe, dvs. modstanderen vinder. Dette afhænger selvfølgelig af modpartens valg.
I denne introduktion til og anvendelse af den matematiske metode i spilteori, vil vi forsimple dilemmaet en del og kun beskæftige os med et 2-parts spil – og begrænse os til to mulige strategier for hver part. Vil vi ligeledes kun gå i dybden med John Nash’s teorier, men dog indledende præsentere spilteoriens historie. På den baggrund vil vi fremføre problemfelter, som kræver en mere samfundsorienteret overvejelse – med inddragelse af den matematiske modellering. Lad os først give et par eksempler på spil i spilteoretisk sammenhæng:
"Prisoners dilemma" (fangernes dilemma): To kendte kriminelle bliver arresteret og varetægsfængslet. De er blevet anholdt under omstændigheder, hvor de helt sikkert kan straffes for en mindre forbrydelse, men de er også under mistanke for en grovere forbrydelse. For eksempel kan vi sige, at de er blevet anholdt med ulovlige våben på sig, og der er sket et væbnet røveri i nærheden. De er under mistanke, men beviserne er ikke stærke nok.
De kan idømmes 1 års fængsel for ulovlig våbenbesiddelse (det er i USA), men anklageren vil gerne have nogen dømt for røveriet. Derfor tilbyder han hver af de anholdte, at han kan slippe helt for straf, hvis han angiver sin makker. Til gengæld vil makkeren få 20 års fængsel for røveriet. Der er naturligvis den hage ved handlen, at de måske begge angiver hinanden. Så får de hver 5 års fængsel.
Der findes to versioner af dette tankeeksperiment:
1. De kender den anden kriminelles valg (tale eller tie), og kan vælge om indtil sidste øjeblik, hvor dommen falder.
2. De kender ikke den andens valg. De er nødt til at træffe deres valg, uden at vide hvad den anden har gjort.
CO2-udledning: Her kan aktører/lande– for eksempel I lande og U lande - investere i begrænsningen af CO2-udledning eller lade stå til i udledningen af CO2. I en meget idealistisk verden må begge grupper af nationer være mest ”tilfredse”, hvis alle handler, ”mindre tilfredse” hvis de kun selv handler og ”mindst tilfredse”, hvis ingen handler. I en mindre idealiseret verden kunne man forestille sig, at en aktør ville være udmærket tilfreds med, at ”modstanderen” handler – og at man ikke selv gør det. Hvad skal, for eksempel, EU, gøre ved klima-topmøderne?
For at kunne analyse dette problem vha. en matematisk model, er vi dog nødt til at kunne vurdere nationernes udbytte af situationen - vi må kvantificere noget kvalitativt. Det er ikke nødvendigvis en let opgave!
1. Hvad er valgmulighederne i “fangernes dilemma”? Lav en overskuelig oversigt over disse – og afgør hvad der sker!
2. Forsøg at opstille en tabel med rækker og søjler (en såkaldt ”spilmatrix” eller en ”udbyttematrix”) ud fra dine overvejelser fra 1). Lad spiller A’s muligheder være i rækkerne og spiller B’s i søjlerne.
3. Sæt nogle værdier på de to aktørers udbytte af ”handling” og ”ikke handling” I CO2-udledningseksemplet (kvantificer dem!). Og lav en overskuelig oversigt over eksempel 2.
Forsøg på at udvikle præcise teorier for hvordan man ”bedst” spiller forskellige former for ”spil” har været gjort flere gange de sidste par hundrede år. Det er først og fremmest matematikere indenfor sandsynlighedsteori, der har taget disse problemer op. Det drejede sig fra begyndelsen om underholdningsspil - gerne med indslag af tilfældigheder som ved kortspil og terningspil.
Spilteorien som selvstændig videnskabelig disciplin blev først etableret ved et grundlæggende arbejde foretaget af matematikeren Johannes von Neumann i 1928. Baggrunden var, at det viste sig, at spilteorien kunne bruges til at analysere en lang række vigtige problemer langt ud over de rammer, man oprindelig havde forestillet sig. Dette gjaldt ikke mindst økonomiske og samfundsmæssige problemstillinger. Disse overvejelser kom først og fremmest frem gennem kontakten mellem matematikeren Johannes von Neumann og nationaløkonomen Oskar Morgenstern. I 1944 udkom deres hovedværk ”Theory of Games and Economic Behavior” (”Teorien om spil og økonomisk adfærd”), som gav en dybdegående matematisk behandling af typer af ”spil” og en række økonomiske problemstillinger. Neumann og Morgensterns hovedkonklusioner falder tilbage på det såkaldte max-min princip. Deres arbejde koncentrerede sig primært om såkaldte ”nul-sum spil” – dvs. spil, hvor den ene vinder det, som den anden taber. Tænk på et simpelt væddemål: ”jeg vil vædde 5 kroner med dig om, at AGF vinder over Brøndby på søndag!” Den ene taber 5 kroner, den anden vinder 5 kroner! Neumann og Morgenstern fokuserede på to-personers spil. Det er lidt sværere at forestille sig hvad der sker, når der er flere spillere – tænk på fangernes dilemma med tre fanger – men det er ikke umuligt!
John Nash arbejdede senere indenfor området og nåede frem til begrebet Nash ligevægten, som værende en optimal strategi i spil, der involverer 2 eller flere personer. Udledningen af Nash-ligevægten er en af de primære grunde til, at John Nash modtog Nobelprisen i 1994. Overordnet formuleres Nash ligevægten som
"et sæt af strategier (én strategi for hver spiller) er en Nash ligevægt, hvis hver spillers strategi er "best response" til de andre spilleres strategier".
Dvs. en Nash ligevægt er en situation i et spil, hvor ingen ”spillere” har lyst til at afvige fra deres strategi, selvom de kender de andre spilleres strategi. Med ”lyst” menes selvfølgelig, at man ikke bliver bedre stillet ved at ændre sit valg. Altså en ”løsning” hvor alle, givet den viden man besidder, ikke kan blive mere tilfredse ved at vælge noget andet. Begrebet blev beskrevet første gang i ”Non-cooperative games” (1950) af John Nash. Nash viste, at hvis alle handler rationelt i et spil, der har en ligevægt vil man opnå denne.
Det er Nash-ligevægten vi skal arbejde ud fra i det følgende.
Nash-ligevægten og dens begrænsninger kan illustreres ud fra fangernes dilemma: begge ”spillere” vil vælge at indgå en aftale, da enhver anden strategi stiller personerne i en situation, hvor en af dem kunne havde opnået noget bedre ved at tage et andet valg (indgå en aftale). Oversigt over fangernes dilemma som en udbytte matrix (med fængselsstraf som angivet værdi):
Matrix:
Cellerne i denne matrix skal læses som et tal-par, hvor det første tal er Fange As straf og det andet Fange Bs. Bemærk, at vi ikke selv er tvunget til at kvantificere noget her – det er gjort for os i eksemplet. Vi har ligeledes markeret det, som viser sig at være den optimale strategi med en understregning.
Umiddelbart skal begge selvfølgelig vælge at tie. Det er imidlertid ikke en Nash ligevægt, som vi vil se lige om lidt, selvom det stiller begge aktører optimalt - men givet den information, at den ene tier, vil den anden indgå en aftale for at stille sig selv bedre (mindre straf) – og dermed vil den anden fange – med samme argument – også indgå en aftale, da dette stiller den enkelte bedre. Så det, som ser ud til at være en (Nash) ligevægt er det faktisk kun tilsyneladende! Deraf også navnet: Fangernes dilemma!