Nash-jämvikt. Spelteori för ekonomer (John Nash)

Innehållsförteckning:

Nash-jämvikt. Spelteori för ekonomer (John Nash)
Nash-jämvikt. Spelteori för ekonomer (John Nash)

Video: Nash-jämvikt. Spelteori för ekonomer (John Nash)

Video: Nash-jämvikt. Spelteori för ekonomer (John Nash)
Video: Nashjämvikt med dominerande strategi 2024, Maj
Anonim

På 1930-talet blev John von Neumann och Oscar Morgenstern grundarna av en ny och intressant gren av matematiken kallad "spelteori". På 1950-talet blev den unge matematikern John Nash intresserad av denna riktning. Jämviktsteorin blev föremål för hans avhandling, som han skrev vid 21 års ålder. Så föddes en ny spelstrategi kallad "Nash Equilibrium", som vann Nobelpriset många år senare - 1994.

Nash jämvikt
Nash jämvikt

Det långa gapet mellan att skriva en avhandling och allmänt erkännande har blivit ett test för en matematiker. Geni utan erkännande resulterade i allvarliga psykiska störningar, men John Nash kunde lösa detta problem tack vare sitt utmärkta logiska sinne. Hans Nash Equilibrium-teori vann ett Nobelpris och hans liv filmades i Beautiful mind.

Kort om spelteori

Eftersom Nash-jämviktsteorin förklarar människors beteende under interaktionsförhållanden, är det värt att överväga spelteorins grundläggande begrepp.

Spelteori studerar deltagarnas (agenters) beteende när det gäller interaktion med varandra som ett spel, när resultatet beror på flera personers beslut och beteende. Deltagaren fattar beslut baserat på sina förutsägelser om andras beteende, vilket kallas spelstrategin.

Det finns också en dominerande strategi där deltagaren får det bästa resultatet för andra deltagares beteende. Detta är spelarens bästa win-win-strategi.

Fångarnas dilemma och vetenskapligt genombrott

Prisoner's dilemma är ett fall av ett spel där deltagarna tvingas fatta rationella beslut och uppnå ett gemensamt mål inför en konflikt av alternativ. Frågan är vilket av dessa alternativ han kommer att välja, inse personligt och allmänt intresse, liksom omöjligheten att få båda. Spelarna verkar vara fängslade i en tuff spelmiljö, vilket ibland får dem att tänka väldigt produktivt.

Nash-jämviktsexempel
Nash-jämviktsexempel

Detta dilemma utforskades av den amerikanske matematikern John Nash. Balansen han hittade var revolutionerande på sitt sätt. Särskilt ljust påverkade denna nya tanke ekonomers åsikt om hur marknadsaktörer gör val, med hänsyn till andras intressen, med nära interaktion och skärningspunkt mellan intressen.

Det är bäst att studera spelteori genom konkreta exempel, eftersom denna matematiska disciplin i sig inte är torrteoretisk.

Exempel på Prisoner's Dilemma

Exempel, två personer begick ett rån, föll i händerna på polisen och förhörs i separata celler. Samtidigt erbjuder poliser varje deltagare förmånliga villkor under vilka han kommer att släppas om han vittnar mot sin partner. Var och en avbrottslingar har följande uppsättning strategier som han kommer att överväga:

  1. Båda vittnar samtidigt och får 2,5 års fängelse.
  2. Båda är tysta samtidigt och får 1 år vardera, för i det här fallet kommer bevisbasen för deras skuld att vara liten.
  3. Den ena vittnar och släpps, medan den andre är tyst och får 5 års fängelse.

Uppenbarligen beror utgången av ärendet på båda deltagarnas beslut, men de kan inte komma överens, eftersom de sitter i olika celler. Konflikten mellan deras personliga intressen i kampen för ett gemensamt intresse är också tydligt. Var och en av fångarna har två handlings alternativ och fyra alternativ för resultat.

Kedja av logiska slutledningar

Så, gärningsmannen A överväger följande alternativ:

  1. Jag är tyst och min partner är tyst - vi kommer båda att få 1 års fängelse.
  2. Jag lämnar in min partner och han lämnar in mig - vi får båda 2,5 års fängelse.
  3. Jag är tyst, och min partner sviker mig - jag kommer att få 5 års fängelse, och han kommer att bli fri.
  4. Jag lämnar över min partner, men han är tyst - jag får frihet och han får 5 års fängelse.

Låt oss ge en matris med möjliga lösningar och resultat för tydlighetens skull.

Tabell över möjliga resultat av fångens dilemma.

Nash jämviktsteori
Nash jämviktsteori

Frågan är, vad kommer varje tävlande att välja?

"Var tyst, du kan inte tala" eller "Du kan inte vara tyst, du kan inte tala"

För att förstå deltagarens val måste du gå igenom kedjan av hans tankar. Enligt brottsling A:s resonemang: om jag förblir tyst och min partner förblir tyst, får vi en minimiperiod (1 år), men jagJag vet inte hur han kommer att bete sig. Om han vittnar mot mig, då är det bättre för mig att vittna, annars kan jag sitta ner i 5 år. Jag sitter hellre ner i 2,5 år än 5 år. Om han håller tyst, så behöver jag desto mer vittna, för på det sättet får jag min frihet. Deltagare B.

john nash balans
john nash balans

Det är inte svårt att se att den dominerande strategin för var och en av förövarna är att vittna. Den optimala poängen med detta spel kommer när båda brottslingarna vittnar och får sitt "pris" - 2,5 års fängelse. Nash-spelteorin kallar detta för jämvikt.

Icke-optimal optimal Nash-lösning

Den revolutionära karaktären hos den nashianska uppfattningen är att en sådan jämvikt inte är optimal när man tar hänsyn till den individuella deltagaren och dennes egenintresse. Det bästa alternativet är trots allt att vara tyst och gå fri.

Nash-jämvikten är en punkt för intressekonvergens, där varje deltagare väljer det alternativ som är optim alt för honom endast om andra deltagare väljer en viss strategi.

Med tanke på alternativet när båda brottslingarna är tysta och bara får 1 år, kan vi kalla det ett Pareto-optim alt alternativ. Det är dock möjligt endast om brottslingarna kunde komma överens i förväg. Men inte ens detta skulle garantera detta resultat, eftersom frestelsen att dra sig tillbaka från avtalet och undvika straff är stor. Bristen på fullständigt förtroende för varandra och faran att få 5 år tvingade att välja alternativet med erkännande. Reflektera över vad deltagarna kommer att hålla sig till alternativet med tystnad, att agera i samförstånd, är helt enkelt irrationellt. En sådan slutsats kan dras om vi studerar Nash-jämvikten. Exempel visar bara att du har rätt.

Egoistisk eller rationell

The Nash Equilibrium Theory gav häpnadsväckande slutsatser som motbevisade de principer som fanns tidigare. Till exempel ansåg Adam Smith beteendet hos var och en av deltagarna som helt själviskt, vilket förde systemet i balans. Denna teori kallades "marknadens osynliga hand."

john nash jämviktsteori
john nash jämviktsteori

John Nash såg att om alla deltagare agerar i sina egna intressen kommer detta aldrig att leda till ett optim alt gruppresultat. Med tanke på att rationellt tänkande är inneboende hos varje deltagare, är valet som erbjuds av Nash-jämviktsstrategin mer troligt.

Rent manligt experiment

Ett utmärkt exempel är det blonda paradoxspelet, som, även om det verkar malplacerat, är en tydlig illustration av hur Nashs spelteori fungerar.

I det här spelet måste du föreställa dig att ett sällskap av fria killar kom till en bar. I närheten finns ett sällskap med tjejer, varav en är att föredra framför andra, säg en blondin. Hur agerar killar för att skaffa den bästa flickvän för sig själva?

balanssituation
balanssituation

Så, resonemang från killarna: om alla börjar bekanta sig med blondinen, så kommer troligen ingen att få det, då kommer hennes vänner inte att vilja bli bekanta. Ingen vill vara den andra fallbacken. Men om killarna väljer att undvikablondin, då är sannolikheten för var och en av killarna att hitta en bra flickvän bland tjejerna stor.

Nash-jämviktssituationen är inte optimal för killar, eftersom alla skulle välja blondinen, för att bara utöva sina egna själviska intressen. Man kan se att strävan efter enbart själviska intressen kommer att vara liktydigt med kollapsen av gruppintressen. Nash-jämvikt kommer att innebära att varje kille agerar i sina egna intressen, som är i kontakt med hela gruppens intressen. Detta är inte det bästa alternativet för alla personligen, utan det bästa för alla, baserat på den övergripande strategin för framgång.

Hela vårt liv är ett spel

Beslutsfattande i den verkliga världen är mycket som ett spel där du förväntar dig vissa rationella beteenden från andra deltagare också. I affärer, på jobbet, i ett team, på ett företag och till och med i relationer med det motsatta könet. Från stora affärer till vanliga livssituationer, allt följer en eller annan lag.

nash spelteori
nash spelteori

Självklart är ovanstående spelsituationer med brottslingar och en bar bara utmärkta illustrationer som visar Nash-jämvikten. Exempel på sådana dilemman uppstår väldigt ofta på den verkliga marknaden, och detta fungerar särskilt i de fall två monopolister kontrollerar marknaden.

Blandade strategier

Ofta är vi inte involverade i en, utan flera matcher samtidigt. Att välja ett av alternativen i ett spel, styrt av en rationell strategi, men du hamnar i ett annat spel. Efter några rationella beslut kan du upptäcka att ditt resultat inte är till din smak. Vadta?

Låt oss överväga två typer av strategier:

  • Ren strategi är deltagarens beteende, som kommer från att tänka på andra deltagares möjliga beteende.
  • Blandad strategi eller slumpmässig strategi är växlingen av rena strategier slumpmässigt eller valet av en ren strategi med en viss sannolikhet. Denna strategi kallas också randomiserad.
Nash-jämvikt i blandade strategier
Nash-jämvikt i blandade strategier

Med tanke på detta beteende får vi en ny titt på Nash-jämvikten. Om det tidigare har sagts att spelaren väljer en strategi en gång, kan ett annat beteende föreställas. Det kan antas att spelarna väljer en strategi slumpmässigt med en viss sannolikhet. Spel som inte kan hitta Nash-jämvikt i rena strategier har dem alltid i blandade strategier.

Nash-jämvikt i blandade strategier kallas blandad jämvikt. Detta är en jämvikt där varje deltagare väljer den optimala frekvensen för att välja sina strategier, förutsatt att andra deltagare väljer sina strategier med en given frekvens.

Straffar och blandad strategi

Ett exempel på en blandad strategi finns i fotbollsspelet. Den bästa illustrationen av en blandad strategi är kanske en straffläggning. Så vi har en målvakt som bara kan hoppa in i ett hörn och en spelare som tar straffen.

Så, om första gången spelaren väljer strategin att skjuta till det vänstra hörnet, och målvakten också faller i det här hörnet och fångar bollen, hur kan saker och ting utvecklas andra gången? Om spelarenkommer att slå i motsatt hörn, är detta troligen för uppenbart, men att slå i samma hörn är inte mindre uppenbart. Därför har både målvakten och sparkaren inget annat val än att förlita sig på slumpmässigt urval.

Genom att varva slumpmässigt urval med en viss ren strategi försöker alltså spelaren och målvakten få maxim alt resultat.

Rekommenderad: