Avancerede spil teori strategier til beslutningstagning

SCP-3426 A Spark Into the Night | Keter class | k-class scenario / planet scp (November 2024)

SCP-3426 A Spark Into the Night | Keter class | k-class scenario / planet scp (November 2024)
Avancerede spil teori strategier til beslutningstagning

Indholdsfortegnelse:

Anonim

Spilteori, studiet af strategisk beslutningstagning, bringer sammen forskelligartede discipliner som matematik, psykologi og filosofi. Spilteori blev opfundet af John von Neumann og Oskar Morgenstern i 1944 og er kommet langt siden da. Betydningen af ​​spilteori til moderne analyse og beslutningstagning kan vurderes af det faktum, at der siden 1970 er blevet tildelt Nobelprisen i Økonomiske Videnskab for så mange som 12 førende økonomer og videnskabsmænd for deres bidrag til spilteori.

Spilteori anvendes på en række områder, herunder erhvervslivet, økonomi, økonomi, statsvidenskab og psykologi. Forståelse af strategier for spilteori - både de populære og nogle af de relativt mindre kendte strategier - er vigtig for at forbedre ens ræsonnement og beslutningsfærdigheder i en kompleks verden.

Fangers dilemma - I et nøddeskal

En af de mest populære og grundlæggende spilteori-strategier er Fangers Dilemma. Dette begreb udforsker beslutningsstrategien taget af to individer, der ved at handle i deres eget individuelle bedste interesse ender med dårligere resultater end hvis de i første omgang havde samarbejdet med hinanden.

I fangenes dilemma opbevares to mistænkte, der er blevet anholdt for en forbrydelse, i separate rum og kan ikke kommunikere med hinanden. Anklageren oplyser hver enkelt af dem individuelt, at hvis han (kald ham Suspect 1) tilstår og vidner mod den anden, kan han gå fri, men hvis han ikke samarbejder og Suspect 2 gør, vil Suspect 1 blive dømt til tre års fængsel. Hvis de begge tilstår, får de en toårig sætning, og hvis de ikke tillader, bliver de dømt til et års fængsel.

Mens samarbejdet er den bedste strategi for de to mistænkte, når der konfronteres med et sådant dilemma, viser forskning, at de fleste rationelle mennesker foretrækker at tilstå og vidne mod den anden person i stedet for at være tavse og tage chancen at den anden part erkender.

Game Theory Strategies

The Fangers Dilemma lægger grunden til avancerede spillteori strategier, hvoraf de populære er:

Matching Pennies : Dette er et nul-sum spil, der involverer to spillere (kalder dem Player A og Player B) samtidig placere en øre på bordet, med udbetalingen afhængigt af om pennies matcher. Hvis begge pennies er hoveder eller haler, vinder spiller A og holder spillerens penny. Hvis de ikke stemmer overens, vinder Player B og holder Player A's øre.

Deadlock : Dette er et socialt dilemma scenario som Fangers Dilemma, idet to spillere enten kan samarbejde eller defekte (dvs.e. ikke samarbejde). I Deadlock, hvis spiller A og spiller B begge samarbejder, får de hver en udbetaling på 1, og hvis de begge er defekte, får de begge en udbetaling på 2. Men hvis spiller A samarbejder og spiller B defekter, så får A en payoff af 0 og B får en udbetaling på 3. I udbetalingsdiagrammet nedenfor repræsenterer det første tal i cellerne (a) til (d) spillerens udbetaling, og det andet tal er det for Player B:

Deadlock Payoff Matrix < Spiller B

Samarbejd

Fejl

Spiller A

Samarbejd

(a) 1, 1

(b) 0, 3

Fejl

(c) 3 , 0

(d) 2, 2

Deadlock adskiller sig fra Fængselsdilemma, idet handlingen med den største gensidig fordel (dvs. begge fejl) også er den dominerende strategi. En dominerende strategi for en spiller er defineret som den, der producerer den højeste udbetaling af enhver tilgængelig strategi, uanset de strategier, der anvendes af de andre spillere.

Et almindeligt citeret eksempel på Deadlock er at to atomkraftværker forsøger at nå til enighed om at fjerne deres arsenaler af atombomber. I dette tilfælde indebærer samarbejde at overholde aftalen, mens afskedigelse betyder hemmeligt afkald på aftalen og fastholdelse af atomvåben arsenalen. Det bedste resultat for hver nation er desværre at renegere aftalen og beholde den nukleare mulighed, mens den anden nation eliminerer sit arsenal, da det vil give den førstnævnte en enorm skjult fordel i forhold til sidstnævnte, hvis krigen nogensinde bryder ud mellem de to. Den næstbedste mulighed er, at både mangler eller ikke samarbejder, da dette bevarer deres status som atomkraft.

Cournot Konkurrence

: Denne model er også begrebsmæssig ligner Fangerens Dilemma og er opkaldt efter den franske matematiker Augustin Cournot, som introducerede den i 1838. Cournot-modellen er mest almindeligt anvendt ved at beskrive et duopol eller to hoved producenter på et marked. For eksempel antager to virksomheder A og B producerer et identisk produkt og kan producere høje eller lave mængder. Hvis de begge samarbejder og indvilliger i at producere på lave niveauer, vil begrænset leverance omsætte til en høj pris for produktet på markedet og betydelige overskud for begge virksomheder. På den anden side, hvis de mangler og producerer på høje niveauer, vil markedet blive oversvømmet og resultere i en lav pris for produktet og dermed lavere overskud. Men hvis man samarbejder (det vil sige producerer på lave niveauer) og de andre mangler (det vil sige surrealistisk producerer på høje niveauer), så bryder førstnævnte bare, mens sidstnævnte tjener et overskud, der er højere end hvis de begge samarbejder.

Udbetalingsmatrixen for virksomhederne A og B er vist (tal repræsenterer overskud i millioner af dollars). Således, hvis A samarbejder og producerer på lave niveauer, mens B defekter og producerer på høje niveauer, er udbetalingen som vist i celle b) - jævnt fordelt for selskab A og 7 mio. USD i overskud for selskab B.

Cournot Payoff Matrix

Firma B

Samarbejd

Fejl

Virksomhed A

Samarbejd

(a) 4, 4

(b) 0, 7

Fejl

) 7, 0

(d) 2, 2

Koordination

: I samordning tjener spillere højere udbetalinger, når de vælger samme handlingsmåde. Som et eksempel, overveje to teknologigiganter, der beslutter at indføre en radikal ny teknologi i hukommelseschips, der kan tjene dem hundredvis af millioner i fortjeneste eller en revideret version af en ældre teknologi, der ville tjene dem meget mindre. Hvis kun ét selskab beslutter sig for at gå videre med den nye teknologi, ville forbrugernes markedsadoptagelse være betydeligt lavere, og som følge heraf ville det tjene mindre, end hvis begge virksomheder beslutter sig for samme handlingsmåde. Udbetalingsmatrixen er vist nedenfor (tal repræsenterer overskud i millioner af dollars).

Hvis begge virksomheder beslutter sig for at indføre den nye teknologi, ville de tjene 600 millioner dollars, mens indførelsen af ​​en revideret version af den ældre teknologi ville tjene dem 300 millioner dollars hver, som vist i celle (d). Men hvis Company A alene beslutter at indføre den nye teknologi, vil den kun tjene 150 millioner dollars, selvom Company B vil tjene $ 0 (formodentlig fordi forbrugerne måske ikke er villige til at betale for sin nu forældede teknologi). I dette tilfælde er det fornuftigt for begge virksomheder at arbejde sammen snarere end alene.

Koordinering Udbetaling Matrix

Virksomhed B

Ny teknologi

Gammel teknologi

Virksomhed A

Ny teknologi

(a) 600, 600

(b) 0, 150 < Gamle teknologier

(c) 150, 0

(d) 300, 300

Centipede Game

: Dette er et omfattende spil, hvor to spillere skiftevis får chancen for at tage større andel af en langsomt stigende penge stash. Centipede spillet er sekventielt, da spillerne gør deres bevægelser efter hinanden snarere end samtidig; hver spiller også kender de strategier, der vælges af de spillere, der spillede før dem. Spillet afsluttes, så snart en spiller tager stashen, hvor spilleren får den større del og den anden spiller får den mindre del.

Hvis Player A og Player B spiller Centipede spillet, skal du antage, at spiller A går først og skal afgøre, om han skal "tage" eller "passere" stashen, som i øjeblikket beløber sig til $ 2. Hvis han tager, skal A og B få $ 1 hver, men hvis A går, skal beslutningen om at "Take or Pass" nu laves af Player B. Hvis B tager, får hun $ 3 (dvs. den forrige stash på $ 2 + $ 1 ) og A får $ 0. Men hvis B passerer, får A nu at afgøre, om man skal tage eller videregive, og så videre. Hvis begge spillere altid vælger at passere, modtager de hver især en gevinst på $ 100 i slutningen af ​​spillet. Pointen i spillet er, at hvis A og B begge samarbejder og "pass" til slutningen af ​​spillet, får de den maksimale udbetaling på $ 100 hver. Men hvis de mistillid den anden spiller og forventer, at de "tager" ved den første mulighed, forudsiger Nash-ligevægten, at spillerne vil tage det lavest mulige krav ($ 1 i dette tilfælde). Eksperimentelle undersøgelser har imidlertid vist, at denne "rationelle" adfærd (som forudsagt af spilteori) sjældent udstilles i det virkelige liv. Dette er ikke intuitivt overraskende i betragtning af den lille størrelse af den oprindelige udbetaling i forhold til den endelige. Lignende opførsel af eksperimentelle emner er også blevet udstillet i Traveller's Dilemma.

Traveler's Dilemma

: Dette er et non-zero sum spil, hvor begge spillere forsøger at maksimere deres egen udbetaling uden hensyntagen til den anden. Udviklet af økonom Kaushik Basu i 1994 i Traveller's Dilemma, et flyselskab indvilliger i at betale to rejsende kompensation for skader på identiske genstande. De to rejsende er dog særskilt forpligtet til at estimere varens værdi med mindst $ 2 og maksimum $ 100. Hvis begge skriver ned samme værdi, refunderer flyselskabet hver af dem det beløb. Men hvis værdierne er forskellige, betaler luftfartsselskabet dem den lavere værdi med en bonus på $ 2 for den rejsende, der skrev ned denne lavere værdi og en straf på $ 2 for den rejsende, der skrev ned den højere værdi.

Nash-ligevægtsniveauet, baseret på tilbagegående induktion, er $ 2 i dette scenario. Men som i Centipede-spillet viser laboratorieeksperimenter konsekvent, at de fleste deltagere - naivt eller ellers - vælger et tal meget højere end $ 2. Traveler's Dilemma kan anvendes til at analysere en række forskellige situationer i virkeligheden. Fremgangsmåden ved tilbagesøgning kan for eksempel bidrage til at forklare, hvordan to virksomheder, der beskæftiger sig med cutthroat-konkurrence, støt kan reducere produktpriserne i et forsøg på at få markedsandel, hvilket kan medføre, at de får større og større tab i processen.

Yderligere spilteori Strategier

Slaget ved kønnene

: Dette er en anden form for koordinationsspillet, der er beskrevet tidligere, men med nogle udbetalingsasymmetrier. Det involverer i det væsentlige et par, der forsøger at koordinere deres aften ude. Mens de havde aftalt at mødes ved enten boldspillet (mandens præference) eller i et spil (kvindens præference), har de glemt det, de havde besluttet, og at sammensætte problemet, kan ikke kommunikere med hinanden. Hvor skal de hen? Udbetalingsmatrixen er som vist - tallene i cellerne repræsenterer den relative grad af nydelse af arrangementet for henholdsvis kvinden og mannen. Celle (a) repræsenterer for eksempel udbetalingen (i form af nydelsesniveauer) for henholdsvis kvinden og manden på legen (hun nyder det meget mere, end han gør). Celle (d) er udbetalingen, hvis begge gør det til boldspil (han nyder det mere end hun gør). Celle (c) repræsenterer utilfredsheden, hvis begge ikke kun går til den forkerte placering, men også til den begivenhed, de nyder mindst - kvinden til boldspil og manden til legen.

Slaget ved Sex Payoff Matrix Mand

Spil

Boldspil

Kvinde

Spil

(a) 6, 3

(b) 2, 2 > Boldspil

(c) 0, 0

(d) 3, 6

Diktator Spil

: Dette er et simpelt spil, hvor Player A skal bestemme, hvordan man deler en pengepræmie med Player B , der ikke har input til spillerens beslutning. Selvom dette ikke er en spilteoristrategi

i sig selv

, giver det nogle interessante indsigter i folks adfærd. Eksperimenter viser, at omkring 50% holder alle pengene til sig selv; 5% opdeler det ligeligt, og de andre 45% giver den anden deltager en mindre andel. Diktatorspillet er tæt forbundet med ultimatumspillet, hvor spiller A får en bestemt mængde penge, hvoraf en del skal gives til spiller B, som kan acceptere eller afvise det givne beløb.Fangen er, at hvis den anden spiller afviser det tilbudte beløb, får både A og B ingenting. Diktator- og ultimatum-spil holder vigtige lektioner for spørgsmål som velgørende giver og filantropi. Fredskrig : En variant af Fangeens Dilemma, hvor "Samarbejd eller Defekt" beslutninger erstattes af "Fred eller krig. "En analogi kan være to virksomheder, der er involveret i en priskrig. Hvis begge afholder sig fra prisnedskæring, nyder de relativ velstand (celle a), men priskrig vil reducere udbetalingerne dramatisk (celle d). Men hvis A engagerer sig i prisnedskæring (krig), men B ikke, ville A have et højere udbytte på 4, da det kan være i stand til at opfange en betydelig markedsandel, og dette højere volumen ville kompensere lavere produktpriser. Fredskrigs udbetalingsmatrix

Firma B Fred

Krig

Firma A

Fred

(a) 3, 3

(b) 0, 4 > Krig

(c) 4, 0

(d) 1, 1

Frivilliges dilemma

: I et frivilliges dilemma skal nogen foretage en opgave eller arbejde for det fælles gode. Det værste mulige resultat er realiseret, hvis ingen frivillige. For eksempel overveje et firma, hvor regnskabsbedraget er uhyre, men øverste ledelse er uvidende om det. Nogle junior medarbejdere i regnskabsafdelingen er opmærksomme på bedrageriet, men tøver med at fortælle topledelsen, fordi det ville medføre, at de medarbejdere, der er involveret i bedrageriet, bliver fyret og sandsynligvis retsforfulgt. At blive mærket som en "whistleblower" kan også have nogle konsekvenser ned ad linjen. Men hvis ingen frivillige, kan det store svig resultere i selskabets eventuelle konkurs og tabet af alles arbejde.

The Bottom Line

Spilteori kan bruges meget effektivt som et redskab til beslutningstagning, uanset om det er økonomisk, forretningsmæssigt eller personligt.