In die 1930's het John von Neumann en Oscar Morgenstern die stigters geword van 'n nuwe en interessante tak van wiskunde genaamd "spelteorie". In die 1950's het die jong wiskundige John Nash in hierdie rigting begin belangstel. Die teorie van ewewig het die onderwerp geword van sy proefskrif, wat hy op die ouderdom van 21 geskryf het. So is 'n nuwe spelstrategie genaamd "Nash Equilibrium" gebore, wat baie jare later die Nobelprys gewen het - in 1994.
Die lang gaping tussen die skryf van 'n proefskrif en algemene erkenning het 'n toets vir 'n wiskundige geword. Genius sonder erkenning het ernstige geestesversteurings tot gevolg gehad, maar John Nash was in staat om hierdie probleem op te los danksy sy uitstekende logiese verstand. Sy Nash Equilibrium-teorie het 'n Nobelprys gewen en sy lewe is in Beautiful mind verfilm.
Kortliks oor spelteorie
Aangesien die Nash-ewewigsteorie die gedrag van mense in die toestande van interaksie verduidelik, is dit die moeite werd om die basiese konsepte van spelteorie te oorweeg.
Spelteorie bestudeer die gedrag van deelnemers (agente) in terme van interaksie met mekaar soos 'n speletjie, wanneer die uitkoms afhang van die besluit en gedrag van verskeie mense. Die deelnemer neem besluite op grond van sy voorspellings oor die gedrag van ander, wat die spelstrategie genoem word.
Daar is ook 'n dominante strategie waarin die deelnemer die beste resultaat kry vir enige gedrag van ander deelnemers. Dit is die speler se beste wen-wen-strategie.
Prisoner's-dilemma en wetenskaplike deurbraak
Prisoner's-dilemma is 'n geval van 'n speletjie waar deelnemers gedwing word om rasionele besluite te neem en 'n gemeenskaplike doelwit te bereik in die lig van 'n konflik van alternatiewe. Die vraag is watter van hierdie opsies hy sal kies, met die besef van persoonlike en algemene belangstelling, asook die onmoontlikheid om albei te kry. Dit lyk of die spelers in 'n moeilike spelomgewing gevange gehou word, wat hulle soms baie produktief laat dink.
Hierdie dilemma is deur die Amerikaanse wiskundige John Nash ondersoek. Die balans wat hy getref het, was op sy eie manier revolusionêr. Hierdie nuwe gedagte het veral die mening van ekonome beïnvloed oor hoe markspelers keuses maak, met inagneming van die belange van ander, met noue interaksie en kruising van belange.
Dit is die beste om spelteorie deur middel van konkrete voorbeelde te bestudeer, aangesien hierdie wiskundige dissipline self nie droogteoreties is nie.
Prisoner's dilemma-voorbeeld
Voorbeeld, twee mense het 'n roof gepleeg, in die hande van die polisie geval en word in aparte selle ondervra. Terselfdertyd bied polisiebeamptes aan elke deelnemer gunstige voorwaardes waaronder hy vrygelaat sal word as hy teen sy lewensmaat getuig. Elk vanmisdadigers het die volgende stel strategieë wat hy sal oorweeg:
- Albei getuig terselfdertyd en kry 2,5 jaar tronkstraf.
- Albei swyg terselfdertyd en ontvang elk 1 jaar, want in hierdie geval sal die bewysbasis van hul skuld min wees.
- Die een getuig en word vrygelaat, terwyl die ander een swyg en 5 jaar tronkstraf kry.
Natuurlik hang die uitkoms van die saak af van die besluit van albei deelnemers, maar hulle kan nie saamstem nie, want hulle sit in verskillende selle. Die konflik van hul persoonlike belange in die stryd om 'n gemeenskaplike belang is ook duidelik sigbaar. Elkeen van die gevangenes het twee opsies vir optrede en 4 opsies vir uitkomste.
Ketting van logiese afleidings
So, oortreder A oorweeg die volgende opsies:
- Ek swyg en my maat swyg - ons sal albei 1 jaar tronkstraf kry.
- Ek gee my maat in en hy gee my in - ons kry albei 2,5 jaar tronkstraf.
- Ek is stil, en my maat verraai my - ek sal 5 jaar tronkstraf kry, en hy sal vry wees.
- Ek gee my maat oor, maar hy swyg - ek kry vryheid, en hy kry 5 jaar tronkstraf.
Kom ons gee 'n matriks van moontlike oplossings en uitkomste vir duidelikheid.
Tabel van moontlike uitkomste van die gevangene se dilemma.
Die vraag is, wat sal elke deelnemer kies?
"Wees stil, jy kan nie praat nie" of "Jy kan nie stil wees nie, jy kan nie praat nie"
Om die deelnemer se keuse te verstaan, moet jy deur die ketting van sy gedagtes gaan. Na aanleiding van die redenasie van misdadiger A: as ek stilbly en my maat bly stil, sal ons 'n minimum termyn (1 jaar) ontvang, maar ekEk weet nie hoe hy hom gaan optree nie. As hy teen my getuig, dan is dit beter vir my om te getuig, anders kan ek vir 5 jaar sit. Ek sit eerder vir 2,5 jaar as 5 jaar. As hy stilbly, dan moet ek des te meer getuig, want so sal ek my vryheid kry. Deelnemer B.
Dit is nie moeilik om te sien dat die oorheersende strategie vir elkeen van die oortreders is om te getuig nie. Die optimale punt van hierdie speletjie kom wanneer beide misdadigers getuig en hul "prys" ontvang - 2,5 jaar in die tronk. Nash-speletjieteorie noem dit ewewig.
Nie-optimale optimale Nash-oplossing
Die revolusionêre aard van die Nasjiaanse siening is dat so 'n ewewig nie optimaal is wanneer die individuele deelnemer en sy eiebelang in ag geneem word nie. Die beste opsie is immers om stil te bly en vry te gaan.
Nash-ewewig is 'n punt van konvergensie van belange, waar elke deelnemer slegs die opsie kies wat vir hom optimaal is as ander deelnemers 'n sekere strategie kies.
As die opsie oorweeg word wanneer beide misdadigers stil is en slegs 1 jaar ontvang, kan ons dit 'n Pareto-optimale opsie noem. Dit is egter slegs moontlik as die misdadigers vooraf kon ooreenkom. Maar selfs dit sal nie hierdie uitkoms waarborg nie, aangesien die versoeking groot is om van die ooreenkoms terug te trek en straf te vermy. Die gebrek aan volkome vertroue in mekaar en die gevaar om 5 jaar gedwing te word om die opsie met erkenning te kies. Dink na oor waaraan deelnemers sal voldoenopsie met stilte, in konsert optree, is eenvoudig irrasioneel. So 'n gevolgtrekking kan gemaak word as ons die Nash-ewewig bestudeer. Voorbeelde bewys net dat jy reg is.
Selfsugtig of rasioneel
Die Nash Equilibrium Theory het verrassende gevolgtrekkings opgelewer wat die beginsels wat voorheen bestaan het, weerlê het. Adam Smith het byvoorbeeld die gedrag van elkeen van die deelnemers as heeltemal selfsugtig beskou, wat die sisteem in balans gebring het. Hierdie teorie is die "onsigbare hand van die mark" genoem.
John Nash het gesien dat as alle deelnemers in hul eie belang optree, dit nooit tot 'n optimale groepresultaat sal lei nie. Gegewe dat rasionele denke inherent aan elke deelnemer is, is die keuse wat die Nash-ewewigstrategie bied meer waarskynlik.
Suiwer manlike eksperiment
'n Goeie voorbeeld is die blonde paradoksspeletjie, wat, hoewel dit oënskynlik uit plek is, 'n duidelike illustrasie is van hoe Nash-speletjieteorie werk.
In hierdie speletjie moet jy jou voorstel dat 'n geselskap van gratis ouens na 'n kroeg gekom het. Daar naby is 'n geselskap meisies, waarvan een verkieslik is bo ander, sê 'n blondine. Hoe tree ouens op om die beste meisie vir hulself te kry?
So, die redenasie van die ouens: as almal met die blondine begin kennis maak, dan sal niemand dit heel waarskynlik kry nie, dan sal haar vriende nie wil kennis maak nie. Niemand wil die tweede terugval wees nie. Maar as die seuns kies om te vermyblond, dan is die waarskynlikheid dat elkeen van die ouens 'n goeie vriendin tussen die meisies sal vind groot.
Die Nash-ewewigsituasie is nie optimaal vir ouens nie, want, om net hul eie selfsugtige belange na te streef, sal almal die blondine kies. Dit kan gesien word dat die najaag van slegs selfsugtige belange gelykstaande sal wees aan die ineenstorting van groepsbelange. Nash-ewewig sal beteken dat elke ou in sy eie belange optree, wat in kontak is met die belange van die hele groep. Dit is nie die beste opsie vir almal persoonlik nie, maar die beste vir almal, gebaseer op die algehele strategie vir sukses.
Ons hele lewe is 'n speletjie
Besluitneming in die regte wêreld is baie soos 'n speletjie waar jy sekere rasionele gedrag ook van ander deelnemers verwag. In besigheid, by die werk, in 'n span, in 'n maatskappy, en selfs in verhoudings met die teenoorgestelde geslag. Van groot transaksies tot gewone lewensituasies, alles gehoorsaam die een of ander wet.
Natuurlik is die bogenoemde speletjiesituasies met misdadigers en 'n kroeg net uitstekende illustrasies wat die Nash-ewewig demonstreer. Voorbeelde van sulke dilemmas kom baie dikwels in die regte mark voor, en dit werk veral in gevalle waar twee monopoliste die mark beheer.
gemengde strategieë
Dikwels is ons betrokke by nie een nie, maar verskeie speletjies op een slag. Kies een van die opsies in een speletjie, gelei deur 'n rasionele strategie, maar jy eindig in 'n ander speletjie. Na 'n paar rasionele besluite kan jy vind dat jou resultaat nie na wense is nie. Watneem?
Kom ons oorweeg twee tipes strategie:
- Suiwer strategie is die deelnemer se gedrag, wat spruit uit dink oor die moontlike gedrag van ander deelnemers.
- Gemengde strategie of ewekansige strategie is die afwisseling van suiwer strategieë lukraak of die keuse van 'n suiwer strategie met 'n sekere waarskynlikheid. Hierdie strategie word ook ewekansig genoem.
As hierdie gedrag in ag geneem word, kry ons 'n nuwe blik op die Nash-ewewig. As daar vroeër gesê is dat die speler een keer 'n strategie kies, kan 'n ander gedrag voorgestel word. Daar kan aanvaar word dat die spelers 'n strategie lukraak met 'n sekere waarskynlikheid kies. Speletjies wat nie Nash-ewewighede in suiwer strategieë kan vind nie, het hulle altyd in gemengde strategieë.
Nash-ewewig in gemengde strategieë word gemengde ekwilibrium genoem. Dit is 'n ewewig waar elke deelnemer die optimale frekwensie kies om sy strategieë te kies, mits ander deelnemers hul strategieë met 'n gegewe frekwensie kies.
Strafskoppe en gemengde strategie
'n Voorbeeld van 'n gemengde strategie kan gevind word in die spel van sokker. Die beste illustrasie van 'n gemengde strategie is miskien 'n strafdoel. So, ons het 'n doelwagter wat net in een hoek kan spring, en 'n speler wat die strafskop sal neem.
So, as die eerste keer dat die speler die strategie kies om na die linkerhoek te skiet, en die doelwagter val ook in hierdie hoek en vang die bal, hoe kan dinge die tweede keer ontwikkel? As die spelerin die teenoorgestelde hoek sal slaan, is dit heel waarskynlik te duidelik, maar om in dieselfde hoek te slaan is nie minder voor die hand liggend nie. Daarom het beide die doelwagter en die skopper geen ander keuse as om op lukrake keuse staat te maak nie.
Dus, deur ewekansige keuse met 'n sekere suiwer strategie af te wissel, probeer die speler en die doelwagter om die maksimum resultaat te kry.