Kas ir atpakaļejošā indukcija?
Atpakaļejoša indukcija spēļu teorijā ir iteratīvs process, ar kuru tiek argumentēts atpakaļ laika gaitā, sākot no problēmas vai situācijas beigām, lai atrisinātu ierobežotas ekstensīvas formas un secīgas spēles un izsecinātu optimālu darbību secību.
Paskaidrojums par atpakaļejošu indukciju
Retrospektīvā indukcija ir izmantota spēļu risināšanai, jo Džons fon Neimans un Oskars Morgensterns izveidoja spēles teoriju kā akadēmisku priekšmetu, kad viņi 1944. gadā publicēja grāmatu “Spēļu teorija un ekonomiskā uzvedība ”.
Katrā spēles posmā atpakaļejoša indukcija nosaka tā spēlētāja optimālo stratēģiju, kurš spēlē veic pēdējo kustību. Pēc tam tiek noteikta nākamā spēlētāja, kurš kustas, optimālā darbība, veicot pēdējā spēlētāja darbību, kā norādīts. Šis process turpinās atpakaļgaitā, līdz katrā laika posmā ir noteikta labākā darbība. Faktiski viens nosaka katras spēles oriģinālās spēles Nash līdzsvaru.
Tomēr rezultāti, kas iegūti no atpakaļejošas indukcijas, bieži vien nespēj paredzēt faktisko cilvēka spēli. Eksperimentālie pētījumi parādīja, ka “racionāla” uzvedība (kā to paredz spēles teorija) reālajā dzīvē tiek reti parādīta. Neracionāli spēlētāji faktiski var iegūt lielākas izmaksas, nekā prognozēts ar atpakaļejošu indukciju, kā parādīts simtkāju spēlē.
Simtgades spēlē divi spēlētāji pārmaiņus iegūst iespēju ņemt lielāku daļu no pieaugošā naudas poda vai nodot katlu otram spēlētājam. Izmaksas tiek sakārtotas tā, ka gadījumā, ja pot tiek nodots pretiniekam un pretinieks ņem pot nākamajā kārtā, viens saņem nedaudz mazāk nekā tad, ja kāds būtu paņēmis pot šajā kārtā. Spēle noslēdzas, tiklīdz spēlētājs paņem atlicināt, un tas saņem lielāku daļu, bet otrs spēlētājs saņem mazāku daļu.
Retrospektīvās indukcijas piemērs
Piemēram, pieņemsim, ka spēlētājs A dodas pirmais, un viņam jāizlemj, vai viņam vajadzētu “ņemt” vai “nodot” atlicināt, kuras pašreizējā summa ir 2 USD. Ja viņš ņem, tad A un B iegūst pa vienam USD 1, bet, ja A tiek izturēts, lēmums par pieņemšanu vai nodošanu tagad jāpieņem spēlētājam B. Ja B pieņem, viņa saņem 3 USD (ti, iepriekšējā atmaksa 2 USD + 1 USD). un A iegūst 0 USD. Bet, ja B iet garām, A tagad izlemj, vai ņemt, vai iet utt. Ja abi spēlētāji vienmēr izvēlas piespēli, katrs spēles beigās saņem 100 USD lielu atlīdzību.
Spēles jēga ir tāda, ja A un B abi sadarbojas un turpina spēlēt līdz spēles beigām, viņi saņem maksimālo izmaksu USD 100 apmērā. Bet, ja viņi neuzticas otram spēlētājam un sagaida, ka viņi pie pirmās izdevības “paņems”, Nešs līdzsvara prognozē, ka spēlētāji uzņemsies pēc iespējas mazāku prasību (šajā gadījumā USD 1).
Šīs spēles Neša līdzsvars, kad nevienam spēlētājam nav stimula novirzīties no izvēlētās stratēģijas, apsverot pretinieka izvēli, liek domāt, ka pirmais spēlētājs ņemtu katlu pašā spēles pirmajā kārtā. Tomēr patiesībā salīdzinoši maz spēlētāju to dara. Tā rezultātā viņi saņem augstāku izmaksu nekā izmaksa, kas tika prognozēta līdzsvara analīzē.
Secīgu spēļu risināšana, izmantojot atpakaļejošu indukciju
Zemāk ir vienkārša secīga spēle starp diviem spēlētājiem. Etiķetes ar tajās esošo 1. un 2. spēlētāju ir attiecīgi informācijas komplekti spēlētājiem viens vai divi. Skaitļi iekavās koka apakšā ir izmaksas attiecīgajā punktā. Spēle ir arī secīga, tāpēc 1. spēlētājs pieņem pirmo lēmumu (pa kreisi vai pa labi), bet 2. spēlētājs pieņem lēmumu pēc 1. spēlētāja (uz augšu vai uz leju).
1. attēls
Retrospektīvā indukcija, tāpat kā visa spēles teorija, izmanto racionalitātes un maksimizācijas pieņēmumus, kas nozīmē, ka 2. spēlētājs maksimāli palielinās savu izmaksu katrā konkrētajā situācijā. Jebkurā no informācijas kopām mums ir divas izvēles, kopumā četras. Izslēdzot izvēles, kuras 2. spēlētājs neizvēlas, mēs varam sašaurināt savu koku. Tādā veidā mēs treknrakstam līnijas, kas maksimāli palielina spēlētāja izmaksas pie dotās informācijas kopas.
2. attēls
Pēc šī samazinājuma 1. spēlētājs var maksimizēt savas izmaksas tagad, kad 2. spēlētāja izvēles ir zināmas. Rezultātā tiek panākts līdzsvars, atgriezeniski stimulējot 1. spēlētāju izvēlēties “pareizo” un 2. spēlētāju izvēloties “augšā”. Zemāk ir spēles risinājums ar līdzsvarotu ceļu, kas izvirzīts treknrakstā.
3. attēls
Piemēram, var viegli izveidot spēli, kas līdzīga iepriekšminētajai, izmantojot spēlētājus kā uzņēmumus. Šajā spēlē varētu būt ietverti produktu izlaišanas scenāriji. Ja 1. uzņēmums vēlētos izlaist produktu, ko uzņēmums 2 varētu darīt, reaģējot? Vai uzņēmums 2 izlaidīs līdzīgu konkurējošu produktu? Prognozējot šī jaunā produkta pārdošanu dažādos scenārijos, mēs varam izveidot spēli, lai paredzētu, kā notikumi varētu izvērsties. Zemāk ir piemērs, kā varētu modelēt šādu spēli.
4. attēls
