Bayesovská hra

Technology

12 hours ago

Author

Bayesovské hry jsou takové modely teorie her, které nemají omezení předpokladu kompletní informace, tedy nevyžadují úplnou znalost pravidel všemi hráči. Poprvé byly definovány v práci Johna C. Harsanyi.

Teorie her z uvedení Bayesovských her silně profitovala, protože ve většině reálných situací hráči nemají kompletní informace o situaci, ve které se nacházejí, ať už se to týká charakteristik ostatních hráčů, informacích o výsledcích her anebo vlastních alternativ v určitém bodě hry. Asymetrie informací je běžným aspektem, který se pomocí běžných konceptů teorie her také nedá simulovat.

Podrobněji

Bayesovský přístup k modelování neurčitosti spočívá v přiřazení subjektivního pravděpodobnostního rozdělení pro charakteristiky, které hráči nejsou s určitostí známé. Každý hráč si takto vytvoří určitý předpoklad o charakteristikách ostatních hráčů. +more Předpoklady ostatních hráčů o konkrétním hráči jsou mu též neznámé, jinými slovy neví, co vědí hráči ostatní. Vzhledem k tomu, že předpoklady ostatních hráčů představují důležitou informaci, která ovlivňuje chování hráče, musí hráč vytvořit očekávání o očekáváních ostatních hráčů. Chování hráče však není ovlivnitelné pouze očekáváními o charakteristikách ostatních hráčů, očekáváním o očekáváních ostatních hráčů, ale i tím, jaká jsou očekávání o očekáváních o očekáváních ostatních hráčů. Takovýto způsob analýzy by vedl k nekonečné řadě pravděpodobnostních rozdělení a z toho výplývajícím rozsáhlým a komplikovaným modelům.

Harsanyi jako první představil návrh transformovat hru s nekompletními informacemi na hru s informacemi kompletními, ale nedokonalými. V Bayesovských hrách je neurčitost o určité charakteristice modelována jako její pravděpodobnostní rozdělení. +more Neurčitost o charakteristikách ostatních hráčů je v Bayesovských hrách vyjádřená pomocí neurčitosti o užitkových funkcích ostatních hráčů. Celkové soukromé informace o charakteristikách hráče ovlivňují jeho užitek a určují jeho typ. V instanci hry pozná každý hráč svůj vlastní typ, ale nepozná typy ostatních hráčů. Společné pravděpodobnostní rozdělení, podle kterého jsou na začátku hry hráčům přiřazené jejich typy, je v Bayesovské hře informací veřejnou. Jestliže o konkrétních typech, které byly přiřazeny hráčům náhodnými tahy na začátku hry, nemají hráči informace, jedná se o typ hry s nedokonalými informacemi. Pravidla pro Bayesovské hry se mírně odlišují od všeobecné definice her:.

Bayesovská hra je složena z následujících elementů:

* množina hráčů N = \{1 , . , n\} \,\. +more * akční prostor A = A_1 \times . \times A_n\,\. , kde A_i\,\. představuje množinu akcí hráče i\,\. pro i\in N * prostor typy T = T_1 \times . \times T_n\,\. , kde T_i\,\. je množina typů hráče i\,\. pro i\in N * pravděpodobnostní rozdělení typů P\in\Delta(T). Konkrétní typ hráče T_i\,\. bude označovaný jako t_i\in T_i * užitková funkce u_i(a,t)\,\. , která každé uspořádané dvojici (a,t)\in A \times T přiřadí hodnotu z \mathbb{R} pro i\in N.

Bayesovská hra je v této podobě rozšířením hry v strategickém tvaru o typy hráčů, rozdělení těchto typů a vyžaduje si i upravení užitkové funkce. Pouze poznamenejme, že odvození Bayesovské hry v extenzivní formě je obdobné.

Strategie představuje vyčerpávající akční plán. V Bayesovských hrách musí tedy každý hráč připravit svojí akci v závislosti na typu, který mu bude v konkrétní instanci hry známý. +more Strategií se proto v Bayesovských hrách myslí systém uspořádaných dvojic (a_i,t_i)\,\. pro \forall t_i\in T_i, anebo jinak funkcí z prostoru typů do prostoru akcí a_i = s_i(t_i)\,\. Důsledkem toho je, že se hráč může chovat v případě různých typů různě. Poněvadž hráč zná svůj vlastní typ ještě předtím, než vykoná svoje rozhodnutí, může se zdát určení akcí pro každý typ zvlášť redundantní. Ale typ určitého hráče není s určitostí znám ostatním hráčům. Proto jsou jejich rozhodnutí závislé na očekávání, jak se bude daný hráč chovat ve všech typech a i na pravděpodobnostním rozdělení těchto typů.

Smíšená strategie hráče i\,\. pro Bayesovské hry představuje funkci z prostoru typů T_i\,\. +more do pravděpodobnostního rozdělení na množině akcí \Delta (A_i)\,\. Pravděpodobnostní rozdělení při strategii \sigma_i(t_i)\,\. a pravděpodobnost hraní akce a_i\,\. hráčem i\,\. , který má v dané hře typ t_i\,\. se bude označovat jako \sigma_i(a_i|t_i)\,\. Strategický prostor Bayesovské hry je označován jako \sum.

Očekávaný užitek hráče i\,\! pro smíšený strategický profil \sigma\,\! a daný profil typů t\,\! se vypočítá jako:

v_i(\sigma ,t) =\sum_{a\in A} (\prod_{j\in N-i} \sigma_j(a_j|t_j)) \times \sigma_i(a_i) \times u_i(a,t)

Očekávání hráče ohledně typu ostatních hráčů je vytvářené na základě pravděpodobnostního rozdělení \Delta (T_i)_{i\in N} a pravděpodobnost výskytu profilu typů t\,\. se vyjadřuje jako p(t) = p(t_1) \times . +more \times p(t_n). Poněvadž toto rozdělení je všem hráčům známé, předpokládá se, že jsou jejich očekávání navzájem konzistentní. Hráč zná svůj vlastní typ a pravděpodobnostní rozdělení všech typů, takže může pomocí Bayesova pravidla určit pravděpodobnost určité uspořádané (n-1)-tice typů ostatních hráčů: p(t_{-i}|t_i)=\frac{p(t)}{\sum_{t_{-i}\in T_{-i}}p(t_{-i},t_i)}.

Hráči mají informaci o pravděpodobnosti výskytu typů ostatních hráčů, ale před začátkem hry neznají svůj vlastní typ. Jejich apriorní očekávaný užitek v instanci hry, v které se hráči chovají podle strategického profilu \sigma\,\. +more, se dá vyjádřit následovně:.

w_i(\sigma )=\sum_{t\in T} p(t) \times v_i(\sigma,t)

Po zvolení typu hráče může hráč vypočítat svůj aposteriorní očekávaný užitek:

w_i(\sigma |t_i)=\sum_{t_{-i}\in T_{-i}} pi(t_{-i}|ti) \times v_i(\sigma ,t).

Bayesovo-Nashovo ekvilibrium

Tento koncept slouží k řešení Bayesovských statických her. I naproti odlišné struktuře těchto her se základní idea Nashova ekvilibria nemění. +more Každá strategie v tomto ekvilibriu musí být nejlepší odpovědí hráče na strategii ostatních hráčů. Bayesovo-Nashovo equilibrium ve hře H s neúplnou informací je Nashovo equilibrium ve hře H s nejistou informací, která je reprezentací původní hry H.

Strategický profil \sigma\,\! je Bayesovo-Nashovým ekvilibriem, jestliže platí jedna z dvou podmínek:

* w_i(\sigma *)\geq w_i(\sigma_i,\sigma_{-i}^*) pro \forall \sigma\in\sum_i\forall i\in N * w_i(\sigma *|t_i)\geq w_i(\sigma_i,\sigma_{-i}^*|t_i) pro \forall t_i\in T_i \sum\sigma_i\in\sum_i\forall i\in N

Z definice vyplývá, že Bayesovo-Nashovo ekvilibrium se dá určit dvěma způsoby. Průběh Bayesovké hry je charakteristický výběrem typů jednotlivých hráčů na jejím začátku. +more Po úvodní sérii pravděpodobnostních tahů je každému hráči přiřazeny jeho typ a hráči hrají dále stejně jako v standardní statické hře. Poněvadž hráči znají svůj vlastní typ, ale neznají typ ostatních hráčů, tak nevědí s určitostí, v které hře se právě nacházejí. Vědí určit pravděpodobnostní rozdělení her na základě jejich přesvědčení vzhledem k typům ostatních hráčů. Bayesovo-Nashovo ekvilibrium představuje takový strategický profil, v kterém žádný z hráčů nemůže dosáhnout lepší očekávaný užitek ani pro jeden ze svých typů. Každá konečná hra s neúplnou informací má alespoň jedno Bayesovo-Nashovo equilibrium.

Příklad - souboj pohlaví

ONA Hokej	2, 3	0, 0
ONA Divadlo	1, 1	3, 2

Bayesovo-Nashovo ekvilibrium si můžeme demonstrovat na známé hře souboj pohlaví. Nejdřív si ukažme standardní situaci (nalevo) řešenou pomocí Nashova equilibria. +more Manželská dvojice se rozhoduje, jak stráví večer. Má dvě možnosti: jít na hokejový zápas nebo do divadla. Oba manželé preferují společně strávený večer, ovšem ON dává přednost hokeji, zatímco ONA by raději zvolila návštěvu divadla. V tabulce ve tvaru dvoumatice jsou zaznamenány preference manželů v podobě výplat (uspokojení ze zvolené činnosti). U této hry bychom Nashova ekvilibria nalezli dvě (2, 3) a (3, 2) tedy trávit čas společně.

ONA Hokej	2, 1	0, 2
ONA Divadlo	1, 3	3, 0

Tabulka "preferuje samotu" ukazuje druhý typ hráče ON. Vyznačuje se stejnou užitkovou funkcí pro hráče ONA, ale ON tu má preference jiné. +more ON sice stále preferuje hokej před divadlem, nicméně v tomto případě chce jít sám. Hráč ONA nemá informace o tom jaký typ v této hře ON představuje, nicméně má přesvědčení, že ON z 80% preferuje společný večer a z 20% samotu. Tato hra se dá znázornit jako asociovaná hra v strategickém tvaru.

ONA Hokej	2, 2. 6	1. +more6, 2. 8	0. 4, 0. 2	0, 0. 4
ONA Divadlo	1, 1. 4	1. 4, 0. 8	2. 6, 2. 2	3, 1. 6

Zde nalezneme 2 čistá Nashova equilibria a to (1. 6, 2. +more8) a (2. 6, 2. 2). Ty představují tyto dva stavy: * pokud jde ON při společenské náladě na hokej a při nespolečenské do divadla je pro hráče ONA racionální jít na hokej * pokud jde ON při společenské náladě do divadla a při nespolečenské na hokej je pro hráče ONA racionální jít do divadla.

Important

Rozdělení pravděpodobnosti

Dokonalé Bayesovo ekvilibrium

Dokonalé Bayesovo ekvilibrium je vylepšením Nashova ekvilibria pro případ dynamických her s nedokonalými informacemi. Dynamické hry jsou hry v extenzivním tvaru. +more Kvůli tomu, aby se ekvilibrium nemuselo omezovat pouze na sekvenční podmínky v rámci pod-her, byl zaveden pojem přesvědčení. Přesvědčení přiřazuje pravděpodobnost vrcholu v rámci jedné informační množiny, což umožňuje výpočet očekávaného užitku i pro podstromy začínající ve vrcholu patřícímu do více početné informační množiny. Explicitní určení přesvědčení umožňuje ne jen stanovení dodatečných formálních požadavků vylepšující racionalitu ekvilibria, ale i posouzení přípustnosti ekvilibria s ohledem na dodatečné kritérium a jejich opodstatnění v realitě. Strategický profil se dá chápat jako scénář a pravděpodobnost scénáře by měla korespondovat s přesvědčeními zodpovídajícími danému ekvilibriovému profilu.

Hráči mají v každé informační množině I\,\. určité přesvědčení o tom, s jakou pravděpodobností se nacházejí ve vrcholu x\in I(x)\,\. +more Přesvědčení je tedy funkce, která přiřazuje každému vrcholu v informační množině číslo z intervalu [0;1]. Přitom platí, že součet pravděpodobností pro vrcholy v jedné informační množině se rovná 1. Pravděpodobnostní rozdělení pro všechny informační množiny vytvářejí systém přesvědčení \mu\,\. Přesvědčení jsou explicitně určené jako součást ekvilibria a spolu se takto uspořádaná dvojice složená ze systému přesvědčení a ze strategického profilu bude označovat jako přiřazení (\mu ,b)\,\. Sekvenční racionalita, která je základní vlastností tohoto ekvilibria, intuitivně znamená, že každé rozhodnutí musí být součástí ekvilibria pro zbytek hry a to pro začátek z kteréhokoliv vrcholu stromu hry pro dané přesvědčení. Teda i z vrcholů, které leží ve více početných informačních množinách. Formálně se sekvenční racionalita dá vyjádřit následující podmínkou:.

U_i((\mu ,b)|I_i)\geq U_i((\mu ,(b_{-i},b'_i))|I_i) pro \forall i\in N,\forall I_i.

Při ekvilibriových strategiích je důležitou vlastností konzistentnost přesvědčení vzhledem na Bayesovu větu. P(x|b)\,\. +more je pravděpodobnost, že vrchol x\,\. bude dosáhnutý, pokud se budou hráči chovat podle behaviorálního strategického profilu b\,\. Podobně p(I(x)|b)\,\. je pravděpodobnost dosáhnutí informační množiny, v které se x\,\. nachází, při hraní strategického profilu b\,\.

Dokonalé Bayesové ekvilibrium je přiřazení (\mu ,b)\,\!, které splňuje následující podmínky:

* (\mu ,b)\,\. je sekvenčně racionální v každém vrcholu * přesvědčení \mu\,\. +more jsou konzistentní vzhledem na Bayesovu větu vždy, když je to možné * strategický profil b\,\. je vzhledem na pod-hry dokonalý.

Reference

Kategorie:Teorie her Kategorie:Bayesovská statistika

5 min read

Share this post:

Like it 8