SPIS TRE CI
WST P
Streszczenie
Podsumowanie ksi ki
Wymagania wst pne
Lektura uzupe niaj ca
Podzi kowania
Rozdzia 1
Wprowadzenie
1.1. Interakcja strategiczna
1.1.1. Gry strategiczne
1.1.2. Gry koalicyjne
1.1.3. Wybór spo eczny i projektowanie mechanizmów
1.2. Przyk ady
1.2.1. Stabilne dopasowania
1.2.2. Problem targowania si
1.2.3. Równowaga transportu
1.2.4. Aukcje
1.2.5. Paradoks Condorceta
1.2.6. Gra ewolucyjna
1.2.7. Gra stochastyczna
1.2.8. Gra powtarzana
1.3. Notacje i podstawowe poj cia
1.3.1. Gry strategiczne
1.3.2. Dominacja
1.3.3. Iterowana eliminacja
1.3.4. Najlepsza odpowied
1.3.5. Mieszane rozwini cia
1.4. Informacja i racjonalno
1.4.1. Strategia dominuj ca i wynik zdominowany
1.4.2. Dominacja i optimum w sensie Pareto
1.4.3. Kolejno eliminacji
1.4.4. Hipotezy wiedzy
1.4.5. Dominacja a strategie mieszane
1.4.6. Gry dynamiczne a przewidywania.
1.5. wiczenia
Rozdzia 2
Gry o sumie zerowej: przypadek sko czony
2.1. Wprowadzenie
2.2. Warto i strategie optymalne
2.3. Regu a minimaksu
2.4. W asno ci zbioru strategii optymalnych
2.5. Twierdzenia Loomisa i Ville’a
2.6. Przyk ady
2.7. Gra kcyjna
2.8. wiczenia
2.9. Komentarze.
Rozdzia 3
Gry o sumie zerowej: przypadek ogólny
3.1. Wprowadzenie
3.2. Twierdzenia o minimaksie w przypadku strategii czystych
3.3. Regu y minimaksu w strategiach mieszanych
3.4. Operator warto ci i gra pochodna
3.5. wiczenia
3.6. Komentarze.
4.1. Wprowadzenie
4.2. Notacja i terminologia
4.3. Dominacja najlepszej odpowiedzi w grach sko czonych
4.4. Racjonalizowalno w zwartych grach ci g ych
4.5. Punkty -równowagi i równowagi Nasha: de nicja
4.6. Równowaga Nasha w grach sko czonych
4.7. Równowaga Nasha w grach ci g ych
4.7.1. Istnienie równowag w strategiach czystych
4.7.2. Istnienie równowag w strategiach mieszanych
4.7.3. Charakterystyka i jedyno równowagi Nasha
4.8. Gry nieci g e .
4.8.1. Rozwi zanie Reny’ego dla gier nieci g ych
4.8.2. Równowagi Nasha w grach nieci g ych
4.8.3. Przybli one równowagi Nasha w grach nieci g ych
4.9. Semialgebraiczno zbioru równowag Nasha
4.10. Uzupe nienie .
4.10.1. Wykonalne wyp aty i punkt gro by
4.10.2. Niezmienno , symetria, punkty ogniskowe i wybór równowagi
4.10.3. Zachowanie Nasha kontra zachowanie ostro ne
4.10.4 Wp yw wiedzy powszechnej na gr
4.11. Twierdzenia o punktach sta ych
4.12. wiczenia .
4.13. Komentarze.
Rozdzia 5
Rozmaito i dynamika równowag
5.1. Wprowadzenie
5.2. Uzupe nienie dotycz ce równowag
5.2.1. Równowagi i nierówno ci wariacyjne
5.2.1.1. Gry sko czone
5.2.1.2. Gry wkl s e
5.2.1.3. Gry populacyjne.
5.2.1.4. Ogólna ewaluacja
5.2.2. Gry potencjalne.
5.2.2.1. Gry sko czone
5.2.2.2. Gry ewaluacyjne
5.3. Rozmaito ci równowag
5.4. Pola wektorowe Nasha i dynamiki
5.5. Równowagi i ewolucja
5.5.1. Dynamiki replikatorów
5.5.2. Papier, kamie , no yce
5.5.3. Gry potencjalne.
5.5.4. Inne dynamiki
5.5.4.1. Dynamika replikatora
5.5.4.2. Dynamika Browna–von Neumanna–Nasha
5.5.4.3. Dynamika Smitha.
5.5.4.4. Dynamika najlepszej odpowiedzi
5.5.5. W asno ogólna
5.5.6. ESS
5.6. wiczenia
5.7. Komentarze. .
Rozdzia 6
Gry w postaci ekstensywnej
6.1. Wprowadzenie
6.2. Gry w postaci ekstensywnej z informacj doskona
6.2.1. Opis .
6.2.2. Strategia i posta normalna
6.2.3. Pó zredukowana posta normalna
6.2.4. Zdeterminowanie gier sko czonych z informacj doskona
6.2.5. Natura jako gracz
6.2.6. Równowaga doskona a w podgrach
6.2.7. Gry niesko czone z informacj doskona
6.3. Gry w postaci ekstensywnej z informacj niedoskona
6.3.1. Zbiory informacyjne
6.3.2. Redukcja postaci normalnej
6.3.3. Strategie randomizowane
6.3.4. Pami doskona a .
6.3.5. Równowaga Nasha w strategiach behawioralnych
6.4. Doskonalenie równowagi w grach w postaci ekstensywnej
6.4.1. Równowaga doskona a w podgrach
6.4.2. Równowagi doskona e sekwencyjne i bayesowskie
6.5. Udoskonalenie równowagi w grze o postaci normalnej
6.6. Powi zania mi dzy udoskonaleniami dla postaci ekstensywnych i normalnych.
6.7. Indukcja w przód i stabilno strategiczna
6.8. wiczenia
6.9. Komentarze.
Rozdzia 7
Równowagi skorelowane, uczenie si , równowagi bayesowskie
7.1. Wprowadzenie
7.2. Równowagi skorelowane
7.2.1. Przyk ady
7.2.2. Struktury informacyjne i gry rozszerzone
7.2.3. Równowaga skorelowana
7.2.4. Korelacja kanoniczna
7.2.5. Charakterystyka
7.2.6. Komentarze
7.3. Procedury bez alu
7.3.1. al zewn trzny
7.3.2. al wewn trzny
7.3.3. Kalibracja .
7.3.4. Zastosowanie w grach .
7.3.4.1. Zewn trzna niesprzeczno a zbiór Hannana
7.3.4.2. Wewn trzna niesprzeczno a równowagi skorelowane
7.4. Gry z informacj niekompletn (lub gry bayesowskie).
7.4.1. Strategie, wyp aty i równowagi
7.4.2. Uzupe nienia
7.5. wiczenia
7.6. Komentarze.
Rozdzia 8
Wprowadzenie do gier powtarzanych
8.1. Wprowadzenie
8.2. Przyk ady
8.3. Model standardowej gry powtarzanej
8.3.1. Historie i rozgrywki
8.3.2. Strategie
8.3.3. Wyp aty
8.4. Wykonalne i indywidualnie racjonalne wyp aty
8.5. Twierdzenia Ludowe
8.5.1. Jednolite twierdzenie Ludowe
8.5.2. Dyskontowe twierdzenie Ludowe
8.5.3. Sko czenie powtarzane twierdzenie Ludowe
8.5.4. Twierdzenia Ludowe dla doskona o ci w podgrach
8.5.4.1. Jednolite równowagi doskona e w podgrach
8.5.4.2. Dyskontowe równowagi doskona e w podgrach
8.5.4.3. Sko czenie powtarzane równowagi doskona e w podgrach
8.6. Rozszerzenie: gry stochastyczne, informacja niekompletna, sygna y
8.6.1. Gra powtarzana z sygna ami
8.6.2. Gry stochastyczne: Wielkie Dopasowanie (Big Match)
8.6.3. Gry powtarzane z informacj niepe n : Twierdzenie Cav u
8.6.3.1. Przypadek ogólny informacji jednostronnie niepe nej
8.7. wiczenia
Rozdzia 9
Rozwi zania wicze
9.1. Podpowiedzi dla rozdzia u 1 .
9.2. Podpowiedzi dla rozdzia u 2.
9.3. Podpowiedzi dla rozdzia u 3.
170
180
9.4. Podpowiedzi do rozdzia u 4
9.5. Podpowiedzi dla rozdzia u 5 . .
9.6. Podpowiedzi do rozdzia u 6
9.7. Podpowiedzi dla rozdzia u 7.
9.8. Podpowiedzi dla rozdzia u 8.
BIBLIOGRAFIA.
Nast puj cy wynik jest standardowym twierdzeniem o minimaksie dla strategii mieszanych. Zak adamy, e funkcja wyp at danej gry jest mierzalna i ograniczona, tak wi c mo emy stosowa twierdzenie Fubiniego i zde niowa mieszane rozszerzenie gry.
Twierdzenie 3.3.2. Niech G = (S, T, g ) b dzie gr o sumie zerowej tak , e:
(i) S i T s zwartymi topologicznymi przestrzeniami Hausdor a; (ii) dla ka dego t w T, g (· , t) jest pó ci g a z góry, a dla ka dego s w S, g (s, ·) jest pó ci g a z do u; (iii) g jest ograniczone i mierzalne w odniesieniu do produktu -algebry borelowskiej S T .
W takim przypadku mieszane rozszerzenie G oznaczane jako ( (S), (T ), g ) posiada warto , a dla ka dego > 0, ka dy z graczy dysponuje -optymaln strategi ze sko czonym wsparciem.
Dowód. Do gier G+ = ( (S ), f (T ), g) oraz G– = ( f (S), (T), g ) mo na zastosowa Stwierdzenie 3.3.1. Otrzymamy dzi ki temu, odpowiednio, warto ci υ + i υ –
W sposób oczywisty υ + υ –
Niech (wzgl. ) b dzie optymaln strategi gracza 1 w grze G+ (wzgl. gracza 2 w G–). Otrzymujemy wtedy:
A zatem, na mocy twierdzenia Fubiniego:
Dzi ki czemu otrzymujemy szukany wynik, co ko czy dowód.
Twierdzenie o minimaksie mo na otrzyma równie z pomoc twierdzenia o separacji w przestrzeniach euklidesowych.
Stwierdzenie 3.3.3. Za ó my, e:
(i) S jest mierzaln przestrzeni , a X jest niepustym wypuk ym zbiorem prawdopodobie stw nad S
(ii) T jest sko czonym, niepustym zbiorem
(iii) g: S × T jest mierzalna i ograniczona
W takim przypadku gra (X, (T), g ) posiada warto , a gracz 2 dysponuje optymaln strategi
Dowód. De niujemy υ = supX infT g (x, t) oraz D ={a ∈ R T :∃ x ∈ X , g ( x , t ) =
X g (s , t ) x (ds ) = a t , ∀t ∈ T }. Zbiór D jest wypuk y i rozdzielny z wypuk ym zbiorem
C ={a ∈ R T ; at v + ε, ∀t ∈ T }, przy dowolnie obranym > 0.
Na mocy standardowego twierdzenia o separacji w przestrzeni euklidesowej T, otrzymujemy istnienie w T pewnego b 0 o w asno ci takiej, e: b , d b , c ∀c ∈ C , ∀d ∈ D .
C jest dodatnio wszechstronny (ang. positively comprehensive ), z czego wynika, e b 0, za poprzez podzia b przez t ∈ T bt otrzymujemy istnienie pewnego y (T) spe niaj cego: g ( x , y ) v + ε ∀ x ∈ X .
Tak wi c v := inf Δ( T ) sup X g ( x , y ) v + ε . A zatem v = v i warto gry (X, (T), g ) istnieje. Istnienie optymalnej strategii dla gracza 2 wynika ze zwarto ci (T).
3.4. Operator warto ci i gra pochodna
Ustalamy zbiory strategii S i T i badamy zmienno funkcji wyp at. Rozwa my zbiór funkcji prowadz cych z S × T do o w asno ci takiej, e:
(a) jest wypuk ym sto kiem (t. j. jest stabilny wzgl dem dodawania i mnoenia przez skalar dodatni oraz 0 ) zawieraj cym funkcje sta e oraz
(b) dla ka dego f w gra (S, T, f) ma warto , któr oznacza b dziemy val S × T ( f ) = sups
inf
T f (s , t ) = inf
Oczywistym jest, e operator val:
S f (s , t ), lub pro ciej przez val( f ).
(1) jest monotoniczny: f g ⇒ val( f ) val(g ); oraz
(2) przesuwa sta e: ∀t ∈ R, val( f + t ) = val( f ) + t Wynika z tego atwy do wysnucia wniosek, w którym mo na u y f = sup S × T | f (s , t )|.
Stwierdzenie 3.4.1. Operator val jest nieekspansywny: |val( f ) val(g )| f g .
Dowód. Z tego, e f g + || f g || wynika, na mocy (1), val( f ) val(g + || f g ||), za ostatnim wyra eniem jest val(g ) + || f g || , na mocy (2).
(2) Niech C b dzie niepustym wypuk ym zwartym podzbiorem K, za F – póci g z góry korespondencj o zwartych, wypuk ych i niepustych warto ciach prowadz c z C do tego zbioru.
De niujemy przez indukcj gry Gn = G(x1, …, xn; y1, …, yn) w jak nast puje: x1 jest dowolne, y1 F(x1) dla danej równowagi ( n, n) w Gn, wprowadzamy x n +1 = n i =1 τn (i ) yi tak, jak powy ej, a nast pnie yn+1 F(xn+1).
(a) Niech x b dzie punktem akumulacji ci gu {xn}. Niech > 0 za N niech b dzie takie, e xN+1 oraz xm B(x , ) dla pewnego m N. Rozwa my równowag ( N , N) w GN = G(x1, …, xN; y1, …, yN) i wykaza , e {xi, i S( N )} B(x , 3 ) oraz {xi, i S( N )} B(x , 3 ) Wywnioskowa , e xN+1 ∈ co{ z F ( z ); z ∈ B ( x ∗ , 3ε)} .
(b) Wywnioskowa istnienie punktu sta ego dla F
wiczenie 7. Gry wypuk e [155]
Gra wypuk a jest dana przez zbiory strategii Si i funkcji wyp at Gi z S = j ∈ I S j do , i I spe niaj cych:
(i) Si jest zwartym wypuk ym podzbiorem przestrzeni euklidesowej, dla ka dego i I.
(ii) Gi(·, s i) jest wkl s a na Si, dla ka dego s –i, dla ka dego i I.
(iii) n i =1 G i jest ci g a na S.
(iv) Gi(si, ·) jest ci g a na S–i dla ka dego si, dla ka dego i I.
Wprowadzamy funkcj zde niowan na S × S poprzez:
Φ(s , t ) = n i =1 G i (si , t i ).
(1) Udowodni , e t jest równowag Nasha wtw
Φ(s , t ) Φ(t , t ), ∀s ∈ S .
(2) Wyka my istnienie równowagi gry wypuk ej.
Za o enie dowodu nie wprost: przypu my, e dla ka dego t S istnieje takie s S, e
Φ(s , t )>Φ(t , t ).
(a) Wykaza , e rodzina
( Os ={t ∈ S ; Φ(s , t )>Φ(t , t )})s ∈ S de niuje otwart otoczk S.
(b) Wywnioskowa istnienie sko czonej rodziny (sk)k K takiej, e
∀t ∈ S , max k ∈ K Φ(s k , t )>Φ(t , t ).
(c) Zaobserwowa , e zde niowane poprzez
Θ(t ) = k ∈ K φk (t )s k k φk (t ) ,
o w asno ci takiej, e φk (t ) = (Φ(s k , t ) Φ(t , t ))+ jest odwzorowaniem
ci g ym ze zbioru S w ten e, a st d istnienie punktu sta ego t* dla .
(d) Wreszcie otrzyma sprzeczno , jako e φk (t ∗ )> 0 poci ga Φ(s k , t ∗ )>
Φ(t ∗ , t ∗ ).
4.13. Komentarze
Poj cie równowagi Nasha (wraz z dowodem jej istnienia) po raz pierwszy pojawi o si w rozprawie Nasha. Nast pnie Nash przeprowadzi kilka dowodów dla ró nych ram, ale wszystkie z nich dotyczy y argumentu z punktu sta ego.
Przeprowadzono wcze niej kilka prób sformu owania podobnego poj cia (poczynaj c od Cournota), jednak czym interesuj cym jest zaobserwowa , e de nicje formalne pojawi y si w tym samym okresie, co kilka wyników odpowiadaj cych u ytym narz dziom (Fan, Kakutani) – tak samo, jak powi zany, osadzony w teorii ekonomicznej dowód istnienia ogólnej równowagi (Arrow, Debreu), podczas gdy odpowiadaj ce temu poj cie wypracowane zosta o przez Walrasa znacznie wcze niej.
Powi zanie mi dzy równowagami a warto ciami/strategiami optymalnymi w grach o sumie zerowej jest podchwytliwe: istnienie warto ci poci ga istnienie -równowag dla wszystkich > 0. Jednak dla danych strategii optymalnych (s, t) warunek optymalno ci dla gracza 1: g (s , t ) g (s , t )(= v), ∀t odpowiada najlepszej odpowiedzi (lub warunkowi równowagi) gracza 2. W terminach zwi zanych z warto ci gry ustala si wyp at i zmienia strategie pozosta ego gracza, a w równowadze dany gracz porównuje to do w asnego zestawu strategii.
Zauwa my równie , e w zale no ci od kontekstu interpretacja równowag mo e by ró na. W oryginalnym sformu owaniu Nasha pro l równowagi s jest norm albo odniesieniem, za warunkiem równowagi jest w asno , któr ka dy z graczy spe nia dla danej swojej funkcji wyp at. W szczególno ci fakt, e dane s stanowi równowag nie jest znany graczom, jako e i nie zna g –i, a wi c nie mo e sprawdzi warunków zaistnienia równowagi.
U innych autorów, s jest pewn kolekcj przekona , za s –i to przekonania gracza i na temat zachowania swoich przeciwników. Wtedy informacje po grze s istotne, mo na na przyk ad sprawdzi , czy rzeczywiste ruchy przeciwników s zgodne z tymi przekonaniami. Bardziej ogólnie rzecz ujmuj c, w obecno ci sygna ów prowadzi to do sformu owania poj cia przypuszczalnych lub samopotwierdzaj cych si równowag (patrz wi cej komentarzy w [200]). Gracze mog równie ywi osobiste przekonania, które s cznie niespójne, ale dla ka dego gracza zgodne z jego obserwacjami (Selten).
wiczenie 3. Równowagi skorelowane vs. Nasha: istnienie (Peleg [162])
(1) Wykaza , e nast puj ca gra:
b1 b2 b3
a1 (−∞, −∞) (3, 1) (0, 2)
a2 (1, 3) (0, 0) (1, −∞)
a3 (2, 0) (−∞, 1) (0, 0)
nie posiada równowagi Nasha, ale ka dy rozk ad o postaci:
b1 b2 b3
a1 0 α 0
a2 β γ 0
a3 0 0 0
gdzie > 0 jest rozk adem skorelowanych równowag.
(2) Rozwa y gr z niesko czonym przeliczalnym zbiorem graczy * = {1, 2, 3, …}. Przyj , e ka dy gracz dysponuje dwiema strategiami 0 lub 1 (tak wi c S i = {0, 1}). Funkcja wyp at gracza i jest nast puj ca:
g i (s ) = s i , s i , w przeciwnym przypadku. je li j s j < ∞
(a) Wykaza , e nie istniej równowagi Nasha w strategiach czystych,
(b) U y Lematu Borela–Cantellego, by udowodni , e nie istniej równie mieszane równowagi,
(c) Udowodni , e rozk ad μ = μ1 2 + μ2 2 na S = i S i = {0,1} * tworzy równowag skorelowan , gdzie
1 jest produktem rozk adów 1 = 1 i 1, gdzie μi 1 (s i = 1) = 1 i ,
2 jest cznym rozk adem, gdzie pro l (s 1 = 1, …, s i = 1, s i+1 = 0, …, s n = 0, …) posiada prawdopodobie stwo 1 i 1 i +1 = 1 i (i +1) . (Zauwa my, e Pμ( s i = ∞) = 1, Pμ2 ( s i =∞) = 0 oraz Pμ2 (si = 1) = 1 i ).
wiczenie 4. Rozk ad równowag skorelowanych poprzez minimaks (Hart i Schmeidler [97])
Niech G b dzie strategiczn gr dwuosobow o zbiorach strategii S 1 i S 2 oraz wyp at g : S = S 1 × S 2 2. Rozwa my teraz gr dwuosobow i o sumie zerowej ze zbiorami strategii S i L = (S 1) 2 (S 2) 2 oraz wyp at zde niowan w sposób nast puj cy:
γ (s ; t i , u i ) = (g i (t i , s i ) g i (u i , s i ))1{t i =s i } .
, ,
(1) Sprawdzi , e posiada warto v oraz strategie optymalne, (2) Wykaza , e je li v 0 oraz Q (S) jest strategi optymaln gracza 1, to Q jest rozk adem równowag skorelowanych w G, (3) Niech (L) De niujemy p 1, prawdopodobie stwo przej cia w S 1 nastpuj co:
Niech teraz 1 b dzie prawdopodobie stwem przy niezmiennym S 1 pod p 1:
De niujemy p 2 i 2 i analogicznie niech = 1 × 2 . Wykaza , e wyp ata ( ; ) mo e zosta roz o ona na wyra enia o postaci
a nast pnie wywnioskowa , e ∀π ∈ Δ( L ), ∃φ ∈ Δ(
(4) Dowie istnienia rozk adu równowag skorelowanych w G, (5) Rozszerzy dowód do przypadku I graczy.
wiczenie 5. Równowagi skorelowane: przypadek sumy zerowej
(1) Rozwa my dwuosobow sko czon gr o sumie zerowej zde niowan przez g : S = S 1 × S 2 . Przy danym (S), niech g (π ) = s ∈
).
(a) Wykaza , e jedyn wyp at w równowagach skorelowanych g( ) wynosi v = val g.
(b) Niech CED(g ) oraz s 1 S 1 posiadaj dodatnie prawdopodobie stwo pod . Wykaza , e prawdopodobie stwo warunkowe (·|s 1) (S 2) stanowi optymaln strategi gracza 2.
(2) Rozwa my nast puj c gr o sumie zerowej [57]: