-
Notifications
You must be signed in to change notification settings - Fork 1
/
02_spieltheorie.tex
263 lines (215 loc) · 10 KB
/
02_spieltheorie.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
\chapter{%
Spieltheorie%
}
\section{%
Strategische Spiele%
}
Es folgen zwei Beispiele für \begriff{strategische Spiele}.
\textbf{Gefangenendilemma}:
Zwei Bankräuber $A, B$ wurden gefasst.
Man kann ihnen die Tat allerdings nicht nachweisen, man könnte sie nur wegen unerlaubten
Waf"|fenbesitzes zu jeweils 3 Jahren Gefängnis verurteilen.
Nun bietet der Staatsanwalt beiden Bankräubern getrennt an, ein Geständnis abzulegen,
um in den Genuss einer Kronzeugenregelung zu kommen.
Dazu darf der jeweils andere aber nicht gestehen.
Ist das der Fall, so kommt der Kronzeuge nur 1 Jahr ins Gefängnis und der andere 9 Jahre.
Gestehen jedoch beide, dann kommen beide für 7 Jahre ins Gefängnis.
$A$ und $B$ haben keine Möglichkeit, sich abzusprechen.
Wie sollen sie verfahren?
\textbf{Kampf der Geschlechter}:
Zwei Partner $A, B$ befinden sich an unterschiedlichen Orten.
$A$ will ins Stadion und $B$ will einkaufen.
Für beide gilt, dass sie am liebsten mit ihrem Partner am Lieblingsort wären.
Am zweitliebsten ist beiden, mit ihrem Partner am anderen Ort zu sein.
Am wenigsten gerne sind sie allein.
$A$ und $B$ können sich nicht absprechen.
Wo sollen sie hingehen?
\linie
\textbf{Entscheidungsmodell}:
Für solche Situationen ist ein allgemeines Entscheidungsmodell erforderlich.
Die Entscheidungen können erfolgen unter
\begin{itemize}
\item
\begriff{Gewissheit}
(alle Bedingungen/Konsequenzen sind bekannt),
\item
\begriff{Risiko}
(die Bedingungen sind nur mit bestimmter Wahrscheinlichkeit bekannt) und
\item
\begriff{Ungewissheit}
(die Bedingungen sind unbekannt).
\end{itemize}
\section{%
Modell für Spiele%
}
Im Folgenden beschränkt man sich auf höchstens zwei Spieler $A$ und $B$
mit $X \in \{A, B\}$.
\textbf{Spiele}:
Beide können ihre Handlungen (\begriff{Strategien}) aus Mengen $S_A$ bzw. $S_B$ wählen.
Bei einem \begriff{endlichen Spiel} sind $S_A := \{a_1, \dotsc, a_{n_A}\}$ und
$S_B := \{b_1, \dotsc, b_{n_B}\}$ endlich.
Ein \begriff{Spielzugpaar} ist ein Element aus $S := S_A \times S_B$.
Eine Funktion $u_X\colon S \to \real$ heißt \begriff{Auszahlungsfunktion}.
Bei einem endlichen Spiel erhält man \begriff{Nutzenmatrizen}
$U^X \in \real^{n_A \times n_B}$ mit
$U_{i,j}^X := u_X(a_i, b_j)$.
Beide Matrizen werden manchmal zur \begriff{Bimatrix}
$U^{AB} \in (\real^2)^{n_A \times n_B}$ mit Einträgen $U_{i,j}^{AB} = (U_{i,j}^A, U_{i,j}^B)$
zusammengefasst.
\textbf{Nullsummenspiel}:
Spiele mit $\forall_{s \in S}\; u_A(s) = -u_B(s)$ heißen \begriff{Nullsummenspiele}.
Bei einem endlichen Spiel ist dann $U^A = -U^B$ und es genügt eine Nutzenmatrix $U := U^A$.
Man spricht dann vom \begriff{Gewinnspieler} $A$ und vom \begriff{Verlustspieler} $B$.
\textbf{strategische Normalform}:
Der Strategieraum $S$ zusammen mit den Auszahlungsfunktionen $u_X$ heißt
\begriff{strategische Normalform}.
\textbf{Spiel mit vollständiger Information}:
Bei einem \begriff{Spiel mit vollständiger Information} kennen $A$ und $B$ beide die
vollständige Auszahlungsfunktion.
Im Folgenden geht es nur noch um endliche Spiele mit vollständiger Information.
\pagebreak
\section{%
Einpersonenspiele%
}
\textbf{Einpersonenspiel}:
Bei einem \begriff{Einpersonenspiel} oder \begriff{Spiel ohne Annahme über Gegner} trifft
$B$ die Wahl unabhängig von $A$ (z.\,B. Wetter).
Es gibt daher nur eine Nutzenmatrix $U = U^A$.
\textbf{Spiel bei Gewissheit}:
Wenn $A$ weiß, dass $B$ $b_j$ spielt, dann spielt $A$ natürlich $a_{\widehat{i}}$ mit\\
$\widehat{i} \in \{1, \dotsc, n_A\}$, sodass $U_{\widehat{i},j} = \max_i U_{i,j}$.
\textbf{Spiel bei Risiko}:
Wenn $A$ keine Information über die Wahl von $B$ hat, dann hängt die Wahl von $A$ von dessen
Mentalität ab.
\begin{itemize}
\item
\emph{risikobereiter Spieler}:
Ermögliche den maximalen Gewinn, d.\,h.\\
wähle $\widehat{i} \in \{1, \dotsc, n_A\}$
mit $\max_j U_{\widehat{i},j} = \max_i \max_j U_{i,j}$.
\item
\emph{vorsichtiger Spieler}:
Maximiere den garantierten Gewinn, d.\,h.\\
wähle $\widehat{i} \in \{1, \dotsc, n_A\}$
mit $\min_j U_{\widehat{i},j} = \max_i \min_j U_{i,j}$.
\end{itemize}
\textbf{weitere Strategien}:
Man kann für die Entscheidung von $B$ auch eine Wahrscheinlichkeitsverteilung ansetzen,
z.\,B. nach dem \begriff{Prinzip des unzureichenden Grunds} die Gleichverteilung
$\PP(b_j) = \frac{1}{n_B}$.
Das Ziel ist es dann, den Erwartungswert zu maximieren.
\section{%
Zweipersonenspiele%
}
Nun spielen $A$ und $B$ gleichzeitig, es gibt also einen Interessenskonflikt.
Zur Abkürzung verwendet man die Schreibweisen $-A := B$ und $-B := A$ für den jeweiligen Gegner.
\textbf{Reaktionsabbildung}:
Die \begriff{Reaktionsabbildung} ist definiert durch\\
$r_X\colon S_{-X} \to \P(S_X)$,
$r_X(y) := \{\widehat{x} \in S_X \;|\; u_X(\widehat{x}, y) = \max_{x \in S_X} u_X(x, y)\}$.
$r_X(y)$ ist die Menge der Spielzüge, die optimal sind, wenn man weiß, dass der Gegner $y$ spielt.
Bei unendlichen Strategiemengen muss das Maximum nicht notwendigerweise existieren.
\textbf{Gesamt-Reaktionsabbildung}:
Die \begriff{Gesamt-Reaktionsabbildung} ist definiert durch\\
$r\colon S \to \P(S)$,
$r(a, b) := r_A(b) \times r_B(a)$.
$r(a, b)$ ist die Menge aller Strategiepaare, bei denen $A$ optimal auf $b$ und $B$ optimal auf
$a$ reagiert.
\linie
\textbf{Beispiel}:
Für $U^{AB} := \smallpmatrix{(0, 20) & (30, 20)\\(10, 0) & (10, 10)}$ ist
$r(a_1, b_1) = \{(a_2, b_1), (a_2, b_2)\}$,\\
$r(a_1, b_2) = \{(a_1, b_1), (a_1, b_2)\}$,
$r(a_2, b_1) = \{(a_2, b_2)\}$ und
$r(a_2, b_2) = \{(a_1, b_2)\}$.
\textbf{Beispiel}:
Für $S_A := [0, 1] =: S_B$, $u_A(a, b) := 2ab - a - b$ und $u_B(a, b) := -u_A(a, b)$ ist
$r_A(b) = \{0\}$ für $b < \frac{1}{2}$,
$r_A(b) = [0, 1]$ für $b = \frac{1}{2}$ und
$r_A(b) = \{1\}$ für $b > \frac{1}{2}$,
wobei $r_B(a) = r_A(a)$.
\linie
\textbf{dominante Strategie}:
Eine \begriff{dominante Stratgie} für $X$
ist $x \in S_X$ mit $\forall_{y \in S_Y}\; x \in r_X(y)$.
\textbf{Beispiel}:
Beim Gefangenendilemma ist $U^{AB} := \smallpmatrix{(-7, -7) & (-1, -9)\\(-9, -1) & (-3, -3)}$.\\
Wegen $r_A(b_1) = \{a_1\} = r_A(b_2)$ ist $a_1$ eine dominante Stratgie für $A$
und analog $b_1$ eine dominante Strategie für $B$.
Deswegen müssen aber in der Realität $A$ und $B$ nicht immer $a_1$ bzw. $b_1$ spielen
(z.\,B. Angst, dass sich $-X$ rächen).
Ist das so, dann sollte die Nutzenmatrix geändert werden.
\linie
\pagebreak
\textbf{\name{Nash}-Gleichgewicht}:
Ein \begriff{\name{Nash}-Gleichgewicht (Gleichgewichtspunkt)} ist ein Spielzugpaar
$\widehat{s} := (\widehat{a}, \widehat{b}) \in S$ mit
$\widehat{a} \in r_A(\widehat{b})$ und $\widehat{b} \in r_B(\widehat{a})$
(d.\,h. $\widehat{s} \in r(\widehat{s})$).
Haben $A$ und $B$ ihre Strategie vorher vereinbart, dann ist eine alleinige Abweichung sinnlos.
\textbf{alternative Charakterisierung}:
Sei $\widehat{s} := (\widehat{a}, \widehat{b}) \in S$.
Dann ist $\widehat{s}$ ein Nash-Gleichgewicht
\begin{itemize}
\item
genau dann, wenn
$\forall_{b \in S_B}\; u_B(\widehat{a}, \widehat{b}) \ge u_B(\widehat{a}, b)$ und
$\forall_{a \in S_A}\; u_A(\widehat{a}, \widehat{b}) \ge u_A(a, \widehat{b})$, und
\item
für ein Nullsummenspiel genau dann, wenn
$\forall_{(a, b) \in S}\;
u(\widehat{a}, b) \ge u(\widehat{a}, \widehat{b}) \ge u(a, \widehat{b})$.\\
In diesem Fall heißt $\widehat{s}$ auch \begriff{Sattelpunkt}.
\end{itemize}
\linie
\textbf{Beispiel}:
Bei der Schlacht in der Bismarck-See wollten die Japaner einen Nachschubkonvoi nach Neuguinea
schicken.
Die Amerikaner wollten das verhindern.
Zwei mögliche Routen (Nord- und Südroute) standen zur Auswahl,
die jeweils $3$ Tage Fahrt lang waren.
Bei der Nordroute war die Sicht schlecht, sodass amerikanische Aufklärer einen ganzen Tag zur
Aufklärung benötigten, bevor sie am nächsten Tag mit der Bombardierung beginnen konnten
(wenn die Japaner die Nordroute gewählt haben).
Hatten Japaner und Amerikaner die Südroute gewählt, so war die Sicht für die Amerikaner so gut,
dass sie schon am selben Tag bombadieren konnten.
Wenn $A$ die USA und $B$ Japan ist und man als Auszahlung die Tage mit Bombardierung festlegt,
so ergibt sich die Nutzenmatrix $U = \smallpmatrix{2 & 2\\1 & 3}$.
Weil $(a_1, b_1)$ ein Sattelpunkt ist, ist es für beide optimal, die Nordroute zu wählen
(was auch so eingetreten ist).
\section{%
Gemischte Strategien%
}
\textbf{Problem}:
Nicht jedes Spiel hat nur einen Gleichgewichtspunkt.
Beim Kampf der Geschlechter kann man z.\,B.
$U^{AB} = \smallpmatrix{(20, 10) & (0, 0)\\(0, 0) & (10, 20)}$ ansetzen,
d.\,h. $(a_1, b_1)$ und $(a_2, b_2)$ sind Gleichgewichtspunkte.
Welcher der Punkte soll ohne Absprache gewählt werden?
Analog ist es beim Nullsummenspiel $U = \smallpmatrix{5 & -5\\-5 & 5}$.
Hier ist ein alleiniges Abweichen immer vorteilhaft, wenn der Gegner bei seiner Strategie bleibt.
\linie
\textbf{gemischte Strategien}:
Bei einem Spiel mit \begriff{gemischten Strategien} geht man von einem endlichen Spiel mit
$S := \{a_1, \dotsc, a_{n_A}\} \times \{b_1, \dotsc, b_{n_B}\}$ und Nutzenmatrizen $U^A, U^B$
aus und setzt\\
$\widetilde{S}_X := \{p_A = (p_{X,1}, \dotsc, p_{X,n_X})^\tp \in [0, 1]^{n_X} \;|\;
\sum_{i=1}^{n_X} p_{X_i} = 1\}$ sowie\\
$\widetilde{u}_X(p_A, p_B) := \EE(u_X) = p_A^\tp \cdot U^X \cdot p_B$
(d.\,h. wählt man $p_A \in \widetilde{S}_A$, dann spielt $A$ mit Wahrscheinlichkeit $p_{A,i}$
die Strategie $a_i$ für $i = 1, \dotsc, n_A$).
\textbf{Beispiel}:
Geht man vom Kampf der Geschlechter aus, so erhält man mit der Identifizierung
$\widetilde{S}_X := [0, 1]$ und $p_X := p_{X,1}$ (geht wegen $p_{X,2} = 1 - p_{X,1}$)
die Nutzenfunktionen\\
$\widetilde{u}_A(p_A, p_B) = 20 p_A p_B + 10 (1 - p_A) (1 - p_B)
= 30 p_A p_B - 10 p_A - 10 p_B + 10$ und\\
$\widetilde{u}_B(p_A, p_B) = 10 p_A p_B + 20 (1 - p_A) (1 - p_B)
= 30 p_A p_B - 20 p_A - 20 p_B + 20$.\\
Man erhält
$\widetilde{r}_A(p_B) = \{0\}$ für $p_B < \frac{1}{3}$,
$\widetilde{r}_A(p_B) = [0, 1]$ für $p_B = \frac{1}{3}$ und
$\widetilde{r}_A(p_B) = \{1\}$ für $p_B > \frac{1}{3}$
(analog $\widetilde{r}_B(p_A)$ mit $p_A = \frac{2}{3}$).
Gleichgewichtspunkte sind damit $(0, 0)$, $(1, 1)$ und $(\frac{2}{3}, \frac{1}{3})$.
\pagebreak