# Jeux à 2 joueurs simultanés et à somme nulle



### Un premier exemple

---

Les joueurs A et B choisissent indépendamment un côté d'une pièce (Pile ou Face) et ils révèlent leur choix en même temps. Si ce choix est identique, alors A donne 2 euros à B, sinon B donne 1 euro à A si A a choisi Pile, et 3 euros sinon. 

**Représentation sous forme normale**: le tableau suivant aggrège les informations du jeu, la première valeur est la gain de A (joueur qui choisit la **ligne**), la deuxième valeur est le gain de B (joueur qui choisit la **colonne**).

|  | **Pile**  | **Face**  
|:--- |:---:|:---:
|**Pile**  |  (-2, 2) | (1, -1)  | 
|**Face**  |  (3, -3) | (-2, 2)  | 



La somme des gains dans chaque case du tableau fait 0: il s'agit d'un jeu à somme nulle, et la deuxième valeur peut être omise.

**Question fondamentale**: définir une façon "raisonnable" de jouer (choisir une stratégie) dans un jeu.

**Question**: résoudre les 2 jeux obtenus en supposant que les joueurs jouent à tour de rôle. 

### Stratégies

---

Pour un joueur, une stratégie (aussi appelé **stratégie mixte**) est une loi de probabilité sur l'ensemble des choix du joueur.  

**Exemple de stratégie**: dans l'exemple précédent une strategie est du type "choisir Pile avec probabilité $p$ et Face avec probabilité $1-p$". Cette stratégie se note $(p, 1-p)$.

**Questions**: 

* Donner l'espérance de gain de A (Ligne) si sa stratégie est $(p, 1-p)$ et celle de B est (1,0) . Idem si celle de B est $(0,1)$.
* Donner l'espérance de gain de A si sa stratégie est (1,0) et celle de B est $(q, 1-q)$. Idem si celle de A est $(0,1)$.
* Donner l'espérance de gain de A  si leurs stratégies respectives sont $(p, 1-p)$ et $(q, 1-q)$.

Une stratégie déterministe est appelée **stratégie pure**. Quelle est l'espérance de gain si les 2 joueurs choisissent des stratégies pures?

### Jeu séquentiel en stratégies mixtes

---
Considérons le jeu de l'exemple précédent où un des joueurs annonce sa stratégie à l'autre, puis l'autre choisit la sienne, et enfin, l'issue (aléatoire) du jeu est déterminée. Résoudre les deux jeux séquentiels que l'on obtient ainsi.

### Modèle général

---

* Deux joueurs appelés "Ligne" et "Colonne" ayant respectivement $n$ et $m$ actions notées $\{1 \dots n \}$ et $\{1 \dots m\}$.
* Chaque joueur choisit une stratégie en secret, et les deux stratégies sont révélées simultanément.
* On note $A_{ij}$ le gain de Ligne s'il choisit la stratégie pure $i \in \{1 \dots n \}$ et Colonne choisit la stratégie pure $j \in \{1 \dots m\}$. Ligne cherche à **maximiser** $A_{ij}$.
* Le gain de Colonne est alors $-A_{ij}$. Colonne cherche à **minimiser** $A_{ij}$.



**Exemple** ($n=2$ et $m=3$):

$$
A =
\left(
\begin{array}{c|c|c}
1&-1&3\\
\hline
5&0&-2\\
\end{array}
\right)
$$

Quelle est le meilleur gain que Ligne peut garantir? Et pour Colonne?


Si on note
* $ \text{maxmin} = \max_{i \in \{1 \dots n\}} \min_{j \in \{1 \dots m\}}  A_{ij}$
* $ \text{minmax} = \min_{j \in \{1 \dots m\}} \max_{i \in \{1 \dots n\}}  A_{ij}$

on a déjà montré que
$$ \text{maxmin} \leq \text{minmax}$$

### Modèle avec des stratégies mixtes

---

On note $p = (p_1, \dots, p_n) \in \Delta_n$ une stratégie mixte de Ligne et $q = (q_1, \dots, q_m) \in \Delta_m$ une stratégie mixte de Colonne, avec
$$\Delta_k = \{x \in \mathbb{R}^k | x \geq 0 \text{ et }\sum_{i=1}^k x_i = 1\} $$




* $\Delta_k$ est un ensemble **convexe** (sans trou entre toute paire de points de $\Delta_k$)
* $\Delta_k$ est un ensemble **compact** (borné et fermé)

Ces deux propriétés font que toute fonction convexe (resp. concave) définie sur cet ensemble admet une seule valeur minimale (resp. maximale).

<center><img src='fig/simplexe.png'  style="width: 1000px;"></center> 


**Questions**: montrer que le gain moyen de Ligne est 
* $(pA)_j$ si Ligne choisit $p \in \Delta_n$ et Colonne choisit la stratégie pure $j \in \{1 \dots m\}$ ($=(0,\dots 0 ,1 ,0,\dots 0 )$ où le 1 est sur la j-ème coordonnée)
* $(Aq^\intercal)_i$ si Ligne choisit $i \in \{1 \dots n\}$ et Colonne choisit  $q \in \Delta_m$
* $pAq^\intercal$ si Ligne choisit $p \in \Delta_n$ et Colonne choisit $q \in \Delta_m$


### Théorème du minimax de von Neumann

---
<div class="alert-info">
Pour tout jeu à somme nulle sous forme normale, il existe une valeur $v^*$ et des stratégies $p^* \in \Delta_n$ et $q^* \in \Delta_m$ telles que:
    
* $p^*A q^{\intercal} \geq v^* , \forall q \in \Delta_m$ ($p^*$ garantit le gain $v^*$ pour Ligne)
* $p A q^{*\intercal} \leq v^* , \forall p \in \Delta_n$ ($q^*$ garantit le gain $-v^*$ pour Colonne)
</div>


Les stratégies $p^*$ et $q^*$ sont appelées **stratégies d'équilibre minimax** et $v^*$ est la **valeur** du jeu

Si on note
* $ \text{supinf} = \sup_{p \in \Delta_n} \inf_{q \in \Delta_m}  pAq^\intercal $
* $ \text{infsup} =  \inf_{q \in \Delta_m} \sup_{p \in \Delta_n} pAq^\intercal $

montrer grâce au théorème que
$$p^* A q^{*\intercal}  = v^* = \text{supinf} = \text{infsup}$$

Montrer également l'unicité de $v^*$. Quid de $p^*$ et de $q^*$?

**Preuve**:
$$
\inf_{q \in \Delta_m} \sup_{p \in \Delta_n} pAq^\intercal
\leq \sup_{p \in \Delta_n} pAq^{*\intercal}
\leq v^*
\leq \inf_{q \in \Delta_m}  p^*Aq^\intercal
\leq \sup_{p \in \Delta_n} \inf_{q \in \Delta_m}  pAq^\intercal
\leq \inf_{q \in \Delta_m} \sup_{p \in \Delta_n} pAq^\intercal
$$

### Exercice

---

Donner la valeur et les stratégies d'équilibre minimax du jeu suivant:

$$
A =
\left(
\begin{array}{c|c|c}
5&3&1\\
\hline
0&1&8\\
\end{array}
\right)
$$


### Lien avec la programmation linéaire

---

Montrer que 
$$p^*A q^{\intercal} \geq v^* , \forall q \in \Delta_m$$
équivaut à
$$(p^*A)_j \geq v^*, \forall j \in \{1 \dots m\} $$

La valeur $v^*$ ainsi que $p^*$ et $q^*$ sont donc une solution au système fini d'inégalités linéaires suivantes avec les variables $p, q, v$:

* $(pA)_j \geq v, \forall j \in \{1 \dots m\} $
* $(Aq^{\intercal})_i \leq v, \forall i \in \{1 \dots n\} $
* $p \in \Delta_n$
* $q \in \Delta_m$



On peut donc trouver une solution, si celle-ci existe, en utilisant la progammation linéaire. 

Le théorème du minimax de von Neumann équivaut à l'existence d'une telle solution  (i.e. l'ensemble des contraintes est non vide).

### Preuve du théorème de von Neumann

---

Soit le programme linéaire suivant:
* $ \max v$
* $(pA)_j \geq v, \forall j \in \{1 \dots m\} $
* $p \in \Delta_n$

**Questions** 
* montrer qu'il admet une solution admissible
* calculer son dual

Le dual est
* $ \min w$
* $(Aq^{\intercal})_i \leq w, \forall i \in \{1 \dots n\} $
* $q \in \Delta_m$

Il admet une solution admissible pour les mêmes raisons que le primal. Les deux problèmes ont donc la même valeur notée $v^*$.

Si $p^*$, $q^*$ et $v^*$ sont des solutions des deux programmes linéaires, on voit qu'elles satisfont les contraintes du théorème de von Neumann.

On peut donc résoudre un jeu en résolvant ce programme linéaire et/ou son dual.

### Exercices

---

* Calculer la valeur des jeux suivants

$$
\left(
\begin{array}{c|c}
1&2\\
\hline
0&1\\
\end{array}
\right)
\quad
\left(
\begin{array}{c|c}
1&0\\
\hline
0&k\\
\end{array}
\right)
\quad
\left(
\begin{array}{c|c|c}
5&6&3\\
\hline
4&7&4\\
\hline
9&3&0
\end{array}
\right)
$$

* Modéliser le jeu "Pierre-Feuille-Ciseaux" sous forme de matrice de gain, écrire le PL qui permet de le résoudre et résoudre le jeu.

* Un jeu est symétrique si, comme dans le jeu "Pierre-Feuille-Ciseaux" les joueurs peuvent être permutés sans modifier leur ensemble d'actions et les gains qui leur sont associés.
    * qu'est-ce que cela implique sur la matrice de gain?
    * en utilisant la caractérisation de la valeur par un PL, montrer que la valeur d'un jeu symétrique est nulle.
    
