# Rapport : Projet Kolkata
_Bruce Rose_

Ce rapport rend compte de ma réalisation du projet Kolkata.



## Utilisation

Pour faciliter l'utilisation de mon implémentation du projet, un fichier `Entrance.py` a été écrit.
Lancez

> `python Entrance.py`

dans un terminal (version utilisée de python : 3.8.2) et laissez-vous guider.

Il vous sera alors possible de personnaliser une partie de Kolkata :
* Nombre d'itérations *m*
* Vitesse de jeu
* Chargement d'une carte spécifique
* Nombre de joueurs *n*
* Nombre de restaurants (ou tables) *k*
* Jeu par équipe
* Nombre d'équipes
* Nombre de joueurs personnalisable par équipe
* Stratégie par équipe

## Stratégies

En plus des stratégies de base *aléatoire* et *tétue*, d'autres stratégies ont été imaginées. Elles sont toutes trouvables dans le fichier `Strategy.py`.

### Mean regression : retour à la normale

Cette stratégie se base sur le principe de retour à la normale. Si un restaurant est très fréquenté (plus que la moyenne) pour *i* itérations de suite, il y a plus de chance pour qu'il soit bien moins fréquenté l'itération suivante *i+1*, d'autant plus que *i* est grand. Cette stratégie fait l'hypothèse que les taux de fréquentation des restaurants sont répartis aléatoirement, ou équivalent* (ce qui n'est pas toujours le cas). On choisit donc toujours le restaurant dont la suite de haute fréquentation est la plus grande.

*Nous verrons que la stratégie fonctionne bien contre des stratégies non-aléatoires.

### Wrong Stochastic Choice : le mal-entendu

Cette stratégie découle de l'interpretation erronée de l'explication suivante :

> (1)   "*A leading stochastic strategy, with utilization ~0.79, gives each customer a probability p of choosing the same restaurant as yesterday (p varying inversely with the number of players who chose that restaurant yesterday), while choosing among other restaurants with uniform probability. This is a better result than deterministic algorithms or simple random choice (noise trader), with utilization fraction 1 - 1/e ≈ 0.63.*"

extraite de la page wikipédia anglophone du *El Farol Bar Problem* (consultée le 05/05/2020, 16:54).

Pour faire son choix, cette stratégie passe en revue chaque restaurant, et calcule sa probabilité de sélection *p* comme suit :

> *p* = 1/(*c* + 1)

Où *c* est le nombre de clients qui sont allés à ce restaurant au dernier tour. Ainsi, moins il y avait de clients à un restaurant le tour d'avant, le plus de chance ce restaurant a d'être choisi par cette stratégie. Ce choix s'apparente un peu à la réflexion que quelqu'un aurait logiquement : "Il y avait beaucoup de monde dans ce restaurant la dernière fois, donc mieux vaut l'éviter".

### Stochastic Choice

Cette stratégie implémente la citation (1) plus haute. Il s'agit de calculer une probabilité *p* de changer de restaurant d'après cette formule :

> *p* = 1/(*c* + 1)

où *c* est le nombre de clients qui ont fréquenté le dernier restaurant choisi au dernier tour. Dans le cas où on décide de changer de restaurant, notre choix se fait aléatoirement parmi tous les autres restaurants.



## Expérimentations

### Tous les mêmes

Dans cette section nous observons l'efficacité des stratégies lorsque tous les joueurs se comportent de manière identique. Les tests se déroulent sur 50 itérations. Nous faisons varier le nombre de joueurs ainsi que le nombre de restaurants, et nous enregistrons les résultats dans un tableau.

#### Random


In [1]:
import myGraphs as mg
# Si le tableau ne s'affiche pas correctement, mettez 'extended_ascii' à False et/ou mettez 'colors' à False.
extended_ascii = True
colors = True
mg.printData("1_random", _extended_ascii=extended_ascii, _colors=colors)

Probabilité d'obtenir un point à une manche donnée avec la stratégie Random (en %) 
┌──────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10    │ 20    │
│ ------------------------- │ ---- │ ----- │ ----- │
│ 2                         │ [95m[1m74.5[0m │ [91m[1m94.5[0m  │ [91m[1m97.5[0m  │
│ 10                        │ [1m20[0m   │ [95m[1m63.6[0m  │ [91m[1m83.1[0m  │
│ 20                        │ [1m10[0m   │ [1m43.75[0m │ [95m[1m63.95[0m │
└──────────────────────────────────────────────────┘


Sans surprise, la stratégie Aléatoire donne de bons résultats lorsque la demande est faible par rapport à l'offre, et inversement lorsque la demande est forte mais l'offre faible. Cette stratégie nous servira de repère pour évaluer les autres.

#### Têtu

In [2]:
mg.printData("1_tetu", _extended_ascii=extended_ascii, _colors=colors)
mg.printData("1_random", _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée avec la stratégie Tetu (en %) 
┌─────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2   │ 10  │ 20  │
│ ------------------------- │ --- │ --- │ --- │
│ 2                         │ [91m[1m100[0m │ [91m[1m100[0m │ [91m[1m100[0m │
│ 10                        │ [1m20[0m  │ [95m[1m70[0m  │ [91m[1m80[0m  │
│ 20                        │ [1m10[0m  │ [1m50[0m  │ [95m[1m70[0m  │
└─────────────────────────────────────────────┘
Probabilité d'obtenir un point à une manche donnée avec la stratégie Random (en %) 
┌──────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10    │ 20    │
│ ------------------------- │ ---- │ ----- │ ----- │
│ 2                         │ [95m[1m74.5[0m │ [91m[1m94.5[0m  │ [91m[1m97.5[0m  │
│ 10                        │ [1m20[0m   │ [95m[1m63.6[0m  │ [91m[1m83.1[0m  │
│ 20                        │ [1m10[0m   │ [1m43.75[0m

Les résulats pour la stratégie Tétu sont à prendre avec du recul, puisque tout dépend du choix au hasard effectué au tout début de l'expérimentation. Notamment, pour les cas où il n'y a que deux joueurs et deux restaurants, nous aurions aurions très bien pu avoir un résultat égal à 50 % dans le cas où les deux joueurs auraient choisis le même restaurant.

#### Mean Regression


In [3]:
mg.printData("1_mere", _extended_ascii=extended_ascii, _colors=colors)
mg.printData("1_random", _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée avec la stratégie Retour à la normale (en %) 
┌────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10   │ 20   │
│ ------------------------- │ ---- │ ---- │ ---- │
│ 2                         │ [95m[1m51[0m   │ [95m[1m51[0m   │ [95m[1m51[0m   │
│ 10                        │ [1m10.2[0m │ [1m10.8[0m │ [1m11.2[0m │
│ 20                        │ [1m5.1[0m  │ [1m5.8[0m  │ [1m6.2[0m  │
└────────────────────────────────────────────────┘
Probabilité d'obtenir un point à une manche donnée avec la stratégie Random (en %) 
┌──────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10    │ 20    │
│ ------------------------- │ ---- │ ----- │ ----- │
│ 2                         │ [95m[1m74.5[0m │ [91m[1m94.5[0m  │ [91m[1m97.5[0m  │
│ 10                        │ [1m20[0m   │ [95m[1m63.6[0m  │ [91m[1m83.1[0m  │
│ 20                        │ [1m10

Les faibles résultats que la stratégie Retour à la normale obtient dans ce test sont facilement compréhensibles. Etant donné que cette stratégie sélectionne en moyenne toujours les restaurants les plus fréquentés, et que dans ces conditions de test tous les joueurs procèdent ainsi, au final tous les joueurs vont dans le même restaurant tout au long de la partie, ce qui leur procure à chacun un minimum de points.

#### Wrong Stochastic Choice

In [4]:
mg.printData("1_wrostocho", _extended_ascii=extended_ascii, _colors=colors)
mg.printData("1_random", _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée avec la stratégie Wrong Stochastic Choice (en %) 
┌────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10   │ 20   │
│ ------------------------- │ ---- │ ---- │ ---- │
│ 2                         │ [95m[1m74[0m   │ [91m[1m80[0m   │ [91m[1m81[0m   │
│ 10                        │ [1m17.8[0m │ [1m46.4[0m │ [1m48[0m   │
│ 20                        │ [1m10[0m   │ [1m35.2[0m │ [1m35.9[0m │
└────────────────────────────────────────────────┘
Probabilité d'obtenir un point à une manche donnée avec la stratégie Random (en %) 
┌──────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10    │ 20    │
│ ------------------------- │ ---- │ ----- │ ----- │
│ 2                         │ [95m[1m74.5[0m │ [91m[1m94.5[0m  │ [91m[1m97.5[0m  │
│ 10                        │ [1m20[0m   │ [95m[1m63.6[0m  │ [91m[1m83.1[0m  │
│ 20                        │ [1

Moins efficace que la stratégie aléatoire dans tous les cas de figure, la stratégie Wrong Stochastic Choice ne s'en sort finalement pas si mal si nous la comparons aux autres stratégies étudiées jusqu'ici.

#### Stochastic Choice

In [5]:
mg.printData("1_stocho", _extended_ascii=extended_ascii, _colors=colors)
mg.printData("1_random", _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée avec la stratégie Stochastic Choice (en %) 
┌────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10   │ 20   │
│ ------------------------- │ ---- │ ---- │ ---- │
│ 2                         │ [95m[1m71[0m   │ [91m[1m93[0m   │ [91m[1m97[0m   │
│ 10                        │ [1m19.4[0m │ [95m[1m67.4[0m │ [91m[1m79.8[0m │
│ 20                        │ [1m10[0m   │ [1m45.1[0m │ [95m[1m66.2[0m │
└────────────────────────────────────────────────┘
Probabilité d'obtenir un point à une manche donnée avec la stratégie Random (en %) 
┌──────────────────────────────────────────────────┐
│ Nb joueurs\Nb restaurants │ 2    │ 10    │ 20    │
│ ------------------------- │ ---- │ ----- │ ----- │
│ 2                         │ [95m[1m74.5[0m │ [91m[1m94.5[0m  │ [91m[1m97.5[0m  │
│ 10                        │ [1m20[0m   │ [95m[1m63.6[0m  │ [91m[1m83.1[0m  │
│ 20                    

Après la stratégie Aléaoire, Stochastic Choice est celle qui obtient les meilleurs résultats.

### Seul contre l'aléa

Dans cette section, nous mettons à l'épreuve nos stratégies dans un contexte plus réaliste, où un joueur possédant la stratégie testée est en compétition avec 19 autres qui eux choisissent aléatoirement. Les résultats obtenus pour différents nombres de restaurants et les différentes stratégies sont rassemblés dans le tableau ci-dessous.

In [6]:
mg.printData('all_vs_alea', _extended_ascii=extended_ascii, _colors=colors)

Probabilité d'obtenir un point à une manche donnée en fonction du nombre de restaurants (en %) 
┌─────────────────────────────────────────────────────────────────────────────┐
│ Nb restaurants │ Random │ Têtu │ MeanRegression │ W.Stochastic │ Stochastic │
│ -------------- │ ------ │ ---- │ -------------- │ ------------ │ ---------- │
│ 2              │ [1m5[0m      │ [1m7[0m    │ [1m12[0m             │ [1m9[0m            │ [1m12[0m         │
│ 10             │ [95m[1m42[0m     │ [95m[1m35[0m   │ [95m[1m45[0m             │ [95m[1m43[0m           │ [95m[1m42[0m         │
│ 20             │ [91m[1m63[0m     │ [91m[1m58[0m   │ [91m[1m62[0m             │ [91m[1m56[0m           │ [91m[1m62[0m         │
└─────────────────────────────────────────────────────────────────────────────┘


Dans ce contexte, la stratégie de retour à la normale obtient les meilleurs résultats et bat même la stratégie aléatoire. Le choix stochastique n'est pas loin derrière à quelques points perdus avec 10 restaurants.

Toutefois, la stratégie de retour à la normale perd tout son intérêt lorsque plusieurs joueurs l'adoptent, comme en attestent les résultats obtenus lorsque l'on fait jouer 5 retour à la normale contre 15 aléatoires.

In [7]:
mg.printData('5_mere_15_random', _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée en fonction du nombre de restaurants (en %)
comparaison du cas 5 contre 15 et 1 contre 19 
┌────────────────────────────────────┐
│ Nb restaurants │ 5 vs 15 │ 1 vs 19 │
│ -------------- │ ------- │ ------- │
│ 2              │ [1m10.4[0m    │ [1m12[0m      │
│ 10             │ [1m16.4[0m    │ [95m[1m45[0m      │
│ 20             │ [1m19.6[0m    │ [91m[1m62[0m      │
└────────────────────────────────────┘


### Contexte complexe

Dans cette section nous observons l'efficacité des stratégies dans un contexte où de multiples stratégies cohabitent. Nous avons créé 5 équipes, constituées de 4 joueurs chacune. Les équipes ont toutes une stratégie différente des autres, et jouent en compétition pour 50 tours. Les résultats sont présentés ci-dessous.

In [8]:
mg.printData('all_vs_all', _extended_ascii=extended_ascii, _colors=colors)


Probabilité d'obtenir un point à une manche donnée en fonction du nombre de restaurants (en %) 
┌─────────────────────────────────────────────────────────────────────────────┐
│ Nb restaurants │ Random │ Têtu │ MeanRegression │ W.Stochastic │ Stochastic │
│ -------------- │ ------ │ ---- │ -------------- │ ------------ │ ---------- │
│ 2              │ [1m11[0m     │ [1m11[0m   │ [1m11[0m             │ [1m8[0m            │ [1m9[0m          │
│ 10             │ [91m[1m57.5[0m   │ [95m[1m34[0m   │ [1m11.5[0m           │ [95m[1m46.5[0m         │ [95m[1m48[0m         │
│ 20             │ [91m[1m69[0m     │ [95m[1m46.5[0m │ [1m16[0m             │ [91m[1m53.5[0m         │ [91m[1m69.5[0m       │
└─────────────────────────────────────────────────────────────────────────────┘


La stratégie aléatoire semble être la plus résiliente dans un cas de figure où de multiples stratégies cohabitent.