# [LU3IN025] Intelligence Artificielle et Jeux 2019-2020

Shi YU (n° 28507587)

mail : shi4yu2@gmail.com


# Projet "Les restaurants de Kolkata"

Github : https://github.com/SU-3IN025-fev2020/projet-kolkata-projet-kolkata-shi

## Introduction
### Description du problème

> Plusieurs joueurs (n), qui habitent dans le même quartier, souhaitent se rendre dans un des k restaurants du quartier. Une fois que leur choix est effectué, les joueurs se rendent dans le restaurant choisi. La règle est alors la suivante :
> * si un joueur est seul dans un restaurant, un plat lui est servi (gain = 1)
> * si plusieurs joueurs se trouvent dans un même restaurant, un joueur est choisi au hasard (de manière uniforme parmi tous les joueurs présents dans ce restaurant), et est servi (gain = 1). Les autres joueurs ne sont pas servis (gain = 0). Le jeu se déroule sur plusieurs itérations (m, fixé à l'avance).

## Réalisation
### Stratégies de base

#### Boucle Principale

> chaque joueur choisit un restaurant où se rendre, selon la stratégie qui est la sienne;
> 
> Les deux stratégies de base qui doivent être implémentées pour cette version de base sont :
> 1. une stratégie aléatoire uniforme
> 2. une stratégie têtue (toujours choisir le même restaurant)

Les deux stratégies de base sont implémentées dans `kalkota_restaurants.py`. De plus, une stratégie de restaurant le plus proche est implémentée.

Les signautres des fonctions implémentées : 

```python
# stratégie aléatoire uniforme (indice 0)
def restaurant_random_choice(nbPlayers, nbRestaus, posPlayers, goalStates)

# stratégie tétu (indice 1)
def restaurant_tetu(nbPlayers, nbRestaus, posPlayers, goalStates)

# stratégie restaurant le plus proche (indice 2)
def restaurant_plusproche(nbPlayers, nbRestaus, posPlayers, goalStates)
```



> chaque joueur se rend au restaurant de son choix, en suivant le plus court chemin jusqu'au restaurant (via l'exécution de l'algorithme A*);


Algorithme A* est implémenté dans `a_star.py`

Les signatures des fonctions implémentées:

```python
# distance manhattan
def manhattan(p1, p2)

# trouver les cases accessibles
def available_neighbours(current_x, current_y, mapGame)

# Algorithme A*
def astar_search(start, end, mapGame)
```


> lorsque tous les joueurs sont arrivés à destination, les joueurs obtiennent leur gain, et prennent connaissance des taux de remplissage de chaque restaurant.
> * si un joueur est seul dans un restaurant, un plat lui est servi (gain = 1)
> * si plusieurs joueurs se trouvent dans un même restaurant, un joueur est choisi au hasard (de manière uniforme parmi tous les joueurs présents dans ce restaurant), et est servi (gain = 1). Les autres joueurs ne sont pas servis (gain = 0). Le jeu se déroule sur plusieurs itérations (m, fixé à l'avance).


#### Exécution

**Simple**

```
$ python kalkota_restaurants.py [iteration] [strategie] [nom_fichier_resultat]
```

**Competition**

```
$ python kalkota_restaurants_competition.py [iteration] [strategie] [nom_fichier_resultat]
```
avec:
* strategie = 01 : aléatoire vs. têtu
* strategie = 02 : aléatoire vs. le plus proche
* strategie = 12 : têtu vs. le plus proche


## Expérimentations

On a réalisé, pour chacune des trois stratégies implémentées, 20 simulations (60 au total), chaque simulation contient 20 iterations. Le résultat est enregistré dans `resultat.csv` contenant l'indice de la stratégie, et pour chaque joueur :
* le succès du joueur (1 s'il arrive au restaurant choisi, 0 sinon)
* le choix du restaurant (indice entre 0 et 9)
* le gain (1 pour le joueur choisi au hasard parmi tous les joueurs présents dans ce restaurant, 0 sinon)


In [1]:
import numpy as np
import pandas as pd

df = pd.read_csv("resultats/resultat.csv", sep="\t")
df_remplissage = pd.read_csv("resultats/resultat_remplissage.csv", sep="\t")

df_strategy0 = df[df["strategie"] == 0]
df_strategy1 = df[df["strategie"] == 1]
df_strategy2 = df[df["strategie"] == 2]


In [2]:
df_success_0 = df_strategy0.filter(regex="success", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df_success_0.mean(axis=0))
print("\n    Taux de réussite stratégie aléatoire uniforme: ", df_success_0.mean(axis=0).mean())

df_success_1 = df_strategy1.filter(regex="success", axis=1)
print("\n==== Taux de réussite de chaque joueur, stratégie 1 têtue ====")
print(df_success_1.mean(axis=0))
print("\n    Taux de réussite stratégie têtue: ", df_success_1.mean(axis=0).mean())
    
df_success_2 = df_strategy2.filter(regex="success", axis=1)
print("\n==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====")
print(df_success_2.mean(axis=0))
print("\n    Taux de réussite stratégie le plus proche: ", df_success_2.mean(axis=0).mean())


==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====
success_0    0.52
success_1    0.52
success_2    0.52
success_3    0.34
success_4    0.48
success_5    0.42
success_6    0.58
success_7    0.50
success_8    0.46
success_9    0.48
dtype: float64

    Taux de réussite stratégie aléatoire uniforme:  0.48200000000000004

==== Taux de réussite de chaque joueur, stratégie 1 têtue ====
success_0    0.52
success_1    0.44
success_2    0.52
success_3    0.70
success_4    0.60
success_5    0.52
success_6    0.40
success_7    0.52
success_8    0.56
success_9    0.52
dtype: float64

    Taux de réussite stratégie têtue:  0.5299999999999999

==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====
success_0    1.0
success_1    1.0
success_2    1.0
success_3    1.0
success_4    1.0
success_5    1.0
success_6    1.0
success_7    1.0
success_8    1.0
success_9    1.0
dtype: float64

    Taux de réussite stratégie le plus proche:  1.0


In [3]:
df_gain_0 = df_strategy0.filter(regex="gain", axis=1)
print("==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df_gain_0.mean(axis=0))
print("\n    Gain moyen stratégie aléatoire uniforme: ", df_gain_0.mean(axis=0).mean())

df_gain_1 = df_strategy1.filter(regex="gain", axis=1)
print("\n==== Gain moyen de chaque joueur, stratégie 1 têtue ====")
print(df_gain_1.mean(axis=0))
print("\n    Gain moyen stratégie têtue: ", df_gain_1.mean(axis=0).mean())
    
df_gain_2 = df_strategy2.filter(regex="gain", axis=1)
print("\n==== Gain moyen de chaque joueur, stratégie 2 le plus proche ====")
print(df_gain_2.mean(axis=0))
print("\n    Gain moyen stratégie le plus proche: ", df_gain_2.mean(axis=0).mean())


==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====
gain_0    0.36
gain_1    0.34
gain_2    0.44
gain_3    0.20
gain_4    0.36
gain_5    0.26
gain_6    0.46
gain_7    0.36
gain_8    0.28
gain_9    0.40
dtype: float64

    Gain moyen stratégie aléatoire uniforme:  0.346

==== Gain moyen de chaque joueur, stratégie 1 têtue ====
gain_0    0.42
gain_1    0.36
gain_2    0.40
gain_3    0.56
gain_4    0.60
gain_5    0.52
gain_6    0.34
gain_7    0.38
gain_8    0.40
gain_9    0.30
dtype: float64

    Gain moyen stratégie têtue:  0.42800000000000005

==== Gain moyen de chaque joueur, stratégie 2 le plus proche ====
gain_0    0.52
gain_1    0.52
gain_2    0.48
gain_3    0.42
gain_4    0.44
gain_5    0.48
gain_6    0.40
gain_7    0.48
gain_8    0.38
gain_9    0.54
dtype: float64

    Gain moyen stratégie le plus proche:  0.466


## Compétition
### stratégie aléatoire vs. stratégie têtue


In [4]:
df01 = pd.read_csv("resultats/competition01.csv", sep="\t")

df01_success_0 = df01.filter(regex="success_(0|1|2|3|4)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df01_success_0.mean(axis=0))
print("\n    Taux de réussite stratégie aléatoire uniforme: ", df01_success_0.mean(axis=0).mean())

print("\n vs. \n")

df01_success_1 = df01.filter(regex="success_(5|6|7|8|9)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 1 têtue ====")
print(df01_success_1.mean(axis=0))
print("\n    Taux de réussite stratégie têtu: ", df01_success_1.mean(axis=0).mean())

==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====
success_0    0.42
success_1    0.47
success_2    0.46
success_3    0.49
success_4    0.48
dtype: float64

    Taux de réussite stratégie aléatoire uniforme:  0.46399999999999997

 vs. 

==== Taux de réussite de chaque joueur, stratégie 1 têtue ====
success_5    0.66
success_6    0.50
success_7    0.54
success_8    0.46
success_9    0.60
dtype: float64

    Taux de réussite stratégie têtu:  0.552


In [5]:
df01_gain_0 = df01.filter(regex="gain_(0|1|2|3|4)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df01_gain_0.mean(axis=0))
print("\n    Gain moyen stratégie aléatoire uniforme: ", df01_gain_0.mean(axis=0).mean())

print("\n vs. \n")

df01_gain_1 = df01.filter(regex="gain_(5|6|7|8|9)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie stratégie 1 têtu ====")
print(df01_gain_1.mean(axis=0))
print("\n    Gain moyen stratégie têtue: ", df01_gain_1.mean(axis=0).mean())

==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====
gain_0    0.28
gain_1    0.35
gain_2    0.27
gain_3    0.33
gain_4    0.32
dtype: float64

    Gain moyen stratégie aléatoire uniforme:  0.31

 vs. 

==== Gain moyen de chaque joueur, stratégie stratégie 1 têtu ====
gain_5    0.52
gain_6    0.42
gain_7    0.44
gain_8    0.35
gain_9    0.51
dtype: float64

    Gain moyen stratégie têtue:  0.44800000000000006


Le groupe ayant la stratégie têtu obtient un taux de réussite et un main meilleur que le group ayant la stratégie aléatoire uniforme.

### stratégie aléatoire vs. stratégie le plus proche


In [6]:
df02 = pd.read_csv("resultats/competition02.csv", sep="\t")

df02_success_0 = df02.filter(regex="success_(0|1|2|3|4)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df02_success_0.mean(axis=0))
print("\n    Taux de réussite stratégie aléatoire uniforme: ", df02_success_0.mean(axis=0).mean())

print("\n vs. \n")
df02_success_2 = df02.filter(regex="success_(5|6|7|8|9)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====")
print(df02_success_2.mean(axis=0))
print("\n    Taux de réussite stratégie le plus proche: ", df02_success_2.mean(axis=0).mean())

==== Taux de réussite de chaque joueur, stratégie 0 aléatoire uniforme ====
success_0    0.50
success_1    0.56
success_2    0.53
success_3    0.50
success_4    0.47
dtype: float64

    Taux de réussite stratégie aléatoire uniforme:  0.5119999999999999

 vs. 

==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====
success_5    1.0
success_6    1.0
success_7    1.0
success_8    1.0
success_9    1.0
dtype: float64

    Taux de réussite stratégie le plus proche:  1.0


In [7]:
df02_gain_0 = df02.filter(regex="gain_(0|1|2|3|4)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====")
print(df02_gain_0.mean(axis=0))
print("\n    Gain moyen stratégie aléatoire uniforme: ", df02_gain_0.mean(axis=0).mean())

print("\n vs. \n")

df02_gain_2 = df02.filter(regex="gain_(5|6|7|8|9)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie 1 têtu ====")
print(df02_gain_2.mean(axis=0))
print("\n    Gain moyen stratégie têtue: ", df02_gain_2.mean(axis=0).mean())

==== Gain moyen de chaque joueur, stratégie 0 aléatoire uniforme ====
gain_0    0.35
gain_1    0.33
gain_2    0.29
gain_3    0.29
gain_4    0.21
dtype: float64

    Gain moyen stratégie aléatoire uniforme:  0.294

 vs. 

==== Gain moyen de chaque joueur, stratégie 1 têtu ====
gain_5    0.55
gain_6    0.54
gain_7    0.58
gain_8    0.56
gain_9    0.57
dtype: float64

    Gain moyen stratégie têtue:  0.5599999999999999


### stratégie têtue vs. stratégie le plus proche

In [8]:
df12 = pd.read_csv("resultats/competition12.csv", sep="\t")

df12_success_1 = df12.filter(regex="success_(0|1|2|3|4)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 1 têtu ====")
print(df12_success_1.mean(axis=0))
print("\n    Taux de réussite stratégie têtu: ", df02_success_0.mean(axis=0).mean())

print("\n vs. \n")
df12_success_2 = df12.filter(regex="success_(5|6|7|8|9)", axis=1)
print("==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====")
print(df12_success_2.mean(axis=0))
print("\n    Taux de réussite stratégie le plus proche: ", df12_success_2.mean(axis=0).mean())

==== Taux de réussite de chaque joueur, stratégie 1 têtu ====
success_0    0.56
success_1    0.52
success_2    0.51
success_3    0.51
success_4    0.49
dtype: float64

    Taux de réussite stratégie têtu:  0.5119999999999999

 vs. 

==== Taux de réussite de chaque joueur, stratégie 2 le plus proche ====
success_5    1.0
success_6    1.0
success_7    1.0
success_8    1.0
success_9    1.0
dtype: float64

    Taux de réussite stratégie le plus proche:  1.0


In [9]:
df12_gain_1 = df12.filter(regex="gain_(0|1|2|3|4)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie stratégie 1 têtu ====")
print(df12_gain_1.mean(axis=0))
print("\n    Gain moyen stratégie têtu: ", df12_gain_1.mean(axis=0).mean())

print("\n vs. \n")

df12_gain_2 = df12.filter(regex="gain_(5|6|7|8|9)", axis=1)
print("==== Gain moyen de chaque joueur, stratégie 2 le plus proche  ====")
print(df12_gain_2.mean(axis=0))
print("\n    Gain moyen le plus proche: ", df12_gain_2.mean(axis=0).mean())

==== Gain moyen de chaque joueur, stratégie stratégie 1 têtu ====
gain_0    0.39
gain_1    0.42
gain_2    0.26
gain_3    0.29
gain_4    0.42
dtype: float64

    Gain moyen stratégie têtu:  0.356

 vs. 

==== Gain moyen de chaque joueur, stratégie 2 le plus proche  ====
gain_5    0.52
gain_6    0.52
gain_7    0.62
gain_8    0.59
gain_9    0.56
dtype: float64

    Gain moyen le plus proche:  0.562


Le group ayant la stratégie le plus proche obtient un meilleur gain lorsqu'il est en compétition avec les deux autres stratégie. Le meilleur gain est expliqué en partie par le taux de réussite maximal.

# Conslusion

De façon général, le taux de réussite de la stratégie têtu est meilleur que la stratégie aléatoire uniforme. Cela est soutenu par le gain moyen supérieur de cette stratégie.

Pour la stratégie le plus proche, le taux de réussite est 1 et le gain moyen est proche de 0.5. Ce gain peut être vu comme étant dû au résultat du choix aléatoire.