# Bayes pas à pas

On veut comparer $P(\text{Gagne} | \text{NoSwitch})$ avec $P(\text{Gagne} | \text{Switch})$ pour déterminer la stratégie la plus efficace.

Dans la suite on va supposer que :
* On choisit P1
* Monty ouvre P2

On doit donc comparer 
1. $P(\text{voiture derrière P1} | \text{découvre P2})$ 
    * Cas où je choisi la porte 1. Il ouvre la 2. Je change pas d'avis. Je gagne
1. $P(\text{voiture derrière P3} | \text{découvre P2})$
    * Cas où je choisi la porte 1. Il ouvre la 2. Je change d'avis, je prends la 3. Je gagne

Cela revient à comparer : 

* $ P(\text{Gagne} | \text{NoSwitch}) = P(\text{voiture derrière P1} | \text{découvre P2}) = \frac{P(\text{découvre P2} | \text{voiture derrière P1}) * P(\text{voiture derrière P1})}{P(\text{découvre P2})} $

* $ P(\text{Gagne} | \text{Switch}) = P(\text{voiture derrière P3} | \text{découvre P2}) = \frac{P(\text{découvre P2} | \text{voiture derrière P3}) * P(\text{voiture derrière P3})}{P(\text{découvre P2})} $




## Quand on ne change pas d'avis

### Calcul de la vraissemblance $P(\text{découvre P2} | \text{voiture derrière P1})$ :
  * La voiture est derrière P1
  * Il peut ouvrir P2 ou P3
  * Donc $P(\text{découvre P2} | \text{voiture derrière P1}) = 1/2$

### Calcul de l'a priori $P(\text{voiture derrière P1})$ :
  * L'a priori c'est la proba sans avoir accès aux données, en l'état des connaissances...
  * La voiture peut être derrière une des 3 portes
  * Donc l'a priori $P(\text{voiture derrière P1}) = 1/3$

### Calcul du dénominateur $P(\text{découvre P2})$ :
On utilise la loi des probabilités totales
* $P(D) = \sum_{i \in I} P(D \cap A_i) = \sum_{i \in I} P(D | A_i) P(A_i) $ où Ai est une théorie/hypothèse alternative
* $P(\text{découvre P2}) =  P(\text{découvre P2} | \text{voiture derrière P1}) *   P(\text{voiture derrière P1}) + P(\text{découvre P2} | \text{voiture derrière P3}) *   P(\text{voiture derrière P3})  $
* $P(\text{découvre P2}) =  1/2 * 1/3 + 1* 1/3$
* $P(\text{découvre P2}) =  1/6 + 1/3$
* $P(\text{découvre P2}) =  1/2$

### Conclusion
* $ P(\text{voiture derrière P1} | \text{découvre P2}) = \frac{P(\text{découvre P2} | \text{voiture derrière P1}) * P(\text{voiture derrière P1})}{P(\text{découvre P2})} $
* $ P(\text{voiture derrière P1} | \text{découvre P2}) = \frac{1/2 * 1/3}{1/2} = \frac{1/6}{1/2} = \frac{2}{6} = \frac{1}{3}$
* $ P(\text{Gagne} | \text{NoSwitch}) = \frac{1}{3}$


## Quand on change d'avis

### Calcul de la vraissemblance $P(\text{découvre P2} | \text{voiture derrière P3})$ :
  * La voiture est derrière P3
  * Il ne peut ouvrir que P2  
  * Donc $P(\text{découvre P2} | \text{voiture derrière P3}) = 1$

### Calcul de l'a priori $P(\text{voiture derrière P3})$
  * L'a priori c'est la proba sans avoir accès aux données, en l'état des connaissances...
  * La voiture peut être derrière une des 3 portes
  * Donc l'a priori $P(\text{voiture derrière P3}) = 1/3$

### Calcul du dénominateur $P(\text{découvre P2})$
* $P(\text{découvre P2}) =  1/2$

### Conclusion
* $ P(\text{voiture derrière P3} | \text{découvre P2}) = \frac{P(\text{découvre P2} | \text{voiture derrière P3}) * P(\text{voiture derrière P3})}{P(\text{découvre P2})} $
* $ P(\text{voiture derrière P3} | \text{découvre P2}) = \frac{1 * 1/3}{1/2} = \frac{1/3}{1/2} = \frac{2}{3}$
* $ P(\text{Gagne} | \text{Switch}) = \frac{2}{3}$


On a donc tout intérêt à changer d'avis car : 

$P(\text{Gagne} | \text{NoSwitch}) = 1/3$ 

$P(\text{Gagne} | \text{Switch}) = 2/3 $

## Simulation Python associée

In [28]:
# prelude
import pandas as pd

def do_bayes_theorem(hypotheses, priors, likelihoods):
  df = pd.DataFrame({
      "hypothesis": hypotheses,
      "prior": priors,
      "likelihood": likelihoods,
  })
  df["posterior"] = df["prior"] * df["likelihood"]
  df["posterior"] = df["posterior"] / df["posterior"].sum()
  return df

# Faire la liste de toutes les hypotheses
hypotheses = ["No switch", "Switch"]

# Faire la liste des a priori
priors = [1/3, 1/3]

# Faire la liste des vraissemblances
# Faut supposer que l'hypothèse est vraie
likelihoods = [1/2, 1]
do_bayes_theorem(hypotheses, priors, likelihoods)

Unnamed: 0,hypothesis,prior,likelihood,posterior
0,No switch,0.333333,0.5,0.333333
1,Switch,0.333333,1.0,0.666667


# Monty Hall - Théorie


* Au départ la proba de gagner est de 1/3
* Je choisis P1
* L'animateur
  * Si la voiture est en 1. Ouvre la 2 ou la 3. Proba = 1/2
  * Si la voiture est en 2. Ouvre la 3. Proba = 1
  * Si la voiture est en 3. Ouvre la 2. Proba = 1
* Je ne switche pas
  * Proba de gagner = 1/3
* Je switche
  * Si la voiture est en 1. Je vais en 2 ou en 3. Je perds
  * Si la voiture est en 2. P3 est ouverte. Je vais en 2. Je gagne
  * Si la voiture est en 3. P2 est ouverte. Je vais en 3. Je gagne
  * Proba de gagner = 2/3
  
### Conclusion
* Je ne switche pas. Proba de gagner = 1/3
* Je switche. Proba de gagner = 2/3


### On peut aller plus vite
* Au départ la proba de gagner est de 1/3
* Je choisis P1
* L'animateur ouvre un rideau
* Si je perd cela veut dire que la proba de gagner était 2/3

# Simulation Python associée
Le code ci-dessous montre qu'on retrouve bien les chiffres théoriques si on fait l'expérience 1000 fois de suite.

In [22]:
# prelude
import numpy as np  

In [23]:
def monty_hall(switch, reps=1_000):
  wins = 0
  doors = [1, 2, 3]
  for _ in range(reps):
    car_door = np.random.choice(doors)
    chosen_door = np.random.choice(doors)
    opened_door = np.random.choice([d for d in doors if d not in [chosen_door, car_door]])
    if not switch:
      wins += car_door == chosen_door
    else:
      new_chosen_door = [d for d in doors if d not in [chosen_door, opened_door]].pop()
      wins += car_door == new_chosen_door
  print(f"Percentage of wins: {wins.sum() / reps * 100} %")

In [24]:
monty_hall(True)
monty_hall(False)

Percentage of wins: 67.9 %
Percentage of wins: 32.5 %
