# Simuler une situation où le hasard joue un rôle
Dans cette partie nous allons nous intéresser au lancer d'un dé ordinaire (6 faces numérotées de 1 à 6) et on utilisera la notation D6 pour y faire référence.
![un dé cubique (D6)](images/d6.jpg)



**L'idée** est d'étudier les fréquences d'apparition de chaque face après avoir exécuté l'expérience un très grand nombre de fois.
![une pile de D6](images/bcp-d6.jpg)

---

On va utiliser python pour simuler un lancer de D6, puis représenter graphiquement les résultats.

Commençons par importer les modules d'affichage

In [None]:
%matplotlib notebook
import matplotlib.pyplot as plt
import ipywidgets as widgets
from IPython.display import display

Il faut pouvoir tirer un nombre au hasard, importons la fonction randint (random veut dire aléatoire en anglais).

In [None]:
from random import randint

Pour enregistrer nos résultats nous aurons besoin de listes :

In [None]:
issues    = [1, 2, 3, 4, 5, 6]  # les issues possibles (xi)
effectifs = [0, 0, 0, 0, 0, 0]  # un compteur pour chaque issue (ni)

list(zip(issues, effectifs))

L'instruction **`zip`** a permis de fabriquer des couples.

Il nous faut maintenant générer des nombres aléatoires entre 1 et 6 :

In [None]:
randint(1, 6)

L'appel à la fonction **`randint(`**_min_**`, `**_max_**`)`** permet d'obtenir aléatoirement un nombre entre *min* et *max* (inclus).

---

Pour plus de commodités, définissons une fonction qui tire plusieurs D6 et renvoie de ces tirages :

In [None]:
# fonction qui permet le tirage aléatoire de 'nb' dés
def tirage(nb):
    liste_tirages = []  # liste vide
    for i in range(nb):
        liste_tirages = liste_tirages + [ randint(1, 6) ]  # on ajoute un élément
    return liste_tirages

serie_test = tirage(10)
print(serie_test)

Maintenant que l'on peut facilement effectuer de nombreux tirages, il faut que l'on calcule le nombre de fois que chaque face est sortie (les effectifs).

Regardons comment compter les occurences de 6 :

In [None]:
compteur = 0
for d6 in serie_test:
    if d6 == 6:
        compteur = compteur + 1
print("Il y a", compteur, "fois le nombre 6")

On pourrait faire un test pour chaque face mais cela se révèlerait coûteux en calcul.

L'idée est d'utiliser directement la liste **`effectifs`**.

En python, les listes sont indexée à partir de 0
>```python
liste = [ "un", "deux", "trois" ]
print(liste[0])
print(liste[1])
print(liste[2])
```

Affiche :
>```python
un
deux
trois
```

Notre index varie donc de **0 à 5** et non de 1 à 6.

In [None]:
effectifs = [0, 0, 0, 0, 0, 0]
for d6 in serie_test:
    print(effectifs)
    print(d6, "-> on augmente l'élément", d6 - 1, "de la liste des effectifs")
    effectifs[d6 - 1] = effectifs[d6 - 1] + 1
    print(effectifs, '\n---')

print("\nLes effectifs de la série", serie_test, "sont:", effectifs)

**En mettant les données en couple :**

In [None]:
list(zip(issues, effectifs))

**Combinons nos résultats :**

Pour de grands tirages (comme 1 000 000 D6), il vaut mieux directement remplir la liste des effectifs et ne pas garder en mémoire la série des tirage.<br>On range le dé dans la bonne case directement...

In [None]:
def distrib_tirage(nb):
    effs = [0, 0, 0, 0, 0, 0]      # initialisation
    for _ in range(nb):            # le compteur n'est pas utilisé dans la boucle, '_' permet de ne gagner en vitesse
        effs[randint(0,5)] += 1    # ici, l'opérateur += permet d'incrémenter la bonne case
    return effs

effectifs_test = distrib_tirage(10)
print(effectifs_test)

In [None]:
experience = list(zip(issues, effectifs_test))
print("Voici la répartition du tirage de 10 D6 :", experience)
for i in range(6):
    print("La face", issues[i], "est sortie", effectifs_test[i], "fois")


Testons la performance :

In [None]:
print("Tirage de 1 000 D6 :")
%time distrib_tirage(1000)

print("Tirage de 10 000 D6 :")
%time distrib_tirage(10**4)

print("Tirage de 100 000 D6 :")
%time distrib_tirage(10**5)

print("---\nTest plus poussé en cours...")
%timeit distrib_tirage(1000)

La performance est acceptable pour notre propos.

Passons à la partie interactive.

## Simulation des tirages

In [None]:
effectifs = [0]*6  # réinitialisation des compteurs
nb_D6 = 1          # nombre de dés 6 à lancer lorsque l'on clique le bouton

# déclaration du diagramme   
fig = plt.figure()
ax = fig.add_subplot(111)

%run -i diagramme.py

Pour mieux comprendre le tirage effectué, calculons les fréquences (en %) :

In [None]:
nb_lancers = sum(effectifs)
frequences = list(map(lambda x: 100*x / nb_lancers, effectifs))

fig = plt.figure()
%run -i freq.py

Les fréquences obtenues se rapprochent d'une valeur théorique que l'on appelle *probabilité*.<br>
Cela permet d'évaluer les chances qu'un événement se réalise lorsque l'on effectue une expérience aléatoire.

Dans cette expérience, chaque face a été réalisée pour environ $\frac{1}{6}$ des lancers. C'est une situation d'équiprobabilité.

| Face |Probabilité associée|
|:----:|:------------------:|
|1|$\frac{1}{6}$|
|2|$\frac{1}{6}$|
|3|$\frac{1}{6}$|
|4|$\frac{1}{6}$|
|5|$\frac{1}{6}$|
|6|$\frac{1}{6}$|


# Probabilités

## Quelques rappels de vocabulaire :
1. **expérience aléatoire** : le résultat n'est pas prévisible à l'avance mais on sait décrire toutes les éventualités.
1. **issue** : un des résultats possibles.
1. **univers** : ensemble de toutes les issues. On le note souvent $\Omega$.
1. **événement** : ensemble d'issues (souvent décrit par une expression).

## Définir une loi de probabilité
Une loi de probabilité sur $\Omega=\bigl\{x_1 ; x_2 ; ... ; x_k \bigr\}$ consiste :
* À définir pour chaque issue $x_i \in \Omega$, sa probabilité $p_i$ avec $0 \leqslant p_i \leqslant 1$.
* À vérifier que $p_1+p_2+...+p_k=1$ ; c'est-à-dire $\sum p_i = 1$.

La probabilité d'un événement est alors la somme des probabilités de chaque issue de cet événement.


---
Dans l'expérience de lancer de dé, l'univers $\Omega=\bigl\{1 ; 2 ; 3 ; 4 ; 5 ; 6\bigr\}$, à chaque issue $i$ on associe $p_i=\frac{1}{6}$.<br>
On a bien : $\sum p_i=\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}=\frac{6}{6}=1$.

L'événement $A$ : « **Obtenir un nombre impair** » correspond aux issues 1, 3 et 5. sa probabilité est donc :
$$\textrm{P}(A)=p_1 + p_3 + p_5 = \frac{3}{6}=\frac{1}{2}$$
L'événement contraire $\overline{A}$ contient toutes les autres issues et se traduit par : « **Obtenir un nombre pair** ».<br>
Sa probabilité est : $$\textrm{P}\left(\overline{A}\right)=1-\textrm{P}(A)=1-\frac{1}{2}=\frac{1}{2}$$

---

# Expérience avec 2 D6

On lance simultanément deux D6 et on note leur somme.<br>
Prendre la somme consiste à utiliser une fonction qui renvoie un nombre entre 2 et 12.<br>
Lorsque l'on va modéliser cette expérience, on parlera de variable aléatoire.

In [None]:
resultats2d6 = [0]*11
issues2d6 = [i+2 for i in range(11)]
nb_D6 = 10

fig = plt.figure()
ax = fig.add_subplot(111)

%run -i diag2d6.py

In [None]:
nb_lancers2d6 = sum(resultats2d6)
frequences2d6 = list(map(lambda x: 100*x / nb_lancers2d6, resultats2d6))

fig = plt.figure()
%run -i freq2d6.py

On voit que la distribution n'est pas uniforme cette fois ci.

Les résultats sont proches de la distribution suivante :

| Somme |Probabilité associée|
|:----:|:------------------:|
|2|$\frac{1}{36}$|
|3|$\frac{2}{36}=\frac{1}{18}$|
|4|$\frac{3}{36}=\frac{1}{12}$|
|5|$\frac{4}{36}=\frac{1}{9}$|
|6|$\frac{5}{36}$|
|7|$\frac{6}{36}=\frac{1}{6}$|
|8|$\frac{5}{36}$|
|9|$\frac{4}{36}=\frac{1}{9}$|
|10|$\frac{3}{36}=\frac{1}{12}$|
|11|$\frac{2}{36}=\frac{1}{18}$|
|12|$\frac{1}{36}$|


Pour justifier ce genre de résultats, nous allons introduire la notion de **variable aléatoire**.