# Introduction aux probabilités

Lancez une pièce de monnaie en l’air et rattrapez-la en cachant le résultat. Toutes choses étant égales par ailleurs, quel est le pourcentage de chance qu’elle soit tombée sur le côté *face* ? La réponse est très intuitive : 50 %.

Comment expliquer ce résultat ? Déjà, le lancer d’une pièce de monnaie ne peut avoir que deux issues : *pile* ou *face*. Ensuite, dans l’énoncé, nous avons annoncé que les deux éventualités étaient équiprobables : ainsi, aucun biais, ou poids, ne favorise l’une ou l’autre. Du point de vue mathématique, la relation s’exprime par le quotient entre l’événement réalisé et le nombre des événements possibles :

$$
P(\text{face}) = \frac{1}{2} = 0,5
$$

La probabilité étant le quotient entre une fraction d’un ensemble et l’ensemble lui-même, elle sera toujours contenue dans un intervalle $[0,1]$ où 0 représente un événement impossible et 1 un événement certain, les valeurs intermédiaires servant à quantifier la vraisemblance d’un événement. Dans le cas de notre pièce de monnaie, un événement impossible serait de demander au lancer de sortir la valeur *paire* et un événement certain de lui demander de sortir soit *pile* soit *face*.

Le passage au pourcentage est simplement une transformation de l'échelle de la probabilité afin de la rendre plus compréhensible.

## Définitions

**Univers :** Noté $\Omega$, il désigne l’ensemble des éventualités.

**Événéments complémentaires :** Un événement $A$ qui se réalise aura pour complémentaire un événement $\overline{A}$ qui ne se réalise pas. Par exemple, dans un lancer de dé à six faces, si nous considérons l’événement $A$ « *obtenir un 6* », alors l’événement $\overline{A}$ serait « *ne pas obtenir un 6* ».

**Événements compatibles :** Pour faire référence à deux événements qui peuvent se produire simultanément, comme obtenir sur un dé à six faces une valeur qui soit à la fois *paire* et *inférieure à 4*. On parle également d’événements « non disjoints » dans la mesure où leur intersection n’est pas vide.

**Événements incompatibles :** Si deux événements ne peuvent se produire simultanément, ils sont dits incompatibles ou disjoints, comme obtenir pile et face lors d’un même lancer de pièce. À l’inverse des événéments compatibles, leur intersection est vide.

**Événements indépendants :** Sont jugés indépendants deux événements qui ne sont pas influencés l’un par l’autre, comme la probabilité d’obtenir un 6 lors d’un premier jet de dé, puis un 2 lors du second.

### Deux événements compatibles sont-ils conjoints ?

La définition des événements compatibles et conjoints a de quoi dérouter au premier abord. Du point de vue mathématique, deux événements sont dits compatibles si leur intersection n’est pas vide : $A \cap B \neq \emptyset$. C’est le cas des événements « *paire* » et « *valeur inférieure à 4* » dans un lancer de dé : $A \cap B = \{2\}$.

Les événements conjoints désignent plutôt l’intersection de ces événements, c’est-à-dire l’ensemble des résultats où les deux événements se produisent simultanément. Dans le cas des événements $A$ et $B$ définis plus haut, le seul événement conjoint correspond au résultat $\{2\}$.

## Cas pratique : exemple du jeu de cartes

Soit trois figures extraites d’un jeu de cartes : un valet (V), une dame (D), un roi (R), déclinées dans les quatre couleurs (♥, ♦, ♠, ♣).

Le cardinal de l’ensemble $\Omega$ est le produit des valeurs par leurs déclinaisons dans les couleurs :

$$
\Omega = 3 \times 4 = 12
$$

### Calculer la probabilité d’événements séparés

Étudions séparément la probabilité d’obtenir le tirage *V* et celle d’obtenir un ♣. Pour la première, nous savons qu’il y a quatre valets dans le jeu, aussi, la probabilité est liée à la fréquence de l’événement dans l’univers :

$$
P(V) = \frac{F(V)}{\Omega} = \frac{4}{12} = \frac{1}{3}
$$

Pour la seconde, l’idée reste de calculer le quotient entre la fréquence de l’éventualité d’obtenir un ♣ et le cardinal de l’ensemble $\Omega$ :

$$
P(♣) = \frac{F(♣)}{\Omega} = \frac{3}{12} = \frac{1}{4}
$$

### Calculer la probabilité d’événements complémentaires

Si $P(♣) = \frac{1}{4}$, alors $P(\overline{♣}) = \frac{3}{4}$. Plus formellement :

$$
\begin{aligned}
P(A) &= 1 - P(\overline{A})\\
P(\overline{A}) &= 1 - P(A)\\
P(A \cup \overline{A}) &= 1\\
P(A \cap \overline{A}) &= 0
\end{aligned}
$$

### Calculer la probabilité d’événements compatibles

Quelle serait maintenant la probabilité de tirer un valet de trèfle ? Comme les deux événements peuvent survenir en même temps, le résultat est l’intersection entre l’ensemble des valets et l’ensemble des trèfles :

$$
P(V \cap ♣) = \frac{F(V♣)}{\Omega} = \frac{1}{12}
$$

Une autre question pourrait être de connaître la probabilité de tirer soit un valet, soit un trèfle lors du même tirage. C'est à cette occasion que la notion de compatibilité est primordiale, parce qu’un valet peut aussi être un trèfle et réciproquement. La probabilité d’obtenir un valet ou un trèfle ne peut seulement être la somme des deux considérées individuellement : il faut dans ce cas lui soustraire l’éventualité où les deux surviennent conjointement. En termes mathématiques :

$$
\begin{aligned}
P(V \cup ♣) &= P(V) + P(♣) - P(V \cap ♣) \\
&= \frac{4}{12} + \frac{3}{12} - \frac{1}{12}\\
&= \frac{6}{12} = \frac{1}{2}
\end{aligned}
$$

### Calculer la probabilité d’événements incompatibles

omment traduire la notion d’incompatibilité ? Prenons la question suivante : quelle est la probabilité d’obtenir soit un valet de trèfle soit une dame de cœur ? Comme les événements ne peuvent arriver en même temps dans un même tirage, on effectue cette fois-ci l’addition de leurs probabilités respectives :

$$
\begin{aligned}
P(P(V \cap ♣) \cup P(D \cap ♥)) &= P(V \cap ♣) + P(D \cap ♥) \\
&= \frac{1}{12} + \frac{1}{12} = \frac{1}{6}
\end{aligned}
$$

### Calculer la probabilité d’événements conditionnels

Considérons à présent l’éventualité d’obtenir lors de deux tirages successifs une carte puis une autre.

#### Avec remise

Si la carte issue du premier tirage est remise dans le jeu avant le second, les deux événements sont jugés **indépendants** : le tirage de la première carte n’influence en aucune manière le résultat de la seconde. La probabilité que deux événements indépendants surviennent est alors le produit des deux événements pris individuellement.

Analysons quelques exemples. Dans le premier, quelle est la probabilité d’obtenir un valet, puis une dame ?

$$
\begin{aligned}
P(V_1 \cap D_2) &= P(V) \times P(D)\\
&= \frac{1}{3} \times \frac{1}{3}\\
&= \frac{1}{9}
\end{aligned}
$$

Quelle est à présent la chance de tirer un valet puis un trèfle ?

$$
\begin{aligned}
P(V_1 \cap ♣_2) &= P(V) \times P(♣)\\
&= \frac{1}{3} \times \frac{1}{4}\\
&= \frac{1}{12}
\end{aligned}
$$

Enfin, calculons l’éventualité d’obtenir un valet de trèfle puis une dame de cœur :

$$
\begin{aligned}
P(P(V \cap ♣)_1 \cap P(D \cap ♥)_2) &= P(V \cap ♣) \times P(D \cap ♥) \\
&= \frac{1}{12} \times \frac{1}{12}\\
&= \frac{1}{144}
\end{aligned}
$$

#### Sans remise

Dans ce cas, la carte tirée n’est pas remise dans le jeu, ce qui rend les deux événements **dépendants** : le résultat du second tirage est influencé par le premier. Prenons l’exemple où l’on souhaite tirer un valet la première fois et une dame la seconde. Au moment du second tirage, il ne reste plus que onze cartes et toujours quatre dames. Autrement dit, nous avons fait l’expérience du premier tirage, ce qui nous donne une information supplémentaire propre à réduire l’incertitude dans laquelle nous étions en présence d’événements indépendants. La probabilité se calcule alors comme suit :

$$
\begin{aligned}
P(V_1 \cap D_2) &= P(V) \times P(D|V)\\
&= \frac{1}{3} \times \frac{4}{11}\\
&= \frac{4}{33}
\end{aligned}
$$

Si la question avait été de calculer plutôt la probabilité d’obtenir deux valets successivement :

$$
\begin{aligned}
P(V_1 \cap V_2) &= P(V) \times P(V|V)\\
&= \frac{1}{3} \times \frac{3}{11}\\
&= \frac{3}{33}
\end{aligned}
$$

Dernier exemple, estimons la probabilité d’obtenir un valet puis un trèfle. Ici, on ne peut résoudre la situation avec une seule formule car, au moment du second tirage, on a besoin de savoir si le valet tiré au premier était un trèfle ou non.

Premier cas, le valet tiré n’était pas un trèfle :

$$
\begin{aligned}
P(P(V \cap \overline{♣})_1 \cap ♣_2) &= P(V \cap \overline{♣})_1 \times P(♣|\overline{♣} \cap V)\\
&= \frac{3}{12} \times \frac{3}{11}\\
&= \frac{9}{132}
\end{aligned}
$$

Dans le second cas, le valet tiré était un trèfle :

$$
\begin{aligned}
P(P(V \cap ♣)_1 \cap ♣_2) &= P(V \cap ♣)_1 \times P(♣|♣ \cap V)\\
&= \frac{1}{12} \times \frac{2}{11}\\
&= \frac{2}{132}
\end{aligned}
$$

#### Probabilités totales

Qu’en est-il si l’on souhaite connaître la probabilité d’obtenir un trèfle au second tour, peu importe le résultat du premier tour ? C’est ici que la formule des probabilités totales entre en jeu. Elle permet de calculer la probabilité globale d’un événement en prenant en compte tous les cas possibles, pondérés par leurs probabilités respectives.

Dans l’exemple précédent, la probabilité totale d’obtenir un trèfle au second tirage est :

$$
P(♣_2|V) = P(V_1 \cap ♣_2) + P(\overline{V_1} \cap ♣_2)
$$

**Formule générale :**

$$
P(A) = \sum_{i=1}^n P(B_i) \cdot P(A|B_i)
$$

En appliquant à notre exemple, nous obtenons :

$$
\begin{aligned}
P(♣_2) &= P(\overline{♣}) \cdot P(♣|\overline{♣}) + P(♣) \cdot P(♣|♣)\\
&= \frac{3}{4} \cdot \frac{3}{11} + \frac{1}{4} \cdot \frac{2}{11}\\
&= \frac{9}{44} + \frac{2}{44}\\
&= \frac{1}{4}
\end{aligned}
$$

## Étude de cas : en randonnée

Soit la phrase suivante :

> Paul, le jeune étudiant talentueux, aime explorer les vastes montagnes verdoyantes.

Après les phases de tokenisation et d’étiquetage, vous obtenez le résultat suivant :

```mermaid
flowchart TB
  A("Paul"):::formal-->At["N"]:::academic
  B(","):::formal-->Bt["PONCT"]:::academic
  C("le"):::formal-->Ct["DET"]:::academic
  D("jeune"):::formal-->Dt["ADJ"]:::academic
  E("étudiant"):::formal-->Et["N"]:::academic
  F("talentueux"):::formal-->Ft["ADJ"]:::academic
  G(","):::formal-->Gt["PONCT"]:::academic
classDef formal fill:#fff,stroke:#D68738,color:#D68738
classDef academic fill:#032B4F,stroke:#032B4F,color:#fff
```
```mermaid
flowchart TB
  H("aime"):::formal-->Ht["V"]:::academic
  I("explorer"):::formal-->It["V"]:::academic
  J("les"):::formal-->Jt["DET"]:::academic
  K("vastes"):::formal-->Kt["ADJ"]:::academic
  L("montagnes"):::formal-->Lt["N"]:::academic
  M("verdoyantes"):::formal-->Mt["ADJ"]:::academic
  N("."):::formal-->Nt["PONCT"]:::academic
classDef formal fill:#fff,stroke:#D68738,color:#D68738
classDef academic fill:#032B4F,stroke:#032B4F,color:#fff
```

### Questions

1. Dans une situation d’équiprobabilité des tokens, quelle est la probabilité de réalisation de l’évènement *Paul* ?  
Il existe 14 tokens en tout qui constituent l’univers des possibilités et un seul évènement *Paul*, ainsi :

$$
P(Paul) = \frac{1}{14}
$$

2. Quelle est la probabilité de l’évènement *ADJ* ?  
Cette fois-ci, la fréquence de l’évènement *ADJ* est de 4, donc :

$$
P(ADJ) = \frac{4}{14} = \frac{2}{7}
$$

3. Quelle est la probabilité de l’évènement $\lnot{ADJ}$ ?  
L'évènement *non ADJ* est quant à lui constitué de tous les évènements qui ne sont pas *ADJ*, soit :

$$
P(\lnot ADJ) = 1 - \frac{2}{7} = \frac{5}{7}
$$

4. Étant considérés comme indépendants, quelle est la probabilité de l’évènement *ADJ* puis de l’évènement *N* ?  
La probabilité de *ADJ* puis de *N* vaut :

$$
\begin{aligned}
P(ADJ_1 \cap N_2) &= P(ADJ) \cdot P(N)\\
&= \frac{2}{7} \cdot \frac{3}{14}\\
&= \frac{6}{98} = \frac{3}{49}
\end{aligned}
$$

5. Et quelle serait la probabilité de l’évènement *ADJ N* ?  
La question est ici d’estimer la probabilité d’un évènement qui soit *ADJ N* :

$$
P(ADJ, N) = \frac{F(ADJ, N)}{\Omega - 1} = \frac{2}{13}
$$

6. Nous souhaiterions maintenant estimer la probabilité de l’évènement *ADJ* ou *N*.  
Les deux évènements sont incompatibles, aussi on retrouve la relation suivante :

$$
\begin{aligned}
P(ADJ \cup N) &= P(ADJ) + P(N)\\
&= \frac{4}{14} + \frac{3}{14} = \frac{7}{14} = \frac{1}{2}
\end{aligned}
$$

7. Quelle est la probabilité de l’évènement *aime* ou *V* ?  
*aime* et *V* pouvant être conjoints, il faut ôter leur fréquence de la somme de leurs probabilités respectives :

$$
\begin{aligned}
P(aime \cup V) &= P(aime) + P(V) - P(aime \cap V)\\
&= \frac{1}{14} + \frac{2}{14} - \frac{1}{14}\\
&= \frac{2}{14} = \frac{1}{7}
\end{aligned}
$$

8. Pour finir, nous souhaiterions vérifier par la formule des probabilités totales que la probabilité de voir un *N* dans une phrase, en considérant les cas ci-dessous, est égale à la fréquence de *N*, soit 3 sur 14 :

- *N* est précédé d’un *ADJ* ;
- *N* n’est pas précédé d’un *ADJ*.

Selon la formule des probabilités totales :

$$
P(N) = P(ADJ) \cdot P(N∣ADJ) + P(\neg ADJ) \cdot P(N∣ \neg ADJ)
$$

En supposant que :

- $P(ADJ) = \frac{4}{14} = \frac{2}{7}$
- $P(\neg ADJ) = 1 - P(ADJ) = \frac{10}{14} = \frac{5}{7}$
- $P(N∣ADJ) = \frac{2}{4} = \frac{1}{2}$
- $P(N∣¬ADJ) = \frac{1}{10}$

On obtient :

$$
\begin{aligned}
P(N) &= \frac{2}{7} \cdot \frac{1}{2} + \frac{5}{7} \cdot \frac{1}{10}\\
&= \frac{1}{7} + \frac{5}{70} = \frac{15}{70}\\
&= \frac{3}{14}
\end{aligned}
$$

## Étude de cas : la chèvre de M. Hall

De 1963 à 1977, les Américain·es ont pu se divertir devant l’émission *Let's Make a Deal*, un jeu télévisé dans lequel les candidat·es se voyaient proposer des marchés qui pouvaient potentiellement maximiser leurs gains. Elle a par la suite donné lieu à la formulation d’un problème mathématique qui porte le nom de son présentateur : Monty Hall.

### Énoncé du problème

Le candidat ou la candidate est placé·e devant trois portes. Derrière l’une d’elle se trouve une voiture et derrière les deux autres, une chèvre. Après avoir choisi une porte au hasard, le présentateur révèle celle où se cache une chèvre parmi les deux autres portes et offre au candidat ou à la candidate l’opportunité de confirmer son choix ou de changer de porte.

Quelles sont ses chances de gagner ?

### Postulats

La formalisation du problème tient compte des postulats suivants :

- Le présentateur sait où se trouve la voiture ;
- le présentateur n’ouvre jamais la porte choisie par le candidat ou la candidate au premier tour ;
- le présentateur ouvre systématiquement une porte derrière laquelle se trouve une chèvre ;
- si le candidat ou la candidate a choisi la porte donnant sur la voiture au premier tour, le présentateur ne donne aucune préférence à l’une ou l’autre des portes qui révèlerait une chèvre ;
- le ou la candidate se voit toujours offrir le choix de changer de porte.

### Modélisation

Naïvement, le problème se résoudrait en considérant uniquement la deuxième situation, lorsque le candidat ou la candidate doit choisir entre deux portes, l’une cachant une voiture et l’autre une chèvre. Dans cette perspective, la chance de gagner serait de une sur deux.

Pourquoi cela n’est-il pas le cas ? Cette réponse n’est pas la solution au problème posé. Pour calculer les chances de gagner du candidat ou de la candidate en prenant en compte tous les postulats, nous devons évaluer ses chances dans le cas où il ou elle confirme son choix et, au contraire, dans le cas où il ou elle modifie son choix.

Estimons la probabilité globale de perdre et celle de gagner :

$$
P(G) = \frac{1}{3} \, , \quad
P(P) = \frac{2}{3}
$$

Maintenant, si le candidat ou la candidate a choisi la porte gagnante au premier tour, modifier son choix le ou la fera obligatoirement perdre. À l’inverse, si il ou elle a choisi l’une des mauvaises portes au premier tour, comme l’autre mauvaise porte aura été révélée par le présentateur, elle aura tout intérêt à changer son choix. Les cas de figure se modélisent :

$$
P(\text{G avec changement}|G) = 0 \, , \quad P(\text{G sans changement}|G) = 1
$$

$$
P(\text{G avec changement}|P) = 1 \, , \quad P(\text{G sans changement}|P) = 0
$$

Sachant cela, nous pouvons calculer la probabilité de gagner avec et sans changement de choix.

#### Avec changement d’avis

$$
\begin{aligned}
P(\text{G avec changement}) &= P(G) \times P(\text{G avec changement}|G) + P(P) \times P(\text{G avec changement}|P)\\
&= \frac{1}{3} \times 0 + \frac{2}{3} \times 1\\
&= 0 + \frac{2}{3}\\
&= \frac{2}{3}
\end{aligned}
$$

#### Sans changement

$$
\begin{aligned}
P(\text{G sans changement}) &= P(G) \times P(\text{G sans changement}|G) + P(P) \times P(\text{G sans changement}|P)\\
&= \frac{1}{3} \times 1 + \frac{2}{3} \times 0\\
&= \frac{1}{3} + 0\\
&= \frac{1}{3}
\end{aligned}
$$

### Conclusion

Même si le résultat est contre-intuitif, il est dans tous les cas préférable de changer son choix !