In [1]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
import seaborn as sns

import scipy as sp

## Probabilités

### possibilités et variable aléatoires
- variable aléatoire = variable stochastique
- EN: probability, random variable, stochastic variable

variable aléatoire c'est une quantité dont la valeur n'est pas connu à l'avance, mais qui a un domaine de valeurs possibles
- le résulat d'un dé à 6 faces est une variable aléatoire
    - les valeurs **mutuellement exclusives possibles** pour cette variable aléatoire sont $X = \{x_1,x_2,..., x_N\} = \{1,2,3,4,5,6\}$

- pour une piece, les valeurs possibles sont $\{\text{pile},\text{face}\} = \{0,1\}$

### expérience
pour obtenir la valeur d'une variable aléatoire je dois effecuter une expérience qui vient "figer" la valeur:
- quand je lance un dé à 6 faces (non-pipé), j'obtiens un 3:
    1. je vais lancer un dé
    2. un dé a 6 faces
    3. 6 valeurs possibles=$\{1,2,3,4,5,6\}$
    4. la valeur que va avoir ce dé est aléatoire
    5. je lance le dé, cette action "choisi" une valeur parmi les possibilité: ici "3"
    6. conclusion: la valeur de ce lancé, après l'expérience, est de "3"
- quand je lance un autre dé (6 faces, non-pipé), un 5

- expériences de **variables aléatoires indépendentes** (pas de karma):
    - ce n'est pas parce que j'ai lancé un 3, que le deuxième lancé m'a donné un 5.
    - le résultat d'un premier dé, n'infuence pas le résultat de l'autre.
- expériences de **variables aléatoires dépendantes**:
    - le résultat d'un premier dé, infuence (sans forcément garentir) le résultat de l'autre.


### [probablité (fréquentiste)](https://en.wikipedia.org/wiki/Frequentist_probability)
- la probabilité $P(x_i)$ d'obtenir une valeur $x_i$= c'est la proportion d'occurences (= fréquence) de cette valeur $x_i$ si je devait effectuer une infinité d'expériences (indépendentes). (= La loi des grand nombre.)

- Donc, la somme des probabilités de toutes les occurences possible a, par définition, toujours une valeur de 1 (car la somme des fréquences est également 1):

    - $\sum_{x \in X} P(x) =\sum_{i=1}^{N} P(x_i) = 1$

- règles de calculs de probabilités avec des occurences **mutuellement exclusives** (si c'est 3 ce ne sait pas être 5):
    - $P(\text{NOT } x_i)$ = $P(x_i^c) = 1- \sum_{j\neq i} P(x_j)$ : $x_i^c$ complément de $x_i$
    - $P(x_i)+P(x_i^c) = 1$
    - $P(a \text{ AND } b) = P(a \cap b) = P(a,b) = P(a)\cdot P(b)$
    - $P(a \text{ OR } b) = P(a \cup b) = P(a) + P(b)$

<br>

- (pour les variables avec occurences non-exclusives):
    - $P(a \text{ OR } b) = P(a \cup b) = P(a) + P(b) - P(a \cap b)$
    - $P(a \text{ AND } b) \neq P(a)\cdot P(b)$
        - la valeur ce celle-ci dépend au cas par cas

## distributions de probabilités discrètes: une expérience
### distribution uniforme
- pour un lancé de dé (6 faces), si il n'est pas pipé (pas truqué),on a des chance identitiques pour chaque face du dé
- pour une piece équilibré on a une chance sur deux d'avoir "pile" (=0), et une chance sur deux d'avoir "face" (=1)

chaque possibilité a le même poids en terme de probabilité: ce sont des distributions uniformes
$ P(x_1) = P(x_2) = ... = P(x_N) = \frac{1}{N}$ 

### [distribution de Bernoulli](https://en.wikipedia.org/wiki/Bernoulli_distribution)
- la manière de modéliser un jet de piece c'est via une expérience de Bernoulli:
  - on a 2 valeurs possibles: $X = \{0,1\}$, le cas le plus simple (qui ait du sens de modéliser)
  - par convention :
      - echec = 0
      - succes = 1
  - par contre, il se peut qu'on ai pas des chances identique pour un scénario vs l'autre
  - les propriétés de cette distribution sont peuvent être décrites par simplement la probabilité d'un succes (= 1) : $P(x=1) = p$

exemple :  
- J'essaye de lancer une bouteille dans une poubelle à 5m de celle-ci. Je ne suis pas très bon. Je n'ai donc pas forcément une chance sur deux de réussir. Ici, disons $P(x=1) = 0.15$
- (Si c'est approprié de modéliser cette expérience de pensé avec une exprérience de Bernoulli,) j'ai 15% de chance de placer la bouteille dans la poubelle à cette distance de 5m. 

### [distribution categorique](https://en.wikipedia.org/wiki/Categorical_distribution)
- c'est une extention de Bernouilli,
  mais au lieu de 2 possibilités $X= \{0,1\}$ je peux en avoir un nombre arbitraire $X= \{1,2,..,N\}$

- chaque occurence peut avoir une probabilité différente
- un dé à 6 faces (pipé ou non) peut être modélisé par une distrubtion catégorique

#### exo A: dé 6 faces équilibré
a) je lance une fois, quelle est la probabilité d'obtenir un 6 ?  
b) je lance une fois, quelle est la probabilité d'obtenir un 8 ?  
c) je lance deux fois, quelle est la probabilité d'obtenir deux 6 d'affilée ?  
d) je lance deux fois, quelle est la probabilité d'obtenir un 4 et un 2 : dans cet ordre ?  
e) je lance deux fois, quelle est la probabilité d'obtenir un 4 et un 2 : peu importe l'ordre ?  
f) je lance deux fois, quelle est la probabilité d'obtenir un total de 5  ?
g) je lance deux fois, quelle est la probabilité d'obtenir un total de 3 ou moins ?  


## distribution discrètes : plusieures expériences

### binomiale
- c'est une généralisation de Bernoulli: on veut calculer les probabilités quand on fait plusieurs expérences de Bernoulli.
- quel est la probabilité d'avoir "k" reussite quand on fait "n" expériences, en sachant qu'un succes a une probabilité $p$
    - $ P(p,k,n) = {n \choose k} \cdot p ^k \cdot (1-p)^{n-k} = \frac{n!}{(k)!(n-k)!}p ^k \cdot (1-p)^{n-k}$
    - avec $n! = (n)(n-1)(n-2)...(3)(2)(1)$ factorielle
    - et $0! = 1$ par définition

<br>
Exemple :  

- pièce non-équilibrée: $P(\text{pile}) = p = 0.6$
- quelle est la proba d'avoir (avec l'ordre des occurance qui est sans importance) 
    - je lance 2 fois : 2 fois pile :
        - $P(\text{pile}) * P(\text{pile}) = 0.6 * 0.6$
    - je lance 2 fois : 1 fois pile, 1 fois face :
        - $P(\text{pile}) * P(\text{face}) + P(\text{face}) * P(\text{pile}) = 0.6 * 0.4 + 0.4 * 0.6 $
        $= 2*(0.6)*(0.4) = 2*P(\text{pile})*P(\text{face})$
    - je lance 2 fois : 2 fois face :
        - $P(\text{face}) * P(\text{face}) = 0.4 * 0.4$
    - je lance 3 fois, 2 fois pile:
        - $ 3* P(\text{face})* P(\text{face}) * P(\text{pile}) = 3 *  P(\text{face})^2 * P(\text{pile})^{(3-2)}$

les coeficients combinatoires $C(k,n) = {N \choose k} = \frac{n!}{(k)!(n-k)!}$ sont les mêmes que les coefficients des identités remarquables:
- $(a+b)^2 = a^2 + 2ab + b^2$
- $(a+b)^3 = a^3 + 3a^2b + 3 a b^2 + b^3$
- $(a+b)^4 = a^4 + 4a^3b + 6 a^2b^2 + 4 ab^3 + b^4$

### [l'espérence](https://en.wikipedia.org/wiki/Expected_value)
- EN : Expected value
- chaque distribution a une moyenne (pondéré) théorique = "l'espérence" $E[X]$ 
    - $E[X] = \mu_X = \sum_i p_i x_i$ 

par exemple pour la loi binomiale avec $n$ expériences, et chance de succès $p$:
- $E[X] = n p$ 
    - pour une piece équilibré, en moyenne, je m'attend à avoir 5 faces sur 10 lancés


### [La loi des grand nombres](https://en.wikipedia.org/wiki/Law_of_large_numbers)
- Dans la limite ou le nombre d'expérience indépendentes identiques devient infinie, l'espérance de la distribion est la même que la moyenne des observation. 
    - $\bar{x} = \frac{\sum_i x_i}{N}$
    - $E[X] = \mu = \lim_{N\to\infty} \bar{x} = \lim_{N\to\infty} \frac{\sum_i x_i}{N}$


### la variance
- $VAR[X] $  
  $ = \sigma^2 $  
  $ = E[(X-\mu_X)^2] $  
  $ = E[(X-E[X])^2] $   
  $ = E[X^2] - E[X]^2$  
  $ = \sum_i p_i (x_i-\mu)^2 $  
  $ = (\sum_i p_i x_i^2) - \mu^2 $

la variance de la loi binomiale:
- $VAR[X] = n p (1-p)$

### [autre moments](https://en.wikipedia.org/wiki/Moment_(mathematics))
- il existes d'autres moment $E[X^n]$ qui permettent de construire d'autres indicateurs que la "moyenne" et "variance"
    

### [multinomiale](https://en.wikipedia.org/wiki/Multinomial_distribution)
- généralisation des binomiale et categorielle: plusieurs valeurs possibles et plusieurs expériences
- exemple avec 3 possibilités:
    - $P(p_1,p_2,p_3, k_1,k_2,k_3) = \frac{n!}{(k_1)!(k_2)!(k_3)!}(p_1)^{k_1} \cdot (p_2)^{k_2} \cdot (p_3)^{k_3}$
    - avec $\sum_i p_i = 1$ et $\sum_i k_i = n$  
<Br><Br>


### [Poisson](https://en.wikipedia.org/wiki/Poisson_distribution)
- la loi de poisson s'applique quand un nombre de réalisations d'un l’événement ce fait dans un laps de temps donné.
- $\lambda$ le nombre moyen d'occurence par unité de temps
- la probabilité d'observer $k$ occurence alors que la moyenne est de $\lambda$:
    - $P_\text{poisson}(k) = \frac{e^{-\lambda} (\lambda)^{k}}{k!}$
    - $E[X] = VAR[X] = \lambda$
<br><br>


#### Exo B
on a observé dans le passé que 45% des clients d’une chaine de supermarché achètent au
moins un produit de sa marque propre lors de chaque visite. Parmi 5 client venus aujourd’hui, 4 d’entre
eux n’ont pas acheté de produits de la marque propre. 
- ~Est ce que cela semble cohérent?~
- Quelle est la probabilité que cela se produise ?

CORRECTION:
- $p(\text{acheter}) = 0.45 $

- $ P(1=\text{acheter}, 4=\text{pas acheter}) $  
  $ = \frac{n!}{k!(n-k)!} (p)^k   (1-p)^{n-k} $  
  $ = \frac{5!}{1!4!}(0.45)^1(0.55)^4 $  
  $ = 0.2058891$




#### Exo C 
trois chasseurs -- A,B,C -- se promènent dans la campagne. 
La probabilité qu'ils atteignent leur cible est de respectivement 0.5,0.7,0.8.

Un lièvre passe, les chasseurs tirent:

a) Quelle est la proba que le lièvre soit touché au moins une fois ?  
b) Quelle est la proba que le lièvre soit touché que par UN chasseur ?  

Au long de leur parcours de chasse, ils ont essayé d'abbatre 3 lièvres, 
avec chaque lièvre à un endroit différent et un moment différent.

c) Quelle est la proba que les chasseurs parviennent à toucher un total de 2 lièvres ?  
d) Quelle est la proba que chaque lièvre rencontré soit touché par exactement 2 chasseurs ?

In [9]:
import math


def poisson_law(k, lambda_):
    """
    Calcule la probabilité de k événements selon la loi de Poisson avec une moyenne lambda_.

    Parameters:
    k (int): Nombre d'événements.
    lambda_ (float): Nombre moyen d'événements (moyenne).

    Returns:
    float: Probabilité de k événements.
    """
    return (lambda_**k * math.exp(-lambda_)) / math.factorial(k)


def binomial_probability(p, k, n):
    """
    Calcule la probabilité d'avoir k réussites en n expériences de Bernoulli.

    Parameters:
    p (float): Probabilité de succès d'une seule expérience.
    k (int): Nombre de réussites.
    n (int): Nombre total d'expériences.

    Returns:
    float: Probabilité d'avoir k réussites en n expériences.
    """
    # Calcul du coefficient binomial (n choose k)
    binomial_coefficient = math.factorial(n) / (
        math.factorial(k) * math.factorial(n - k)
    )

    # Calcul de la probabilité binomiale
    probability = binomial_coefficient * (p**k) * ((1 - p) ** (n - k))

    return probability


# Probabilités individuelles des chasseurs
p_A = 0.5
p_B = 0.7
p_C = 0.8

# a) Probabilité que le lièvre soit touché au moins une fois
p_no_hit = (1 - p_A) * (1 - p_B) * (1 - p_C)
p_at_least_one_hit = 1 - p_no_hit
print(
    f"Probabilité que le lièvre soit touché au moins une fois: {p_at_least_one_hit:.4f}"
)

# b) Probabilité que le lièvre soit touché par un seul chasseur
p_only_A = p_A * (1 - p_B) * (1 - p_C)
p_only_B = (1 - p_A) * p_B * (1 - p_C)
p_only_C = (1 - p_A) * (1 - p_B) * p_C
p_exactly_one_hit = p_only_A + p_only_B + p_only_C
print(
    f"Probabilité que le lièvre soit touché par un seul chasseur: {p_exactly_one_hit:.4f}"
)

# c) Probabilité que les chasseurs touchent un total de 2 lièvres
p = p_at_least_one_hit  # probabilité qu'un lièvre soit touché au moins une fois
k = 2  # on en veut 2
n = 3  # ils voient 3 lièvres
p_total_2_hares = binomial_probability(p, k, n)
print(
    f"Probabilité que les chasseurs touchent un total de 2 lièvres: {p_total_2_hares:.4f}"
)


# d) Probabilité que chaque lièvre soit touché par exactement 2 chasseurs
p_2_hits = p_A * p_B * (1 - p_C) + p_A * (1 - p_B) * p_C + (1 - p_A) * p_B * p_C
p_all_2_hares = p_2_hits**3
print(
    f"Probabilité que chaque lièvre soit touché par exactement 2 chasseurs: {p_all_2_hares:.4f}"
)


Probabilité que le lièvre soit touché au moins une fois: 0.9700
Probabilité que le lièvre soit touché par un seul chasseur: 0.2200
Probabilité que les chasseurs touchent un total de 2 lièvres: 0.0847
Probabilité que chaque lièvre soit touché par exactement 2 chasseurs: 0.1038


#### Exo D
Lors des 10 premières années, il y a eu en moyenne 2 accidents par mois à un carrefour
réputé dangereux. Le mois passé, il y a eu une augmentation de 100% du nombre
d’accidents par rapport à cette moyenne: 
- ~le carrefour semble t il être devenue plus
dangereux?~
- En admettant que la sitation n'a pas changé, quel est la probabilité d'avoir un carrefour avec au moins 4 accidents ?

CORRECTION:
- distribution de Poisson
- le nombre d'accidents moyen est de 2/mois ==> $\lambda = 2$

- proba d'avoir exactement 4 accident sur ce mois-ci=  $e^{-2} (2)^{4}/(4!) = 0.0902$
    - pas la réponse !


- proba d'avoir 3 accidents ou moins ce mois-ci:
    - $P(x\leq 3)$  
      $ = P(0)+P(1)+P(2)+P(3)$  
      $= e^{-2}(2)^0/(0!) + e^{-2}(2)^1/(1!) +e^{-2}(2)^2/(2!) + e^{-2}(2)^3/(3!)$  
      $= 0.8571$



- proba d'avoir 4 accidents ou plus:  
    - $P(x \geq 4) $  
      $= 1 - P(X \leq 3)$  
      $ = 1 - 0.8571 = 0.1429$

In [4]:
# Paramètres de la distribution de Poisson
lambda_ = 2

# Probabilité d'avoir exactement 4 accidents
p_exactly_4 = poisson_law(4, lambda_)
print(f"Probabilité d'avoir exactement 4 accidents: {p_exactly_4:.4f}")

# Probabilité d'avoir 3 accidents ou moins
p_0 = poisson_law(0, lambda_)
p_1 = poisson_law(1, lambda_)
p_2 = poisson_law(2, lambda_)
p_3 = poisson_law(3, lambda_)
p_3_or_less = p_0 + p_1 + p_2 + p_3
print(f"Probabilité d'avoir 3 accidents ou moins: {p_3_or_less:.4f}")

# Probabilité d'avoir 4 accidents ou plus
p_4_or_more = 1 - p_3_or_less
print(f"Probabilité d'avoir 4 accidents ou plus: {p_4_or_more:.4f}")


Probabilité d'avoir exactement 4 accidents: 0.0902
Probabilité d'avoir 3 accidents ou moins: 0.8571
Probabilité d'avoir 4 accidents ou plus: 0.1429


#### Exo E
Un magasin de bijouterie de luxe, reçoit en moyenne 5 client par jour.
Ils ont constaté que avec le nouvel employé arrivé recemment, 
ils ont eu 3 client ou moins chaque jour lors de ces 2 premiers jours.

a) Quel est la probabilité que ce nombre de clients soit du au hasard ? (pas la faute du nouvel employé)  
b) Combiens de jour consecutif avec 3 clients ou moins faut-il pour que 
la probabilité que cette serie de jours ce produise est de moins de 1% ?

In [5]:
# Paramètres de la distribution de Poisson
lambda_ = 5

# a) Probabilité d'avoir 3 clients ou moins en un jour
p_0 = poisson_law(0, lambda_)
p_1 = poisson_law(1, lambda_)
p_2 = poisson_law(2, lambda_)
p_3 = poisson_law(3, lambda_)
p_3_or_less = p_0 + p_1 + p_2 + p_3
print(f"Probabilité d'avoir 3 clients ou moins en un jour: {p_3_or_less:.4f}")

# Probabilité d'avoir 3 clients ou moins pendant deux jours consécutifs
p_2_days = p_3_or_less**2
print(
    f"Probabilité d'avoir 3 clients ou moins pendant deux jours consécutifs: {p_2_days:.4f}"
)

# b) Nombre de jours consécutifs pour que la probabilité soit inférieure à 1%
n = 1
while (p_3_or_less**n) >= 0.01:
    n += 1
print(
    f"Nombre de jours consécutifs avec 3 clients ou moins pour que la probabilité soit inférieure à 1%: {n}"
)


Probabilité d'avoir 3 clients ou moins en un jour: 0.2650
Probabilité d'avoir 3 clients ou moins pendant deux jours consécutifs: 0.0702
Nombre de jours consécutifs avec 3 clients ou moins pour que la probabilité soit inférieure à 1%: 4


## distribution continues
- au lieu d'avoir des possibilités finies/discrètes on a des densité de probabilité:
    - le nombre de possibilité est infinie: chaque valeur dans une plage donné est une possibilité
    - mais comme on a une "infinité" de possible, la probabilité est "nulle" pour une valeur spécifique 
    - cela signifie qu'on ne calcule pas les la probabilité d'une occurence, mais la probabilité dans une plage d'occurences
    - on fait des intégrales plutôt qu'une somme
    - on calcule l'aire sous la courbe plutot que la hauteur de barre

![](repos/aire_proba.png)

### [distribution normale](https://en.wikipedia.org/wiki/Normal_distribution)
- La loi Normale est characterisé **uniquement par sa moyenne et sa variance**
$N(\mu,\sigma^2)$: c'est une référence dans les statistiques et probabilités


![](repos/boxplot-gauss.png)





### [theorème central limite](https://en.wikipedia.org/wiki/Central_limit_theorem)
- EN : Central Limit Theorem
  
- Formulation simplifié:
    - Une somme de variables aléatoires indépendantes et identiquement distribuées tend (le plus souvent) vers une variable aléatoire gaussienne.
    - Ce théorème et ses généralisations offrent une explication de l'omniprésence de la loi normale dans la nature : de nombreux phénomènes sont dus à l'addition d'un grand nombre de petites perturbations aléatoires.
<br><br>

- Formulation exacte pour la somme de variables:
    - Setup:
        - On a $n$ variables identiques et indépendentes $\{x_i\}$
        - $x_i$ ne doivent pas forcément suivre une distribution normale
        - chaque $x_i$ a une espérence $\mu$ et variance $\sigma^2$
    - Conséquences:
        - la somme de ces $x_i$ tend vers une distribution normale avec les characteristiques suivantes:
            - $\sum_{i=1}^n x_i \sim N(n\mu,n\sigma^2)$
<br><br>

- Formulation exacte pour la moyenne des echantillons:
    - Setup: 
        - Une population a pour la variable $X$ une moyenne/espérence de $\mu$ et variance $\sigma^2$
        - Cette variable $X$ de la population ne doit pas forcément suivre une distribution normale
        - Quand on prend un echantillon $i$, on peut calculer la moyenne $\bar{x}_i$ de cet echantillon 
        - Un nombre $n$ d'echantillons indépendants ont chacuns une moyenne observé : un ensemble $\{\bar{x}_i\}$ qui sont différents les uns des autres
    - Consequences :
        - Les valeurs des moyennes de ces echantillons $\{\bar{x}_i\}$, suivent une distribution normale avec les propriétés suivante:
            - la moyenne des $\{\bar{x}_i\}$ = la moyenne de la population $\mu$ quand $n\to\infty$
            - la variance des $\{\bar{x}_i\}$  est proportionnel avec la variance de la population et inversement proportionnel avec le nombre d'échantillons
                -  $\text{VAR}[\bar{x}] \sim \frac{\sigma^2}{n}$
            - $\frac{\sum_{i=1}^n \bar{x}_i}{n} \sim N(\mu,\frac{\sigma^2}{n})$
### loi normale centrée réduite
- loi normale standard
- EN: standard normal distribution

- Beaucoup de phénomènes peuvent être décrite par des loi normales (=voir theorème central limite).
- Il est possible de comparer deux valeurs extrèmes qui viennent de deux distribution normale différentes, mais pas directement.
    - exemple: qu'est-ce qui est le plus extrème: un homme qui a une taille de 2.10m (ou plus)  ou qui a un poids de 55kg (ou moins) ?
        - Comme chaque characteristique suit une distribution normale, la position de ces valeurs sur cette courbe est une indication de à quel point c'est probable ou vraisemblable.

- Pour faire cette comparaison, il est nécéssaire de traduire tout $X$ en Z-score :
    - $Z(X) = \frac{X -\mu_X}{\sigma_X}$
    - $\forall x_i \in X: z_i = \frac{x_i -\mu}{\sigma} \approx  \frac{x_i -\bar{x}}{s}$

Pour l'exemple donné plus haut:
- admettons que la taille $T$ de la population humaine masculine suit une distribution normale avec $\mu = 1.8m$ et $\sigma = 0.08m$
- admettons que le poids $P$ de la population humaine masculine suit une distribution normale avec $\mu = 70kg$ et $\sigma = 5kg$
- $z_T = \frac{2.10-1.80}{0.08} = 3.75$
- $z_P = \frac{55-70}{5} = -4$
- $|z_P| = |-4| > |3.75| = |z_T| $
- Un poids de $55kg$ est plus extrème qu'une taille de $2.10m$


### [distribution lognormale](https://en.wikipedia.org/wiki/Log-normal_distribution)

somme de nombre aléatoire => normale  
multiplication de nombre aléatoire => log-normale

### [distribution Pareto](https://en.wikipedia.org/wiki/Pareto_distribution)

- la loi des 80-20
- exemple dans le monde réel:
    - dans chaque organisation avec $N$ personnes, (en général) $\sqrt{N}$ fourni 50% du travail effectif dans cette organisation
        - dans une organisation avec 10 personnes, 3 font 50% du travail
        - dans une organisation avec 10 000 personnes, 100 font 50% du travail

# [Théorème de Bayes](https://en.wikipedia.org/wiki/Bayes%27_theorem)

$P(A|B) = \frac{P(B|A) P(A)}{P(B)}$  
avec :
- $A,B$ des événements
- $P(A)$,$P(B)\neq 0$ les probabilités d'observer les évenements
- $P(A|B)$ la probabilité conditionnele d'observer $A$ alors que $B$ est vrai
- $P(B|A)$ la probabilité conditionnele d'observer $B$ alors que $A$ est vrai

Ce théorème est facilement demontrable si on sait que:
- $P(A \cap B) = P(A|B)* P(B) $
- $P(B\cap A) = P(A \cap B)$ 


#### exemple sur des malades (reprise de wiki):
imaginons que:
- 1 personne sur 100 000 à un cancer du pancreas
- 100% des patients qui ont un cancer du pancreas souffrent de symptômes (perte d'appétit, perte de poids, ...)
- certaines personnes souffrent des mêmes symptômes, mais n'ont pas de cancer du pancreas
- disons 10 sur 99 999 ont des symptômes, mais sans cancer

on a donc pour chaque 100 000 personnes :
- 1 personne qui a un cancer
- 99 999 qui n'en ont pas  
et en même temps
- 11 personnes qui souffrent de symptômes
- 99 989 qui n'en souffrent pas

La probabilité d'avoir un cancer quand on a les symptômes ne sont que de 9,1 % (dans cet exemple-ci): <br>
- $ P(Cancer|Symptômes) $ <br> 
- $ \quad = \frac{ P(Symptômes|Cancer) * P(Cancer)}{P(Symptômes)} $ <br>
- $ \quad = \frac{ P(Symptômes|Cancer) * P(Cancer)}{P(Symptômes|Cancer)*P(Cancer) + P(Symptômes|NoCancer) * P(NoCancer)}$ <br>
- $\quad  = \frac{ (1) * (1/100000)}{(1+10)/100000} = \frac{1}{11} = 0.091$ 
