In [1]:
from scipy.stats import binom, poisson, hypergeom, geom
import seaborn as sns
import pandas as pd
import ipywidgets as widgets
from ipywidgets import interactive
import matplotlib.pyplot as plt

# Intuitions derrière la loi binomiale

Imaginez que vous postuliez pour un stage. Combien de dossiers de postulation devriez vous envoyer pour augmenter les chances de recevoir une proposition d'entretien ?

La loi binomiale permet d'obtenir la probabilité de recevoir m propositions lorsqu'on envoie n dossiers, étant donné la probabilité qu'un dossier soit accepté.

Vous trouverez ci-dessous un graphique interactif représentant la loi binomiale. La barre en vert vous permet de reconnaître la variable pour laquelle pour cherchez la probabilité. Observez comment la distribution des probabilités se modifie lorsque vous faîtes varier les paramètres. (Veillez à ce que le nombre de réponses recherché soit inférieur ou égal au nombre de dossiers envoyés !).

Dans notre cas on peut interpréter le paramètre "Probabilité de succès" comme étant déterminé par la qualité de votre dossier : plus celle-ci est élevée, plus la porbabilité de succès augmente

In [2]:
def binom_viz(trials, successes, prob):
    
    binom_table = pd.DataFrame({'successes': list(range(0, trials+1 ))})
    binom_table['prob'] = binom_table['successes'].apply(
        lambda x: binom.pmf(x, trials, prob))
    
    colors = (trials+1)*['b']
    colors[successes] = 'g'
    binom_table['prob'].plot.bar(x='successes', y='prob', color=colors, figsize=(20,10))
    #plt.rcParams['figure.figsize'] = (15, 9)
    #plt.figure(figsize=(20,10))
    plt.ylim(0, 1)
    plt.xlim(0, 50)
    plt.xlabel('Nombre de succès parmis les essais', fontsize=20)
    plt.ylabel('Probabilités', fontsize=20)
    plt.xticks(list(range(0,51)), labels=list(range(0,51)))
    
    caption_1.value = "La probabilité d'être accepté exactement {} fois est de".format(str(successes))+" {}".format(str(round(binom_table['prob'].iloc[successes],4)))
   
    
    

In [3]:
prob = widgets.FloatSlider(min=0.01, max=1, step=0.01, value=0.5, continuous_update=False)
prob_label = widgets.Label('Probabilité de succès')
w_1 = widgets.HBox([prob, prob_label])

trials = widgets.IntSlider(min=0, max=50, step = 1, value= 10, continuous_update=False)
trials_label = widgets.Label('Essais')
w_2 = widgets.HBox([trials, trials_label])

successes = widgets.IntSlider(min=0, max=50, step = 1, value= 2, continuous_update=False)
trials_label = widgets.Label('Succès')
w_3 = widgets.HBox([successes, trials_label])

caption_1 = widgets.Label(value= "La probabilité d'être accepté exactement {} fois est de".format(str(successes)))

ui_1 = widgets.VBox([w_1, w_2, w_3])


In [4]:
out_1 = widgets.interactive_output(binom_viz, {'trials': trials, 'successes': successes, 'prob': prob})


display(ui_1, out_1, caption_1)

VBox(children=(HBox(children=(FloatSlider(value=0.5, continuous_update=False, max=1.0, min=0.01, step=0.01), L…

Output()

Label(value="La probabilité d'être accepté exactement 2 fois est de 0.0439")

# Intuitions derrière la loi géométrique

Imaginez désormais que vous cherchiez à connaître la probabilité de recevoir une proposition d'entretien après un certain nombre de réponses négatives, étant donné une certaine probabilité de succès.


La loi gémotrique permet d'obtenir la probabilité de recevoir 1 propositions après n réponses négatives.

Vous trouverez ci-dessous un graphique interactif représentant la loi gémotriques. Observez comment la distribution des probabilités se modifie lorsque vous faîtes varier les paramètres.

In [5]:
def geom_viz(k, p):
    
    geom_table = pd.DataFrame({'k': list(range(0, k+1))})
    geom_table['prob'] = geom_table['k'].apply(
        lambda x: geom.pmf(x, p) if p>0 else 0)
    
    colors = (k+1)*['b']
    colors[k] = 'g'
    geom_table['prob'].plot.bar(x='k', y='prob', color=colors, figsize=(20,10))
    plt.rcParams['figure.figsize'] = (15, 9)
    plt.ylim(0, 1)
    plt.xlim(0, 50)
    plt.xlabel("Nombre de succès après n essais", fontsize=20)
    plt.ylabel('Probabilités', fontsize=20)
    plt.xticks(list(range(0,51)), labels=list(range(0,51)))
    
    caption_2.value =  "La probabilité de réussir à l'essai {} ".format(str(k)) + "est de {}".format(str(round(geom_table['prob'].iloc[k],4)))
    
    print(geom_table)

In [6]:
k = widgets.IntSlider(min=0, max=10, step=1, value=2, continuous_update=False)
k_label = widgets.Label("Nombre d'essais")
w_4 = widgets.HBox([k, k_label])

p = widgets.FloatSlider(min=0, max=1, step=0.01, value=0.5, continuous_update=False)
p_label = widgets.Label('Probabilité de succès')
w_5 = widgets.HBox([p, p_label])



caption_2 = widgets.Label(value= "")

ui_2 = widgets.VBox([w_4, w_5])


In [7]:
out_2 = widgets.interactive_output(geom_viz, {'k': k, 'p' : p})

display(ui_2, out_2, caption_2)

VBox(children=(HBox(children=(IntSlider(value=2, continuous_update=False, max=10), Label(value="Nombre d'essai…

Output()

Label(value="La probabilité de réussir à l'essai 2 est de 0.25")

# Intuitions derrière la loi hypergéométrique

Imaginez maintenant que votre dossier ait été retenu par l'une des entreprises auprès desquelles vous avez postulez.

La loi hypergeométrique vous permet d'obtenir la probabilité que vous soyez reçu pour un second entretien étant donné :
1. Le nombre total de candidats reçus au premier entretien (ici, 50)
2. Le nombre de candidats à qui on proposera un second entretien (5)
3. Le nombre candidats aillant une certaine caractéristique parmi tous les autres. (Par exemple, "candidats appartenant à la même volée que vous qui ont postulé pour le même stage". Si vous cherchez à savoir si vous serez sélectionné, i.e. avoir la caractéristique d'être vous, le nombre se réduit à 1)
4. Le nombre de candidats aillant cette caractéristique qu'on souhaite voire apparaître dans le tirage 

Vous trouverez ci-dessous un graphique interactif représentant la loi hypergéométrique. Observez comment la distribution des probabilités se modifie lorsque vous faîtes varier les paramètres. 

(Si cela fait plus de sens, on peut imaginer une autre caractéristique, comme "candidats appartenant à la même volée que vous qui ont postulé pour le même stage")

In [8]:
def hypergeom_viz(k_2, N, R, n):
    
    h_table = pd.DataFrame({'k_2': list(range(0, 31 ))})
    h_table['prob'] = h_table['k_2'].apply(
        lambda x: hypergeom.pmf(x, N, R, n))
    
    colors = 31*['b']
    colors[k_2] = 'g'
    h_table['prob'].plot.bar(x='k_2', y='prob', color=colors, figsize=(20,10))
    plt.rcParams['figure.figsize'] = (15, 9)
    plt.ylim(0, 1)
    plt.xlim(0, 20)
    plt.ylabel('Probabilités', fontsize=20)
    plt.xlabel("Nombre d'invidus tirés ayant une certaine caractéristique", fontsize=20)
    plt.xticks(list(range(0,51)), labels=list(range(0,51)))
    
    caption_3.value =  "La probabilité de tirer {} individus parmi le groupe d'intérêt de quand on tire {} indvidus parmi {} ".format(str(k_2), str(n), str(N)) + "est de {}".format(str(round(h_table['prob'].iloc[k_2],4)))
    
    

In [9]:
k_2 = widgets.IntSlider(min=0, max=20, step=1, value=1, continuous_update=False)
k_2_label = widgets.Label("Nombre d'invidus qui nous intéressent dans ce groupe")
w_6 = widgets.HBox([k_2, k_2_label])

N = widgets.IntSlider(min=0, max=100, step = 1, value= 50, continuous_update=False)
N_label = widgets.Label("Nombre total d'individus dans le pool")
w_7 = widgets.HBox([N, N_label])

R = widgets.IntSlider(min=0, max=50, step = 1, value= 1, continuous_update=False)
R_label = widgets.Label("Nombre total d'invidus du groupe qui nous intéresse")
w_8 = widgets.HBox([R, R_label])

n = widgets.IntSlider(min=0, max=30, step = 1, value= 5, continuous_update=False)
n_label = widgets.Label("Nombre d'individus qui seront sélectionnés")
w_9 = widgets.HBox([n, n_label])

caption_3 = widgets.Label(value= "La probabilité de tirer {} individu parmi le groupe d'intérêt de quand on tire {} indvidus parmi {} est de ".format(str(k), str(n), str(N)))

ui_3 = widgets.VBox([w_7, w_9,w_8, w_6])


In [10]:
out_3 = widgets.interactive_output(hypergeom_viz, {'k_2': k_2, 'N': N, 'R': R, 'n' : n})

display(ui_3, out_3, caption_3)

VBox(children=(HBox(children=(IntSlider(value=50, continuous_update=False), Label(value="Nombre total d'indivi…

Output()

Label(value="La probabilité de tirer 1 individus parmi le groupe d'intérêt de quand on tire 5 indvidus parmi 5…

# Intuitions derrière la loi poisson

Imaginez que vous en êtes au mois de janvier de votre dernier semestre et qu'il vous faut trouver un stage pour le mois de juillet. Combien de propositions d'entretien pouvez vous esprérer recevoir d'ici là ?

La loi poisson permet d'obtenir la probabilité de recevoir m propositions dans un intervalle de temps donné étant donné le nombre de propositions moyen envoyées sur cette période.

Vous trouverez ci-dessous un graphique interactif représentant la loi poisson. Observez comment la distribution des probabilités se modifie lorsque vous faîtes varier les paramètres.

Notez que la distribution "continue" hors du cadre du graphique quand le nombre moyen de réponses tend vers le maximum du slider.

In [11]:
def poisson_viz(k_3, mu):
    
    poisson_table = pd.DataFrame({'k_3': list(range(0, 51 ))})
    poisson_table['prob'] = poisson_table['k_3'].apply(
        lambda x: poisson.pmf(x, mu))
    
    colors = 51*['b']
    colors[k_3] = 'g'
    poisson_table['prob'].plot.bar(x='k_3', y='prob', color=colors, figsize=(20,10))
    plt.rcParams['figure.figsize'] = (15, 9)
    plt.ylim(0, 1)
    plt.xlim(0, 50)
    plt.ylabel('Probabilités', fontsize=20)
    plt.xlabel("Nombre de réponses dans l'interval", fontsize=20)


    plt.xticks(list(range(0,51)), labels=list(range(0,51)))
    
    caption_4.value = "La probabilité de recevoir exactement {} réponses sur la période est".format(str(k_3))+" {}".format(str(round(poisson_table['prob'].iloc[k_3],4)))
    
    

In [12]:
k_3 = widgets.IntSlider(min=0, max=50, step=1, value=1, continuous_update=False)
k_3_label = widgets.Label('Nombre de réponses')
w_10 = widgets.HBox([k_3, k_3_label])

mu = widgets.IntSlider(min=0, max=50, step = 1, value=5, continuous_update=False)
mu_label = widgets.Label('Nombre moyen de réponses sur la période')
w_11 = widgets.HBox([mu, mu_label])



caption_4 = widgets.Label(value= "La probabilité d'être accepté exactement {} fois est de".format(str(successes)))

ui_4 = widgets.VBox([w_10, w_11])


In [13]:
out_4 = widgets.interactive_output(poisson_viz, {'k_3': k_3, 'mu': mu})

display(ui_4, out_4, caption_4)

VBox(children=(HBox(children=(IntSlider(value=1, continuous_update=False, max=50), Label(value='Nombre de répo…

Output()

Label(value='La probabilité de recevoir exactement 1 réponses sur la période est 0.0337')