# Cours 1 - Introduction et fondements de l'expérience
Créé par Michel-Pierre Coll - 2022, michel-pierre.coll@psy.ulaval.ca


## 0. Instructions - calepin interactifs

Les simulations, la visualisation et l'interaction sont d'excellentes façon de comprendre certains concepts statistiques (Moreau, 2015). Au cours de la session nous utiliserons régulièrement des simulations et visualisations pour illuster certains concepts. 

Ces simulations sont effectuées en utilisant des documents comme celui-ci ("calepins" ou *notebooks*) qui contiennent des explications et des "cellules" qui permettent d'exécuter le langage de programmation *Python*. Dans la majorité des cas, le code sera caché. Il vous sera parfois demandé de changer quelques paramètres dans le code pour évaluer leur effet sur les résultats à l'aide de boutons. **LA COMPRÉHENSION DU CODE DANS LES CELLULES N'EST PAS NÉCESSAIRE POUR LE COURS.** Si vous aimeriez comprendre comment les simulations sont effectuées, vous pouvez cliquer sur "Show code".


Pour débuter, exécutez le calepin en allant dans le menu "Runtime -> Run all" ci-haut.

Moreau, D. (2015). When seeing is learning: dynamic and interactive visualizations to teach statistical concepts. Front. Psychol. 6:342. doi: 10.3389/fpsyg.2015.00342



```{tip} ipython3
test

```

In [None]:
:tags: [hide-input]
%pip install ipywidgets
%pip install seaborn

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from scipy import stats
import numpy as np
import seaborn as sns
from ipywidgets import interact_manual
%config InlineBackend.figure_format='retina'


def normal_dist(mu=170, sigma=20):
  plt.figure(figsize=(10, 6))
  x = np.linspace(mu - 10*sigma, mu + 10*sigma, 1000)
  plt.axvline(mu, color='r', linestyle='--')
  plt.plot(x, stats.norm.pdf(x, mu, sigma), label='Distribution de la population')
  plt.title('Distribution de la taille dans la population', fontsize=20)
  plt.ylabel('Densité', fontsize=20)
  plt.xlabel('Taille (cm)', fontsize=20)
  plt.xlim(100, 250)
  plt.tick_params(labelsize=15)
  plt.show()

interactive_plot = interact_manual(normal_dist, mu=(100,240),sigma=(1,40))



Nous utiliserons souvent des figures interactives. Par exemple, dans la cellule ci-dessous, vous pouvez modifier la moyenne et l'écart-type de la distribution normale de la taille dans la population et voir l'effet de ces changements sur la forme de la distribution.

**mu:** Moyenne de la distribution dans la population

**sigma:** Écart-type de la distribution dans la population.



In [None]:

def normal_dist(mu=170, sigma=20):
  plt.figure(figsize=(10, 6))
  x = np.linspace(mu - 10*sigma, mu + 10*sigma, 1000)
  plt.axvline(mu, color='r', linestyle='--')
  plt.plot(x, stats.norm.pdf(x, mu, sigma), label='Distribution de la population')
  plt.title('Distribution de la taille dans la population', fontsize=20)
  plt.ylabel('Densité', fontsize=20)
  plt.xlabel('Taille (cm)', fontsize=20)
  plt.xlim(100, 250)
  plt.tick_params(labelsize=15)
  plt.show()

interactive_plot = interact_manual(normal_dist, mu=(100,240),sigma=(1,40))



In [None]:
#@title _

def normal_dist_sample(mu=170, sigma=20, n=20, nouveau=0):
    groupe1 = np.random.normal(loc=mu, scale=sigma, size=n)
    fig, axes= plt.subplots(1, 2, figsize=(20, 6))

    x = np.linspace(mu - 3*sigma, mu + 3*sigma, 1000)
    y1 = [stats.norm.pdf(x, mu, sigma)[np.argmin(np.abs(x - v))] for v in groupe1]
    axes[0].axvline(mu, color='r', linestyle='--')

    axes[0].plot(x, stats.norm.pdf(x, mu, sigma), label='Distribution de la population')
    axes[0].set_title('1A- Distribution de la taille dans la population', fontsize=20)
    axes[0].scatter(groupe1, y1, label=('Dernier échantillon aléatoire (N=' +  str(n) + ')') , s=50, color='k')
    axes[0].set_ylabel('Densité', fontsize=20)
    axes[0].set_xlabel('Taille (cm)', fontsize=20)
    axes[0].set_xlim(mu-3*sigma, mu+3*sigma)
    axes[0].tick_params(labelsize=15)
    axes[0].legend(fontsize=12)

    sns.histplot(groupe1, kde=False, edgecolor='k', ax=axes[1])
    axes[1].axvline(np.mean(groupe1), linestyle='--', color='r', label='Moyenne: (N=' + str(n) + '): ' + str(np.round(np.mean(groupe1), 2)))
    axes[1].axvline(np.mean(groupe1), linestyle='--', color='r', alpha=0, label='ÉT: (N=' + str(n) + '): ' + str(np.round(np.std(groupe1), 2)))

    # axes[1].axvline(np.mean(all_means)-np.std(groupe1), linestyle='--', color='g', label='Écart-type: ' + str(np.round(np.std(groupe1), 2)))
    # axes[1].axvline(np.mean(all_means)+np.std(groupe1), linestyle='--', color='g', label='Erreur standard: ' + str(np.round(np.std(groupe1)/np.sqrt(N_groupe1), 2)))
    axes[1].set_title("1B - Distribution de l'échantillon aléatoire", fontsize=20)
    axes[1].set_ylabel('Fréquence', fontsize=20)
    axes[1].set_xlabel('Taille (cm)', fontsize=20)
    axes[1].set_xlim(mu-3*sigma, mu+3*sigma)

    axes[1].legend(fontsize=12)
    axes[1].tick_params(labelsize=15)
    plt.show()


interactive_plot = interact_manual(normal_dist_sample, mu=(100,240),sigma=(1,500), n=(1, 5000), nouveau=(0,1))
interactive_plot.widget.children[4].description = 'Exécuter!'




## TEst