![Data Dunkers Banner](https://github.com/Data-Dunkers/lessons/blob/main/images/top-banner.jpg?raw=true)

<a href="https://hub.callysto.ca/jupyter/hub/user-redirect/git-pull?repo=https%3A%2F%2Fgithub.com%2Fdata-dunkers%2Flessons&branch=main&subPath=data-statistics.ipynb&depth=1" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-callysto-button.svg?sanitize=true" width="123" height="24" alt="Open in Callysto"/></a>
<a href="https://colab.research.google.com/github/data-dunkers/lessons/blob/main/data-statistics.ipynb" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-colab-button.svg?sanitize=true" width="123" height="24" alt="Open in Colab"/></a>

# Leçon de Data Dunkers : les statistiques

## Objectifs

À la fin de cette leçon, les étudiants seront capables de :
- Calculer des mesures statistiques de base telles que le minimum, le maximum, la moyenne et la médiane en utilisant Python.
    - Exemple : Calculer le nombre minimum, maximum, médian et moyen de matchs joués par les joueurs des Raptors.
- Manipuler et mettre en forme des données statistiques pour une présentation claire.
    - Exemple : Convertir le nombre médian de matchs d'un nombre flottant à un nombre entier et arrondir la moyenne à une décimale.
- Générer des statistiques complètes pour des ensembles de données entiers à l'aide de fonctions telles que `describe()`.
    - Exemple : Utilisez la fonction `describe()` pour afficher toutes les statistiques disponibles pour les colonnes numériques de l'ensemble de données Raptors.
- Appliquer les chaînes f pour un formatage avancé des données en Python afin de créer des résultats clairs et précis.
    - Exemple : Utilisez les chaînes f pour formater la sortie de mesures statistiques telles que le minimum, le maximum, la moyenne et la médiane d'une manière lisible.

## Introduction

Les statistiques sont utilisées dans de nombreux domaines d'étude afin de déterminer pourquoi les choses se produisent, quand elles se produisent et si leur répétition est prévisible. Voici quelques exemples quotidiens de l'utilisation des statistiques¹ :

- **Biologie** : Les statistiques peuvent être utilisées pour analyser les données provenant d'expériences et d'études de recherche en biologie.
- **Croissance de l'entreprise** : Les statistiques peuvent être utilisées pour analyser les données des ventes et d'autres mesures commerciales afin d'identifier les tendances et les opportunités de croissance.
- **Économie** : Les statistiques peuvent être utilisées pour analyser des données économiques telles que le PIB, les taux d'inflation et les taux de chômage.
- Agriculture et jardinage** : Les statistiques peuvent être utilisées pour analyser le rendement des cultures et d'autres données agricoles.
- Épicerie** : Les statistiques peuvent être utilisées pour analyser les données relatives aux ventes des épiceries et autres détaillants.
- Logement** : Les statistiques peuvent être utilisées pour analyser les données relatives au logement, telles que les prix des maisons et les taux de location.
- Infrastructure** : Les statistiques peuvent être utilisées pour analyser les données relatives à l'infrastructure, telles que les schémas de circulation et l'état des routes.
- Médecine** : Les statistiques peuvent être utilisées pour analyser des données médicales telles que les résultats des patients et l'efficacité des médicaments.
- Garanties** : Les statistiques peuvent être utilisées pour analyser les données relatives aux réclamations au titre de la garantie afin d'identifier les tendances et les problèmes potentiels liés aux produits.
- **Performance du site web** : Les statistiques peuvent être utilisées pour analyser les données relatives au trafic sur les sites web et le comportement des utilisateurs.

1. Source : Conversation avec Bing, 2023-07-10 : Conversation avec Bing, 2023-07-10

---

Calculons quelques statistiques de base, notamment la moyenne, la médiane, le minimum et le maximum.

Rappelons les noms des colonnes du fichier Raptors :

| Le nom de la colonne est le suivant : "Colonne" - "Signification" - "Colonne" - "Signification" - "Colonne" - "Signification".
|--------|---------|--------|---------|
| Âge - Âge du joueur au 1er février de la saison - 3P - 3-Point Field Goals Per Game - 3-Points Field Goals Per Game - 3-Points Field Goals Per Game - 3-Points Field Goals Per Game - 3-Points Field Goals Per Game
3PA | 3-Point Field Goal Attempts Per Game | 3P | 3-Point Field Goal Attempts Per Game | 3PA | 3-Point Field Goal Attempts Per Game
| 3P% | Pourcentage de réussite au tir à 3 points par match
2P | 2-Point Field Goals Per Game | GS | Games Started | 2P | 2-Point Field Goals Per Game | GS | Games Started | 2P | 2-Point Field Goals Per Game
2PA | Tentatives de tir au but à 2 points par match | GS | Games Started | 2PA | Tentatives de tir au but à 2 points par match | MP | Minutes jouées par match
2P% | 2-Point Field Goal Percentage | 2P% | 2-Point Field Goal Percentage | 2P% | 2-Point Field Goal Percentage | FG | Field Goals Per Game
| eFG% | Pourcentage effectif de buts sur le terrain* | FGA | Tentatives de buts sur le terrain par match
FG% | Pourcentage effectif de buts sur le terrain* | FGA | Tentatives de buts sur le terrain par match | FT | Lancers francs par match | FG% | Pourcentage de buts sur le terrain par match
FG% | Pourcentage de réussite au tir au but | FTA | Tentatives de lancers francs par match | ORB | Rebonds offensifs
| ORB | Rebonds offensifs par match FT% | Pourcentage de lancers francs
ORB | Rebonds offensifs par match | FT% | Pourcentage de lancers francs | DRB | Rebonds défensifs par match | TRB | Rebonds totaux par match | AST | Assists per game
| AST - Assists Per Game - STL - Steals Per Game - BLK - Blocks Per Game - BLK - Blocks Per Game - BLK - Blocks Per Game - BLK
| BLK | Blocs par match | TOV | Turnovers par match | PF | Fautes personnelles par match
| PF | Fautes personnelles par match | PTS | Points par match


<span style="font-size:10px">*Cette statistique tient compte du fait qu'un but de 3 points vaut un point de plus qu'un but de 2 points.</span>

## min(), max(), median(), mean()

Importons un fichier de données sur la saison 2023 des Raptors et utilisons la colonne `'G'` pour calculer le nombre minimum, maximum, moyen et médian de matchs joués.

In [None]:
import pandas as pd

url = 'https://raw.githubusercontent.com/Data-Dunkers/data/main/NBA/raptors-2023.csv'
raptors_df = pd.read_csv(url)

print('Minimum =', raptors_df['G'].min())

print('Maximum =', raptors_df['G'].max())

print('Median =', int(raptors_df['G'].median()))

print('Mean =', raptors_df['G'].mean().round(1))

Vous avez remarqué que nous avons utilisé la fonction `round()` pour arrondir la moyenne à la première décimale ?

Nous avons également converti la médiane d'un float (un nombre avec des décimales) en un entier à l'aide de la fonction `int()`.

## Exercice

Quel est l'âge moyen des Raptors ?

In [None]:
# Write your program here


## Supplémentaire

### Moyenne pour toutes les colonnes numérotées

Et si nous voulions regarder les moyennes de *toutes* les colonnes numérotées ? C'est simple !

In [None]:
raptors_df.mean(numeric_only = True).round(2)

### Toutes les statistiques en même temps

Affiche toutes les statistiques disponibles pour toutes les colonnes numériques (avec `describe()`) :

In [None]:
raptors_df.describe()

Que se passe-t-il si nous ne voulons consulter qu'une seule colonne ?

In [None]:
raptors_df['G'].describe()

### cordes de fa

En utilisant des techniques d'impression avancées en Python (appelées *f-strings*), nous pouvons formater la sortie exactement comme nous le souhaitons :

In [None]:
print(f"Minimum = {raptors_df['G'].min():.0f}")

print(f"Maximum = {raptors_df['G'].max():.0f}")

print(f"Mean = {raptors_df['G'].mean():.1f}")

print(f"Median = {raptors_df['G'].median():.0f}")

---
*Report issues or give us feedback about this notebook [here](https://docs.google.com/forms/d/e/1FAIpQLSdMRX2hPqZyD8-argFJXxB3ABQdLk3aUH1CAfmMEtcFAlWzCw/viewform?usp=pp_url&entry.1771525592=Module%20Resources%20%28the%20Jupyter%20notebooks%2C%20PPTS%20or%20additional%20resources%29&entry.1364186163=Statistics).*

---
Retour à [Leçons](https://github.com/Data-Dunkers/lessons/blob/main/lessons.ipynb)

---