![Data Dunkers Banner](https://github.com/Data-Dunkers/lessons/blob/main/images/top-banner.jpg?raw=true)

<a href="https://hub.callysto.ca/jupyter/hub/user-redirect/git-pull?repo=https%3A%2F%2Fgithub.com%2Fdata-dunkers%2Flessons&branch=main&subPath=graphing-scatter-plots.ipynb&depth=1" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-callysto-button.svg?sanitize=true" width="123" height="24" alt="Open in Callysto"/></a>
<a href="https://colab.research.google.com/github/data-dunkers/lessons/blob/main/graphing-scatter-plots.ipynb" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-colab-button.svg?sanitize=true" width="123" height="24" alt="Open in Colab"/></a>

# Leçon "Data Dunkers" : Création de graphiques linéaires et de diagrammes de dispersion

Le cahier d'activités correspondant à ce cahier de leçons est disponible [ici] (https://github.com/Data-Dunkers/activities/blob/main/graphing.ipynb).

## Objectifs

À la fin de cette leçon, les élèves seront capables de :
- d'analyser les relations entre les variables à l'aide de diagrammes de dispersion.
    - Exemple : Créer un diagramme de dispersion pour examiner la relation entre les buts tentés et les buts marqués par Pascal Siakam.
- de personnaliser et d'améliorer l'analyse visuelle des données.
    - Exemple : Personnaliser un diagramme de dispersion en ajoutant des titres, des étiquettes et en ajustant la taille des points pour plus de clarté.
- Explorer les tendances et les modèles de données à l'aide d'outils visuels tels que les lignes de tendance.
    - Exemple : Ajoutez une ligne de tendance à un graphique en nuage de points pour analyser l'évolution de l'efficacité des tirs au but de Pascal Siakam en fonction du nombre de tentatives.

## Obtenir et filtrer des données

Nous allons continuer à importer et à traiter les données de Pascal Siakam comme nous l'avons fait jusqu'à présent.

In [None]:
import pandas as pd
url = 'https://raw.githubusercontent.com/Data-Dunkers/data/main/NBA/Pascal_Siakam.csv'
df = pd.read_csv(url)
df = df[df['SEASON_ID'] <= '2022-23']
df

## Graphiques en ligne

Précédemment, nous avons utilisé `px.bar()` pour créer des graphiques en barres avec Plotly Express, nous pouvons créer des [graphiques linéaires] (https://plotly.com/python/line-charts/) avec `px.line()`.

In [None]:
import plotly.express as px
px.line(df, 
        x='SEASON_ID', 
        y='FGM', 
        title='Siakam Field Goals by Season')

## Diagrammes de dispersion

Les [diagrammes de dispersion] (https://plotly.com/python/line-and-scatter/) sont similaires aux graphiques linéaires, sans les lignes de connexion.

In [None]:
px.scatter(df, 
           x='FGA', 
           y='FGM', 
           title='Siakam Field Goals versus Field Goal Attempts')

## Affichage d'autres données

Nous pouvons **colorer** les points en fonction d'une autre valeur de l'ensemble de données. Plaçons des valeurs numériques sur les axes et colorons les points en fonction de la saison.

In [None]:
px.scatter(df, 
           x='FGA', 
           y='FGM', 
           title='Siakam Field Goals Made versus Field Goal Attempts', 
           color='SEASON_ID')

Nous pouvons également modifier la **taille** des points de données pour qu'elle soit proportionnelle à l'une des colonnes de données.

In [None]:
px.scatter(df, 
           x='FGA', 
           y='FGM', 
           title='Siakam Field Goals versus Field Goal Attempts', 
           color='SEASON_ID', 
           size='AST')

## Trendlines

Pour nous aider à tirer des conclusions, nous pouvons ajouter une ligne de meilleur ajustement, que nous appelons une ligne de tendance. Nous utilisons souvent la méthode des [moindres carrés ordinaires] (https://en.wikipedia.org/wiki/Ordinary_least_squares) (MCO) pour calculer les paramètres de la ligne de tendance.

In [None]:
px.scatter(df, 
           x='FGA', 
           y='FGM', 
           title='Siakam Field Goals Made versus Field Goal Attempts', 
           trendline='ols')

## Exercice

Créez un diagramme de dispersion avec les passes décisives par match (`'AST'`) sur l'axe des x, les points par match (`'PTS'`) sur l'axe des y, et `color='AGE'`. Incluez une ligne de tendance.

In [None]:
# write your code here


---
*Report issues or give us feedback about this notebook [here](https://docs.google.com/forms/d/e/1FAIpQLSdMRX2hPqZyD8-argFJXxB3ABQdLk3aUH1CAfmMEtcFAlWzCw/viewform?usp=pp_url&entry.1771525592=Module%20Resources%20%28the%20Jupyter%20notebooks%2C%20PPTS%20or%20additional%20resources%29&entry.1364186163=Creating%20Scatter%20Plots).*

---
Retour à [Leçons](https://github.com/Data-Dunkers/lessons/blob/main/lessons.ipynb)