![Data Dunkers Banner](https://github.com/Data-Dunkers/lessons/blob/main/images/top-banner.jpg?raw=true)

<a href="https://hub.callysto.ca/jupyter/hub/user-redirect/git-pull?repo=https%3A%2F%2Fgithub.com%2Fdata-dunkers%2Flessons&branch=main&subPath=data-columns.ipynb&depth=1" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-callysto-button.svg?sanitize=true" width="123" height="24" alt="Open in Callysto"/></a>
<a href="https://colab.research.google.com/github/data-dunkers/lessons/blob/main/data-columns.ipynb" target="_parent"><img src="https://raw.githubusercontent.com/Data-Dunkers/lessons/main/images/open-in-colab-button.svg?sanitize=true" width="123" height="24" alt="Open in Colab"/></a>

# Leçon de Data Dunkers : Colonnes

Le cahier d'activités correspondant à ce cahier de leçons est disponible [ici] (https://github.com/Data-Dunkers/activities/blob/main/data-columns.ipynb).

*Un guide pour cette leçon est disponible [ici](https://github.com/pbeens/Data-Dunkers/blob/main/Demos/Guides/columns-guide.md) ou sous forme de [PDF](https://github.com/pbeens/Data-Dunkers/blob/main/Demos/Guides/columns-guide.pdf) pour téléchargement.

## Objectifs

A la fin de cette leçon, les élèves seront capables de :

- Charger et visualiser des données à partir d'un fichier CSV à l'aide de pandas.
    - Exemple : Charger les données de basket-ball de Pascal Siakam à partir d'un fichier CSV dans un DataFrame et afficher son contenu.
- Accéder à des colonnes spécifiques d'un DataFrame et les manipuler.
    - Exemple :  Afficher et filtrer des colonnes telles que "FGM" (Field Goals Made) et "FGA" (Field Goal Attempts) pour se concentrer sur les performances de tir.
- Appliquer des boucles Python pour explorer et comprendre les colonnes du DataFrame.
    - Exemple : Utiliser une boucle for pour itérer sur les noms des colonnes et imprimer chacun d'entre eux, ce qui permet de mieux comprendre la structure de l'ensemble de données.

## Importation / Entrée

Nous allons importer la [bibliothèque de code](https://en.wikipedia.org/wiki/Library_(computing)) appelée [pandas](https://pandas.pydata.org/) pour lire les données d'un [fichier CSV](https://en.wikipedia.org/wiki/Comma-separated_values).

In [None]:
import pandas as pd

# URL of the CSV file containing data for Pascal Siakam
url = 'https://raw.githubusercontent.com/Data-Dunkers/data-dunkers-modules/main/data-dunkers/Data/Pascal_Siakam.csv'

# Read the CSV file into a pandas DataFrame named df
df = pd.read_csv(url)

# Display the DataFrame
df

Vous pouvez consulter le fichier CSV brut [ici] (https://raw.githubusercontent.com/Data-Dunkers/data/main/NBA/Pascal_Siakam.csv).

Vous remarquez la dernière ligne ? Pourquoi devriez-vous la garder à l'esprit ?

## Regarder les colonnes

Il y a beaucoup de colonnes, nous allons donc les lister en utilisant l'attribut `columns`.

Remarquez qu'il n'y a pas de parenthèses lorsque nous utilisons `columns`.

In [None]:
df.columns

Une autre façon d'examiner les colonnes pourrait être d'utiliser une boucle "for". La boucle est un concept important en programmation.

In [None]:
for column in df.columns:
    print(column)

Voici ce que signifient toutes les colonnes :

| Nom du champ | Définition | Nom du champ | Définition | Nom du champ | Définition
|---|---|---|---|
| AST - Le nombre total de passes décisives effectuées par le joueur. | FTM | Le nombre total de lancers francs effectués par le joueur. |
| BLK - Le nombre total de tirs adverses qu'un joueur a dévié ou empêché. | GP | Le nombre de matchs dans lesquels le joueur est apparu. |
| DREB | Le nombre total de rebonds qu'un joueur a pris sur le plan défensif. | GS - Le nombre de matchs où le joueur était dans l'équipe de départ. |
| FG_PCT | Pourcentage de tentatives de tir réussies. | MIN - Le nombre total de minutes jouées par le joueur. |
| FG2_PCT | Pourcentage de tentatives de tir à deux points réussies. | OREB | Le nombre total de rebonds qu'un joueur a pris du côté offensif. |
| FG2A | Nombre total de tentatives de tir à deux points effectuées par le joueur. | PF | Le nombre total de fautes personnelles commises par le joueur. |
| FG2M | Le nombre total de buts à deux points marqués par un joueur. | PLAYER_AGE | L'âge du joueur. |
| FG3_PCT | Pourcentage de tentatives de tirs à trois points réussies. | PTS | Le nombre total de points marqués par un joueur. |
| FG3A | Nombre total de tentatives de tirs à trois points effectuées par le joueur. | REB - Le nombre total de rebonds (offensifs + défensifs) qu'un joueur a pris. |
| FG3M - Le nombre total de buts à trois points marqués par un joueur. | SEASON_ID | L'identifiant de la saison de basketball. |
| FGA | Le nombre total de tentatives de tir au but par le joueur. | STL | Le nombre total de fois où un joueur a réussi à prendre le ballon à un adversaire. |
| FGM | Le nombre total de buts marqués par un joueur. | Le nombre total de fois où un joueur a réussi à prendre le ballon à l'adversaire. |
| FT_PCT | Le pourcentage de tentatives de lancers francs réussies. | TEAM_ID | Un identifiant unique pour l'équipe. |
| FTA | Le nombre total de tentatives de lancers francs par le joueur. | TOV | Nombre total de fois où le joueur a perdu la possession du ballon. |

Examinons uniquement la colonne des buts marqués (Field Goals Made).

In [None]:
df['FGM']

Et si nous voulions aussi avoir FGA (Field Goal Attempts Per Game) ? Remarquez que les noms des colonnes sont maintenant placés dans une liste (`[ ]`), qui est entourée de crochets.

In [None]:
df[['FGM', 'FGA']]

## Exercice

Modifiez le code ci-dessous pour n'afficher que les colonnes Pourcentage de buts marqués, Pourcentage de buts marqués à 2 points, Pourcentage de buts marqués à 3 points et Pourcentage de lancers francs.

*Conseil : commencez par noter les noms de ces champs dans le tableau ci-dessus.

In [None]:
import pandas as pd

url = 'https://raw.githubusercontent.com/Data-Dunkers/data-dunkers-modules/main/data-dunkers/Data/Pascal_Siakam.csv'
df = pd.read_csv(url)

# Write your code below



---
Retour à [Leçons] (https://github.com/Data-Dunkers/lessons/blob/main/lessons.ipynb)

---