# Visualisation de données en Python
## Visualisation avec Pandas et Matplotlib

Questions
* Quels sont les différents types de données dans Pandas?
* Quel est l'impact des types sur les statistiques descriptives?
* Comment visualiser les données d'un DataFrame Pandas?
* Comment personnaliser un graphique?

Objectifs
* Manipuler les types de données.
* Créer des graphiques simples à partir d'un DataFrame.
* Personnaliser un graphique avec les méthodes d'objets Matplotlib.

# Data Visualization in Python
## Visualization with Pandas and Matplotlib

Questions
* What are the different data types in Pandas?
* What impacts have data types on descriptive statistics?
* How to visualize data from a Pandas DataFrame?
* How to customize a plot?

Objectives
* Manipulate the data types.
* Create simple plots from a DataFrame.
* Customize a plot with the methods of Matplotlib objects.

In [None]:
# Charger le module pandas
import pandas as pd

# Charger les données
surveys_df = pd.read_csv("../data/surveys.csv")

In [None]:
# First make sure pandas is loaded
import pandas as pd

# Read in the survey csv
surveys_df = pd.read_csv("../data/surveys.csv")

## Types de données
### Vérifier le type de données pour chaque colonne
Puisque le type des données peut avoir un impact sur
l'apparence d'un graphique, il est nécessaire de valider
au préalable le type des données de chaque colonne de
DataFrame que nous allons utiliser dans notre analyse.

## Types of Data
### Checking the format of our data
Since the data types can impact the appearance of a chart,
it is necessary to first validate the data type of each
column in the DataFrame that we will use in our analysis.

Types Python | Types Pandas | Description
:-----------:|:------------:|:-----------
`str`        | `object`     | Type générique, aussi utilisé en cas de multiples types
`int`        | `int64`      | Nombres entiers représentés avec 64 bits
`float`      | `float64`    | Nombres réels représentés avec 64 bits, ou non-définis (NaN)
 N/A         | `datetime64` | Dates et heures, avec une précision allant jusqu'à la nanoseconde

Native Python Type | Pandas Type | Description
:-----------------:|:-----------:|:-----------
`str`              | `object`    | The most general dtype. Will be assigned to your column if column has mixed types (numbers and strings).
`int`              | `int64`     | 64 bits integer
`float`            | `float64`   | Numeric characters with decimals. If a column contains numbers and NaNs(see below), pandas will default to float64.
 N/A               | `datetime64`| Values meant to hold time data.

In [None]:
# Le type de données pour les identifiants d'espèces
surveys_df['species_id'].dtype

In [None]:
# Getting the data type of species identifiers
surveys_df['species_id'].dtype

In [None]:
# Le type de données pour la colonne des mois
surveys_df['month'].dtype

In [None]:
# Getting the data type of month values
surveys_df['month'].dtype

In [None]:
# Obtenir le type de données pour chaque colonne
surveys_df.dtypes

In [None]:
# Getting the data types of all columns
surveys_df.dtypes

### Impacts sur les statistiques descriptives

### Working With Our Survey Data

In [None]:
# Statistiques descriptives sur les valeurs numériques
surveys_df.describe()

In [None]:
# Summary of descriptive statistics
surveys_df.describe()

In [None]:
# Convertir les numéros de mois en valeurs nominales
surveys_df['month'] = surveys_df['month'].astype('str')
surveys_df['month'].dtype

In [None]:
# Convert month numbers to nominal values
surveys_df['month'] = surveys_df['month'].astype('str')
surveys_df['month'].dtype

In [None]:
# Statistiques descriptives sur une variable qualitative
surveys_df['month'].describe()

In [None]:
# Descriptive statistics on a categorical variable
surveys_df['month'].describe()

In [None]:
# Lister les différents mois
surveys_df['month'].unique()

In [None]:
# Listing all different months
surveys_df['month'].unique()

In [None]:
# Lister les différentes années
surveys_df['year'].unique()

In [None]:
# Listing all different years
surveys_df['year'].unique()