# Python File I/O
## Python file operation

Un fichier est un conteneur pour stocker des données. Python a plusieurs fonctions pour créer, lire, mettre à jour et supprimer des fichiers.

Pour manipuler un fichier, il faut d'abord l'ouvrir, le modifier (ecrire/lire) puis le fermer. Il est indispensable de fermer un fichier après l'avoir ouvert afin de libérer les ressources associées au fichier.

## Ouvrir un fichier en python

En python, on peut ouvrir un fichier en utilisant la fonction `open()`. La syntaxe de la fonction `open()` est la suivante:

```python
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
```

- `file`: le nom du fichier à ouvrir
- `mode`: le mode d'ouverture du fichier.
- `buffering`: le mode de buffering. Les modes de buffering sont:
    - `0`: pas de buffering
    - `1`: buffering ligne par ligne
    - `>1`: buffering avec la taille spécifiée
    - `-1`: buffering par défaut
- `encoding`: le mode d'encodage du fichier
- `errors`: le mode de gestion des erreurs
- `newline`: le mode de gestion des sauts de ligne
- `closefd`: le mode de fermeture du fichier
- `opener`: le mode d'ouverture du fichier

La fonction `open()` retourne un objet de type `file`. On peut utiliser cet objet pour lire, écrire et modifier le fichier.

> **Note**: Nous allons utiliser le fichier stocké dans `./files/test.txt` dans ce `Jupyter Notebook`.

In [1]:
TEST_FILE_PATH = "./files/test.txt"

In [2]:
# open file
file1 = open("./files/test.txt")

# Explicit mode declaration
file2 = open(TEST_FILE_PATH, "r")
file2

<_io.TextIOWrapper name='./files/test.txt' mode='r' encoding='UTF-8'>

Ici, nous avons crée un objet `file1` qui est associé au fichier `test.txt`. Par défaut s'il n'est pas spécifié, le mode d'ouverture est `r` (read). On peut spécifier le mode d'ouverture en utilisant le paramètre `mode` de la fonction `open()`.

### Différents modes d'ouverture

| Mode | Description |
| --- | --- |
| `r` | Ouvre un fichier en lecture seule. C'est le mode par défaut. |
| `w` | Ouvre un fichier en écriture seule. Ecrase le fichier s'il existe. Crée un nouveau fichier sinon. |
| `a` | Ouvre un fichier en écriture seule. Ajoute le contenu à la fin du fichier s'il existe. Crée un nouveau fichier sinon. |
| `x` | Ouvre un fichier en écriture seule. Crée un nouveau fichier. Retourne une erreur si le fichier existe déjà. |
| `+` | Ouvre un fichier en lecture et écriture. |
| `b` | Ouvre un fichier en mode binaire. |

```python
file1 = open(TEST_FILE_PATH)      # equivalent to 'r' or 'rt'
file1 = open(TEST_FILE_PATH,'w')  # write in text mode
file1 = open(TEST_FILE_PATH,'r+b') # read and write in binary mode
```

## Read file

Une fois le fichier ouvert, on peut lire son contenu en utilisant la méthode `read()` de l'objet `file`. La méthode `read()` retourne le contenu du fichier sous forme de chaîne de caractères. La syntaxe de la méthode `read()` est la suivante:

```python
file.read(size=-1)
```

La méthode `read()` prend un paramètre optionnel `size` qui indique le nombre maximum de caractères à lire. Si le paramètre `size` n'est pas spécifié, la méthode `read()` lit tout le contenu du fichier.

In [None]:
# open a file
file11 = open(TEST_FILE_PATH, "r")

# read the file
s = ""
read_content = file11.read(1)
s += read_content
while read_content != "\n":
    read_content = file11.read(1)
    s += read_content
print((s)) 

print

This is a tast file.



## Closing file

Quand nous avons terminé de travailler avec un fichier, il est important de le fermer. La méthode `close()` de l'objet `file` permet de fermer un fichier et de libérer la resource. La syntaxe de la méthode `close()`.

In [12]:
# open a file
file1 = open(TEST_FILE_PATH, "r")
file1.seek(10)
# read the file
read_content = file1.read(4)
print(read_content)

# close the file
file1.close()

tast


> **Note**: Apres avoir utilisé le fichier, il est important de le fermer. C'est une bonne pratique en programmation.

## with...open syntax

La syntaxe `with...open` permet d'ouvrir un fichier et de le fermer automatiquement après avoir terminé de travailler avec. La syntaxe de la syntaxe `with...open` est la suivante:

```python
with open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) as file:
    # do something with file
```

In [10]:
with open(TEST_FILE_PATH, "r", encoding="utf-8") as file1:
    print(file1)
    read_content = file1.read()
    print(read_content)

print("Out of with")

<_io.TextIOWrapper name='./files/test.txt' mode='r' encoding='utf-8'>
This is a tast file.
Hello from the test file.
Hello from the course
Hello from 6th floor
Out of with


> **Note**: La syntaxe `with...open` est recommandée pour ouvrir un fichier, car elle se charge de fermer le fichier automatiquement.

## Ecrire dans un fichier

Pour écrire dans un fichier, on utilise la méthode `write()` de l'objet `file`. La syntaxe de la méthode `write()` est la suivante:

```python
file.write(str)
```

Il y deux choses a se souvenirs quand on écrit dans un fichier en mode `w`:

- Si le fichier n'existe pas, il sera crée.
- Si le fichier existe, son contenu sera écrasé.

In [30]:
with open('./files/test2.txt', 'r+') as file2:
    # write contents to the test2.txt file
    file2.write('Programming is Fun. ')
    file2.write('Written from Python.\n')
    file2.write('Written from Python 2.')

## Python file methods

| Method | Description |
| --- | --- |
| `close()` | Ferme le fichier. |
| `detach()` | Sépare le fichier du buffer. |
| `fileno()` | Retourne le numéro du fichier. |
| `flush()` | Vide le buffer du fichier. |
| `isatty()` | Retourne `True` si le fichier est un terminal. |
| `read(n)` | Lit `n` octets du fichier. |
| `readable()` | Retourne `True` si le fichier est lisible. |
| `readline(n=-1)` | Lit une ligne du fichier. |
| `readlines(n=-1)` | Lit `n` lignes du fichier. |
| `seek(offset, from=SEEK_SET)` | Change la position du curseur. |
| `seekable()` | Retourne `True` si le fichier supporte `seek()`. |
| `tell()` | Retourne la position du curseur. |
| `truncate(size=None)` | Tronque le fichier à `size` octets. |
| `writable()` | Retourne `True` si le fichier est écrivable. |
| `write(s)` | Ecrit la chaîne `s` dans le fichier. |
| `writelines(lines)` | Ecrit une liste de lignes dans le fichier. |

# CSV file

Le type de fichier CSV (Comma Separated Values) est un format de fichier qui permet de stocker des données tabulaires (lignes / colonnes). Chaque ligne du fichier représente une ligne du tableau. Les valeurs de chaque ligne sont séparées par une virgule.

## Exemple de fichier CSV

| id | name | age | city | uid | pwd |
| --- | --- | --- | --- | --- | --- |
| 1 | John | 25 | New York | toto | 12345 |
| 2 | Jack | 30 |  | titi | 12345 |

```csv
id,name,age,city,uid,pwd
1,John,25,New York,toto,12345
2,Jack,30,,titi,12345
```

Ici, on a un fichier CSV qui contient 4 colonnes: `id`, `name`, `age` et `city`. Chaque ligne du fichier représente une personne. La première ligne du fichier est appelée `header` et contient les noms des colonnes.

## Le module CSV

Python a un module CSV qui permet de lire et d'écrire des fichiers CSV. Le module CSV fournit des classes pour lire et écrire des données tabulaires au format CSV.

## Lire un fichier CSV

Pour lire un fichier CSV, on utilise la classe `reader` du module CSV. La classe `reader` permet de lire les données d'un fichier CSV ligne par ligne. La syntaxe de la classe `reader` est la suivante:

```python
csv.reader(csvfile, dialect='excel', **fmtparams)
```

La classe `reader` prend un paramètre obligatoire `csvfile` qui est un objet `file` ou une chaîne de caractères qui représente le chemin du fichier CSV. La classe `reader` prend aussi un paramètre optionnel `dialect` qui permet de spécifier le dialecte du fichier CSV. Le paramètre `dialect` prend un objet `Dialect` ou une chaîne de caractères qui représente le nom du dialecte. Il est aussi possible de spécifier des paramètres optionnels en lien avec le dialecte en utilisant le paramètre `fmtparams`.

### l'objet Dialect

L'objet `Dialect` permet de spécifier le dialecte du fichier CSV. L'objet `Dialect` a les attributs suivants:

| Attribut | Description |
| --- | --- |
| `delimiter` | Le caractère qui sépare les champs. Par défaut `,`. |
| `doublequote` | Si `True`, on utilise deux symboles de citation a la suite, sinon on utilise le caractère d'échapement |
| `escapechar` | Le caractère qui échappe les caractères spéciaux. Par défaut `None`. Si `None` l'escaping est désactivé |
| `lineterminator` | Le caractère qui termine une ligne. Par défaut `'\r\n'`. |
| `quotechar` | Le caractère qui entoure les champs. Par défaut `'"'`. |
| `quoting` | Définis comment géré les caractères d'échapement. Les valeurs possibles sont: <ul><li>`csv.QUOTE_ALL`: tous les champs sont entourés de `quotechar`</li><li>`csv.QUOTE_MINIMAL`: seuls les champs qui contiennent des caractères spéciaux sont entourés de `quotechar`</li><li>`csv.QUOTE_NONNUMERIC`: seuls les champs qui ne sont pas des nombres sont entourés de `quotechar`</li><li>`csv.QUOTE_NONE`: aucun champ n'est entouré de `quotechar`</li>Par défaut `QUOTE_MINIMAL`.<ul> |
| `skipinitialspace` | Si `True`, les espaces après le délimiteur sont ignorés. Par défaut `True`. |
| `strict` | Si `True`, une exception `Error` est levée si le fichier est mal formé. Par défaut `False`. |

### Les diferents Dialect par defaut

| Parameter | default | excel | excel-tab | unix |
| --- | --- | --- | --- | --- |
| delimiter | ',' | ',' | '\t' | ',' |
| doublequote | True | True | True | False |
| escapechar | None | None | None | None |
| lineterminator | '\r\n' | '\r\n' | '\r\n' | '\n' |
| quotechar | '"' | '"' | '"' | '"' |
| quoting | csv.QUOTE_MINIMAL | csv.QUOTE_MINIMAL | csv.QUOTE_MINIMAL | csv.QUOTE_ALL |
| skipinitialspace | False | False | False | False |
| strict | False | False | False | False |

[Source](https://wellsr.com/python/introduction-to-csv-dialects-with-the-python-csv-module/)

### Définir un dialecte

On peut définir un dialecte en utilisant la fonction `register_dialect()` du module CSV. La syntaxe de la fonction `register_dialect()` est la suivante:

```python
csv.register_dialect(name, dialect=None, **fmtparams)
```


In [31]:
CSV_FILE = './files/users.csv'
CSV_FILE_EU = './files/users_eu.csv'

In [None]:
# read csv file using csv module
import csv
names = []
with open(CSV_FILE, 'r') as file:
    reader = csv.DictReader(file)
    for row in reader:
        print("ligne ", row)
        names.append(row["name"])
    
print(names)

In [None]:
names = []
with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    print((reader))
    next(reader)
    for row in reader:
        names.append((row[1]))
        print("ligne ", row)
    
print(names)

In [None]:
with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file)
    next(reader)
    # use list comprehension to convert each item in the reader object to a tuple
    users = [(row[1]) for row in reader]
    print(users)

## Changer le delimiter

On peut changer le délimiteur en utilisant le paramètre `delimiter` de la classe `reader`. Le paramètre `delimiter` prend un caractère qui représente le délimiteur.

```python
csv.reader(csvfile, delimiter=',')
```

In [None]:
with open(CSV_FILE_EU, 'r') as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

with open(CSV_FILE_EU, 'r') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        print(row)

## Ecrire dans un fichier CSV

Pour écrire dans un fichier CSV, on utilise la classe `writer` du module CSV. La classe `writer` permet d'écrire les données dans un fichier CSV ligne par ligne. La syntaxe de la classe `writer` est la suivante:

```python
csv.writer(csvfile, dialect='excel', **fmtparams)
```

La classe `writer` prend un paramètre obligatoire `csvfile` qui est un objet `file` ou une chaîne de caractères qui représente le chemin du fichier CSV. La classe `writer` prend aussi un paramètre optionnel `dialect` qui permet de spécifier le dialecte du fichier CSV. Le paramètre `dialect` prend un objet `Dialect` ou une chaîne de caractères qui représente le nom du dialecte. Il est aussi possible de spécifier des paramètres optionnels en lien avec le dialecte en utilisant le paramètre `fmtparams`.

### La fonction writerow()

La classe `writer` a une méthode `writerow()` qui permet d'écrire une ligne dans le fichier CSV. La syntaxe de la méthode `writerow()` est la suivante:

```python
csvwriter.writerow(row)
```

La méthode `writerow()` prend un paramètre `row` qui est un itérable (liste, tuple, dictionnaire, etc.) qui représente une ligne du fichier CSV.

In [45]:
with open(CSV_FILE, 'r') as file:
    reader = csv.reader(file, delimiter=";")
    users = [tuple(row) for row in reader]

    with open(CSV_FILE, 'w', newline='') as file:
        writer = csv.writer(file, delimiter="\t")
        for user in users:
            if user[0] == 'id': # user row is header
                writer.writerow((user[0], user[1], user[2], 'is_active', 'pwd'))
            else:
                writer.writerow((user[0], user[1], user[2], '1', "hellopwd"))

# Matplotlib

Matplotlib est une bibliothèque de visualisation de données en 2D et 3D. Elle permet de créer des graphiques, des histogrammes, des diagrammes de dispersion, etc. avec quelques lignes de code.

## Installation

Pour installer Matplotlib, on utilise la commande suivante:

```bash
conda install matplotlib
```

## Importer Matplotlib

Pour utiliser Matplotlib, on doit l'importer dans notre programme. On peut importer Matplotlib en utilisant la commande suivante:
Par convention, on importe le module `pyplot` de `Matplotlib` en utilisant l'alias `plt`.

```python
import matplotlib.pyplot as plt
```

## Les graphiques

Matplotlib permet de créer différents types de graphiques. On peut créer des graphiques en utilisant la fonction `plot()` du module `pyplot`. La syntaxe de la fonction `plot()` est la suivante:

```python
plt.plot(x, y, format_string, **kwargs)
```

La fonction `plot()` prend 3 paramètres obligatoires:

- `x`: les valeurs de l'axe des abscisses
- `y`: les valeurs de l'axe des ordonnées
- `format_string`: une chaîne de caractères qui spécifie le format du graphique

La fonction `plot()` prend aussi des paramètres optionnels qui permettent de personnaliser le graphique.

In [None]:
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]

plt.plot(x, y, 'rD-.')
plt.show()

Ici, on a créé un graphique qui représente les valeurs de `x` en fonction des valeurs de `y`. Le paramètre `format_string` est `'ro'` qui spécifie que le graphique doit être de couleur rouge (`r`) et que les points doivent être représentés par des cercles (`o`).

## Les formats

La fonction `plot()` prend un paramètre `format_string` qui permet de spécifier le format du graphique. Le paramètre `format_string` est une chaîne de caractères qui peut avoir jusqu'à 3 caractères. Le premier caractère spécifie la couleur du graphique, le deuxième caractère spécifie le type de ligne et le troisième caractère spécifie le type de marqueur.

### Les couleurs

| Caractère | Couleur |
| --- | --- |
| `b` | Bleu |
| `g` | Vert |
| `r` | Rouge |
| `c` | Cyan |
| `m` | Magenta |
| `y` | Jaune |
| `k` | Noir |
| `w` | Blanc |

### Les types de ligne

| Caractère | Description |
| --- | --- |
| `-` | Ligne pleine |
| `--` | Ligne en pointillés |
| `-.` | Ligne en tirets |
| `:` | Ligne en pointillés |
| `o` | Cercle |
| `v` | Triangle vers le bas |
| `^` | Triangle vers le haut |
| `s` | Carré |
| `p` | Pentagone |
| `*` | Etoile |
| `+` | Plus |
| `x` | Croix |
| `D` | Diamant |

In [None]:
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]

plt.plot(x, y, '--')
plt.show()

Ici, on a créé un graphique qui représente les valeurs de `x` en fonction des valeurs de `y`. Le paramètre `format_string` est `'g--'` qui spécifie que le graphique doit être de couleur verte (`g`) et que les points doivent être représentés par des lignes en pointillés (`--`).

## Les paramètres optionnels

La fonction `plot()` prend des paramètres optionnels qui permettent de personnaliser le graphique. Voici les paramètres optionnels les plus utilisés:

| Paramètre | Description |
| --- | --- |
| `alpha` | Définis la transparence du graphique. La valeur doit être entre `0` et `1`. |
| `color` | Définis la couleur du graphique. |
| `label` | Définis le label du graphique. |
| `linewidth` | Définis l'épaisseur de la ligne du graphique. |
| `marker` | Définis le type de marqueur du graphique. |
| `markersize` | Définis la taille des marqueurs du graphique. |
| `linestyle` | Définis le type de ligne du graphique. |
| `markeredgecolor` | Définis la couleur des bords des marqueurs du graphique. |
| `markeredgewidth` | Définis l'épaisseur des bords des marqueurs du graphique. |
| `markerfacecolor` | Définis la couleur du centre des marqueurs du graphique. |
| `markerfacecoloralt` | Définis la couleur du centre des marqueurs alternatifs du graphique. |
| `markevery` | Définis la fréquence d'affichage des marqueurs du graphique. |
| `zorder` | Définis l'ordre d'affichage du graphique. |

In [None]:
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
x2 = [1, 2, 3, 4]
y = [10, 20, 30, 40, 50]
y2 = [15, 23, 28, 37]

plt.plot(x, y, color='green', linestyle='dashed', linewidth=2, marker='o', markerfacecolor='blue', markersize=12, label="Test")
plt.plot(x2, y2, color='red', linewidth=2, marker='D', markerfacecolor='green', markersize=12, label="Test 2")

plt.xlabel('x - axis')
plt.ylabel('y - axis')

plt.legend()

plt.title('My first graph!')

plt.show()

## Les labels

On peut ajouter des labels sur les axes du graphique en utilisant les fonctions `xlabel()` et `ylabel()` du module `pyplot`. La fonction `xlabel()` permet d'ajouter un label sur l'axe des abscisses. La fonction `ylabel()` permet d'ajouter un label sur l'axe des ordonnées. La syntaxe de ces fonctions est la suivante:

```python
plt.xlabel(label, fontdict=None, labelpad=None, **kwargs) # xlabel
plt.ylabel(label, fontdict=None, labelpad=None, **kwargs) # ylabel
```

Les fonctions `xlabel()` et `ylabel()` prennent un paramètre `label` qui est une chaîne de caractères qui représente le label. Les fonctions `xlabel()` et `ylabel()` prennent aussi des paramètres optionnels qui permettent de personnaliser le label.

## Le titre

On peut ajouter un titre au graphique en utilisant la fonction `title()` du module `pyplot`. La fonction `title()` permet d'ajouter un titre au graphique. La syntaxe de la fonction `title()` est la suivante:

```python
plt.title(label, fontdict=None, loc=None, pad=None, **kwargs)
```

La fonction `title()` prend un paramètre `label` qui est une chaîne de caractères qui représente le titre. La fonction `title()` prend aussi des paramètres optionnels qui permettent de personnaliser le titre.

## Afficher le graphique

Pour afficher le graphique, on utilise la fonction `show()` du module `pyplot`. La fonction `show()` permet d'afficher le graphique. La syntaxe de la fonction `show()` est la suivante:

```python
plt.show(block=None)
```

La fonction `show()` prend un paramètre optionnel `block` qui permet de spécifier si le programme doit être bloqué pendant l'affichage du graphique. Si `block` est `True`, le programme est bloqué pendant l'affichage du graphique. La fonction `show()` affiche une nouvelle fenêtre qui contient le graphique.

## Sauvegarder le graphique

On peut sauvegarder le graphique dans un fichier en utilisant la fonction `savefig()` du module `pyplot`. La fonction `savefig()` permet de sauvegarder le graphique dans un fichier. La syntaxe de la fonction `savefig()` est la suivante:

```python
plt.savefig(fname, dpi=None, facecolor='w', edgecolor='w', orientation='portrait', papertype=None, format=None, transparent=False, bbox_inches=None, pad_inches=0.1, metadata=None)
```

La fonction `savefig()` prend un paramètre `fname` qui est une chaîne de caractères qui représente le chemin du fichier. La fonction `savefig()` prend aussi des paramètres optionnels qui permettent de personnaliser le fichier.

## Les histogrammes

Un histogramme est un graphique qui permet de représenter la distribution des données. Un histogramme est composé de plusieurs rectangles qui représentent la distribution des données. La largeur de chaque rectangle est proportionnelle à l'intervalle de la valeur qu'il représente. La hauteur de chaque rectangle est proportionnelle au nombre de valeurs qu'il représente.
On peut créer un histogramme en utilisant la fonction `hist()` du module `pyplot`. La syntaxe de la fonction `hist()` est la suivante:

```python
plt.hist(x, bins=None, range=None, density=None, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', orientation='vertical', rwidth=None, log=False, color=None, label=None, stacked=False, normed=None, *, data=None, **kwargs)
```

La fonction `hist()` prend un paramètre `x` qui est une liste de valeurs qui représente les données. La fonction `hist()` prend aussi des paramètres optionnels qui permettent de personnaliser l'histogramme.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

rng = np.random.default_rng(seed=42)

N_points = 100000
n_bins = 20

# Generate two normal distributions
dist1 = rng.standard_normal(N_points)

#fig, axs = plt.subplots(1, 2, sharey=True, tight_layout=True)

# We can set the number of bins with the *bins* keyword argument.
plt.hist(dist1, bins=n_bins)

## Les diagrammes de dispersion

Un diagramme de dispersion est un graphique qui permet de représenter la relation entre deux variables. Un diagramme de dispersion est composé de points qui représentent les valeurs des deux variables. On peut créer un diagramme de dispersion en utilisant la fonction `scatter()` du module `pyplot`. La syntaxe de la fonction `scatter()` est la suivante:

```python
plt.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, plotnonfinite=False, data=None, **kwargs)
```

La fonction `scatter()` prend deux paramètres `x` et `y` qui sont des listes de valeurs qui représentent les données. La fonction `scatter()` prend aussi des paramètres optionnels qui permettent de personnaliser le diagramme de dispersion.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv("data/swiss_all.csv")

plt.scatter(data[data["year"]==2000]['X'],data[data["year"]==2000]['Y'],s=1,c=data[data["year"]==2000]['Z'],vmax=1000)
plt.xlabel('Latitude')
plt.ylabel('Longitude')
plt.title('Switzerland density in 2000')

Ici, on a créé un diagramme de dispersion qui représente la densité de population en suisse

## Les barres

Un graphique en barres est un graphique qui permet de représenter des données sous forme de barres. Un graphique en barres est composé de plusieurs barres qui représentent les données. La hauteur de chaque barre est proportionnelle à la valeur qu'elle représente. On peut créer un graphique en barres en utilisant la fonction `bar()` du module `pyplot`. La syntaxe de la fonction `bar()` est la suivante:

```python
plt.bar(x, height, width=0.8, bottom=None, *, align='center', data=None, **kwargs)
```

La fonction `bar()` prend deux paramètres `x` et `height` qui sont des listes de valeurs qui représentent les données. La fonction `bar()` prend aussi des paramètres optionnels qui permettent de personnaliser le graphique en barres.

In [None]:
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 5]

plt.bar(x, y, tick_label=['one', 'two', 'three', 'four', 'five'])

plt.show()

Ici, on a créé un graphique en barres qui représente les valeurs de `x` en fonction des valeurs de `y`.

## Les diagrammes circulaires

Un diagramme circulaire est un graphique qui permet de représenter des données sous forme de secteurs. Un diagramme circulaire est composé de plusieurs secteurs qui représentent les données. La taille de chaque secteur est proportionnelle à la valeur qu'il représente. On peut créer un diagramme circulaire en utilisant la fonction `pie()` du module `pyplot`. La syntaxe de la fonction `pie()` est la suivante:

```python
plt.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None, radius=None, counterclock=True, wedgeprops=None, textprops=None, center=(0, 0), frame=False, rotatelabels=False, *, data=None)
```

La fonction `pie()` prend un paramètre `x` qui est une liste de valeurs qui représentent les données. La fonction `pie()` prend aussi des paramètres optionnels qui permettent de personnaliser le diagramme circulaire.

In [None]:
import matplotlib.pyplot as plt

x = [10, 20, 30, 40, 50]
labels = ['A', 'B', 'C', 'D', 'E']

plt.pie(x, labels=labels)
plt.show()

Ici, on a créé un diagramme circulaire qui représente les valeurs de `x`.

## Les sous-graphiques

On peut créer plusieurs graphiques dans une même fenêtre en utilisant la fonction `subplot()` du module `pyplot`. La fonction `subplot()` permet de créer plusieurs graphiques dans une même fenêtre. La syntaxe de la fonction `subplot()` est la suivante:

```python
plt.subplot(nrows, ncols, index, **kwargs)
```

La fonction `subplot()` prend 3 paramètres obligatoires:

- `nrows`: le nombre de lignes de la fenêtre
- `ncols`: le nombre de colonnes de la fenêtre
- `index`: l'index du graphique

La fonction `subplot()` prend aussi des paramètres optionnels qui permettent de personnaliser le graphique.

In [None]:
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]

plt.subplot(2, 1, 1)
plt.plot(x, y)

plt.subplot(2, 1, 2)
plt.bar(x, y)

plt.show()

Ici, on a créé deux graphiques dans une même fenêtre. Le premier graphique représente les valeurs de `x` en fonction des valeurs de `y`. Le deuxième graphique représente les valeurs de `x` en fonction des valeurs de `y`.

## Les styles

Matplotlib permet de personnaliser les graphiques en utilisant des styles. Un style est un ensemble de propriétés qui permet de personnaliser les graphiques. On peut utiliser un style en utilisant la fonction `style.use()` du module `pyplot`. La fonction `style.use()` permet d'utiliser un style. La syntaxe de la fonction `style.use()` est la suivante:

```python
plt.style.use(style)
```

La fonction `style.use()` prend un paramètre `style` qui est une chaîne de caractères qui représente le nom du style.

In [None]:
import matplotlib.pyplot as plt

plt.style.use('default')

x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]

plt.plot(x, y)
plt.show()

Ici, on a créé un graphique qui représente les valeurs de `x` en fonction des valeurs de `y`. Le style utilisé est `ggplot`.

#### Differents styles

- `default` : le style par défaut
- `classic` : le style classique
- `ggplot` : le style ggplot
- `seaborn` : le style seaborn
- `fivethirtyeight` : le style fivethirtyeight
- `dark_background` : le style dark_background
- `bmh` : le style bmh
- `grayscale` : le style grayscale

### Exemples

vous trouverez plus d'exemples [ici](https://matplotlib.org/stable/gallery/index.html)

## Bonus - linear regression

La régression linéaire est une technique qui permet de trouver la relation entre deux variables. La régression linéaire est utilisée pour prédire la valeur d'une variable en fonction de la valeur d'une autre variable. On peut créer une régression linéaire en utilisant la fonction `plot()` du module `pyplot`.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# hours of study
x = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9])
# scores
y = np.array([60, 50, 70, 80, 90, 100, 90, 95, 100])

# linear regression
m, b = np.polyfit(x, y, 1)
# plot the points
plt.scatter(x, y)
# plot the linear regression line
plt.plot(x, m*x + b, "r")

# show the plot
plt.show()

# Matplotlib - 3D

Matplotlib permet de créer des graphiques en 3D. 

[Exemples](https://matplotlib.org/stable/gallery/mplot3d/index.html)

In [None]:
import numpy as np
import matplotlib.pyplot as plt


ax = plt.subplot(projection='3d')

# Prepare arrays x, y, z
theta = np.linspace(-4 * np.pi, 4 * np.pi, 100)
z = np.linspace(-2, 2, 100)
r = z**2 + 1
x = r * np.sin(theta)
y = r * np.cos(theta)

ax.plot(x, y, z, label='parametric curve')
ax.legend()

plt.show()

Ici, on a créé un graphique en 3D qui représente les valeurs de `x` en fonction des valeurs de `y` et des valeurs de `z`. Le paramètre `format_string` est `'ro'` qui spécifie que le graphique doit être de couleur rouge (`r`) et que les points doivent être représentés par des cercles (`o`).

## Point cloud

Un point cloud est un graphique en 3D qui permet de représenter des données sous forme de points. Un point cloud est composé de plusieurs points qui représentent les données. On peut créer un point cloud en utilisant la fonction `scatter()` du module `pyplot`. La syntaxe de la fonction `scatter()` est la suivante:

```python
plt.scatter(x, y, z, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, plotnonfinite=False, data=None, **kwargs)
```

La fonction `scatter()` prend 3 paramètres `x`, `y` et `z` qui sont des listes de valeurs qui représentent les données. La fonction `scatter()` prend aussi des paramètres optionnels qui permettent de personnaliser le point cloud.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Fixing random state for reproducibility
np.random.seed(19680801)


def randrange(n, vmin, vmax):
    """
    Helper function to make an array of random numbers having shape (n, )
    with each number distributed Uniform(vmin, vmax).
    """
    return (vmax - vmin)*np.random.rand(n) + vmin

fig = plt.figure()
ax = fig.add_subplot(projection='3d')

n = 100

# For each set of style and range settings, plot n random points in the box
# defined by x in [23, 32], y in [0, 100], z in [zlow, zhigh].
for m, zlow, zhigh in [('o', -50, -25), ('^', -30, -5)]:
    xs = randrange(n, 23, 32)
    ys = randrange(n, 0, 100)
    zs = randrange(n, zlow, zhigh)
    ax.scatter(xs, ys, zs, marker=m)

ax.set_xlabel('X Label')
ax.set_ylabel('Y Label')
ax.set_zlabel('Z Label')

plt.show()

Ici, on a créé un point cloud qui représente les valeurs de `x` en fonction des valeurs de `y` et des valeurs de `z`.

In [None]:
from mpl_toolkits.mplot3d import axes3d
import matplotlib.pyplot as plt
from matplotlib import cm

ax = plt.figure().add_subplot(projection='3d')
X, Y, Z = axes3d.get_test_data(0.05)
ax.contourf(X, Y, Z, cmap=cm.coolwarm)

plt.show()
plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# Generate data
x = np.linspace(-5, 5, 100)
y = np.linspace(-5, 5, 100)
X, Y = np.meshgrid(x, y)
Z = np.sin(np.sqrt(X**2 + Y**2))

# Create figure and axes
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')

# Plot the surface
ax.plot_surface(X, Y, Z, cmap='viridis')

# Set labels and title
ax.set_xlabel('X')
ax.set_ylabel('Y')
ax.set_zlabel('Z')
ax.set_title('3D Plot')

# Enable interactive navigation
ax.mouse_init()

# Show the plot
plt.show()