# NumPy : charger des données à partir de fichiers

In [None]:
import numpy as np
file_path = '../assets/comptage-voyageurs-trains-transilien.csv'

## Avec loadtxt()

Les paramètres de la fonction `loadtxt()` utilisés ici sont :
* le path vers le fichier à charger
* `delimiter` informe sur le délimiteur entre les données
* `skiprows` permet d'ignorer un certain nombre de lignes, par défaut à 0, ici ce paramètre permet d'ignorer l'en-tête
* `usecols` est une liste des colonnes à utiliser, c'est à dire des données à charger.

In [None]:
sncf_data = np.loadtxt(file_path, delimiter=";", skiprows=1, usecols=[-1])

In [None]:
sncf_data

In [None]:
sncf_data.dtype

## Avec nunmpy.genfromtxt
`genfromtxt` offre plus de souplesse sur le chargement des données en effectuant deux boucles : la prmière charge les données sous la sorme d'une séquence de chaines de caractères et la seconde les convertit dans le type adapté.

La cellule suivante montre un chargement de base.

In [None]:
np.genfromtxt(file_path, delimiter=";", names=True)

Il est possible d'inposer le datatype par colonne afin de retrouver toutes nos informations.

In [None]:
datatype = ['U50', 'f8', 'U10', 'U50', 'U50', 'U50', 'f8']
np.genfromtxt(file_path, delimiter=";", names=True, dtype=datatype)

Numpy propose également une fonction de tri qui retourne une copie de l'array.

In [None]:
np.sort(np.genfromtxt(file_path, delimiter=";", names=True, dtype=datatype), order=('Date_de_comptage', 'Nom_gare'))

Il est également possible au chargement de filtrer les colonnes

In [None]:
np.genfromtxt(file_path, delimiter=";", names=True, dtype=datatype, usecols=(0, -1))

In [None]:
import matplotlib.pyplot as plt

plt.style.use('seaborn-dark')
plt.plot(np.arange(len(sncf_data)), sncf_data)

In [None]:
s_data = np.genfromtxt(file_path, delimiter=";", names=True, dtype=datatype, usecols=(0, -1))

plt.plot(np.arange(len(s_data)), s_data['Montants'])