# Chargement des données

Ce Notebook est purement utilitaire : nous allons l'utiliser pour charger nos données, et il sera utilisé dans les autres Notebook pour nous faciliter la vie. Un autre objectif sera aussi de charger les bibliothèques utiles pour exécuter nos autre Notebook. 

Ainsi, on regroupe ici une bonne partie de ce dont nous aurons besoin pour travailler : nos données et les bibliothèques.

## Les bibliothèques

Nous chargeons ici les possibles bibliothèques que nous pourrons utiliser. 

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import random
import warnings

from arch import arch_model
    
from datetime import datetime, timedelta
import datetime

# import tensorflow as tf

from numpy import array

from statsmodels.tsa.stattools import adfuller
from statsmodels.tsa.seasonal import seasonal_decompose
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.stattools import acf, pacf
from statsmodels.tsa.ar_model import AutoReg
from statsmodels.tsa.stattools import arma_order_select_ic

from statsmodels.tsa.stattools import adfuller
from statsmodels.tsa.stattools import kpss

from statsmodels.tsa.holtwinters import SimpleExpSmoothing 
from statsmodels.tsa.holtwinters import ExponentialSmoothing

from statsmodels.graphics.tsaplots import plot_pacf

import os

import math

from IPython.display import Markdown, display

def printmd(string):
    display(Markdown(string))

## Définition de variables

Ici, nous définissons des variables pour nous faciliter la vie : 
- chaque variable porte le nom du jeton d'une certaine BlockChain. Ainsi la variable `ada` a pour valeur `Cardano`
- le nom des fichiers est obtenu à partir des noms des Blockchaines (regardez le dossier `data`, le nom des fichiers contient bien le nom de leur Blockchaines)
- le chemin des fichiers est ensuite défini (il faut ajouter le répertoire `data` au nom du fichier)

Dans la suite, nous allons charger nos dataframes dans un dictionnaire indexé par le nom des Blockchaines.

In [None]:
ada = "Cardano"
eth = "Ethereum"
btc = "Bitcoin"

names =  [ada, btc, eth]

# nom des fichiers
fileNames = ["coin_"+name+".csv" for name in names]

# définition de la source des données "Coindex" et génération des chemins complets
source =  "Coincodex" 
files = [os.path.join("data", source, fileName) for fileName in fileNames]

print(files)


## Chargement des données

Le chargement des données se fait en parcourant notre liste de chemin de fichiers.

Les dataframes sont stockés dans un dictionnaire.

In [None]:
dataCoins = {}

for index, (file, name) in enumerate(zip(files, names)):

    print("Coin loaded: ", file, name)

    dataCoins[name] = pd.read_csv(file,
                            header=0,
                            index_col=0, 
                            parse_dates=["Date"])
                            
    printmd("**Dtypes**:\n")
    print(dataCoins[name].dtypes)

    printmd("**From**:\n")
    print(dataCoins[name].index.min(), " to ", dataCoins[name].index.max())

    dataCoins[name].sort_index(axis=0, inplace=True)

dataCoins["Bitcoin"].head()


### Questions

1. des questions sur `enumerate()` dans la boucle `for` ? voir Google `Python enumerate`
2. des question sur `zip()` ? voir Google `Python zip()`
3. est ce que tout les dataframes générés ont bien un index initialisé avec les dates ? où est le code réalisant cette opération ? quel paramètre ?

### Utilisation

Pour utiliser notre dictionnaire `dataCoins`, voici un exemple :

In [None]:
data = dataCoins[ada]

data = data.loc[:, ['Close']]
data.head()



Et un autre exemple, affichant les dataframes chargés dans le dictionnaire. Cela permettra ainsi de voir si tous s'est bien passé quand on chargera ce fichier. 

In [None]:
plt.rcParams['figure.figsize'] = [15, 8]

ax = None
legends = []

for (key, value) in dataCoins.items():
    
    if ax == None:
        ax  = value.loc[:, ['Close']].plot()
    else:
        value.loc[:, ['Close']].plot(ax=ax)

    legends.append(key)

ax.legend(legends);


In [None]:
data.Close