# Accélérer les calculs & analyse d'une classification
Objectifs : 
* 1 comment utiliser le cloud computing pour accélérer les calculs ?
* 2 analyser les performances d'un modèle de classification

## Objectif
Nous allons voir comment se servir des services cloud (Google Colab) pour accélerer les calculs du Deep Learning.

**Remarque importante :**  vous devez avoir un compte Google pour exécuter le code de cette session

## Partie 1 - Calcul sur Graphic Processing Unit (GPU)

Nous allons maintenant changer les paramètres d'exécution de la plateforme *cloud*.  
L'architecture **matérielle** standard de Google Colab utilise un CPU (unité centrale de traitement de calcul).

Nous allons modifier cette architecture afin d'utiliser un **GPU**.   
Un GPU est un accélérateur *matériel* qui nous permettra d'augmenter considérablement la vitesse d'exécution des calculs lors de l'apprentissage du modèle de Deep Learning.

Pour réaliser cela, il faut suivre les instructions suivantes :

### Paramètrage du Notebook
Menu "Runtime"

* cliquez : Change Runtime Type 
* Panel Notebook settings
* changer ""Hardward accelerator"
* Passez de "None" à "GPU"
* cliquez sur "SAVE"



## Vérification du matériel

Le code de la cellule suivante permet d'afficher les caractéristiques du matériel qui vous est alloué (mémoire, CPU et GPU).

In [0]:
from tensorflow.python.client import device_lib

print ("# number devices = ",len(device_lib.list_local_devices()))

for item in device_lib.list_local_devices():
  print (item)
  print("===== * =====")

On constate que grâce aux instructions qui précèdent (runTime GPU), on dispose maintenant d'une architecture spécialisée qui va nous permettre de réaliser les calculs qui viennent beaucoup plus rapidement !

Par exemple, au moment de rédaction de ce Notebook, la carte graphique (GPU) mise à disposition dans le *cloud* est une Tesla P100.

Ce ne sera pas forcément le cas pour vous lorsque vous réaliserez cette exercice car, bien entendu, le matériel évolue constamment ;-)

## Chargement des données 
 

### Étape 1 :
Cliquez sur l'**onglet de la colonne de gauche** puis sur l'icône du **répertoire** (3ème icône en partant du haut) comme le montre cette copie d'écran :

![onglet de la colonne de gauche](https://drive.google.com/uc?id=1d88MtBLFfzxeFzE6lKjiSsoLSiSAfzBv)

### Etape 2
* 1- Cliquer sur l'icône 'UPLOAD' comme le montre la copie d'écran suivante 
* 2- A l'aide du sélecteur de fichiers
* 3- Sélectionner le fichier `classification-churn.csv`  
* 4- Cliquer sur 'Open'


![alt text](https://drive.google.com/uc?id=10C_sjNOJxrxG8kc4EAJd9iduYC0Dkbm2)

### Etape 3 : 

le fichier `classification-churn.csv` apparaît alors dans la liste des fichiers chargés dans l'espace *cloud* (machine distante) de Google Colab.

Vous pouvez alors passer à la suite ....

![alt text](https://drive.google.com/uc?id=1oFFz2QY5uYy5tP4xfDLYpBj1t5lViW2E)

## Lecture des données

In [0]:
import pandas as pd
data_set = pd.read_csv('classification-churn.csv' , sep = ";")

In [0]:
# echantillon aleatoire de quelques lignes
data_set.sample(3)

In [0]:
# les colonnes du data set
data_set.columns

## Description

Il s'agit d'un data-set d'un opérateur **telecom**.
Les données sont les consommations de service des clients de cet opérateur.

Ce sont les données comportementales des clients. Il y a une ligne par client. 

Les colonnes :
* nombre d'appel domestiques
* nombre d'appel à l'international
etc...

La colonne que l'on va chercher à prédire ensemble est la colonne *target*. 

> * Cette colonne vaut **0** si le client conserve son contrat
> * cette colonne vaut **1** si le client *change* d'opérateur et rompt le contrat.

L'analyse de ce type de comportement (rupture de contrat) est nommé **churn analysis**. Le terme français est *attrition*.
https://fr.wikipedia.org/wiki/Attrition_(taux)

En marketing, les clients qui résilient un contrat en cours de durée de vie (avant l'échéance du contrat) sont nommés des *churneurs*.

A l'aide du Machine Learning, on peut prédire ces ruptures avant qu'elles ne se produisent et envisager des **actions** afin de les éviter. 

Par exemple, baisse de tarifs, promotion, avantages, ...

C'est une analyse très importante dans de nombreux domaines car la "fuite" des clients représentent des montants considérables. 

Par exemple, jusqu'à 30% des clients partent avant l'échéance de leur contrat d'assurance.


## Préparer les données
* enlever les colonnes inutiles
* séparer input vs. output

In [0]:
# enlever les colonnes inutiles :
if 'Unnamed: 20' in data_set.columns:
  data_set = data_set.drop('Unnamed: 20', axis=1)
if 'Unnamed: 21' in data_set.columns:
  data_set = data_set.drop('Unnamed: 21', axis=1)
  data_set.columns

In [0]:
# l'outputs (colonne 'target') -> y
if 'target' in data_set.columns:
  y = data_set.pop('target')
  
# le reste en inputs -> X
X = data_set.copy()

# le nb de colonne
input_dim_col = X.shape[1]

### Préambule : import, seed

In [11]:
import pandas as pd
import numpy as np

import tensorflow as tf
import tensorflow.keras as keras

from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import SGD
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

seed = 31415926

Using TensorFlow backend.


In [0]:
X_train, X_test, y_train, y_test = train_test_split(X, y , test_size = 0.33 , random_state = seed)

In [0]:
def get_model():
  return keras.Sequential([
      keras.layers.Dense(32, input_dim= input_dim_col , activation= tf.nn.sigmoid   ),      
      keras.layers.Dense(1 , activation= tf.nn.sigmoid)
  ])

In [0]:
model = get_model()

epochs = 32 #100
batch_size = 64 #32

model.compile(loss= 'binary_crossentropy' , optimizer = 'adam', metrics=['accuracy'])

## Apprentissage du modèle de Deep Learning

In [0]:
model.fit(X_train, 
          y_train, 
          validation_data=(X_test , y_test), 
          epochs = epochs, 
          batch_size = batch_size, 
          steps_per_epoch=50,
          verbose = 1)

## Conclusion
Vous savez maintenant comment modifier l'**architecture matérielle** de la plateforme *cloud computing* pour accélérer les calculs du modèle de Deep Learning


# Partie 2 - Analyse approfondie de la classification

La deuxième partie de ce notebook est consacrée à l'analyse du modèle.
* on calcule la précision du modèle (*accuracy*)
* on montre comment calculer une matrice de confusion


## Evaluation du modèle de Deep Learning
On calcule l'*accuracy* : pourcentage de bonnes prédictions (détection des *churneurs*).

In [0]:
scores = model.evaluate(X_test , y_test)
print ("accuracy = {}".format(scores[1]))

### Prédire la Classe d'appartenance
On cherche à prédire si le client quitte ou pas l'opérateur.

* pour calculer une **probabilité** d'appartenance à chaque classe, on utilise `model.predict(X_test)`
* pour calculer une **classe** d'appartenance, on utilise `(model.predict(X_test) > 0.5).astype("int")`

Cela revient à appliquer un seuil (`0.5`) sur les probabilités. 

Voici les exemples en code dans les cellules suivantes :

In [0]:
y_pred = model.predict(X_test)

# affichage 
y_pred

Calculons la **classe** (churneur ou pas) pour chaque instance (client)

In [0]:
y_pred = (model.predict(X_test) > 0.5).astype("int")
# ajustement du format ...
y_pred = y_pred.reshape(-1)

### Vérification de l'accuracy

In [0]:
# Pour comparer chaque prédiction,client par client, avec la vraie valeur :
print(y_pred == y_test)
print("________ * ________")
# accuracy en pourcentage :
print("accuracy = " , np.sum(y_pred == y_test)/y_pred.shape[0])

## Matrice de Confusion 

Nous utilisons une matrice de confusion pour interpréter les résultats.

La matrice de confusion est un matrice *carrée* comportant autant de lignes qu'il y a de classes dans le problème.

Ici, nous avons **deux** classes : churn vs non-churn. Il y aura donc **deux** lignes et **deux** colonnes. 
Dans notre cas, c'est une matrice 2 x 2

En colonne, on reporte les valeurs **prédites** par l'algorithme. 
("*predicted*" dans le tableau ci-dessous).

En ligne, on reporte les valeurs **observées** dans la réalité.
("*True*" dans le tableau ci-dessous).

On reporte dans le tableau les instances de la manière suivante :

> - dans la diagonale principale du tableau le nombre d'instances correctement prédites (*churn* et *non-churn*).  
Les vrais-négatifs (*true negative* : `TN`) et les vrais-positifs (*true positive* : `TP`).
> - dans les cellules restantes, on reporte les erreurs de classification : les faux-positifs (`FP`) et les faux-négatifs (`FN`) 

Pour aller plus loin sur la matrice de confusion :
https://fr.wikipedia.org/wiki/Matrice_de_confusion

Affichage d'une matrice de confusion :

In [31]:
pd.DataFrame([["TN","FP"],["FN","TP"]],
             columns=["predicted-non-churn (0)","predicted-churn (1)"] ,
             index=["True-non-churn (0)","True-churn (1)"])

Unnamed: 0,predicted-non-churn (0),predicted-churn (1)
True-non-churn (0),TN,FP
True-churn (1),FN,TP


In [0]:
from sklearn.metrics import confusion_matrix
from sklearn.metrics import ConfusionMatrixDisplay

conf_mat = confusion_matrix(y_test , y_pred ,labels = [0,1])
tn, fp, fn, tp = conf_mat.ravel()

Affichage (formatée) de la matrice de confusion

In [0]:
cm_display = ConfusionMatrixDisplay(conf_mat,[0,1])
cm_display.plot()

In [0]:
# la même matrice ... non formatée
conf_mat

### Analyse des résultats

Rappel : 
* non churneurs (ceux qui restent) ont étiquette `0`
* churneurs (ceux qui partent) ont étiquette `1`

In [0]:
print("non-churneurs (conservent leurs contrats) correctement detectés = ",tn) 
print("churneurs (résilient leurs contrats) correctement detectés = " , tp)
print("churneurs non détectés (résilient leurs contrats en vrai) " , fn)
print("faux churneurs (détectés partant mais restant en vrai) = ", fp)

In [0]:
print("% de départ non prédits = " , fn / (fn + tn) )

In [0]:
from sklearn.metrics import classification_report

print(classification_report(y_test , y_pred , labels=[0 , 1]))