# Neural Network for Churn

## Introduction

Ce projet est centré sur l'utilisation de scikit-learn et Tensorflow, des bibliothèques de Python utilisée pour le Machine Learning & Deep Learning.
Avec le dataset Churn trouvé sur Kaggle, ce projet va me permettre d'en apprendre plus sur le Machine Learning et l'utilisations des bibliothèques dédiées au réseaux de neurones (scikit, tensorflow, keras)

### Importation 

In [14]:
import pandas as pd
from sklearn.model_selection import train_test_split

Ces données traitent sur une liste de clients ayant un abonnement Multimédia, Churn est le terme utilisé pour désigner les personnes qui résilient ou non un abonnement.

In [2]:
df = pd.read_csv('Churn.csv')

In [3]:
df

Unnamed: 0,Customer ID,Gender,Senior Citizen,Partner,Dependents,tenure,Phone Service,Multiple Lines,Internet Service,Online Security,...,Device Protection,Tech Support,Streaming TV,Streaming Movies,Contract,Paperless Billing,Payment Method,Monthly Charges,Total Charges,Churn
0,7590-VHVEA,Female,0,Yes,No,1,No,No phone service,DSL,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,29.85,29.85,No
1,7590-VHVEG,Female,0,Yes,No,1,No,No phone service,DSL,No,...,No,No,No,No,Month-to-month,Yes,Electronic check,29.85,29.85,No
2,5575-GNVDE,Male,0,No,No,34,Yes,No,DSL,Yes,...,Yes,No,No,No,One year,No,Mailed check,56.95,1889.5,No
3,3668-QPYBK,Male,0,No,No,2,Yes,No,DSL,Yes,...,No,No,No,No,Month-to-month,Yes,Mailed check,53.85,108.15,Yes
4,7795-CFOCW,Male,0,No,No,45,No,No phone service,DSL,Yes,...,Yes,Yes,No,No,One year,No,Bank transfer (automatic),42.30,1840.75,No
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7039,6840-RESVB,Male,0,Yes,Yes,24,Yes,Yes,DSL,Yes,...,Yes,Yes,Yes,Yes,One year,Yes,Mailed check,84.80,1990.5,No
7040,2234-XADUH,Female,0,Yes,Yes,72,Yes,Yes,Fiber optic,No,...,Yes,No,Yes,Yes,One year,Yes,Credit card (automatic),103.20,7362.9,No
7041,4801-JZAZL,Female,0,Yes,Yes,11,No,No phone service,DSL,Yes,...,No,No,No,No,Month-to-month,Yes,Electronic check,29.60,346.45,No
7042,8361-LTMKD,Male,1,Yes,No,4,Yes,Yes,Fiber optic,No,...,No,No,No,No,Month-to-month,Yes,Mailed check,74.40,306.6,Yes


Pour entraîner notre modèle, je vérifie qu'il n'y ait aucune valeur nulles

In [24]:
df.isna().sum()

Customer ID          0
Gender               0
Senior Citizen       0
Partner              0
Dependents           0
tenure               0
Phone Service        0
Multiple Lines       0
Internet Service     0
Online Security      0
Online Backup        0
Device Protection    0
Tech Support         0
Streaming TV         0
Streaming Movies     0
Contract             0
Paperless Billing    0
Payment Method       0
Monthly Charges      0
Total Charges        0
Churn                0
dtype: int64

Pour réaliser l'entrainement de mon modèle, je réalise une transformation des données, on cherche à prédire si les clients vont se désabonner ou non, je supprime donc la colonne Churn qui pourrait troubler le modèle et la colonne CustomerID qui n'est pas utile.

In [15]:
X = pd.get_dummies(df.drop(['Churn', 'Customer ID'], axis=1))
y = df['Churn'].apply(lambda x: 1 if x=='Yes' else 0)

In [16]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

In [17]:
y_train.head()

1927    1
5278    1
3630    0
1449    0
2188    0
Name: Churn, dtype: int64

In [18]:
X_train

Unnamed: 0,Senior Citizen,tenure,Monthly Charges,Gender_Female,Gender_Male,Partner_No,Partner_Yes,Dependents_No,Dependents_Yes,Phone Service_No,...,Total Charges_995.35,Total Charges_996.45,Total Charges_996.85,Total Charges_996.95,Total Charges_997.65,Total Charges_997.75,Total Charges_998.1,Total Charges_999.45,Total Charges_999.8,Total Charges_999.9
1927,0,49,99.80,False,True,False,True,False,True,False,...,False,False,False,False,False,False,False,False,False,False
5278,0,6,89.30,True,False,True,False,True,False,False,...,False,False,False,False,False,False,False,False,False,False
3630,0,17,25.15,False,True,False,True,False,True,False,...,False,False,False,False,False,False,False,False,False,False
1449,0,23,20.85,False,True,True,False,True,False,False,...,False,False,False,False,False,False,False,False,False,False
2188,0,71,116.25,False,True,False,True,True,False,False,...,False,False,False,False,False,False,False,False,False,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6733,0,24,89.55,True,False,True,False,True,False,False,...,False,False,False,False,False,False,False,False,False,False
6456,0,59,44.30,False,True,False,True,True,False,True,...,False,False,False,False,False,False,False,False,False,False
6944,0,1,30.50,True,False,False,True,False,True,True,...,False,False,False,False,False,False,False,False,False,False
3688,0,19,100.00,False,True,False,True,False,True,False,...,False,False,False,False,False,False,False,False,False,False


In [19]:
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import Dense
from sklearn.metrics import accuracy_score

Je peux ainsi créer un modèle de réseau de neurones en utilisant Keras couche par couche.
Chaque couche sera Dense, c'est à dire une couche fully connected (chaque neurone de la couche est connecté à la couche précédente)

On peut donc commencer à entraîner notre modèle, on renvoie chaque échantillon de l'entrainement avec Input(shape=(len(X_train.columns)
Par la suite on crée différentes couches en commençant par 32 neurones, puis 64 neurones en Rectified Linear Unit.
La couche de sortie est en sigmoide ce qui affichera soit une valeur entre 0 et 1

In [20]:
from tensorflow.keras.layers import Input

model = Sequential()
model.add(Input(shape=(len(X_train.columns),)))
model.add(Dense(units=32, activation='relu'))
model.add(Dense(units=64, activation='relu'))
model.add(Dense(units=1, activation='sigmoid'))

In [21]:
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['accuracy'])

In [29]:
model.fit(X_train, y_train, epochs=500, batch_size=32)

Epoch 1/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7975 - loss: 0.4248
Epoch 2/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7862 - loss: 0.4336
Epoch 3/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7862 - loss: 0.4537
Epoch 4/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8000 - loss: 0.4308
Epoch 5/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7967 - loss: 0.4314
Epoch 6/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7927 - loss: 0.4340
Epoch 7/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7975 - loss: 0.4233
Epoch 8/500
[1m177/177[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7910 - loss: 0.4444
Epoch 9/500
[1m177/177[0m [32

<keras.src.callbacks.history.History at 0x23292968e90>

In [30]:
y_hat = model.predict(X_test)
y_hat = [0 if val < 0.5 else 1 for val in y_hat]

[1m45/45[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step 


In [32]:
y_hat

[0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 1,
 1,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 1,
 1,
 0,
 0,
 0,
 1,
 1,
 1,
 1,
 0,
 0,
 0,
 0,
 1,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 1,
 1,
 1,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 1,
 0,
 1,
 0,
 0,
 1,
 0,
 1,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 0,
 1,
 0,
 0,
 0,


In [33]:
accuracy_score(y_test, y_hat)

0.8055358410220014

La probabilité étant de 0.805, on peut affirmer que la probabilité qu'un client se désabonne du service est assez élevée.