In [1]:
import pandas as pd

# Création d'un dataset de customer churn
data = {
    'CustomerID': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'Gender': ['Female', 'Male', 'Female', 'Male', 'Female', 'Female', 'Male', 'Male', 'Female', 'Female'],
    'Age': [25, 34, 45, 23, 54, 35, 42, 27, 29, 31],
    'Tenure': [12, 5, 24, 3, 56, 19, 8, 10, 9, 15],  # Tenure in months
    'Balance': [2000, 3000, 1500, 500, 4500, 3200, 1000, 600, 800, 2200],
    'Products': [1, 2, 2, 1, 3, 2, 1, 1, 2, 3],  # Number of products subscribed
    'HasCrCard': [1, 0, 1, 0, 1, 1, 0, 0, 1, 1],  # Whether the customer has a credit card (1: Yes, 0: No)
    'IsActiveMember': [1, 1, 0, 0, 1, 0, 1, 1, 0, 1],  # Whether the customer is an active member (1: Yes, 0: No)
    'EstimatedSalary': [50000, 60000, 52000, 25000, 75000, 64000, 48000, 27000, 29000, 57000],
    'Churn': [0, 1, 0, 1, 0, 1, 0, 0, 1, 0]  # Whether the customer churned (1: Yes, 0: No)
}

# Conversion du dictionnaire en DataFrame
df = pd.DataFrame(data)

# Affichage du DataFrame
print(df)

# Sauvegarde du DataFrame sous forme de fichier CSV
df.to_csv('customer_churn.csv', index=False)


   CustomerID  Gender  Age  Tenure  Balance  Products  HasCrCard  \
0           1  Female   25      12     2000         1          1   
1           2    Male   34       5     3000         2          0   
2           3  Female   45      24     1500         2          1   
3           4    Male   23       3      500         1          0   
4           5  Female   54      56     4500         3          1   
5           6  Female   35      19     3200         2          1   
6           7    Male   42       8     1000         1          0   
7           8    Male   27      10      600         1          0   
8           9  Female   29       9      800         2          1   
9          10  Female   31      15     2200         3          1   

   IsActiveMember  EstimatedSalary  Churn  
0               1            50000      0  
1               1            60000      1  
2               0            52000      0  
3               0            25000      1  
4               1            75

In [2]:
# Chargement du dataset à partir du fichier CSV
df = pd.read_csv('customer_churn.csv')

In [3]:
# Analyse de la répartition des churners et non-churners
churn_counts = df['Churn'].value_counts()
print(f"Nombre de churners: {churn_counts[1]}")
print(f"Nombre de non-churners: {churn_counts[0]}")


Nombre de churners: 4
Nombre de non-churners: 6


In [4]:
# Analyse des caractéristiques des churners vs non-churners
churn_mean = df[df['Churn'] == 1].mean()
non_churn_mean = df[df['Churn'] == 0].mean()

In [5]:
print("Moyenne des caractéristiques des churners:")
print(churn_mean)
print("\nMoyenne des caractéristiques des non-churners:")
print(non_churn_mean)


Moyenne des caractéristiques des churners:
CustomerID             5.25
Age                   30.25
Tenure                 9.00
Balance             1875.00
Products               1.75
HasCrCard              0.50
IsActiveMember         0.25
EstimatedSalary    44500.00
Churn                  1.00
dtype: float64

Moyenne des caractéristiques des non-churners:
CustomerID             5.666667
Age                   37.333333
Tenure                20.833333
Balance             1966.666667
Products               1.833333
HasCrCard              0.666667
IsActiveMember         0.833333
EstimatedSalary    51500.000000
Churn                  0.000000
dtype: float64


In [6]:
# Affichage des statistiques descriptives du dataset
print(df.describe())

       CustomerID        Age     Tenure      Balance   Products  HasCrCard  \
count    10.00000  10.000000  10.000000    10.000000  10.000000  10.000000   
mean      5.50000  34.500000  16.100000  1930.000000   1.800000   0.600000   
std       3.02765   9.823441  15.380001  1315.759181   0.788811   0.516398   
min       1.00000  23.000000   3.000000   500.000000   1.000000   0.000000   
25%       3.25000  27.500000   8.250000   850.000000   1.000000   0.000000   
50%       5.50000  32.500000  11.000000  1750.000000   2.000000   1.000000   
75%       7.75000  40.250000  18.000000  2800.000000   2.000000   1.000000   
max      10.00000  54.000000  56.000000  4500.000000   3.000000   1.000000   

       IsActiveMember  EstimatedSalary      Churn  
count       10.000000        10.000000  10.000000  
mean         0.600000     48700.000000   0.400000  
std          0.516398     16852.629205   0.516398  
min          0.000000     25000.000000   0.000000  
25%          0.000000     33750.00000

CustomerID : Identifiant unique pour chaque client.
Gender : Genre du client (Male ou Female).
Age : Âge du client.
Tenure : Durée d'abonnement en mois.
Balance : Solde du compte du client.
Products : Nombre de produits souscrits par le client.
HasCrCard : Indique si le client possède une carte de crédit (1: Oui, 0: Non).
IsActiveMember : Indique si le client est un membre actif (1: Oui, 0: Non).
EstimatedSalary : Salaire estimé du client.
Churn : Indique si le client a cessé d'utiliser les services (1: Oui, 0: Non).