## Importation de librairies

In [1]:
# Importation des librairies
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from dateutil import parser

## Importation du jeu de données

In [12]:
client = pd.read_csv(r"../data/clients.csv")
print("Jeu de données importé ✅✅")

Jeu de données importé ✅✅


## Suppression des colonnes sensibles

In [3]:
colonnes_a_supprimer = ['id_client', 'nom', 'email', 'téléphone','id_magasin']

client = client.drop(columns=colonnes_a_supprimer)
NewDataClient = client.copy()
print("Colonnes Sensibles Supprimées ✅✅")

Colonnes Sensibles Supprimées ✅✅


## Colonnes de dates converties en format exact

In [4]:
def convertir_en_date_uniforme(df, colonnes):
    def parse_date_robuste(x):
        try:
            return parser.parse(x, dayfirst=True)
        except:
            return pd.NaT
    
    for col in colonnes:
        df[col] = df[col].astype(str).apply(parse_date_robuste)
        df[col] = df[col].dt.strftime("%Y-%m-%d")
    return df

colonnes_de_date = ["date_inscription","date_dernier_achat"]
NewDataClient = convertir_en_date_uniforme(NewDataClient,colonnes_de_date)
print("Colonnes de dates uniformisées ✅✅")

Colonnes de dates uniformisées ✅✅


## Conversion en format date

In [5]:
for col in colonnes_de_date: 
    NewDataClient[col] =pd.to_datetime(NewDataClient[col], errors="coerce")

print("Colonnes de date transfromée en format de date ✅✅")

Colonnes de date transfromée en format de date ✅✅


## Features Engineering

### **Ancienneté du client** : Nombre de jours depuis l'inscription

In [6]:
from datetime import datetime
today = datetime.today()
NewDataClient["anciennete_jours"] = (today - NewDataClient["date_inscription"]).dt.days

### **Récence** : Nombre de jours depuis le dernier achat

In [7]:
NewDataClient["recence_jours"] = (today - NewDataClient["date_dernier_achat"]).dt.days

### **Fréquence des achats** : Intervalle moyen entre inscription et dernier achat

In [8]:
NewDataClient["duree_entre_achat"] =(NewDataClient["date_dernier_achat"] - NewDataClient["date_inscription"]).dt.days

### **Statut du Client** : Définir actif/inactif selon un seuil de récence (par ex. inactif si recence_jours > 180 jours)

In [9]:
NewDataClient["statut_client"] = NewDataClient["recence_jours"].apply(lambda x: "Actif"if x <= 180 else "Inactif")

## Exportation de la base de données

In [10]:
# Exportation de la nouvelle données
NewDataClient.to_csv(r"../data/NewDataClient.csv", index=False)
print("NewDataClient exporté ✅✅")

NewDataClient exporté ✅✅
