Segmentation Clients E-commerce

Projet L3 Data Science & Big Data

Dashboard Streamlit de segmentation clients basé sur l'analyse RFM + K-Means.

Structure du projet

projet_segmentation/
│
├── app.py            → Dashboard principal (à lancer avec streamlit run app.py)
├── data_loader.py    → Chargement et nettoyage du dataset
├── rfm.py            → Calcul des scores RFM + normalisation
├── clustering.py     → K-Means, méthode du coude, interprétation métier
├── requirements.txt  → Dépendances Python
└── data/
    └── online_retail.xlsx   ← Fichier à télécharger et placer ici

Installation

Étape 1 — Cloner / copier le projet

Placez tous les fichiers dans un dossier projet_segmentation/.

Étape 2 — Créer un environnement virtuel (recommandé)

python -m venv venv
source venv/bin/activate       # Linux / Mac
venv\Scripts\activate          # Windows

Étape 3 — Installer les dépendances

pip install -r requirements.txt

Étape 4 — Télécharger le dataset

Lien : https://archive.ics.uci.edu/ml/datasets/online+retail
Téléchargez le fichier Online Retail.xlsx
Créez un dossier data/ à la racine du projet
Renommez le fichier en online_retail.xlsx et placez-le dans data/

Étape 5 — Lancer le dashboard

streamlit run app.py

Le dashboard s'ouvre automatiquement dans votre navigateur à l'adresse : http://localhost:8501

Fonctionnalités du dashboard

Onglet	Contenu
📊 Indicateurs globaux	KPIs, distributions Recency/Frequency/Monetary, évolution CA
📈 Méthode du coude	Graphiques Inertie + Silhouette pour choisir k
🎯 Segmentation	Scatter 3D + 2D des clusters, camembert de répartition
👥 Profils clients	Tableau des moyennes, descriptions métier, radar chart, export CSV

Algorithmes utilisés

Analyse RFM

Recency : jours depuis le dernier achat
Frequency : nombre de commandes distinctes
Monetary : chiffre d'affaires total par client

Normalisation

Log-transform (log1p) pour réduire l'effet des outliers
StandardScaler (mean=0, std=1) pour homogénéiser les échelles

K-Means

Méthode du coude (Inertia) pour trouver le k optimal
Score de silhouette pour valider la qualité du clustering
Interprétation automatique des segments basée sur les centroïdes

Source des données

Online Retail Dataset — UCI Machine Learning Repository
https://archive.ics.uci.edu/ml/datasets/online+retail

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Segmentation Clients E-commerce

Projet L3 Data Science & Big Data

Structure du projet

Installation

Étape 1 — Cloner / copier le projet

Étape 2 — Créer un environnement virtuel (recommandé)

Étape 3 — Installer les dépendances

Étape 4 — Télécharger le dataset

Étape 5 — Lancer le dashboard

Fonctionnalités du dashboard

Algorithmes utilisés

Analyse RFM

Normalisation

K-Means

Source des données

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.ipynb_checkpoints		.ipynb_checkpoints
__pycache__		__pycache__
README.md		README.md
app.py		app.py
clustering.py		clustering.py
data_loader.py		data_loader.py
online_retail.xlsx		online_retail.xlsx
requirements.txt		requirements.txt
rfm.py		rfm.py

Folders and files

Latest commit

History

Repository files navigation

Segmentation Clients E-commerce

Projet L3 Data Science & Big Data

Structure du projet

Installation

Étape 1 — Cloner / copier le projet

Étape 2 — Créer un environnement virtuel (recommandé)

Étape 3 — Installer les dépendances

Étape 4 — Télécharger le dataset

Étape 5 — Lancer le dashboard

Fonctionnalités du dashboard

Algorithmes utilisés

Analyse RFM

Normalisation

K-Means

Source des données

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages