Skip to content

SENE90/Projet_Final_Streamlit_Python

Repository files navigation

Segmentation Clients E-commerce

Projet L3 Data Science & Big Data

Dashboard Streamlit de segmentation clients basé sur l'analyse RFM + K-Means.


Structure du projet

projet_segmentation/
│
├── app.py            → Dashboard principal (à lancer avec streamlit run app.py)
├── data_loader.py    → Chargement et nettoyage du dataset
├── rfm.py            → Calcul des scores RFM + normalisation
├── clustering.py     → K-Means, méthode du coude, interprétation métier
├── requirements.txt  → Dépendances Python
└── data/
    └── online_retail.xlsx   ← Fichier à télécharger et placer ici

Installation

Étape 1 — Cloner / copier le projet

Placez tous les fichiers dans un dossier projet_segmentation/.

Étape 2 — Créer un environnement virtuel (recommandé)

python -m venv venv
source venv/bin/activate       # Linux / Mac
venv\Scripts\activate          # Windows

Étape 3 — Installer les dépendances

pip install -r requirements.txt

Étape 4 — Télécharger le dataset

Étape 5 — Lancer le dashboard

streamlit run app.py

Le dashboard s'ouvre automatiquement dans votre navigateur à l'adresse : http://localhost:8501


Fonctionnalités du dashboard

Onglet Contenu
📊 Indicateurs globaux KPIs, distributions Recency/Frequency/Monetary, évolution CA
📈 Méthode du coude Graphiques Inertie + Silhouette pour choisir k
🎯 Segmentation Scatter 3D + 2D des clusters, camembert de répartition
👥 Profils clients Tableau des moyennes, descriptions métier, radar chart, export CSV

Algorithmes utilisés

Analyse RFM

  • Recency : jours depuis le dernier achat
  • Frequency : nombre de commandes distinctes
  • Monetary : chiffre d'affaires total par client

Normalisation

  • Log-transform (log1p) pour réduire l'effet des outliers
  • StandardScaler (mean=0, std=1) pour homogénéiser les échelles

K-Means

  • Méthode du coude (Inertia) pour trouver le k optimal
  • Score de silhouette pour valider la qualité du clustering
  • Interprétation automatique des segments basée sur les centroïdes

Source des données

Online Retail Dataset — UCI Machine Learning Repository
https://archive.ics.uci.edu/ml/datasets/online+retail

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages