Projet d'évaluation finale en Data Science. L'objectif est de prédire le prix des loyers d'appartements aux États-Unis à partir d'un jeu de données de 10 000 annonces immobilières. Le projet inclut une analyse exploratoire (EDA), la construction de modèles de Machine Learning (supervisés et non supervisés), et le déploiement d'une API FastAPI.
Auteurs: Adam Beloucif et Emilien MORICE.
- Analyse Exploratoire des Données (EDA) interactive via Jupyter Notebook
- Pre-processing & Feature Engineering robustes
- Modèles Supervisés (Régression, Arbre, Random Forest avec R² = 0.72)
- Modélisation Non Supervisée (Clustering K-Means)
- Serveur d'inférence API FastAPI
- Fichiers configurés pour un ciblage Docker rapide
- Rapport d'analyse Métier
# 1. Installer les dépendances
pip install -r requirements.txt
# 2. Entraîner les modèles (génère model.pkl et scaler.pkl ainsi que les graphiques)
python scripts/train_models.py
# 3. Lancer l'API
uvicorn api.main:app --reloadeda.ipynb: Notebook de l'Exploration des Données.scripts/train_models.py: Entraînement des modèles.api/main.py: Code de l'API déployée.rapport_analyse_business.md: Conséquences métier et interprétation des modèles.requirements.txt&Dockerfile: Configuration et Déploiement.
curl -X 'POST' \
'http://127.0.0.1:8000/predict' \
-H 'accept: application/json' \
-H 'Content-Type: application/json' \
-d '{
"bathrooms": 1,
"bedrooms": 2,
"square_feet": 1050,
"latitude": 38.905,
"longitude": -76.986
}'- Python 3.10
- Pandas, Scikit-learn, Matplotlib, Seaborn
- FastAPI, Pydantic, Uvicorn
- Docker
- Initial release: Implémentation du pipeline Data Science complet et exposition via API FastAPI. Écriture du rapport Business.
Par Adam Beloucif · Data Engineer & Fullstack Developer · GitHub · LinkedIn