# 🧠 Projet de Soutenance IA – Overview

## 🎯 Objectif du projet

L’objectif de ce projet est de prédire le **prix d’un service freelance** proposé sur la plateforme Fiverr, en s’appuyant à la fois sur :
- la **description textuelle** du service,
- le **niveau du vendeur** (Nouveau, Confirmé, Top),
- la **fiabilité estimée** du profil (note composite interne).

Deux approches complémentaires sont explorées :
- une **régression** pour prédire le prix exact,
- une **classification** pour estimer la tranche de prix.

---

## 🗂️ Structure des notebooks

Le projet est découpé en 7 notebooks pédagogiques, chacun étant autonome et centré sur une étape clé du pipeline de traitement :

| Étape | Notebook | Description |
|-------|----------|-------------|
| 1️⃣ | [`01_pre-processing.ipynb`](./01_pre-processing.ipynb) | Nettoyage des données brutes et préparation du jeu analysable |
| 3️⃣ | [`02_model_regression.ipynb`](./03_model_regression.ipynb) | Entraînement du modèle de régression pour estimer les prix |
| 4️⃣ | [`03_model_classification.ipynb`](./04_model_classification.ipynb) | Entraînement du modèle de classification pour estimer la tranche de prix |
| 5️⃣ | [`04_model_transformation.ipynb`](./05_model_transformation.ipynb) | Sauvegarde des transformations, modèles et pipelines pour déploiement |
| 6️⃣ | [`05_predict.ipynb`](./06_predict.ipynb) | Tests de prédictions sur de nouveaux cas et analyse des résultats |
| 7️⃣ | [`06_app.ipynb`](./07_app.ipynb) | Application interactive avec Gradio pour tester les modèles |

---

## ⚙️ Technologies principales

- **Python 3.10**
- `pandas`, `numpy`, `scikit-learn`
- `xgboost`, `sentence-transformers`
- `Gradio` pour l’interface utilisateur
- `joblib` pour la sérialisation des modèles

---

## 💡 Remarques pédagogiques

Chaque notebook est autonome et commenté pour faciliter la compréhension :
- Des blocs `🔹 Info` ou `⚠️ Astuce` signalent les points pédagogiques importants.
- Les modèles sont testés sur des jeux distincts pour validation.
- L’architecture est conçue pour **être modulaire** et adaptée à un usage futur en production.

---

👨‍🏫 *Ce document sert de guide de lecture pour la soutenance et permet de naviguer efficacement dans le projet.*