Skip to content

Louisq05/wine_quality_ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

image

Wine Quality Prediction

Description du projet

Ce projet vise à prédire la qualité d’un vin à partir de ses caractéristiques physico-chimiques (acidité, pH, teneur en alcool, sucre résiduel, etc.).
C'est un projet supervisé de type régression basé sur le dataset public Wine Quality (UCI).

Objectifs :

  • Explorer les données (EDA) pour comprendre les facteurs influençant la qualité.
  • Entraîner et comparer plusieurs modèles de régression.
  • Évaluer la performance via la RMSE.
  • Sélectionner et interpréter le meilleur modèle.

Structure fichiers

wine-quality-ml/
│
├── data/               # Données brutes et nettoyées
│   ├── raw/
│   └── processed/
│
├── notebooks/          # Notebooks Jupyter (EDA, entraînement)
│   ├── 01_eda.ipynb
│   └── 02_model_training.ipynb
│
├── src/                # Scripts Python
│   ├── data_preprocessing.py
│   └── model_training.py
│
├── models/             # modèles sauvegardés (.pkl, .joblib, ...)
├── tests/              # tests unitaires / smoke
├── docs/               # notes, rapports
├── README.md
└── .gitignore

Installation

1. Cloner le dépôt

git clone https://github.com/<ton_nom_utilisateur>/wine-quality-ml.git
cd wine-quality-ml

2. Créer un environnement virtuel (recommandé)

python -m venv venv
# Windows
venv\Scripts\activate
# macOS/Linux
source venv/bin/activate

3. Installer les dépendances

pip install -r requirements.txt

Données

Sources (UCI) :

Chaque ligne = un échantillon de vin ; la colonne cible est quality (note généralement entre 0 et 10).

Pipeline du projet (résumé)

  1. EDA : statistiques descriptives, corrélations, visualisations.
  2. Prétraitement : nettoyage, traitement des valeurs manquantes, normalisation.
  3. Modélisation : régression linéaire, Ridge/Lasso, RandomForest, éventuellement XGBoost/LightGBM.
  4. Évaluation : RMSE (principal), MAE, analyse d’erreurs.
  5. Optimisation : recherche d’hyperparamètres (Grid/Random/Optuna).
  6. Packaging : script d’inférence predict.py, sauvegarde du modèle, README + Model Card.

Technologies recommandées

  • Python 3.9+
  • pandas, numpy, scikit-learn
  • matplotlib, seaborn
  • (optionnel) xgboost / lightgbm, optuna
  • Jupyter Notebook

🧾 Auteur

Projet réalisé par Louis Quibeuf / premier projet pratique en Machine Learning.

📜 Licence

MIT : réutilisation permise avec attribution.

About

Projet d'apprentissage automatique axé sur la qualité du vin

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors