Wine Quality Prediction

Wine Quality Prediction

Description du projet

Ce projet vise à prédire la qualité d’un vin à partir de ses caractéristiques physico-chimiques (acidité, pH, teneur en alcool, sucre résiduel, etc.).
C'est un projet supervisé de type régression basé sur le dataset public Wine Quality (UCI).

Objectifs :

Explorer les données (EDA) pour comprendre les facteurs influençant la qualité.
Entraîner et comparer plusieurs modèles de régression.
Évaluer la performance via la RMSE.
Sélectionner et interpréter le meilleur modèle.

Structure fichiers

wine-quality-ml/
│
├── data/               # Données brutes et nettoyées
│   ├── raw/
│   └── processed/
│
├── notebooks/          # Notebooks Jupyter (EDA, entraînement)
│   ├── 01_eda.ipynb
│   └── 02_model_training.ipynb
│
├── src/                # Scripts Python
│   ├── data_preprocessing.py
│   └── model_training.py
│
├── models/             # modèles sauvegardés (.pkl, .joblib, ...)
├── tests/              # tests unitaires / smoke
├── docs/               # notes, rapports
├── README.md
└── .gitignore

Installation

1. Cloner le dépôt

git clone https://github.com/<ton_nom_utilisateur>/wine-quality-ml.git
cd wine-quality-ml

2. Créer un environnement virtuel (recommandé)

python -m venv venv
# Windows
venv\Scripts\activate
# macOS/Linux
source venv/bin/activate

3. Installer les dépendances

pip install -r requirements.txt

Données

Sources (UCI) :

Wine Quality – Red: https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv
Wine Quality – White: https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv

Chaque ligne = un échantillon de vin ; la colonne cible est quality (note généralement entre 0 et 10).

Pipeline du projet (résumé)

EDA : statistiques descriptives, corrélations, visualisations.
Prétraitement : nettoyage, traitement des valeurs manquantes, normalisation.
Modélisation : régression linéaire, Ridge/Lasso, RandomForest, éventuellement XGBoost/LightGBM.
Évaluation : RMSE (principal), MAE, analyse d’erreurs.
Optimisation : recherche d’hyperparamètres (Grid/Random/Optuna).
Packaging : script d’inférence predict.py, sauvegarde du modèle, README + Model Card.

Technologies recommandées

Python 3.9+
pandas, numpy, scikit-learn
matplotlib, seaborn
(optionnel) xgboost / lightgbm, optuna
Jupyter Notebook

🧾 Auteur

Projet réalisé par Louis Quibeuf / premier projet pratique en Machine Learning.

📜 Licence

MIT : réutilisation permise avec attribution.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Wine Quality Prediction

Description du projet

Structure fichiers

Installation

1. Cloner le dépôt

2. Créer un environnement virtuel (recommandé)

3. Installer les dépendances

Données

Pipeline du projet (résumé)

Technologies recommandées

🧾 Auteur

📜 Licence

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
data		data
docs		docs
models		models
notebooks		notebooks
tests		tests
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

Wine Quality Prediction

Description du projet

Structure fichiers

Installation

1. Cloner le dépôt

2. Créer un environnement virtuel (recommandé)

3. Installer les dépendances

Données

Pipeline du projet (résumé)

Technologies recommandées

🧾 Auteur

📜 Licence

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages