Bienvenue dans ce dépôt dédié à la pratique et à l’expérimentation des algorithmes de Machine Learning.
Ce projet regroupe des exercices complets sur plusieurs algorithmes supervisés et non-supervisés, accompagnés de traitements des données réels, visualisations et tests d’évaluation.
Machine learning projects │ ├── Dataset/ # Jeux de données utilisés │ ├── Clustering/ # Tous les modèles de clustering | ├── K-means │ ├── DBSCAN │ ├── Fuzzy C-Means │ ├── Gaussian Mixture │ ├── Hierarchique | ├── Meanshift | ├── Mini-Batch │ └── OPTICS
│ ├── Decision Tree/ # Arbres de décision (classification et régression) │ ├── Matplotlib/ # Graphiques et visualisations avec matplotlib │ ├── Pandas/ # Manipulations de données avec Pandas │ ├── REGRESSION_LINEAIRE/ # Modèles de régression linéaire │ ├── REGRESSION LOGISTIQUE/ # Modèles de régression logistique │ ├── Random Forest/ # Méthodes d'ensemble (Bagging, Voting, etc.) │ ├── Bagging │ ├── Voting Classifier │ └── Autres variantes │ ├── SVM/ # Machines à vecteurs de support │ ├── ScikitLearn/ # Utilisation de la librairie Scikit-learn │ └── Seaborn/ # Visualisations avancées avec Seaborn
Ce dépôt couvre plusieurs aspects clés du workflow en Machine Learning :
- Nettoyage de données (remplissage, suppression, encodage, normalisation etc.)
- Gestion des valeurs manquantes
- Normalisation et standardisation
- Rééchantillonnage (SMOTE, sous-échantillonnage)
- Courbes de distribution
- Matrices de corrélation
- Graphiques interactifs (Seaborn, Matplotlib)
- Visualisation des clusters
- Régression linéaire
- Régression logistique
- Arbres de décision
- Random Forest
- SVM (linear & kernel)
- Méthodes d'ensemble : Bagging, Random Forest, Voting Classifier ,XGBOOST ,CATBOOST
- Clustering : DBSCAN, K-means, Fuzzy C-Means, GMM, OPTICS, etc.
- Accuracy, Recall, Precision, F1-score
- Matrices de confusion
- Cross-validation
Ce dépôt est destiné à :
- Renforcer la compréhension des algorithmes classiques de ML
- Pratiquer la visualisation et le prétraitement
- Comprendre les limites et points forts de chaque méthode
- Développer une approche rigoureuse et reproductible
- Python 3
- Pandas, NumPy
- Scikit-Learn
- Seaborn, Matplotlib
- SciPy, Statsmodels
- Cloner le repo : git clone https://github.com/Falux-27/ML-Exercices.git cd ML-Exercices