machine learning
Ce document retranscrit une démarche de classification automatique d’un ensemble de fromages (29 observations) décrits par leurs propriétés nutritives (ex. protéines, lipides, etc. ; 9 variables). L’objectif est d’identifier des groupes de fromages homogènes, partageant des caractéristiques similaires.
Nous utiliserons essentiellement deux approches en nous appuyant sur deux procédures des packages spécialisés pour Python : la classification ascendante hiérarchique (CAH – Package SciPy) ; la méthode des centres mobiles (k-Means – Package Scikit-Learn).
Le fichier « fromage.txt » provient de la page de cours de Marie Chavent de l’Université de Bordeaux. Les excellents supports et exercices corrigés que l’on peut y trouver compléteront à profit ce tutoriel qui se veut avant tout un guide simple pour une première prise en main de Python dans le contexte de la classification automatique
• Chargement et description des données
• Classification automatique
• Pistes pour la détection du nombre adéquat de classes
• Description – interprétation des groupes