Programme Python qui, à partir de n'importe quel fichier contenant un jeu de données pour l'entraînement des arbres de décision, retourne la racine de l'arbre de décision construit selon le principe de minimisation de l'entropie.
- Calcul d'entropie
- Validation témoin avec
scipyetsklearn - Support des chaînes de caractères et entiers (numérisation automatique)
- Visualisation optionnelle avec
matplotlib
exemple :
Racine choisie par le programme : ('P3', 0.3605)
Racine scipy (témoin) : ('P3', 0.2499)
Arbre sklearn (témoin) :
|--- P3 ...
Le programme retourne la racine et deux résultats témoins pour validation.
python program.py # Fichier par défaut (example.csv)
python program.py fichier.csv yes # Avec affichage graphique
python program.py --file exo1.csv --plot yesFormat CSV requis :
a b c class
1 3 2 A
0 0 2 B
...
pip install -r requirements.txtDépendances :
pandas,numpy,scikit-learnmatplotlibscipy