# Exploration des différents modèles (pour la classification des déplacements sans PCA)

L'idée de ce notebook est de faire une exploration rapide de différents modèles pour conserver les plus prometteurs et de les étudier plus précisément ensuite.

### Modèles étudiés
- **Random Forest**
- **Gradient Boosting**
- **SVM**
- **KNN**
- **Régression Linéaire, Logistique ...**
- **ANN** (Keras)

### Récupération des données

In [11]:
from sklearn.preprocessing import LabelEncoder
import pandas as pd
from sklearn.utils import shuffle
import joblib


data = pd.read_csv('../preprocessing_data/move_preprocess.csv')

X = data.drop('action', axis=1)
y = data['action']

le = LabelEncoder()
y = le.fit_transform(y)

X_shuffled, y_shuffled = shuffle(X, y, random_state=42)


['label_encoder_move.pkl']

Comme cette étape ne concerne que l'exploration des résultats des différents modèles, on se passe de séparer les données en validation et d'entraînement pour l'instant, on va juste faire une validation croisée.

### Exploration des différents modèles

In [None]:
from explore_models import explore_models

top3, best_model = explore_models(X_shuffled, y_shuffled)

# Dowload the best model (temporary)


In [None]:

joblib.dump(best_model, '../models_temp/best_model_move.pkl')
joblib.dump(le, "../models_temp/label_encoder_move.pkl")

In [None]:
arbre = best_model.estimators_[0]

import matplotlib.pyplot as plt
from sklearn.tree import plot_tree
import numpy as np

plt.figure(figsize=(20,10))
plot_tree(arbre, filled=True, feature_names=X.columns, class_names=np.unique(y).astype(str))
plt.show()