In [2]:
import pandas as pd
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import VotingClassifier


#read the csv file
df = pd.read_csv('data/stat_acc_V3_new.csv', sep=';')

#initialisation des variables X et Y (à modifier avec les jeux de données d'apprentissage)
X = df.drop(['descr_grav'], axis=1)
Y = df['descr_grav']

### Classification avec SVM

In [3]:
#création d'un classifieur SVM
svm = SVC()
svm_params = {'kernel':('linear', 'rbf'), 'C':[1, 10]}
svm_grid = GridSearchCV(svm, svm_params, cv=5)
svm_grid.fit(X, Y)
best_svm = svm_grid.best_estimator_

#enregistrement des meilleurs paramètres
print("Meilleurs paramètres SVM : ", svm_grid.best_params_)


KeyboardInterrupt: 

### Classification avec Random Forest

In [None]:
#création d'un classifieur Random Forest
rf = RandomForestClassifier()
rf_params = {'n_estimators':[10, 100, 1000], 'max_depth':[None, 10, 100]}
rf_grid = GridSearchCV(rf, rf_params, cv=5)
rf_grid.fit(X, Y)
best_rf = rf_grid.best_estimator_

#enregistrement des meilleurs paramètres
print("Meilleurs paramètres Random Forest : ", rf_grid.best_params_)

### Classification avec MLP

In [None]:
#création d'un classifieur MLP
mlp = MLPClassifier()
mlp_params = {'hidden_layer_sizes':[(10,), (100,), (1000,)], 'activation':['relu', 'tanh', 'logistic']}
mlp_grid = GridSearchCV(mlp, mlp_params, cv=5)
mlp_grid.fit(X, Y)
best_mlp = mlp_grid.best_estimator_

#enregistrement des meilleurs paramètres
print("Meilleurs paramètres MLP : ", mlp_grid.best_params_)

### Fusion classifieurs

In [None]:
#fusion des classifieurs

#vote majoritaire
voting_clf = VotingClassifier(estimators=[('svm', best_svm), ('rf', best_rf), ('mlp', best_mlp)], voting='hard')
voting_clf.fit(X, Y)

#vote pondéré
voting_clf = VotingClassifier(estimators=[('svm', best_svm), ('rf', best_rf), ('mlp', best_mlp)], voting='soft')
voting_clf.fit(X, Y)

#prediction sur un nouveau jeu de données (à modifier avec les jeux de données de test)
X_pred = df.drop(['descr_grav'], axis=1)
Y_pred = voting_clf.predict(X_pred)