# Projet Intelligence Artificielle

## Besoin client 3 : Système d'alerte pour les tempêtes 

### Préparation des données

In [1]:
# Importation des librairies nécessaires

import pandas as pd
import numpy as np
from sklearn.preprocessing import OrdinalEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
import pickle as pk

In [None]:
# Importation des bases de données 

# data_prof = pd.read_csv('./Données/Data_Arbre.csv')
data_clean = pd.read_csv("./Données/data_clean.csv", encoding='utf-8', sep=";", decimal=",")

In [None]:
# Affichage des premières lignes des données de notre base de données

# data_prof.head()
data_clean.head()

In [None]:
# Récupération des colonnes désirées 

data = data_clean[["haut_tot","haut_tronc","tronc_diam","fk_arb_etat","fk_stadedev","age_estim", "fk_prec_estim","clc_quartier", "clc_secteur","fk_port","fk_pied","fk_situation","fk_revetement","feuillage"]]
data.head()

In [None]:
# Autre méthode pour récuperer les colonnes désirées

colonnes = ["haut_tot","haut_tronc","tronc_diam","fk_arb_etat","fk_stadedev","age_estim", "fk_prec_estim","clc_quartier", "clc_secteur","fk_port","fk_pied","fk_situation","fk_revetement","feuillage"]
data_new = data_clean[colonnes]

In [None]:
# Corrélation entre les variables numériques

correlation = data.corr(method='pearson', numeric_only= True).style.background_gradient(cmap='Pastel1')
correlation

In [None]:
# Retrait des lignes dont on ne se sert pas

index = data[(data["fk_arb_etat"] == 'SUPPRIMÉ') | 
             (data["fk_arb_etat"]=='ABATTU') | 
             (data["fk_arb_etat"]=='EN PLACE') | 
             (data["fk_arb_etat"]=='REMPLACÉ')].index
data.drop(index, inplace = True)
data.head()

In [None]:
# Binarisation des valeurs de fk_arb_etat

data.loc[data["fk_arb_etat"] == "Essouché","fk_arb_etat"] = 1
data.loc[data["fk_arb_etat"] != 1,"fk_arb_etat"] = 0
data.fk_arb_etat = data.fk_arb_etat.astype(int)

In [None]:
# Changement des ordinalités dans les colonnes en charactère

encodeur = OrdinalEncoder()
cols = ["clc_quartier", "clc_secteur","fk_port","fk_pied","fk_situation","fk_revetement","feuillage"]
changement = data[cols]
data[cols] = encodeur.fit_transform(changement)

In [None]:
# Visualisation des données transformées

print(data)

In [None]:
# Nouvelle corrélation entre les variables numériques

new_correlation = data.corr(method='pearson', numeric_only= True).style.background_gradient(cmap='Pastel1')
new_correlation

In [None]:
# Classification des données en X

x = data[["haut_tot", "haut_tronc","tronc_diam","clc_quartier"]]
print(x)
print(x.shape)