In [None]:
# PARTIE 3

# Importation des bibliothèques
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import r2_score
import joblib

# Chargement du dataset nettoyé
dataset = pd.read_csv("datas/dataset.csv", delimiter="\t")

# Suppression des lignes ayant des valeurs manquantes
dataset = dataset.dropna(axis=0, how='any')

# Séparation des données en variables explicatives (X) et cible (y)
# On prend les colonnes 5 à 11 incluses (points de vie → génération)
# Séparation des données
X = dataset.iloc[:, 5:12].values  # colonnes d’entrée (caractéristiques)
y = dataset["POURCENTAGE_DE_VICTOIRES"].values  # colonne cible

# Découpage des données en apprentissage et validation
X_apprentissage, X_validation, y_apprentissage, y_validation = train_test_split(
    X, y, test_size=0.2, random_state=0
)

# ==========================
# ALGORITHME 1 : RÉGRESSION LINÉAIRE
# ==========================
algorithme = LinearRegression()
algorithme.fit(X_apprentissage, y_apprentissage)
predictions = algorithme.predict(X_validation)
precision = r2_score(y_validation, predictions)
print(">> ----------- REGRESSION LINEAIRE -----------")
print(">> Précision =", precision)
print("----------------------------------------------")

# ==========================
# ALGORITHME 2 : ARBRE DE DÉCISION
# ==========================
algorithme = DecisionTreeRegressor()
algorithme.fit(X_apprentissage, y_apprentissage)
predictions = algorithme.predict(X_validation)
precision = r2_score(y_validation, predictions)
print(">> ----------- ARBRE DE DÉCISION -----------")
print(">> Précision =", precision)
print("--------------------------------------------")

# ==========================
# ALGORITHME 3 : FORÊT ALÉATOIRE
# ==========================
algorithme = RandomForestRegressor()
algorithme.fit(X_apprentissage, y_apprentissage)
predictions = algorithme.predict(X_validation)
precision = r2_score(y_validation, predictions)
print(">> ----------- FORÊTS ALÉATOIRES -----------")
print(">> Précision =", precision)
print("--------------------------------------------")

# ==========================
# SAUVEGARDE DU MODÈLE
# ==========================
import os
os.makedirs("modele", exist_ok=True)  # crée le dossier si absent

fichier = "modele/modele_pokemon.mod"
joblib.dump(algorithme, fichier)

print("Modèle sauvegardé avec succès dans :", fichier)


>> ----------- REGRESSION LINEAIRE -----------
>> Précision = 0.9035707242164948
----------------------------------------------
>> ----------- ARBRE DE DÉCISION -----------
>> Précision = 0.8716987557353841
--------------------------------------------
>> ----------- FORÊTS ALÉATOIRES -----------
>> Précision = 0.9359923522029547
--------------------------------------------
Modèle sauvegardé avec succès dans : modele/modele_pokemon.mod
