In [None]:
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.naive_bayes import GaussianNB, CategoricalNB
from sklearn import metrics

import warnings
warnings.filterwarnings("ignore")

In [None]:
# Load the dataset from CSV
data = pd.read_csv("./dataset.csv")

# Identify non-categorical columns to filter out
non_categorical_columns = ['Debtor', 'Unemployment rate', 'Inflation rate', 'GDP', 'Target']

X = data.drop(non_categorical_columns, axis=1)  # Features
y = data['Target']  # Target variable

# Division des données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [None]:
# Initialisation du classificateur Naive Bayes
naive_bayes = CategoricalNB(min_categories=50)

# Entraînement du modèle
naive_bayes.fit(X_train, y_train)

# Prédiction sur l'ensemble de test
y_pred = naive_bayes.predict(X_test)

In [None]:
# Évaluation des performances du modèle
accuracy = metrics.accuracy_score(y_test, y_pred)
print(f"Précision du modèle : {accuracy}")

# Affichage du rapport de classification et de la matrice de confusion
print("Rapport de classification :")
print(metrics.classification_report(y_test, y_pred))

print("Matrice de confusion :")
print(metrics.confusion_matrix(y_test, y_pred))

In [None]:
# Définir les hyperparamètres à tester
parameters = {'var_smoothing': [1e-9, 1e-8, 1e-7, 1e-6, 1e-5],
              'priors': [None, [0.2, 0.3, 0.5], [0.3, 0.4, 0.3]]}

# Initialiser le modèle Naïf Bayes Gaussien
naive_bayes = GaussianNB()

# Utiliser GridSearchCV pour tester différents hyperparamètres
grid_search = GridSearchCV(naive_bayes, parameters, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)

# Obtenir les résultats de la validation croisée
results = pd.DataFrame(grid_search.cv_results_)

# Afficher un tableau des résultats pour chaque combinaison d'hyperparamètres testée
print("Tableau des performances pour différentes combinaisons d'hyperparamètres :")
print(results[['param_var_smoothing', 'param_priors', 'mean_test_score', 'std_test_score']])