## Première Partie : Mise en place d’un modèle naïf
Pour établir une baseline, nous avons construit un modèle naïf simple afin de prédire si une exploitation agricole est financièrement saine (DIFF = 1) ou défaillante (DIFF = 0). Deux approches ont été retenues :


In [4]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import roc_auc_score

# Étape 1 : Chargement des données
df = pd.read_csv("/content/farms_train.csv", sep=";")
df = df.replace(',', '.', regex=True)

# Étape 2 : Séparer les variables explicatives de la cible
X = df[['R2', 'R7', 'R8', 'R17', 'R22', 'R32']]
y = df['DIFF']

# Étape 3 : Division du dataset en train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Étape 4 : Création et entraînement du classificateur Naïve Bayes
model = GaussianNB()
model.fit(X_train, y_train)

# Étape 5 : Prédictions
y_pred_proba = model.predict_proba(X_test)[:, 1]  # Probabilité d'appartenance à la classe 1 (DIFF = 1)

# Étape 6 : Calcul de l'AUC
auc = roc_auc_score(y_test, y_pred_proba)
print("AUC du modèle Naïve Bayes :", auc)


AUC du modèle Naïve Bayes : 0.8782093482554312
