In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
import joblib

# Charger les donn√©es
df = pd.read_csv('data.csv', encoding='latin-1')

# Supprimer les colonnes non pertinentes
df = df.drop(columns=['cow', 'date', 'hour', 'oestrus','calving','lameness','mastitis','other_disease','accidents','mixing','management_changes', 'acidosis'])

# Remplacer les valeurs NA dans LPS par la moyenne
df['LPS'] = df['LPS'].fillna(df['LPS'].mean())

# S√©parer X et y
X = df.drop(columns=['OK'])
y = df['OK']

# Normaliser les donn√©es (important pour SVM)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Diviser les donn√©es
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, random_state=17, test_size=0.2)

# Cr√©er et entra√Æner le mod√®le SVM
svm = SVC(kernel='rbf', C=1, gamma='scale')  # Tu peux aussi tester 'linear' ou 'poly' comme kernel
svm.fit(X_train, y_train)

# Pr√©dire
y_pred = svm.predict(X_test)

# Afficher les m√©triques
print("Score SVM :", svm.score(X_test, y_test))
print("\nRapport de classification :\n", classification_report(y_test, y_pred))
print("\nMatrice de confusion :\n", confusion_matrix(y_test, y_pred))
print("\nDistribution des classes :\n", y.value_counts())

# Sauvegarder le mod√®le entra√Æn√©
joblib.dump(svm, 'svm_model.pkl')
print("‚úÖ Mod√®le sauvegard√© sous 'model.pkl'")

# Sauvegarder le scaler pour les futures pr√©dictions
joblib.dump(scaler, 'scaler.pkl')
print("‚úÖ Scaler sauvegard√© sous 'scaler.pkl'")

# Charger le mod√®le sauvegard√© (pour test)
loaded_model = joblib.load('svm_model.pkl')

# Charger le scaler sauvegard√©
loaded_scaler = joblib.load('scaler.pkl')

# Effectuer des pr√©dictions avec le mod√®le charg√©
X_test_scaled = loaded_scaler.transform(X_test)  # Normaliser les donn√©es de test avant pr√©diction
y_pred_loaded = loaded_model.predict(X_test_scaled)

# Afficher les r√©sultats avec le mod√®le charg√©
print("\n‚úÖ Accuracy avec le mod√®le charg√© : ", classification_report(y_test, y_pred_loaded))
print("\nüßÆ Matrice de confusion avec le mod√®le charg√© :\n", confusion_matrix(y_test, y_pred_loaded))


Score SVM : 0.8593970132431671

Rapport de classification :
               precision    recall  f1-score   support

           0       0.96      0.75      0.84      1794
           1       0.79      0.97      0.87      1755

    accuracy                           0.86      3549
   macro avg       0.88      0.86      0.86      3549
weighted avg       0.88      0.86      0.86      3549


Matrice de confusion :
 [[1349  445]
 [  54 1701]]

Distribution des classes :
 OK
1    8898
0    8846
Name: count, dtype: int64
‚úÖ Mod√®le sauvegard√© sous 'model.pkl'
‚úÖ Scaler sauvegard√© sous 'scaler.pkl'





‚úÖ Accuracy avec le mod√®le charg√© :                precision    recall  f1-score   support

           0       1.00      0.64      0.78      1794
           1       0.73      1.00      0.84      1755

    accuracy                           0.82      3549
   macro avg       0.87      0.82      0.81      3549
weighted avg       0.87      0.82      0.81      3549


üßÆ Matrice de confusion avec le mod√®le charg√© :
 [[1145  649]
 [   0 1755]]
