In [11]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.svm import LinearSVC
from sklearn.pipeline import make_pipeline
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report
from io import StringIO

# Lecture du fichier CSV
df = pd.read_csv('../data/train-sep.csv')

# Séparation des données et prétraitement
X_train, X_test, y_train, y_test = train_test_split(df['titre'], df['type'], test_size=0.2, random_state=42)

# Création d'un pipeline et entraînement du modèle
model = make_pipeline(TfidfVectorizer(), LinearSVC())
model.fit(X_train, y_train)

# Prédiction sur l'ensemble de test
predictions = model.predict(X_test)

# Création d'un DataFrame pour comparer les prédictions et les références
resultats = pd.DataFrame({
    'Titre': X_test,
    'Categorie Réelle': y_test,
    'Categorie Prédite': predictions
})

# Réinitialisation de l'index pour une meilleure lisibilité
resultats.reset_index(drop=True, inplace=True)

# Affichage du tableau des résultats
print(resultats)

# Optionnel: Sauvegarder le tableau dans un fichier CSV
resultats.to_csv('../data/resultats_predictions.csv', index=False)

precision = accuracy_score(y_test, predictions)
print(f'Précision du modèle : {precision} \n -----------------------------\n')

# Génération d'un rapport de classification
rapport_classification = classification_report(y_test, predictions)
print('Rapport de classification :\n', rapport_classification)

rapport_df = pd.read_fwf(StringIO(rapport_classification), delimiter=';', header=0)
rapport_df.to_csv('../data/result_tfid.csv', index=False)

                                         Titre Categorie Réelle  \
0                 Croque monsieur au reblochon           Entrée   
1                   Pâte à crêpes sans balance          Dessert   
2                     Tomates farcies au boeuf   Plat principal   
3             Quenelles de Polenta au beaufort           Entrée   
4           Ballotines de volaille au chaource   Plat principal   
...                                        ...              ...   
1742  Pâte de pommes de terre de ma grand-mère   Plat principal   
1743                 Crumble de poulet au thym   Plat principal   
1744   Et un cheesecake white-chocolate ! Un !           Entrée   
1745            Quenelles de poisson au cognac           Entrée   
1746                            Lapin en sauce   Plat principal   

     Categorie Prédite  
0       Plat principal  
1              Dessert  
2       Plat principal  
3               Entrée  
4       Plat principal  
...                ...  
1742    Plat princip