In [3]:
import os
import pandas as pd
from IPython.display import display
import joblib
from sklearn_crfsuite import CRF

# Spécifiez le chemin du modèle CRF local
crf_model_path = r'C:\Users\vikne\Documents\Master 2\Semestre 9\Intelligence artificielle\Travel-Order-Resolver\ai\nlp\models\tokens_classification\crf\crf_model.joblib'

# Charger le modèle CRF
try:
    if os.path.exists(crf_model_path):
        crf_model = joblib.load(crf_model_path)
        print("Modèle CRF chargé avec succès.")
    else:
        print(f"Le modèle CRF n'a pas été trouvé à l'emplacement spécifié: {crf_model_path}")
except Exception as e:
    print(f"Erreur lors du chargement du modèle CRF: {e}")

# Fonction pour extraire les caractéristiques d'une liste de tokens
def extract_features(tokens):
    features = []
    for i in range(len(tokens)):
        token = tokens[i]
        feature = {
            'word': token,
            'is_capitalized': token[0].isupper(),
            'is_punctuation': token in ",.!?;:",
            'word_len': len(token),
        }
        features.append(feature)
    return features

# Liste des phrases pour l'évaluation
phrases = [
    "Je pars de Paris et j'arrive à Marseille.",
    "Je vais à Bordeaux en partant de Toulouse.",
    "Mon trajet va de VILLIERS SUR LOIR à JARNY.",
    "Nous partons de Lyon et nous arrivons à Nice.",
    "Le départ est prévu à Lille, et l'arrivée se fera à Strasbourg.",
    "Mon itinéraire inclut un départ de Montpellier et une arrivée à Perpignan.",
    "Le train partira de Nantes pour arriver à Rennes.",
    "Un vol de Genève à Zurich est prévu demain matin.",
    "Je vais de Grenoble à Dijon en voiture.",
    "Je voyage de Bruxelles à Amsterdam ce week-end.",
    "L'itinéraire commence à Marseille et se termine à Toulon.",
    "Nous prenons un train de Rouen pour aller au Havre.",
    "Le départ sera à Limoges et l'arrivée à Poitiers.",
    "Je quitte Monaco pour aller à Menton.",
    "Le bus va de Caen à Cherbourg.",
    "Il part de Bayonne et arrive à Biarritz.",
    "Je vais de Chamonix à Annecy.",
    "Nous roulons de Bastia à Ajaccio.",
    "Le ferry part de Calais pour arriver à Douvres.",
    "Je pars de Bordeaux et j'arrive à Paris.",
    "Notre vol va de Madrid à Barcelone.",
    "Un trajet en voiture de Milan à Rome est prévu.",
    "Je vais à Paris en partant de Lyon."
]

# Liste pour stocker les résultats
results = []

# Fonction pour afficher les prédictions
for phrase in phrases:
    try:
        tokens = phrase.split()
        features = extract_features(tokens)

        # Obtenir les prédictions du modèle CRF
        predictions = crf_model.predict([features])
        labels = predictions[0]

        # Ajouter les entités détectées à la liste des résultats
        for token, label in zip(tokens, labels):
            if label != 'O':  # On ignore les tokens avec le label 'O'
                results.append({"Phrase": phrase, "Entity": token, "Label": label})
    except Exception as e:
        print(f"Erreur lors du traitement de la phrase '{phrase}': {e}")

# Convertir les résultats en DataFrame
df = pd.DataFrame(results)

# Afficher le tableau
if not df.empty:
    display(df)
else:
    print("Aucune entité détectée.")


Modèle CRF chargé avec succès.


Unnamed: 0,Phrase,Entity,Label
0,Je pars de Paris et j'arrive à Marseille.,Je,ARR
1,Je pars de Paris et j'arrive à Marseille.,pars,ARR
2,Je pars de Paris et j'arrive à Marseille.,de,ARR
3,Je pars de Paris et j'arrive à Marseille.,Paris,ARR
4,Je pars de Paris et j'arrive à Marseille.,et,ARR
...,...,...,...
192,Je vais à Paris en partant de Lyon.,Paris,ARR
193,Je vais à Paris en partant de Lyon.,en,ARR
194,Je vais à Paris en partant de Lyon.,partant,ARR
195,Je vais à Paris en partant de Lyon.,de,ARR
