Para hacer predicciones con el modelo cargado, podrías hacer lo siguiente:


se importan las bibliotecas necesarias para trabajar con los modelos de transformers, numpy y TensorFlow.

El código carga un modelo previamente guardado utilizando la clase TFCamembertForSequenceClassification. Este modelo ha sido entrenado para clasificar secuencias de texto en diferentes categorías. Necesitarás proporcionar la ruta al modelo guardado en la línea loaded_model = TFCamembertForSequenceClassification.from_pretrained("path_to_save_model").

Luego, se carga el tokenizador correspondiente al modelo Camembert utilizando la clase CamembertTokenizer. El tokenizador se utiliza para convertir el texto en una representación numérica que el modelo pueda entender. En este caso, se carga el tokenizador base "camembert-base".

A continuación, se define un ejemplo de entrada de texto en la variable text. Aquí es donde debes proporcionar el texto que deseas clasificar.

El código codifica la entrada de texto utilizando el tokenizador. La función encode_plus toma el texto y lo convierte en una representación numérica adecuada para el modelo. Los resultados se almacenan en la variable inputs.

Luego, se realiza la predicción utilizando el modelo cargado. Se pasa la entrada codificada inputs['input_ids'] al modelo y se obtienen las predicciones.

Para encontrar la clase con la mayor probabilidad, se utiliza la función argmax de la biblioteca NumPy para obtener el índice de la clase con el valor máximo en el arreglo de predicciones.

Finalmente, se imprime el sentimiento predicho utilizando la lista de sentimientos proporcionada en sentiments. El índice predicho se utiliza para acceder al sentimiento correspondiente en la lista y se imprime en la consola.

In [16]:
import os
import tensorflow as tf
from transformers import CamembertTokenizer, TFCamembertForSequenceClassification

# Definir el directorio del modelo guardado
model_base_dir = os.path.abspath(os.path.join(os.getcwd(), '..', 'models'))
model_dir = os.path.join(model_base_dir, 'path_to_save_model')

# Cargar el modelo y el tokenizador
tokenizer = CamembertTokenizer.from_pretrained(model_dir)
model = TFCamembertForSequenceClassification.from_pretrained(model_dir)

# Función para predecir el sentimiento de un nuevo texto
def predict_sentiment(text):
    encoded_dict = tokenizer.encode_plus(
        text,
        add_special_tokens=True,
        max_length=64,
        padding='max_length',
        truncation=True,
        return_attention_mask=True,
        return_tensors='tf',
    )

    input_id = encoded_dict['input_ids']
    attention_mask = encoded_dict['attention_mask']

    # Realizar la predicción
    outputs = model(input_id, attention_mask=attention_mask)
    logits = outputs.logits

    # Obtener la etiqueta predicha
    predicted_label = tf.argmax(logits, axis=1).numpy()[0]

    return predicted_label

# Mapear etiquetas a sentimientos
label_to_sentiment = {
    0: 'frustration',
    1: 'tristesse',
    2: 'colere',
    3: 'joie',
    4: 'neutre'
}

# Predicción para un nuevo texto ingresado por el usuario
new_text = "j'ai enfin trouvé le cadeau parfait"
predicted_label = predict_sentiment(new_text)
predicted_sentiment = label_to_sentiment[predicted_label]

print(f"Le sentiment prédit pour le texte '{new_text}' est: {predicted_sentiment}")


Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
All model checkpoint layers were used when initializing TFCamembertForSequenceClassification.

All the layers of TFCamembertForSequenceClassification were initialized from the model checkpoint at d:\Python Code\Project\analyzer\models\path_to_save_model.
If your task is similar to the task the model of the checkpoint was trained on, you can already use TFCamembertForSequenceClassification for predictions without further training.


Le sentiment prédit pour le texte 'j'ai enfin trouvé le cadeau parfait' est: joie
