In [1]:
import spacy
from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer
import torch
# !python3.11 -m spacy download fr_core_news_sm

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Charger le modèle spaCy pour le prétraitement
nlp = spacy.load('fr_core_news_sm')

In [3]:
# Charger le modèle BERT pour l'analyse des sentiments en français
sentiment_model = AutoModelForSequenceClassification.from_pretrained("nlptown/bert-base-multilingual-uncased-sentiment")
sentiment_tokenizer = AutoTokenizer.from_pretrained("nlptown/bert-base-multilingual-uncased-sentiment")
sentiment_analyzer = pipeline('sentiment-analysis', model=sentiment_model, tokenizer=sentiment_tokenizer)

In [4]:
# Charger le modèle GPT pour la génération de texte
gpt_model = pipeline("text-generation", model="gpt2")

In [5]:
# Fonction pour prétraiter le texte avec spaCy
def preprocess_text(text):
    doc = nlp(text)
    tokens = [token.lemma_ for token in doc]
    entities = [(ent.text, ent.label_) for ent in doc.ents]
    return " ".join(tokens), entities

In [6]:
# Fonction pour analyser les sentiments avec BERT
def analyze_sentiment(text):
    result = sentiment_analyzer(text)
    return result

In [7]:
# Fonction pour générer un résumé ou une réponse avec GPT
def generate_summary(text):
    result = gpt_model(text, max_length=50, num_return_sequences=1)
    return result[0]['generated_text']

In [8]:
# Application

reviews = [
        "J'adore le nouveau design du produit ! Il est incroyable et fonctionne parfaitement.",
        "Le service était terrible et j'ai dû attendre des heures. Pas recommandé.",
        "Super expérience, l'équipe était très serviable et le produit vaut chaque centime."
    ]

for review in reviews:
    print(f"Avis original : {review}")
        
    preprocessed_text, entities = preprocess_text(review)
    print(f"Texte prétraité : {preprocessed_text}")
    print(f"Entités : {entities}")
        
    sentiment = analyze_sentiment(review)
    print(f"Sentiment : {sentiment}")
        
    summary = generate_summary(review)
    print(f"Résumé généré : {summary}")
    print("-" * 50)

Avis original : J'adore le nouveau design du produit ! Il est incroyable et fonctionne parfaitement.
Texte prétraité : je adorer le nouveau design de produit ! il être incroyable et fonctionner parfaitement .
Entités : []


Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Sentiment : [{'label': '5 stars', 'score': 0.8755618333816528}]
Résumé généré : J'adore le nouveau design du produit ! Il est incroyable et fonctionne parfaitement.

[Translation by H. G. de Brabantse (1858-1930)
--------------------------------------------------
Avis original : Le service était terrible et j'ai dû attendre des heures. Pas recommandé.
Texte prétraité : le service être terrible et je avoir devoir attendre un heure . pas recommander .
Entités : []


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Sentiment : [{'label': '1 star', 'score': 0.7083746790885925}]
Résumé généré : Le service était terrible et j'ai dû attendre des heures. Pas recommandé.

Pursuant: No service.

RÉSCHURER: But you never said that.


--------------------------------------------------
Avis original : Super expérience, l'équipe était très serviable et le produit vaut chaque centime.
Texte prétraité : Super expérience , le équipe être très serviable et le produit valoir chaque centime .
Entités : [('Super expérience', 'MISC')]


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Sentiment : [{'label': '5 stars', 'score': 0.8006826639175415}]
Résumé généré : Super expérience, l'équipe était très serviable et le produit vaut chaque centime. »

The book on which his life is based consists of three important essays, one in which
--------------------------------------------------


: 