In [13]:
import torch

In [15]:
import tensorflow as tf

In [17]:
import keras

# Text Classification

In [20]:
from transformers import pipeline

pipe = pipeline("text-classification", model="nlptown/bert-base-multilingual-uncased-sentiment")

In [22]:
# Exemple d'analyse de sentiments
pipe("Je suis énervé.")

[{'label': '1 star', 'score': 0.551443874835968}]

In [24]:
pipe("Je suis très heureux.")

[{'label': '5 stars', 'score': 0.8128679394721985}]

# Translation

In [27]:
# Pipeline pour la traduction (Anglais vers Français par exemple)
traducteur = pipeline('translation_en_to_fr', model='t5-base')

# Traduction d'une phrase de l'anglais vers le français
phrase_traduite = traducteur("I am learning Data Science.")

# Affichage de la phrase traduite
print(phrase_traduite[0]['translation_text'])

J'apprends la science des données.


# Generation de texte

In [29]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer

# Chargement du tokenizer et du modèle pour la génération de texte
tokenizer = GPT2Tokenizer.from_pretrained("antoiloui/belgpt2")
model = GPT2LMHeadModel.from_pretrained("antoiloui/belgpt2")

# Préparation des entrées pour la génération de texte, avec attention_mask
inputs = tokenizer("L'apprentissage de la data science c'est", return_tensors="pt")
attention_mask = inputs['attention_mask']

# Génération de texte en français en fournissant l'attention_mask et en définissant pad_token_id si nécessaire
text_generation = model.generate(
    input_ids=inputs['input_ids'],
    attention_mask=attention_mask,
    max_length=200,
    num_return_sequences=1,
    pad_token_id=tokenizer.eos_token_id  # Définir si nécessaire
)

# Affichage du texte généré
print(tokenizer.decode(text_generation[0], skip_special_tokens=True))

L'apprentissage de la data science c'est aussi apprendre à utiliser des outils de data science . Le premier est un peu plus long , mais il est très agréable à lire . Il est donc important de bien choisir son matériel . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son équipement . Il est donc important de bien choisir son matériel de ski . Il est donc important de bien choisir son matériel de


# Classification zero-shot

La classification à zero-shot fait référence à la capacité d'un modèle à classer correctement des textes dans des catégories sans avoir reçu d'exemples spécifiques lors de son entraînement.

Le modèle utilise sa compréhension générale de la langue pour faire des hypothèses sur la classification.

In [33]:
pipe = pipeline("zero-shot-classification", model="joeddav/xlm-roberta-large-xnli")

Some weights of the model checkpoint at joeddav/xlm-roberta-large-xnli were not used when initializing XLMRobertaForSequenceClassification: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [34]:
# Pipeline pour la classification à zéro coup
classify_zero_shot = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")

# Exemple de classification à zéro coup en français
classify_zero_shot(
    "Cet article traite de l'importance de l'intelligence artificielle dans la société moderne.",
    candidate_labels=["éducation", "politique", "technologie", "économie"],
    hypothesis_template="Cet article est sur {}."
)

{'sequence': "Cet article traite de l'importance de l'intelligence artificielle dans la société moderne.",
 'labels': ['technologie', 'politique', 'éducation', 'économie'],
 'scores': [0.7246903777122498,
  0.09451788663864136,
  0.0943371132016182,
  0.0864545926451683]}

La sequence est classée dans la classe 'technologie' avec un score de 0.72

# Tokenization

In [37]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# Nom du modèle pré-entraîné que vous souhaitez utiliser

model_name = "nlptown/bert-base-multilingual-uncased-sentiment"

# Chargement du tokenizer et du modèle pour la classification de séquences
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Création d'une pipeline de classification de sentiment
classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)

# Exemple de texte à analyser
texte = "Je suis ravi de d'apprendre sur le sujet de l'intelligence artificielle."

# Tokenisation du texte
tokens = tokenizer.tokenize(texte)
input_ids = tokenizer.encode(texte)

# Affichage des tokens et des identifiants de tokens
print("Tokens:", tokens)
print("Identifiants de Tokens:", input_ids)

# Exécution de la pipeline de classification de sentiment sur le texte
resultat = classifier(texte)

# Affichage du résultat de l'analyse de sentiment
print("Résultat de l'analyse de sentiment:", resultat)

Tokens: ['je', 'suis', 'ravi', 'de', 'd', "'", 'apprend', '##re', 'sur', 'le', 'sujet', 'de', 'l', "'", 'intelligence', 'arti', '##fici', '##elle', '.']
Identifiants de Tokens: [101, 10149, 41496, 73681, 10102, 146, 112, 60011, 10247, 10344, 10130, 32733, 10102, 154, 112, 19334, 33005, 61463, 14205, 119, 102]
Résultat de l'analyse de sentiment: [{'label': '5 stars', 'score': 0.4703008830547333}]


In [38]:
# Nom du modèle pré-entraîné que vous souhaitez utiliser
model_name = "bert-base-multilingual-cased"

# Chargement du tokenizer
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Exemple de texte à tokeniser
sequence = "Je suis ravi de d'apprendre sur le sujet de l'intelligence artificielle."

# Tokenisation de la séquence
tokens = tokenizer.tokenize(sequence)
print("Tokens:", tokens)

Tokens: ['Je', 'suis', 'ra', '##vi', 'de', 'd', "'", 'apprend', '##re', 'sur', 'le', 'sujet', 'de', 'l', "'", 'intelligence', 'arti', '##ficie', '##lle', '.']


In [39]:
# Conversion des tokens en identifiants de tokens
token_ids = tokenizer.convert_tokens_to_ids(tokens)
print("Identifiants de Tokens:", token_ids)

Identifiants de Tokens: [13796, 49301, 11859, 11310, 10104, 172, 112, 62131, 10246, 10326, 10141, 34949, 10104, 180, 112, 30151, 46118, 72138, 11270, 119]


In [40]:
# Décodage des identifiants de tokens pour récupérer la séquence
decoded_sequence = tokenizer.decode(token_ids)
print("Séquence décodée:", decoded_sequence)

Séquence décodée: Je suis ravi de d ' apprendre sur le sujet de l ' intelligence artificielle.


# Faire un résumé

In [42]:
# Charger la pipeline de résumé avec le modèle BART
summarizer = pipeline("summarization", model="facebook/bart-large-cnn")

# Exemple de texte long à résumer
text = """
L'intelligence artificielle est un domaine de l'informatique qui met l'accent sur la création de machines capables de travailler et de réagir comme des humains. Certains des exemples de travail dans ce domaine sont l'apprentissage automatique, où les ordinateurs, les logiciels et les appareils effectuent via des algorithmes des tâches de manière intelligente. Les algorithmes d'apprentissage automatique, qui sont au cœur de l'intelligence artificielle, permettent aux ordinateurs de s'entraîner sur des données fournies puis d'utiliser ces données pour prédire et prendre des décisions basées sur de nouvelles données. Les avantages de l'intelligence artificielle sont nombreux et peuvent avoir un impact significatif sur les secteurs où la précision et la cohérence sont cruciales.
"""

# Effectuer le résumé
summary = summarizer(text, max_length=50, min_length=30, do_sample=False)

# Afficher le résumé
print(summary[0]['summary_text'])

L'intelligence artificielle est un domaine de l'informatique. Les algorithmes d'apprentissage automatique permettent aux ordinateurs de s'entraîner sur des donn


# Description d'image

In [44]:
import sentencepiece

In [45]:
def generer_legende_en_francais(chemin_image):
    """
    Génère une légende pour une image donnée en anglais et la traduit en français.

    :param chemin_image: Le chemin vers l'image pour laquelle générer une légende.
    :type chemin_image: str
    :return: La légende traduite en français.
    :rtype: str
    """

    # Initialiser la pipeline de légendage d'image
    pipeline_legende_image = pipeline("image-to-text", model="Salesforce/blip-image-captioning-large")

    # Initialiser la pipeline de traduction de l'anglais vers le français
    pipeline_traduction = pipeline("translation", model="Helsinki-NLP/opus-mt-en-fr")

    # Génération de la légende en anglais
    resultats_legende = pipeline_legende_image(chemin_image)
    legende_anglaise = resultats_legende[0]['generated_text']

    # Traduction de la légende en français
    legende_francaise = pipeline_traduction(legende_anglaise, max_length=512)
    texte_francais = legende_francaise[0]['translation_text']

    return texte_francais

In [46]:
legende_francaise = generer_legende_en_francais(r"C:\Users\nicolas.sales\Desktop\climb.jpg")
print(legende_francaise)

un homme grimpant sur une montagne la nuit avec la lune en arrière-plan


In [47]:
legende_francaise2 = generer_legende_en_francais(r"C:\Users\nicolas.sales\Desktop\Europcar\Star Rating\Evolution of star rating.png")
print(legende_francaise2)

un graphique indiquant le nombre de personnes qui se trouvent dans chaque pays
