# Tutoriel : Utilisation avanc√©e de Hugging Face Transformers

Ce tutoriel couvre les fonctionnalit√©s cl√©s de Hugging Face Transformers, align√©es avec votre pr√©sentation : les pipelines, les classes dynamiques `Auto*`, le fine-tuning de mod√®les pr√©-entra√Æn√©s, et l'int√©gration multimodale.

## 1. Importation des biblioth√®ques

In [1]:
from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification, Trainer, TrainingArguments
from datasets import load_dataset


  from .autonotebook import tqdm as notebook_tqdm





## 2. Utilisation des pipelines Hugging Face

Les pipelines offrent une interface simplifi√©e pour utiliser des mod√®les pr√©-entra√Æn√©s. Essayons la classification de texte et la traduction.

In [2]:
# Pipeline de classification de texte
classificateur = pipeline('text-classification', model='distilbert-base-uncased-finetuned-sst-2-english')
resultat = classificateur('This movie was absolutely fantastic!')[0]
print('R√©sultat de la classification :', resultat)

# Pipeline de traduction (Anglais vers Fran√ßais)
traducteur = pipeline('translation_en_to_fr', model='t5-base')
traduction = traducteur('Transformers are revolutionizing NLP.')[0]['translation_text']
print('Traduction :', traduction)

R√©sultat de la classification : {'label': 'POSITIVE', 'score': 0.999874472618103}
Traduction : Les transformateurs r√©volutionnent la LNP.


## 3. Chargement dynamique avec AutoModel et AutoTokenizer

Les classes `Auto*` permettent de charger facilement n'importe quel mod√®le ou tokenizer √† partir du hub Hugging Face.

In [3]:
# Chargement dynamique du tokenizer et du mod√®le
tokenizer = AutoTokenizer.from_pretrained('bert-base-cased')
model = AutoModelForSequenceClassification.from_pretrained('bert-base-cased', num_labels=2)


Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-base-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


## 4. Pr√©paration des donn√©es et tokenisation

Utilisons le jeu de donn√©es IMDB pour la classification des sentiments, et appliquons la tokenisation avec le tokenizer BERT.

In [4]:
# Chargement et tokenisation des donn√©es IMDB
dataset = load_dataset('imdb')

def tokenize_function(examples):
    return tokenizer(examples['text'], truncation=True, padding=True)

tokenized_datasets = dataset.map(tokenize_function, batched=True)

Map: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 50000/50000 [00:56<00:00, 888.65 examples/s] 


## 5. Fine-tuning du mod√®le avec Trainer

Nous allons entra√Æner le mod√®le BERT sur les donn√©es IMDB en utilisant `Trainer` et `TrainingArguments`.

In [5]:
# Configuration des arguments d'entra√Ænement
training_args = TrainingArguments(
    output_dir='./results',
    evaluation_strategy='epoch',
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    num_train_epochs=2,
    weight_decay=0.01,
)

# Cr√©ation du Trainer et entra√Ænement
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_datasets['train'].select(range(2000)),
    eval_dataset=tokenized_datasets['test'].select(range(500)),
)
trainer.train()



KeyboardInterrupt: 

## 6. Exemple multimodal : Classification d'images avec CLIP

Utilisons le mod√®le CLIP pour associer du texte √† une image, d√©montrant l'int√©gration multimodale.

In [7]:
from transformers import CLIPProcessor, CLIPModel
from PIL import Image

# Chargement du mod√®le et du processeur CLIP
clip_model = CLIPModel.from_pretrained('openai/clip-vit-base-patch32')
clip_processor = CLIPProcessor.from_pretrained('openai/clip-vit-base-patch32')

# Chargement d'une image et du texte
image = Image.open('img.png')
texte = ['Un chien', 'Un chat', 'Un paysage']

# Pr√©paration des entr√©es et inf√©rence
inputs = clip_processor(text=texte, images=image, return_tensors='pt', padding=True)
outputs = clip_model(**inputs)
logits_per_image = outputs.logits_per_image
probas = logits_per_image.softmax(dim=1)
print('Probabilit√©s :', probas)

Probabilit√©s : tensor([[9.9877e-01, 2.8467e-04, 9.4090e-04]], grad_fn=<SoftmaxBackward0>)


## 7. G√©n√©ration de l√©gendes d'images en fran√ßais

Dans cette section, nous allons g√©n√©rer une l√©gende pour une image en anglais, puis la traduire en fran√ßais. Nous utilisons le mod√®le `BLIP` pour la g√©n√©ration de l√©gendes et un mod√®le de traduction de Helsinki-NLP.

In [8]:
from transformers import pipeline
from PIL import Image

# Chargement de l'image
image_path = 'img.png'
image = Image.open(image_path)

# D√©finition de la fonction pour g√©n√©rer la l√©gende
def generer_legende_en_francais(chemin_image):
    pipeline_legende_image = pipeline('image-to-text', model='Salesforce/blip-image-captioning-large')
    pipeline_traduction = pipeline('translation', model='Helsinki-NLP/opus-mt-en-fr')

    resultats_legende = pipeline_legende_image(chemin_image)
    legende_anglaise = resultats_legende[0]['generated_text']
    legende_francaise = pipeline_traduction(legende_anglaise, max_length=512)
    texte_francais = legende_francaise[0]['translation_text']

    return texte_francais

# G√©n√©ration de la l√©gende en fran√ßais
legende_francaise = generer_legende_en_francais(image)
print('L√©gende g√©n√©r√©e :', legende_francaise)



L√©gende g√©n√©r√©e : il y a un chien blanc qui est assis dans l'herbe
