# Fondamentaux de la bibliothèque Transformers

Hugging Face repose sur trois blocs fondamentaux qui permettent de passer d'un texte brut à un modèle capable de prédire ou de générer du contenu.

---

## Les modèles
Le choix du modèle dépend de la tâche finale. La bibliothèque propose des classes automatisées pour charger les bonnes architectures comme le montre exemple ce dessous.

```python
from transformers import AutoModel
from transformers import AutoModelForSequenceClassification
from transformers import AutoModelForSeq2SeqLM
```
---

## Les tokenizers
Un modèle ne lit pas de texte. Il lit des nombres. La classe AutoTokenizer s'occupe de cette conversion. Elle segmente le texte en unités appelées tokens et les transforme en vecteurs numériques. C'est l'étape obligatoire avant toute injection de donnée dans le modèle.

```python
from transformers import AutoTokenizer
```

## L’entraînement
La boucle d'apprentissage est gérée par la classe Trainer. Elle évite d'écrire manuellement les fonctions de perte ou les mises à jour de poids.

* Trainer : Le Trainer standard convient aux tâches classiques  comme la classification de texte (BERT, RoBERTa…)
* Seq2SeqTrainer: est optimisé pour la génération de texte.
* TrainingArguments: Les TrainingArguments et Seq2SeqTrainingArguments permettent de configurer les hyperparamètres comme la vitesse d'apprentissage ou le nombre d'itérations.

## Résumé simple

| Cas                       | Classe                                           |
| ------------------------- | ------------------------------------------------ |
| Classification            | `Trainer`                                        |
| Traduction / Résumé       | `Seq2SeqTrainer`                                 |
| Paramètres d'entraînement | `TrainingArguments` / `Seq2SeqTrainingArguments` |

## Remarque

Le Trainer est une couche simplifiée. Il reste tout à fait possible d'utiliser PyTorch de manière brute avec une boucle for et un optimiseur classique, mais le Trainer réduit drastiquement le risque d'erreur et le volume de code nécessaire.