In [None]:
# Installation de Transformers et pyTorch
! pip install transformers datasets

In [None]:
import torch
import transformers
torch.__version__, transformers.__version__

In [None]:
torch.cuda.is_available()

## Constructions de mod√®les personnalis√©s

Vous pouvez modifier la configuration du mod√®le pour changer la fa√ßon dont un mod√®le est construit. La configuration sp√©cifie les attributs d'un mod√®le, tels que le nombre de couches ou de t√™tes d'attention. Vous partez de z√©ro lorsque vous initialisez un mod√®le √† partir d'une configuration personnalis√©e. Les attributs du mod√®le sont initialis√©s de mani√®re al√©atoire et vous devrez entra√Æner le mod√®le avant de pouvoir l'utiliser pour obtenir des r√©sultats significatifs.

Commencez par importer `AutoConfig`, puis chargez le mod√®le pr√©-entra√Æn√© que vous voulez modifier. Dans `AutoConfig.from_pretrained()`, vous pouvez sp√©cifier l'attribut que vous souhaitez modifier, tel que le nombre de t√™tes d'attention :

In [None]:
from transformers import AutoConfig

my_config = AutoConfig.from_pretrained("distilbert-base-uncased", n_heads=12)

Cr√©ez un mod√®le personnalis√© √† partir de votre configuration avec `AutoModel.from_config()` :

In [None]:
from transformers import AutoModel

my_model = AutoModel.from_config(my_config)

Consultez le guide [Cr√©er une architecture personnalis√©e](https://huggingface.co/docs/transformers/main/fr/./create_a_model) pour plus d'informations sur la cr√©ation de configurations personnalis√©es.

## Trainer - une boucle d'entra√Ænement optimis√©e par PyTorch

Tous les mod√®les sont des [`torch.nn.Module`](https://pytorch.org/docs/stable/nn.html#torch.nn.Module) standard, vous pouvez donc les utiliser dans n'importe quelle boucle d'entra√Ænement typique. Bien que vous puissiez √©crire votre propre boucle d'entra√Ænement, ü§ó Transformers fournit une classe `Trainer` pour PyTorch, qui contient la boucle d'entra√Ænement de base et ajoute des fonctionnalit√©s suppl√©mentaires comme l'entra√Ænement distribu√©, la pr√©cision mixte, et plus encore.

En fonction de votre t√¢che, vous passerez g√©n√©ralement les param√®tres suivants √† `Trainer` :

1. Un `PreTrainedModel` ou un [`torch.nn.Module`](https://pytorch.org/docs/stable/nn.html#torch.nn.Module):

   ```py
   >>> from transformers import AutoModelForSequenceClassification

   >>> model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")
   ```

2. `TrainingArguments` contient les hyperparam√®tres du mod√®le que vous pouvez changer comme le taux d'apprentissage, la taille due l'√©chantillon, et le nombre d'√©poques pour s'entra√Æner. Les valeurs par d√©faut sont utilis√©es si vous ne sp√©cifiez pas d'hyperparam√®tres d'apprentissage :

   ```py
   >>> from transformers import TrainingArguments

   >>> training_args = TrainingArguments(
   ...     output_dir="path/to/save/folder/",
   ...     learning_rate=2e-5,
   ...     per_device_train_batch_size=8,
   ...     per_device_eval_batch_size=8,
   ...     num_train_epochs=2,
   ... )
   ```

3. Une classe de pr√©traitement comme un tokenizer, un processeur d'images ou un extracteur de caract√©ristiques :

   ```py
   >>> from transformers import AutoTokenizer

   >>> tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
   ```

4. Chargez un jeu de donn√©es :

   ```py
   >>> from datasets import load_dataset

   >>> dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT
   ```

5. Cr√©ez une fonction qui transforme le texte du jeu de donn√©es en token :

   ```py
   >>> def tokenize_dataset(dataset):
   ...     return tokenizer(dataset["text"])
   ```

   Puis appliquez-la √† l'int√©gralit√© du jeu de donn√©es avec `map`:

   ```py
   >>> dataset = dataset.map(tokenize_dataset, batched=True)
   ```

6. Un `DataCollatorWithPadding` pour cr√©er un √©chantillon d'exemples √† partir de votre jeu de donn√©es :

   ```py
   >>> from transformers import DataCollatorWithPadding

   >>> data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
   ```

Maintenant, rassemblez tous ces √©l√©ments dans un `Trainer` :

In [None]:
from transformers import Trainer

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["test"],
    tokenizer=tokenizer,
    data_collator=data_collator,
)  # doctest: +SKIP

Une fois que vous √™tes pr√™t, appelez la fonction `train()` pour commencer l'entra√Ænement :

In [None]:
trainer.train()

<Tip>

Pour les t√¢ches - comme la traduction ou la g√©n√©ration de r√©sum√© - qui utilisent un mod√®le s√©quence √† s√©quence, utilisez plut√¥t les classes `Seq2SeqTrainer` et `Seq2SeqTrainingArguments`.

</Tip>

Vous pouvez personnaliser le comportement de la boucle d'apprentissage en red√©finissant les m√©thodes √† l'int√©rieur de `Trainer`. Cela vous permet de personnaliser des caract√©ristiques telles que la fonction de perte, l'optimiseur et le planificateur. Consultez la documentation de `Trainer` pour savoir quelles m√©thodes peuvent √™tre red√©finies. 

L'autre moyen de personnaliser la boucle d'apprentissage est d'utiliser les [Callbacks](https://huggingface.co/docs/transformers/main/fr/./main_classes/callbacks). Vous pouvez utiliser les callbacks pour int√©grer d'autres biblioth√®ques et inspecter la boucle d'apprentissage afin de suivre la progression ou d'arr√™ter l'apprentissage plus t√¥t. Les callbacks ne modifient rien dans la boucle d'apprentissage elle-m√™me. Pour personnaliser quelque chose comme la fonction de perte, vous devez red√©finir le `Trainer` √† la place.