![HuggingFace](images/hugging_face_logo.png)

In [None]:
# Установка Transformers
! pip install transformers datasets
# Чтобы установить из исходного кода вместо последнего релиза, закомментируйте команду выше и раскомментируйте следующую.
# ! pip install git+https://github.com/huggingface/transformers.git

# Краткий обзор

### Начните работу с 🤗 Transformers!

Если вы хотите начать работать с Transformers, не важно, являетесь ли вы разработчиком или простым пользователем, этот краткий гид поможет вам разобраться и покажет, как:

- Использовать [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) для создания выводов.
- Загрузить предобученные модели и препроцессоры с помощью [AutoClass](https://huggingface.co/docs/transformers/main/en/./model_doc/auto).
- Быстро обучить модель, используя PyTorch или TensorFlow.

Если вы новичок, мы настоятельно рекомендуем ознакомиться с нашими руководствами или [курсом](https://huggingface.co/course/chapter1/1), чтобы лучше понять представленные концепции.

#### Подготовка к работе

Перед началом работы убедитесь, что у вас установлены все необходимые библиотеки:

```bash
!pip install transformers datasets
```

Кроме того, вам потребуется установить предпочитаемую библиотеку для машинного обучения:

Для работы с **PyTorch**:

```bash
pip install torch
```

Или, если предпочитаете **TensorFlow**:

```bash
pip install tensorflow
```

Теперь вы готовы начать свое приключение с Hugging Face Transformers! 🌟

## Конвейер (Pipeline)

The function [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) — это простейший и наивысший по скорости способ применения предварительно обученной модели для выполнения выводов. Благодаря [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) "из коробки", вы можете с легкостью совершать множество задач в различных модальностях. Пример задач представлен в таблице ниже:

<Hint>

Чтобы получить полный перечень доступных задач, ознакомьтесь с [API функциями pipeline](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

</Hint>

| **Задача**                          | **Описание**                                                                                                          | **Модальность**       | **Идентификатор pipeline**                      |
|-------------------------------------|----------------------------------------------------------------------------------------------------------------------|-----------------------|------------------------------------------------|
| Классификация текста                | Присвоение метки для заданной последовательности текста                                                              | Обработка текста      | pipeline(task=“sentiment-analysis”)             |
| Генерация текста                    | Создание текста на основе введенной начальной фразы                                                                  | Обработка текста      | pipeline(task=“text-generation”)                |
| Резюмирование                       | Составление резюме или краткого изложения текста или документа                                                        | Обработка текста      | pipeline(task=“summarization”)                  |
| Классификация изображений           | Присвоение метки изображению                                                                                         | Компьютерное зрение   | pipeline(task=“image-classification”)          |
| Сегментация изображений             | Присвоение меток каждому пикселю изображения (поддерживает семантическую, паноптическую и инстанс сегментацию)        | Компьютерное зрение   | pipeline(task=“image-segmentation”)            |
| Обнаружение объектов                | Прогнозирование границ (bounding boxes) и классов объектов на изображении                                            | Компьютерное зрение   | pipeline(task=“object-detection”)              |
| Классификация аудио                 | Присвоение метки аудиоданным                                                                                          | Аудио                 | pipeline(task=“audio-classification”)          |
| Автоматическое распознавание речи   | Преобразование речи в текст                                                                                          | Аудио                 | pipeline(task=“automatic-speech-recognition”)  |
| Визуальные вопросы и ответы         | Ответы на вопросы об изображении, предоставляя изображение и вопрос                                                  | Мультимодальный       | pipeline(task=“vqa”)                           |
| Вопросы и ответы по документу       | Ответы на вопросы о документе, предоставляя изображение и вопрос                                                     | Мультимодальный       | pipeline(task="document-question-answering")   |
| Описания изображений                | Генерация описания для данного изображения                                                                           | Мультимодальный       | pipeline(task="image-to-text")                  |

Чтобы приступить, создайте экземпляр [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) и укажите задачу, которую вы хотите выполнить. В этом руководстве вы можете использовать [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) для анализа тональности как пример.

In [None]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")

Функция [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) загружает и кэширует стандартную [предобученную модель](https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english) и токенизатор для анализа настроений. Теперь вы можете использовать `classifier` для анализа ваших целевых текстов:

In [None]:
classifier("We are very happy to show you the 🤗 Transformers library.")

Если у вас несколько входных данных, передайте их в виде списка в функцию [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline), чтобы получить список словарей в ответ:

In [None]:
results = classifier(["We are very happy to show you the 🤗 Transformers library.", "We hope you don't hate it."])
for result in results:
    print(f"label: {result['label']}, with score: {round(result['score'], 4)}")

Функция [`pipeline()`](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) также может выполнять итерации по всему набору данных для любой задачи, которую вы выберете. В этом примере давайте выберем автоматическое распознавание речи в качестве нашей задачи:

In [None]:
import torch
from transformers import pipeline

speech_recognizer = pipeline("automatic-speech-recognition", model="facebook/wav2vec2-base-960h")

Чтобы начать работу с аудио датасетом, можно следовать [Быстрому старту](https://huggingface.co/docs/datasets/quickstart#audio) от 🤗 Datasets. Вот как можно загрузить датасет [MInDS-14](https://huggingface.co/datasets/PolyAI/minds14):

```python
from datasets import load_dataset

# Загрузка датасета MInDS-14
dataset = load_dataset("PolyAI/minds14")
```

Эта простая команда позволяет вам загружать и использовать датасет MInDS-14 для итерации и анализа. Убедитесь, что у вас установлены необходимые библиотеки и ваше окружение готово к работе с аудио данными.

In [None]:
from datasets import load_dataset, Audio

dataset = load_dataset("PolyAI/minds14", name="en-US", split="train")

Вам необходимо убедиться, что частота дискретизации вашего набора данных совпадает с частотой, на которой была обучена модель [`facebook/wav2vec2-base-960h`](https://huggingface.co/facebook/wav2vec2-base-960h):

In [None]:
dataset = dataset.cast_column("audio", Audio(sampling_rate=speech_recognizer.feature_extractor.sampling_rate))

Аудиофайлы автоматически загружаются и пересэмплируются при обращении к столбцу `"audio"`. Извлеките массивы сырых волновых сигналов из первых 4 образцов и передайте их как список в конвейер:

```python
# Пример кода для выполнения этой задачи
waveform_arrays = []
for i in range(4):
    waveform_array = dataset[i]["audio"]["array"]  # Извлекаем массив волны
    waveform_arrays.append(waveform_array)

# Передаем список массивов в конвейер
pipeline_output = some_pipeline(waveform_arrays)
``` 

In [None]:
result = speech_recognizer(dataset[:4]["audio"])
print([d["text"] for d in result])

Для работы с большими наборами данных, где входные данные значительны (например, в задачах обработки речи или изображений), лучше использовать генератор вместо списка, чтобы не загружать все данные в память одновременно. Подробнее об этом можно узнать в [документации к API pipeline](https://huggingface.co/docs/transformers/main/en/./main_classes/pipelines).

### Использование другой модели и токенизатора в пайплайне

Если вы хотите использовать другую модель и токенизатор в вашем пайплайне, то, к счастью, это можно сделать достаточно просто. В пакете `transformers` от Hugging Face процесс сводится к нескольким шагам:

```python
from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer

# Загрузка модели и токенизатора
model = AutoModelForSequenceClassification.from_pretrained('my-custom-model')
tokenizer = AutoTokenizer.from_pretrained('my-custom-model')

# Создание пайплайна со своей моделью и токенизатором
custom_pipeline = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)

# Тестирование нового пайплайна
result = custom_pipeline("Ваш текст здесь!")
print(result)
```

### Пояснения

- **AutoModelForSequenceClassification**: Этот класс используется для загрузки предобученной модели, способной выполнять задачи классификации последовательностей.
  
- **AutoTokenizer**: Он отвечает за обработку текстов, превращая их в формат, который может "понять" модель.

- **pipeline**: Позволяет быстро создавать и использовать различные комбинации моделей и токенизаторов для задач NLP.

### Советы

- Убедитесь, что модель и токенизатор, которые вы используете, совместимы друг с другом.
- Ознакомьтесь с документацией [Hugging Face](https://huggingface.co/transformers/) для получения более подробной информации о доступных моделях и токенизаторах.
- Если модель и токенизатор доступны на платформе Hugging Face, вы можете использовать их идентификаторы для прямой загрузки.

OpenAI tokenizer tool - https://platform.openai.com/tokenizer

Функция [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) может работать с любой моделью из [Hub](https://huggingface.co/models), что облегчает адаптацию [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline) для различных задач. Например, если вам нужна модель для обработки текста на французском языке, используйте теги на Hub, чтобы отфильтровать подходящую модель. В результате фильтрации можно увидеть, что многоязычная модель [BERT](https://huggingface.co/nlptown/bert-base-multilingual-uncased-sentiment), адаптированная для анализа сентиментов, отлично подойдет для работы с текстом на французском языке:


In [None]:
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"

Для использования предварительно обученной модели и её связанного токенизатора с помощью классов [AutoModelForSequenceClassification](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModelForSequenceClassification) и [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer) выполните следующий код:

```python
from transformers import AutoModelForSequenceClassification, AutoTokenizer

# Укажите путь или имя модели
model_name = "имя_предварительно_обученной_модели"

# Загрузка модели
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Загрузка токенизатора
tokenizer = AutoTokenizer.from_pretrained(model_name)
```

Эти классы `AutoClass` позволяют автоматически определять правильную конфигурацию, связанную с указанной моделью, делая процесс загрузки более простым и универсальным. Дополнительную информацию об `AutoClass` вы можете узнать в следующем разделе.

In [None]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

Используйте [TFAutoModelForSequenceClassification](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.TFAutoModelForSequenceClassification) и [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer), чтобы загрузить предобученную модель и её соответствующий токенайзер (о `TFAutoClass` будет больше информации в следующем разделе):

In [None]:
from transformers import AutoTokenizer, TFAutoModelForSequenceClassification

model = TFAutoModelForSequenceClassification.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

Укажите модель и токенизатор в функции [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline), и теперь вы можете применять `classifier` к тексту на французском языке:

In [None]:
classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)
classifier("Nous sommes très heureux de vous présenter la bibliothèque 🤗 Transformers.")

Если вы не можете найти подходящую модель для своего случая, вам потребуется дообучить предварительно обученную модель на ваших данных. Ознакомьтесь с нашим [руководством по дообучению](https://huggingface.co/docs/transformers/main/en/./training), чтобы узнать, как это сделать. И наконец, после того как вы дообучите свою модель, пожалуйста, подумайте о том, чтобы [поделиться](https://huggingface.co/docs/transformers/main/en/./model_sharing) моделью с сообществом на Hub, чтобы сделать машинное обучение доступным для всех! 🤗

## АвтоКласс

Под капотом, классы [AutoModelForSequenceClassification](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModelForSequenceClassification) и [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer) работают вместе, чтобы запустить [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline), который вы использовали выше. [AutoClass](https://huggingface.co/docs/transformers/main/en/./model_doc/auto) представляет собой сокращение, которое автоматически получает архитектуру предобученной модели по её названию или пути. Вам нужно лишь выбрать соответствующий `AutoClass` для вашей задачи и подходящий класс для предварительной обработки данных.

Вернёмся к примеру из предыдущего раздела и посмотрим, как можно использовать `AutoClass`, чтобы воспроизвести результаты работы [pipeline()](https://huggingface.co/docs/transformers/main/en/main_classes/pipelines#transformers.pipeline).

### AutoTokenizer

`AutoTokenizer` — это компонент библиотеки 🤗 Transformers, который умеет автоматически формировать подходящий токенизатор, исходя из указанной модели. Он позволяет значительно упростить процесс настройки и использования токенизаторов для различных задач.

С помощью `AutoTokenizer`, вы можете легко получить нужный токенизатор без необходимости указывать конкретный класс токенизатора, который соответствует выбранной модели. Достаточно только знать имя модели, и `AutoTokenizer` сделает за вас всю остальную работу.

#### Пример использования

```python
from transformers import AutoTokenizer

# Инициализация токенизатора для определенной модели
tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")

# Токенизация примерного текста
tokens = tokenizer.tokenize("Hello, how are you?")

print(tokens)
```

#### Преимущества

- **Универсальность**: поддерживает широкий диапазон моделей и заданий.
- **Простота**: минимальные усилия для выбора и настройки правильного токенизатора.
- **Гибкость**: легко адаптируется под различные языковые модели и их версии.

### Заключение

Использование `AutoTokenizer` значительно ускоряет процесс подготовки данных для языковых моделей и дает возможность сосредоточиться на выполнении самой задачи, не отвлекаясь на технические детали токенизации.

Токенизатор отвечает за предварительную обработку текста, преобразуя его в массив чисел, которые будут использоваться в качестве входных данных для модели. Существует множество правил, регулирующих процесс токенизации, включая способы деления слова и уровень, на котором следует разделять слова (узнать больше о токенизации можно в [кратком обзоре токенизатора](https://huggingface.co/docs/transformers/main/en/./tokenizer_summary)). Самое важное, что нужно помнить, это то, что необходимо создавать экземпляр токенизатора с тем же именем модели, чтобы обеспечить использование тех же правил токенизации, с которыми модель была предварительно обучена.

Загрузите токенизатор с помощью [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer):

In [None]:
from transformers import AutoTokenizer

model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
tokenizer = AutoTokenizer.from_pretrained(model_name)

Пропустите ваш текст через токенизатор:

In [None]:
encoding = tokenizer("We are very happy to show you the 🤗 Transformers library.")
print(encoding)

Токенизатор возвращает словарь, содержащий:

 * [input_ids](https://huggingface.co/docs/transformers/main/en/./glossary#input-ids): числовые представления ваших токенов.
 * [attention_mask](https://huggingface.co/docs/transformers/main/en/.glossary#attention-mask): показывает, какие токены следует учитывать.

Токенизатор также может принимать список входных данных, а также дополнить и обрезать текст для возврата пакета с одинаковой длиной:

In [None]:
pt_batch = tokenizer(
    ["We are very happy to show you the 🤗 Transformers library.", "We hope you don't hate it."],
    padding=True,
    truncation=True,
    max_length=512,
    return_tensors="pt",
)

In [None]:
tf_batch = tokenizer(
    ["We are very happy to show you the 🤗 Transformers library.", "We hope you don't hate it."],
    padding=True,
    truncation=True,
    max_length=512,
    return_tensors="tf",
)

<Tip>

 Ознакомьтесь с [руководством по предварительной обработке](https://huggingface.co/docs/transformers/main/en/./preprocessing), чтобы узнать больше о токенизации и использовании [AutoImageProcessor](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoImageProcessor), [AutoFeatureExtractor](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoFeatureExtractor) и [AutoProcessor](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoProcessor) для предварительной обработки изображений, аудио и мультимодальных данных.

</Tip>

### АвтоМодель

<details>
<summary>Нажмите, чтобы раскрыть информацию</summary>

AutoModel — это удобный инструмент в библиотеке Hugging Face, который позволяет легко загружать предобученные модели. Он автоматически определяет, какой тип модели требуется, и загружает соответствующее хранилище и конфигурацию. Это значительно упрощает работу, поскольку вам не нужно специально указывать тип модели, которую вы хотите использовать.

Чтобы начать использовать AutoModel, требуется лишь несколько строк кода. Например:

```python
from transformers import AutoModel, AutoTokenizer

model_name = "bert-base-uncased"
model = AutoModel.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Теперь вы можете использовать модель и токенизатор
```

Эта пара строк скачает и инициализирует BERT-модель из хранилища Hugging Face, которую затем можно использовать для различных NLP задач, таких как классификация текста, создание ответов и другие.

Для получения дополнительной информации и примеров использования посетите [Hugging Face Transformers](https://huggingface.co/transformers/).

</details>

🤗 Библиотека Transformers предоставляет простой и единообразный способ загрузки предобученных моделей. Это означает, что вы можете загружать [AutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModel) так же, как и [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer). Единственное отличие заключается в выборе правильной [AutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModel) для конкретной задачи. Например, для классификации текста (или последовательностей) следует загружать [AutoModelForSequenceClassification](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModelForSequenceClassification):

In [None]:
from transformers import AutoModelForSequenceClassification

model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
pt_model = AutoModelForSequenceClassification.from_pretrained(model_name)

<Tip>

Изучите [краткий обзор задач](https://huggingface.co/docs/transformers/main/en/./task_summary), чтобы узнать, какие задачи поддерживает класс [AutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModel).

</Tip>

Теперь передайте предварительно обработанный пакет входных данных непосредственно модели. Для этого просто распакуйте словарь, добавив `**`:

In [None]:
pt_outputs = pt_model(**pt_batch)

Модель выдает итоговые активации в атрибуте `logits`. Чтобы получить вероятности, примените софтмакс-функцию к `logits`:

```python
import torch.nn.functional as F

# Пример, как использовать softmax для получения вероятностей
probabilities = F.softmax(logits, dim=-1)
```

Здесь `dim=-1` указывает на то, что функция будет применена вдоль последнего измерения, преобразуя логиты в вероятности.

In [None]:
from torch import nn

pt_predictions = nn.functional.softmax(pt_outputs.logits, dim=-1)
print(pt_predictions)

🤗 Transformers предоставляет простой и унифицированный способ загрузки заранее обученных экземпляров. Это означает, что вы можете загрузить [TFAutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.TFAutoModel) так же, как вы бы загрузили [AutoTokenizer](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoTokenizer). Единственное отличие – это выбор подходящей [TFAutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.TFAutoModel) для конкретной задачи. Для текстовой (или последовательностной) классификации следует загрузить [TFAutoModelForSequenceClassification](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.TFAutoModelForSequenceClassification):

In [None]:
from transformers import TFAutoModelForSequenceClassification

model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
tf_model = TFAutoModelForSequenceClassification.from_pretrained(model_name)

<Tip>

Посмотрите [сводку задач](https://huggingface.co/docs/transformers/main/en/./task_summary), чтобы узнать о задачах, поддерживаемых классом [AutoModel](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoModel).

</Tip>

Теперь передайте предварительно обработанный пакет входных данных непосредственно в модель, передавая ключи словаря напрямую к тензорам:

In [None]:
tf_outputs = tf_model(tf_batch)

Модель выдает окончательные активации в атрибуте `logits`. Чтобы получить вероятности, примените функцию softmax к `logits`:

```python
import torch

# Предположим, что значения logits уже известны
logits = torch.tensor([2.0, 1.0, 0.1])

# Применяем softmax, чтобы получить вероятности
probabilities = torch.nn.functional.softmax(logits, dim=0)

print(probabilities)
```

Данный код применяет функцию softmax к элементам вектора `logits`, переводя их в вероятности, которые суммируются до 1.

In [None]:
import tensorflow as tf

tf_predictions = tf.nn.softmax(tf_outputs.logits, axis=-1)
tf_predictions

<Tip>

Все модели 🤗 Transformers (как на PyTorch, так и на TensorFlow) выдают тензоры *до* применения заключительной функции активации (например, softmax), поскольку итоговая функция активации часто объединяется с функцией потерь. Выходные данные моделей представлены в виде специальных dataclass-структур, поэтому их атрибуты поддерживают автодополнение в среде разработки. Эти выходные данные ведут себя как кортежи или словари (их можно индексировать, используя целое число, срез или строку), при этом атрибуты со значением None игнорируются.

</Tip>

### Сохранение модели



Как только ваша модель настроена, вы можете сохранить ее вместе с токенизатором, используя метод [PreTrainedModel.save_pretrained()](https://huggingface.co/docs/transformers/main/en/main_classes/model#transformers.PreTrainedModel.save_pretrained):

In [None]:
pt_save_directory = "./pt_save_pretrained"
tokenizer.save_pretrained(pt_save_directory)
pt_model.save_pretrained(pt_save_directory)

Когда будете готовы вновь использовать модель, перезагрузите её с помощью метода [PreTrainedModel.from_pretrained()](https://huggingface.co/docs/transformers/main/en/main_classes/model#transformers.PreTrainedModel.from_pretrained):

In [None]:
pt_model = AutoModelForSequenceClassification.from_pretrained("./pt_save_pretrained")

Когда ваша модель настроена по вашему запросу, вы можете сохранить её вместе с токенизатором, используя [TFPreTrainedModel.save_pretrained()](https://huggingface.co/docs/transformers/main/en/main_classes/model#transformers.TFPreTrainedModel.save_pretrained):

In [None]:
tf_save_directory = "./tf_save_pretrained"
tokenizer.save_pretrained(tf_save_directory)
tf_model.save_pretrained(tf_save_directory)

Когда вы будете готовы использовать модель снова, загрузите её с помощью метода [TFPreTrainedModel.from_pretrained()](https://huggingface.co/docs/transformers/main/en/main_classes/model#transformers.TFPreTrainedModel.from_pretrained):

In [None]:
tf_model = TFAutoModelForSequenceClassification.from_pretrained("./tf_save_pretrained")

Одной из особенно полезных возможностей 🤗 Transformers является способность сохранять модель и загружать её как модель для PyTorch или TensorFlow. Параметр `from_pt` или `from_tf` позволяет преобразовать модель из одной фреймворка в другой:

In [None]:
from transformers import AutoModel

tokenizer = AutoTokenizer.from_pretrained(tf_save_directory)
pt_model = AutoModelForSequenceClassification.from_pretrained(tf_save_directory, from_tf=True)

In [None]:
from transformers import TFAutoModel

tokenizer = AutoTokenizer.from_pretrained(pt_save_directory)
tf_model = TFAutoModelForSequenceClassification.from_pretrained(pt_save_directory, from_pt=True)

## Создание индивидуальных моделей

Вы можете изменить класс конфигурации модели, чтобы задать, каким образом она будет построена. Конфигурация определяет атрибуты модели, такие как количество скрытых слоев или голов внимания. Когда вы инициализируете модель из класса пользовательской конфигурации, вы начинаете с нуля. Атрибуты модели инициализируются случайным образом, и вам потребуется обучить модель, прежде чем она начнет выдавать осмысленные результаты.

Начните с импорта [AutoConfig](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoConfig), затем загрузите предварительно обученную модель, которую вы хотите изменить. В методе [AutoConfig.from_pretrained()](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.AutoConfig.from_pretrained) можно указать атрибут, который вы хотите изменить, например, количество голов внимания:

In [None]:
from transformers import AutoConfig

my_config = AutoConfig.from_pretrained("distilbert-base-uncased", n_heads=12)

Чтобы создать модель из вашей индивидуальной конфигурации с использованием метода [AutoModel.from_config()](https://huggingface.co/docs/transformers/main/en/model_doc/auto#transformers.FlaxAutoModelForVision2Seq.from_config), выполните следующие шаги:

```python
from transformers import AutoConfig, AutoModel

# Шаг 1: Создайте свою конфигурацию модели
config = AutoConfig.from_pretrained("ваш_набор_конфигурации")

# Шаг 2: Создайте модель, используя вашу конфигурацию
model = AutoModel.from_config(config)

# Теперь у вас есть модель, построенная на основе вашей уникальной конфигурации
```

Этот подход позволяет вам использовать заранее определённые параметры конфигурации, чтобы гибко создавать модели, учитывая ваши конкретные потребности и задачи. Если у вас есть заранее определённые настройки, которые вы хотите включить в модель, это отличный способ сделать это.

In [None]:
from transformers import AutoModel

my_model = AutoModel.from_config(my_config)

Чтобы создать модель на основе вашей пользовательской конфигурации, используя метод `TFAutoModel.from_config()`, следуйте приведенной ниже структуре:

```python
from transformers import TFAutoModel

# Предположим, у вас есть конфигурация, загруженная в объект config
config = ...

# Создание модели из конфигурации
model = TFAutoModel.from_config(config)

# Теперь вы можете использовать вашу модель для различных задач
```

В данном примере мы предполагаем, что у вас уже существует объект конфигурации `config`, который будет использоваться для создания модели. Метод `from_config()` помогает инициализировать вашу модель на основе этой конфигурации. Не забывайте, что `TFAutoModel` относится к версии с поддержкой TensorFlow.

In [None]:
from transformers import TFAutoModel

my_model = TFAutoModel.from_config(my_config)

Ознакомьтесь с руководством [Создание пользовательской архитектуры](https://huggingface.co/docs/transformers/main/en/./create_a_model) для получения дополнительной информации о создании пользовательских конфигураций.

## Trainer - оптимизированный цикл обучения PyTorch



Все модели представляют собой стандартный [`torch.nn.Module`](https://pytorch.org/docs/stable/nn.html#torch.nn.Module), поэтому их можно использовать в любом типичном цикле обучения. Хотя вы можете написать собственный цикл обучения, библиотека 🤗 Transformers предлагает класс [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer) для PyTorch, который включает базовую логику обучения и добавляет дополнительную функциональность, такую как распределенное обучение, смешанная точность и многое другое.

В зависимости от вашей задачи, вам обычно нужно передать следующие параметры в [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer):

1. [PreTrainedModel](https://huggingface.co/docs/transformers/main/en/main_classes/model#transformers.PreTrainedModel) или [`torch.nn.Module`](https://pytorch.org/docs/stable/nn.html#torch.nn.Module):

    ```python
    >>> from transformers import AutoModelForSequenceClassification

    >>> model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")
    ```

2. [TrainingArguments](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.TrainingArguments), содержащие гиперпараметры модели, которые можно изменить, такие как скорость обучения, размер пакета и количество эпох для обучения. Если вы не укажете параметры, будут использоваться значения по умолчанию:

    ```python
    >>> from transformers import TrainingArguments

    >>> training_args = TrainingArguments(
    ...     output_dir="path/to/save/folder/",
    ...     learning_rate=2e-5,
    ...     per_device_train_batch_size=8,
    ...     per_device_eval_batch_size=8,
    ...     num_train_epochs=2,
    ... )
    ```

3. Класс для предобработки данных, например, токенизатор, процессор изображений, извлекатель признаков или процессор:

    ```python
    >>> from transformers import AutoTokenizer

    >>> tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")
    ```

4. Загрузите датасет:

    ```python
    >>> from datasets import load_dataset

    >>> dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT
    ```

5. Создайте функцию для токенизации датасета:

    ```python
    >>> def tokenize_dataset(dataset):
    ...     return tokenizer(dataset["text"])
    ```

    Затем примените её ко всему датасету с помощью [map](https://huggingface.co/docs/datasets/main/en/package_reference/main_classes#datasets.Dataset.map):

    ```python
    >>> dataset = dataset.map(tokenize_dataset, batched=True)
    ```

6. [DataCollatorWithPadding](https://huggingface.co/docs/transformers/main/en/main_classes/data_collator#transformers.DataCollatorWithPadding) для создания пакета примеров из вашего датасета:

    ```python
    >>> from transformers import DataCollatorWithPadding

    >>> data_collator = DataCollatorWithPadding(tokenizer=tokenizer)
    ```

Теперь соберите все эти классы в [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer):

In [None]:
from transformers import Trainer

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["test"],
    tokenizer=tokenizer,
    data_collator=data_collator,
)  # doctest: +SKIP

Когда будете готовы, вызовите [train()](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer.train), чтобы начать обучение:

In [None]:
trainer.train()

<Tip>

Если вам нужно выполнить задачи, такие как перевод или краткое изложение, которые используют модель "последовательность в последовательность", воспользуйтесь классами [Seq2SeqTrainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Seq2SeqTrainer) и [Seq2SeqTrainingArguments](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Seq2SeqTrainingArguments).

</Tip>

Вы можете настроить поведение цикла обучения, расширив методы внутри класса [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer). Это позволяет изменять такие параметры, как функция потерь, оптимизатор и планировщик. Ознакомьтесь с документацией [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer), чтобы узнать, какие методы можно расширить.

Другой способ настроить цикл обучения — использовать [Callbacks](https://huggingface.co/docs/transformers/main/en/./main_classes/callbacks). С помощью callback-функций можно интегрировать другие библиотеки и следить за прогрессом обучения или приостановить его заранее. Callback'и сами по себе не изменяют ничего в цикле обучения. Чтобы, например, изменить функцию потерь, вам нужно расширить класс [Trainer](https://huggingface.co/docs/transformers/main/en/main_classes/trainer#transformers.Trainer).