# Въведение в Hugging Face Transformers API

Hugging Face е една от водещите компании в областта на изкуствения интелект, специализирана в обработката на естествен език (NLP) и дълбокото обучение (deep learning). Тяхната библиотека *Transformers* предоставя лесен за използване интерфейс за работа с предварително обучени модели на базата на трансформeр архитектурата, като **BERT**, **GPT**, **T5**, **DistilBERT**, **RoBERTa** и други.

### Основни характеристики на Transformers API

Библиотеката **Transformers** е проектирана така, че да улесни разработчиците и изследователите при използването на сложни езикови модели, като предлага:

* **Предварително обучени модели** – достъп до стотици модели за различни NLP задачи.

* **Лесно зареждане и използване** – модели могат да бъдат заредени с няколко реда код.

* **Поддръжка на различни frameworks** – работи както с PyTorch, така и с TensorFlow.

  * *TensorFlow* е библиотека за дълбоко обучение, разработена от Google,
която предоставя гъвкавост и мащабируемост при изграждане на невронни мрежи.

  * *PyTorch* е динамична библиотека за машинно обучение, разработена от Meta, която улеснява прототипирането и изследването на модели чрез автоматична диференциация и гъвкав граф на изчисления.

* **Интуитивни API интерфейси** – позволява използването на модели без дълбоки познания в машинното обучение.

* **Многобройни NLP задачи** – включва текстова класификация, въпрос-отговор, машинен превод, генериране на текст и други.

### Основни компоненти

Библиотеката разполага с няколко основни класа, които обединяват логиката на работа на моделите:

1. **AutoModel** – позволява автоматично зареждане на правилния модел за дадена
задача.

2. **AutoTokenizer** – използва се за обработка на входния текст в подходящ за модела формат.

3. **Pipeline** – високо ниво API, което комбинира модел, токенизатор и други компоненти за бързо тестване на задачи.

### Пример за използване

Ето как може лесно да се използва **Transformers API**, за да зареди предварително обучен модел за анализ на настроението:

In [1]:
!pip install transformers torch

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-curand-cu12==10.3.5.147 (from torch)
  Downloading nvidia_curand_cu12-10.3.5

In [2]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")

result = classifier("I love using Hugging Face Transformers!")
print(result)

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision 714eb0f (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

Device set to use cuda:0


[{'label': 'POSITIVE', 'score': 0.9971315860748291}]


Това автоматично зарежда **BERT-базиран модел** за анализ на настроения и връща резултат с оценка на емоцията (положителна или отрицателна).

### Работа с персонализирани модели

Може също да се зареди специфичен модел от Hugging Face Model Hub, например **DistilBERT**:

In [3]:
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model_name = "distilbert-base-uncased-finetuned-sst-2-english" # deepseek-ai/DeepSeek-V3-0324
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

inputs = tokenizer("Hugging Face makes NLP easy!", return_tensors="pt")
outputs = model(**inputs)

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

Output:

In [4]:
import torch
import torch.nn.functional as F

# Преобразуване на изхода във вероятности
probs = F.softmax(outputs.logits, dim=-1)

# Избор на най-вероятния клас
predicted_class = torch.argmax(probs, dim=-1).item()

# Етикети на класовете (0 = отрицателно, 1 = положително)
labels = ["Negative", "Positive"]

print(f"Sentiment: {labels[predicted_class]}, Confidence: {probs[0][predicted_class]:.4f}")

Sentiment: Positive, Confidence: 0.9987


In [6]:
import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer

model_name = "distilbert-base-uncased-finetuned-sst-2-english"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Преместване на модела на GPU (ако е наличен)
device = "cuda" if torch.cuda.is_available() else "cpu"
model.to(device)

# Токенизиране и преместване на входните данни на GPU
inputs = tokenizer("Hugging Face makes NLP hard and upleasent!", return_tensors="pt")
inputs = {key: value.to(device) for key, value in inputs.items()}

# Изпълнение на модела
outputs = model(**inputs)

# Получаване на вероятности и класифициране
probs = torch.nn.functional.softmax(outputs.logits, dim=-1)
predicted_class = torch.argmax(probs, dim=-1).item()

labels = ["Negative", "Positive"]
print(f"Sentiment: {labels[predicted_class]}, Confidence: {probs[0][predicted_class]:.4f}")

Sentiment: Negative, Confidence: 0.8537


Тук **DistilBERT** обработва текста и връща логитите (logits - оценките) за класификацията.

### Заключение

Hugging Face Transformers API значително улеснява използването на съвременни NLP модели без необходимост от сложна конфигурация. С няколко реда код може да се интегрират модели във нашите приложения, като се използват за анализ на текст, машинен превод, въпрос-отговор и други задачи.