<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/NLP/NLP-2025/New/%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0_%E2%84%96%E2%80%AF7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>



# Практическая работа № 7  
**Тема.** Использование платформы Hugging Face для комплексного анализа и генерации текста

---

## 1. Цель и задачи работы

Платформа **Hugging Face** за последние годы превратилась из репозитория моделей в **полноценную экосистему для всего цикла работы с NLP**: от поиска и запуска предобученных моделей до их дообучения, оценки, развёртывания и публикации. Её центральные компоненты — **Model Hub**, **Datasets Hub**, **Spaces**, **Inference API** и **библиотеки (`transformers`, `datasets`, `evaluate`)** — позволяют решать практически любую задачу обработки естественного языка «из коробки».

**Цель настоящей работы** — сформировать у обучающегося **системное и практическое представление** о возможностях Hugging Face как **единая интегрированная платформа для NLP**. Особое внимание уделяется не просто запуску моделей, а **осознанному выбору архитектуры под задачу**, **интерпретации результатов**, **сравнению моделей** и **демонстрации решений через веб-интерфейсы**.

**Основные задачи работы:**

1. Освоить **ключевые компоненты экосистемы Hugging Face**: `transformers`, `datasets`, `evaluate`, `gradio`, Spaces.  
2. Реализовать и протестировать **все основные типы NLP-задач**, поддерживаемых платформой:  
   - **Text Classification** (классификация текста),  
   - **Token Classification** (NER, морфологическая разметка),  
   - **Question Answering** (QA по контексту и табличный QA),  
   - **Zero-Shot Classification** (классификация без обучения),  
   - **Translation** (перевод),  
   - **Summarization** (автоматическое реферирование),  
   - **Feature Extraction** (получение эмбеддингов),  
   - **Text Generation** (генерация текста),  
   - **Fill-Mask** (восстановление пропущенных слов),  
   - **Sentence Similarity** (семантическое сходство),  
   - **Text Ranking** (ранжирование документов по релевантности).  
3. Использовать **единый корпус текстов** (из Практической работы № 1) как основу для всех экспериментов.  
4. Провести **сравнительный анализ качества** различных моделей внутри одной задачи (например, RuBERT vs ruRoBERTa для NER).  
5. Применить **методы оценки**, встроенные в библиотеку `evaluate` (ROUGE, BLEU, F1, accuracy и др.).  
6. Проанализировать **вычислительные затраты и скорость** различных моделей на CPU/GPU.  
7. Разработать **единый веб-интерфейс на Gradio**, демонстрирующий все реализованные задачи.  
8. Опубликовать интерфейс на **Hugging Face Spaces** и обеспечить воспроизводимость через `requirements.txt` и `app.py`.

---

## 2. Теоретические предпосылки

### 2.1. Архитектура экосистемы Hugging Face

Экосистема Hugging Face строится на трёх китах:

- **Model Hub** — централизованный репозиторий миллионов моделей, снабжённых Model Card, лицензией и примерами использования.  
- **Datasets Hub** — коллекция корпусов и датасетов, доступных одной строкой кода.  
- **Spaces** — платформа для развёртывания веб-приложений (на Gradio, Streamlit) поверх моделей.

Центральная библиотека — **`transformers`** — предоставляет **единый API** для всех типов задач через класс `pipeline`. Например:

```python
from transformers import pipeline
classifier = pipeline("text-classification", model="DeepPavlov/rubert-base-cased")
```

Это позволяет решать сложные NLP-задачи **без написания низкоуровневого кода**.

### 2.2. Типы задач и их особенности

| Тип задачи | Описание | Пример модели |
|-----------|--------|--------------|
| **Text Classification** | Отнесение текста к категории | `cointegrated/rubert-tiny2` |
| **Token Classification** | Разметка каждого токена (NER, POS) | `DeepPavlov/rubert-base-cased-ner` |
| **Question Answering** | Извлечение ответа из контекста | `deepset/roberta-base-squad2` |
| **Table QA** | Ответ на вопрос по таблице | `google/tapas-base-finetuned-wtq` |
| **Zero-Shot Classification** | Классификация по произвольным меткам | `facebook/bart-large-mnli` |
| **Translation** | Перевод между языками | `Helsinki-NLP/opus-mt-ru-en` |
| **Summarization** | Сокращение текста | `IlyaGusev/rut5_base_sum_gen` |
| **Feature Extraction** | Получение эмбеддингов | `intfloat/multilingual-e5-large` |
| **Text Generation** | Генерация продолжения | `meta-llama/Meta-Llama-3-8B-Instruct` |
| **Fill-Mask** | Восстановление [MASK] | `DeepPavlov/rubert-base-cased` |
| **Sentence Similarity** | Сравнение двух предложений | `sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2` |
| **Text Ranking** | Ранжирование документов по запросу | `intfloat/multilingual-e5-large` |

### 2.3. Преимущества единой платформы

- **Воспроизводимость**: любую модель можно загрузить по имени.  
- **Скорость прототипирования**: запуск задачи — 3–5 строк кода.  
- **Открытость**: большинство моделей — open-weight, с лицензией.  
- **Интеграция**: лёгкое сочетание задач (например, NER → Summarization).

---

## 3. Методика и порядок выполнения работы

### 3.1. Этап 1. Подготовка экспериментального корпуса

- Используется корпус из Практической работы № 1 (новости, ≥10 000 документов).  
- Для задач, требующих структуры (Table QA), создаётся **искусственный датасет** из таблиц (например, «Результаты спортивных соревнований»).  
- Для Zero-Shot и Translation — подготавливаются тексты на русском и (опционально) татарском.

### 3.2. Этап 2. Реализация задач через `pipeline`

Для каждой задачи создаётся отдельный скрипт или функция:

```python
# Пример для NER
ner = pipeline("ner", model="DeepPavlov/rubert-base-cased-ner", tokenizer="DeepPavlov/rubert-base-cased-ner")
result = ner("Президент России Владимир Путин выступил в Москве.")
```

**Требования**:  
- Использовать **актуальные русскоязычные модели** из Model Hub;  
- Для каждой задачи — **минимум две модели** для сравнения.

### 3.3. Этап 3. Оценка качества

- Использовать библиотеку `evaluate` для расчёта метрик:  
  - F1 для NER и Classification,  
  - ROUGE для Summarization,  
  - BLEU для Translation,  
  - Accuracy для QA.  
- Для задач без эталона (Zero-Shot, Generation) — **качественный анализ** (примеры, частота галлюцинаций).

### 3.4. Этап 4. Анализ производительности

- Измерить время инференса на CPU и GPU для каждой модели;  
- Сравнить объём памяти;  
- Сделать выводы о **компромиссе «качество–скорость»**.

### 3.5. Этап 5. Сравнительный анализ

- Построить сводную таблицу:  
  `Задача | Модель | Качество | Скорость | Ресурсы`  
- Выявить **лидера по каждой задаче** для русского языка.

### 3.6. Этап 6. Интерпретация результатов

- Для NER — визуализация сущностей;  
- Для QA — выделение ответа в контексте;  
- Для Zero-Shot — анализ confidence scores.

### 3.7. Этап 7. Разработка веб-интерфейса

Создаётся единый интерфейс на **Gradio** с вкладками:

- **Классификация текста** (выбор модели, меток);  
- **Извлечение сущностей** (NER);  
- **Ответ на вопрос** (ввод контекста и вопроса);  
- **Перевод** (выбор направления);  
- **Реферирование**;  
- **Zero-Shot классификация**;  
- **Сравнение предложений** (Sentence Similarity).

### 3.8. Этап 8. Публикация на Hugging Face Spaces

- Создание репозитория на Hugging Face;  
- Загрузка `app.py`, `requirements.txt`;  
- Настройка Space с GPU (если требуется);  
- Тестирование и публикация ссылки.

---

## 4. Дополнительные исследовательские задания

1. **Многоязычность**: протестировать модели на татарско-русских текстах.  
2. **Комбинация задач**: например, NER → Summarization (реферат с выделением имён).  
3. **Оптимизация для CPU**: использовать distilled-модели (DistilBERT, rubert-tiny).  
4. **Сравнение с API**: сопоставить локальный инференс с Hugging Face Inference API по скорости и стоимости.  
5. **Автоматическая аннотация**: использовать NER и Classification для разметки вашего корпуса.

---

## 5. Требования к отчёту

Отчёт по **ГОСТ 7.32–2017** должен включать:

1. Введение с обоснованием роли Hugging Face в современном NLP;  
2. Описание всех 11 типов задач и выбранных моделей;  
3. Результаты оценки и сравнительной таблицы;  
4. Анализ компромисса «качество–скорость»;  
5. Скриншоты веб-интерфейса и примеры работы;  
6. Ссылку на **Hugging Face Space**;  
7. Выводы: какие модели наиболее эффективны для русского языка по каждой задаче?

---

## 6. Критерии оценивания

| Оценка | Критерии |
|--------|----------|
| **Отлично (5)** | Реализованы все 11 задач, есть сравнение моделей, оценка, веб-интерфейс на Spaces, анализ качества и скорости. |
| **Хорошо (4)** | Реализовано ≥8 задач, есть интерфейс и базовый анализ. |
| **Удовлетворительно (3)** | Реализовано ≥5 задач, есть примеры и интерфейс. |
| **Неудовлетворительно (2)** | Отсутствует системная реализация или публикация. |
