<a href="https://colab.research.google.com/github/CodeHunterOfficial/Data-Mining/blob/main/Transformers.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Курсовая работа: **Разработка веб-приложения для анализа текстов и ответов на вопросы с использованием Django и BERT (Hugging Face)**

#### План

1. **Введение**
   - Цель и задачи работы.
   - Актуальность разработки веб-приложений для обработки текстов с использованием моделей машинного обучения.
   - Краткое описание технологий Django и BERT (Hugging Face).

2. **Теоретическая часть**

   2.1. **Обзор Django**:
   - Основные функции и особенности Django как фреймворка для веб-разработки.
   - Архитектура MVC/MTV и её применение.
   
   2.2. **Обзор BERT (Hugging Face)**:
   - Принцип работы модели BERT.
   - Использование библиотеки Hugging Face для загрузки и применения предобученных моделей.
   - Пример применения BERT для задачи "Ответ на вопрос".

3. **Практическая часть**
   
   3.1. **Проектирование и разработка веб-приложения**:
   - Задачи приложения: ввод текста и вопросов, получение ответов.
   - Основные компоненты:
     - Django как backend.
     - BERT (Hugging Face) как модель для обработки текста.
   
   3.2. **Интеграция Django и BERT**:
   - Установка Django и библиотеки Hugging Face.
   - Настройка предобученной модели BERT для обработки вопросов.
   - Взаимодействие с моделью через Django (простое API для отправки запросов и получения ответов).

   3.3. **Интерфейс пользователя**:
   - Простая веб-форма для ввода текста и вопроса.
   - Отображение ответа от модели на веб-странице.

4. **Тестирование**
   - Проверка работы приложения на различных примерах.
   - Тестирование модели на правильность ответов и производительность.

5. **Заключение**
   - Результаты работы: как модель справляется с задачей.
   - Возможные улучшения и дальнейшее развитие проекта.

6. **Список литературы**
   - Официальная документация Django, Hugging Face, статьи по BERT.


In [None]:
!pip install transformers



In [None]:
from transformers import pipeline

# Загружаем модель для вопросно-ответной системы
qa_pipeline = pipeline("question-answering", model="deepset/roberta-base-squad2")

# Пример текста, на который будем отвечать
context = """
Hugging Face — это компания, предоставляющая инструменты для обработки естественного языка.
Они предлагают широкий спектр моделей и наборов данных, что упрощает разработку AI приложений.
"""

# Пример вопроса
question = "Что предоставляет Hugging Face?"

# Получаем ответ
result = qa_pipeline(question=question, context=context)

# Выводим ответ
print(f"Вопрос: {question}")
print(f"Ответ: {result['answer']}")

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/496M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/79.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/772 [00:00<?, ?B/s]



Вопрос: Что предоставляет Hugging Face?
Ответ: это компания


In [None]:
# Пример вопроса
question = "Что они предлагают?"

# Получаем ответ
result = qa_pipeline(question=question, context=context)

# Выводим ответ
print(f"Вопрос: {question}")
print(f"Ответ: {result['answer']}")

Вопрос: Что они предлагают?
Ответ: 
Hugging Face


In [None]:
from transformers import pipeline

# Загружаем модель BERT для вопросно-ответной системы
qa_pipeline = pipeline("question-answering", model="google-bert/bert-large-uncased-whole-word-masking-finetuned-squad")

# Пример текста
context = """
Hugging Face — это компания, основанная в 2016 году, предоставляющая инструменты для обработки естественного языка.
Она быстро стала лидером в области разработки моделей для машинного обучения.
Компания предлагает широкий спектр моделей и наборов данных, что упрощает разработку AI приложений.
Hugging Face активно поддерживает сообщество разработчиков, предоставляя доступ к моделям через свой сайт и API.
Среди популярных моделей можно выделить BERT, GPT-2 и RoBERTa, которые используются для различных задач, таких как анализ тональности, генерация текста и перевод.
"""

# Примеры вопросов
questions = [
    "Когда была основана компания Hugging Face?",
    "Что предоставляет Hugging Face?",
    "Какие модели популярны среди разработчиков?",
    "Для каких задач можно использовать модели Hugging Face?"
]

# Получаем ответы на вопросы
for question in questions:
    result = qa_pipeline(question=question, context=context)
    print(f"Вопрос: {question}")
    print(f"Ответ: {result['answer']}")
    print()  # Пустая строка для разделения выводов


config.json:   0%|          | 0.00/443 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

Some weights of the model checkpoint at google-bert/bert-large-uncased-whole-word-masking-finetuned-squad were not used when initializing BertForQuestionAnswering: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForQuestionAnswering from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForQuestionAnswering from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

Вопрос: Когда была основана компания Hugging Face?
Ответ: Face

Вопрос: Что предоставляет Hugging Face?
Ответ: доступ к моделям

Вопрос: Какие модели популярны среди разработчиков?
Ответ: BERT

Вопрос: Для каких задач можно использовать модели Hugging Face?
Ответ: BERT, GPT-2 и RoBERTa

