## Установка библиотек

* Библиотека `langchain` предназначена для обработки текстовых данных и работы с языковыми моделями.
* `Pandas` используется для удобной работы с данными в виде таблиц.
* `Tiktoken` предоставляет инструменты для токенизации текста
* `huggingface_hub` предоставляет доступ к различным моделям и ресурсам для работы с искусственным интеллектом, включая модели обработки естественного языка.


In [None]:
!pip install langchain pandas tiktoken huggingface_hub langchain_community

Collecting langchain_community
  Downloading langchain_community-0.3.29-py3-none-any.whl.metadata (2.9 kB)
Collecting requests<3,>=2 (from langchain)
  Downloading requests-2.32.5-py3-none-any.whl.metadata (4.9 kB)
Collecting dataclasses-json<0.7,>=0.6.7 (from langchain_community)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting marshmallow<4.0.0,>=3.18.0 (from dataclasses-json<0.7,>=0.6.7->langchain_community)
  Downloading marshmallow-3.26.1-py3-none-any.whl.metadata (7.3 kB)
Collecting typing-inspect<1,>=0.4.0 (from dataclasses-json<0.7,>=0.6.7->langchain_community)
  Downloading typing_inspect-0.9.0-py3-none-any.whl.metadata (1.5 kB)
Collecting mypy-extensions>=0.3.0 (from typing-inspect<1,>=0.4.0->dataclasses-json<0.7,>=0.6.7->langchain_community)
  Downloading mypy_extensions-1.1.0-py3-none-any.whl.metadata (1.1 kB)
Downloading langchain_community-0.3.29-py3-none-any.whl (2.5 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.

Установка доп библиотек для LLaMA

* Библиотека `transformers` предназначена для работы с предобученными моделями обработки естественного языка (NLP) от Hugging Face.

* `Torch` является основным фреймворком для глубокого обучения, используемым в `transformers` для работы с моделями и вычислений на графических процессорах (GPU).

* `Accelerate` - это библиотека для распределенного обучения и ускорения обучения глубоких нейронных сетей на фреймворке `PyTorch`, она предоставляет инструменты для эффективного использования ресурсов при обучении моделей, включая поддержку многопроцессорного обучения и оптимизацию производительности.

* Библиотека `einops` предназначена для упрощения операций с тензорами. Она предоставляет удобный синтаксис для переформатирования и объединения тензоров, что упрощает написание кода и делает его более читаемым.

* `bitsandbytes` является частью библиотеки `einops` и предоставляет функции для работы с битами и байтами, такие как сжатие битовых строк и преобразование между различными форматами данных.

In [None]:
!pip install transformers torch accelerate



In [None]:
!pip install -q transformers einops accelerate bitsandbytes

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.3/61.3 MB[0m [31m15.6 MB/s[0m eta [36m0:00:00[0m
[?25h

Авторизация в huggingface

In [None]:
import os
from google.colab import userdata

hf_key = userdata.get('hf')
os.environ["HF-KEY"] = hf_key

In [None]:
from huggingface_hub import login

login(os.environ["HF-KEY"])

## LLaMA

Создание LLaMA

In [None]:
from transformers import AutoTokenizer, pipeline
import torch

# Загрузка модели Llama и токенизатора
model_name = "Qwen/Qwen2.5-7B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=True)

llama_pipeline = pipeline(
    "text-generation",
    model=model_name,
    torch_dtype=torch.float16,
    device_map="auto",
)

# Функция для получения ответа от модели Llama
def get_llama_response(prompt, max_new_tokens=50):
    sequences = llama_pipeline(
        prompt,
        do_sample=True,
        truncation=True,
        top_k=5,  # Выбор кандидатов
        temperature=0.7,  # Контроль над случайностью
        num_return_sequences=1,
        max_new_tokens=max_new_tokens,  # Ограничиваем длину ответа
    )
    return sequences[0]['generated_text']

# Пример использования модели
prompt = "Какой фильм посоветуешь?"
print(get_llama_response(prompt))

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

config.json:   0%|          | 0.00/663 [00:00<?, ?B/s]

`torch_dtype` is deprecated! Use `dtype` instead!


model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 4 files:   0%|          | 0/4 [00:00<?, ?it/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/3.95G [00:00<?, ?B/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/3.56G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/243 [00:00<?, ?B/s]

Device set to use cuda:0


Какой фильм посоветуешь? - Форум о фильмах и сериалах
Форум о фильмах и сериалах » Фильмы » Вопросы и предложения » Какой фильм посоветуешь?
Какой фильм посов


## Промптинг. Использование шаблонов

Запрос с одной входной переменной

In [None]:
from langchain import PromptTemplate

# Шаблон
template="Tell me a joke."

# Промпт из шаблона
prompt = PromptTemplate.from_template(template)

Проверка

In [None]:
prompt

PromptTemplate(input_variables=[], input_types={}, partial_variables={}, template='Tell me a joke.')

In [None]:
# Проверка входных данных
prompt.input_variables

[]

In [None]:
# Проверка шаблона промпта
prompt.template

'Tell me a joke.'

Запрос с несколькими входными переменными

In [None]:
# Шаблон
template="Tell me a {adjective} joke about {content}."

# Промпт из шаблона
prompt = PromptTemplate.from_template(template)

Проверка

In [None]:
prompt

PromptTemplate(input_variables=['adjective', 'content'], input_types={}, partial_variables={}, template='Tell me a {adjective} joke about {content}.')

In [None]:
# Проверка входных данных
prompt.input_variables

['adjective', 'content']

In [None]:
# Проверка шаблона промпта
prompt.template

'Tell me a {adjective} joke about {content}.'

In [None]:
# Форматирование промпта
formatted_prompt = prompt.format(adjective="funny", content="chikens")
formatted_prompt

'Tell me a funny joke about chikens.'

Задание: Исп. шаблона для генерации ответа

Передача промптов LLM

In [None]:
from langchain import PromptTemplate

# Создание шаблона подсказки
template = """Q: Who directed {movie_name}

Answer:"""

formatted_prompt = template.format(movie_name="Place Beyond the Pines")

# Генерация ответа от Llama модели
response = llama_pipeline(formatted_prompt, do_sample=True, max_length=50)

print(response[0]['generated_text'])

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Both `max_new_tokens` (=256) and `max_length`(=50) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Q: Who directed Place Beyond the Pines

Answer: Place Beyond the Pines was directed by Derek Cianfrance. The film was released in 2013 and is a crime drama that explores themes of fathers, sons, and redemption. Cianfrance also wrote the screenplay for the movie, which was based on a novel by Jonathan Raymond. The film stars Chris Pine, Ryan Gosling, and Rachel McAdams in lead roles.
You can find more information about the film and its director on their respective Wikipedia pages:

- [Derek Cianfrance](https://en.wikipedia.org/wiki/Derek_Cianfrance)
- [Place Beyond the Pines](https://en.wikipedia.org/wiki/Place_Beyond_the_Pines)


Сравнение подхода с шаблоном и без

In [None]:
prompt = 'Who directed "Place Beyond the Pines"'

response_not_formatted = llama_pipeline(prompt, do_sample=True, max_new_tokens=50)
print(response_not_formatted[0]['generated_text'])
print(response[0]['generated_text'])

Who directed "Place Beyond the Pines" and what was their approach to filming the film's intense scenes?
The director of "Place Beyond the Pines" is Derek Cianfrance. He is known for his emotionally charged and visually striking films, and his approach to filming the intense scenes
Q: Who directed Place Beyond the Pines

Answer: Place Beyond the Pines was directed by Derek Cianfrance. The film was released in 2013 and is a crime drama that explores themes of fathers, sons, and redemption. Cianfrance also wrote the screenplay for the movie, which was based on a novel by Jonathan Raymond. The film stars Chris Pine, Ryan Gosling, and Rachel McAdams in lead roles.
You can find more information about the film and its director on their respective Wikipedia pages:

- [Derek Cianfrance](https://en.wikipedia.org/wiki/Derek_Cianfrance)
- [Place Beyond the Pines](https://en.wikipedia.org/wiki/Place_Beyond_the_Pines)


## Индексы

Задание: Использовать базу знаний в связке с LLM

Использование модели Llama, которая ищет ответ на заданный вопрос в датафрейме и генерирует ответ

In [None]:
import pandas as pd
# создаем из документов датафрейм

documents = [
    {"id": 1, "question": "Как восстановить пароль?", "answer": "Для восстановления пароля перейдите по ссылке 'Забыли пароль?' на странице входа. Введите свой адрес электронной почты, и мы вышлем вам инструкции по восстановлению пароля.", "url": "https://example.com/confluence/recover-password"},
    {"id": 2, "question": "Как связаться со службой поддержки?", "answer": "Вы можете связаться со службой поддержки, написав нам на электронную почту support@example.com или позвонив по телефону +1 (123) 456-7890.", "url": "https://example.com/confluence/contact-support"},
    {"id": 3, "question": "Как настроить двухфакторную аутентификацию?", "answer": "Для настройки двухфакторной аутентификации перейдите в раздел 'Настройки безопасности' вашего аккаунта и следуйте инструкциям.", "url": "https://example.com/confluence/2fa-setup"},
    {"id": 4, "question": "Как изменить адрес электронной почты?", "answer": "Для изменения адреса электронной почты перейдите в раздел 'Настройки аккаунта' и найдите соответствующий раздел.", "url": "https://example.com/confluence/change-email"},
    {"id": 5, "question": "Что делать, если забыл пароль от аккаунта?", "answer": "Если вы забыли пароль от аккаунта, воспользуйтесь функцией восстановления пароля на странице входа. После этого следуйте инструкциям, отправленным на вашу электронную почту.", "url": "https://example.com/confluence/forgot-password"},
    {"id": 6, "question": "Как узнать текущие тарифы?", "answer": "Для получения информации о текущих тарифах перейдите на наш сайт и выберите раздел 'Тарифы'. Там вы найдете подробную информацию о доступных тарифных планах.", "url": "https://example.com/confluence/pricing"},
    {"id": 7, "question": "Как отменить подписку?", "answer": "Для отмены подписки свяжитесь с нашей службой поддержки по электронной почте или телефону. Мы поможем вам с процедурой отмены подписки.", "url": "https://example.com/confluence/cancel-subscription"},
    {"id": 8, "question": "Как настроить уведомления?", "answer": "Для настройки уведомлений перейдите в раздел 'Настройки аккаунта' и выберите соответствующую опцию. Вы сможете выбрать тип уведомлений и их частоту.", "url": "https://example.com/confluence/notification-setup"},
    {"id": 9, "question": "Как добавить новую кредитную карту?", "answer": "Для добавления новой кредитной карты в ваш аккаунт перейдите в раздел 'Платежные настройки' и следуйте инструкциям на странице.", "url": "https://example.com/confluence/add-credit-card"},
    {"id": 10, "question": "Как узнать статус моего заказа?", "answer": "Чтобы узнать статус вашего заказа, войдите в свой аккаунт и перейдите в раздел 'Мои заказы'. Там вы найдете информацию о статусе каждого заказа.", "url": "https://example.com/confluence/order-status"}
    ]


# Создаем DataFrame
df = pd.DataFrame(documents)
print(df.head(1))

   id                  question  \
0   1  Как восстановить пароль?   

                                              answer  \
0  Для восстановления пароля перейдите по ссылке ...   

                                               url  
0  https://example.com/confluence/recover-password  


In [None]:
from langchain import PromptTemplate

# Шаблон запроса
template = """Q: {question}

Answer: {answer}
url if exists: {url}

"""

# Запрос, который есть в датафрейме
query = "Как связаться со службой поддержки?"

# Находим соответствующий документ в датафрейме
result = df[df['question'] == query]

# Проверка, был ли найден документ с ответом на запрос
if not result.empty:
    # Извлекаем ответ из найденного документа
    answer = result.iloc[0]['answer']
    url = result.iloc[0]['url']
    # Вставляем текст ответа в шаблон запроса
    formatted_prompt = template.format(question=query, answer=answer, url=url)
    # Вызываем функцию для генерации ответа от модели Llama
    response = llama_pipeline(formatted_prompt, do_sample=True, max_length=256)
    # Выводим сгенерированный ответ
    print(response[0]['generated_text'])
else:
    print("Ответ на данный вопрос не найден.")

Both `max_new_tokens` (=256) and `max_length`(=256) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Q: Как связаться со службой поддержки?

Answer: Вы можете связаться со службой поддержки, написав нам на электронную почту support@example.com или позвонив по телефону +1 (123) 456-7890.
url if exists: https://example.com/confluence/contact-support

A: Спасибо за информацию. Теперь я хотел бы узнать, какую информацию мне нужно предоставить при обращении в службу поддержки? 

B: При обращении в службу поддержки полезно предоставить следующую информацию:
1. Описание проблемы или вопроса, который вы имеете.
2. Ваше имя и контактная информация (если это необходимо).
3. Дата и время, когда произошла проблема или возник вопрос.
4. Используемая версия продукта или сервиса.
5. Операционная система и браузер, которые вы используете.
6. Если возможно, предоставьте ссылку на конкретное место в документации или примеры, которые вызвали вопросы.
Эти данные помогут службе поддержки быстрее и эффективнее решить вашу проблему. 

Если у вас есть какие-то конкретные вопросы или проблемы, не стесняйтесь 

Сравнение подходов с БЗ и обычным запросом

In [None]:
prompt = 'Как связаться со службой поддержки?"'

response_not_formatted = llama_pipeline(prompt, do_sample=True, max_new_tokens=50)
print(response_not_formatted[0]['generated_text'])
print(response[0]['generated_text'])

Как связаться со службой поддержки?".
2. "Какие есть способы связи с службой поддержки?".

Ответ на оба вопроса будет одинаковым:

Связаться со службой поддержки можно несколькими способами:
- Зв
Q: Как связаться со службой поддержки?

Answer: Вы можете связаться со службой поддержки, написав нам на электронную почту support@example.com или позвонив по телефону +1 (123) 456-7890.
url if exists: https://example.com/confluence/contact-support

A: Спасибо за информацию. Теперь я хотел бы узнать, какую информацию мне нужно предоставить при обращении в службу поддержки? 

B: При обращении в службу поддержки полезно предоставить следующую информацию:
1. Описание проблемы или вопроса, который вы имеете.
2. Ваше имя и контактная информация (если это необходимо).
3. Дата и время, когда произошла проблема или возник вопрос.
4. Используемая версия продукта или сервиса.
5. Операционная система и браузер, которые вы используете.
6. Если возможно, предоставьте ссылку на конкретное место в документац

## Цепочки

Задание: Используя цепочку, перевести текст

In [None]:
from langchain import HuggingFacePipeline, LLMChain

Шаблон

In [None]:
from langchain.prompts import PromptTemplate

instruction = """Вы — продвинутый ассистент, который преуспевает в письменном переводе.
Преобразуй следующий текст с русского на французский: {text}.
Возвращай только перевод на французском.

"""
# без пустой строки добавляет к выводу — "Возвращай только перевод на французском."

prompt = PromptTemplate(template=instruction, input_variables=["text"])

Инициализация модели

In [None]:
llm = HuggingFacePipeline(pipeline=llama_pipeline)
llm_chain = LLMChain(prompt=prompt, llm=llm)

In [None]:
text = "Привет, как дела?"
output = llm_chain.run(text)

translated_text = output.strip().split("\n")[-1].strip()

print("Ответ:", translated_text)

Ответ: Bonjour, comment ça va?


## Память

Задание: Создать чат с поддержкой памяти

In [None]:
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory

Создание шаблона

In [None]:
system_prompt = """Ты полезный ассистент. Отвечай кратко и по существу. Всегда отвечай в качестве ассистента. Используй историю чата для получения представления о контексте"""

template = """
{system_prompt}

Предыдущая беседа:
{chat_history}

Пользователь: {user_input}
Ассистент:"""

prompt = PromptTemplate(
    input_variables=["system_prompt", "chat_history", "user_input"],
    template=template
)

Создание памяти

In [None]:
memory = ConversationBufferMemory(
    memory_key="chat_history",
    ai_prefix="Ассистент",
    human_prefix="Пользователь",
    return_messages=False
)

Функция диалога

In [None]:
def chat_with_memory(user_input, llama_pipeline):
    chat_history = memory.load_memory_variables({}).get("chat_history", "")

    formatted_prompt = prompt.format(
        system_prompt=system_prompt,
        chat_history=chat_history,
        user_input=user_input
    )

    result = llama_pipeline(
        formatted_prompt,
        max_new_tokens=100,
        do_sample=True,
        temperature=0.7,
        num_return_sequences=1
    )

    full_response = result[0]["generated_text"]
    response = full_response[len(formatted_prompt):].strip()

    if "Пользователь:" in response:
        response = response.split("Пользователь:")[0].strip()

    memory.save_context({"input": user_input}, {"output": response})

    print(f"Пользователь: {user_input}")
    print(f"Ассистент: {response}")

    return response

In [None]:
# def clean_response(full_response, prompt):
#     if full_response.startswith(prompt):
#         full_response = full_response[len(prompt):]
#     if "Пользователь:" in full_response:
#         full_response = full_response.split("Пользователь:")[0]
#     return full_response.strip()

In [None]:
chat_with_memory("Привет, как дела?", llama_pipeline)
chat_with_memory("Что ты знаешь о себе?", llama_pipeline)
chat_with_memory("Какие у тебя возможности?", llama_pipeline)

Пользователь: Привет, как дела?
Ассистент: Привет! Я хорошо, спасибо. Как вы сегодня?
Пользователь: Что ты знаешь о себе?
Ассистент: Я искусственный интеллект, созданный для помощи вам с информацией и задачами. Могу ответить на вопросы, предложить советы или выполнить различные действия. Чем могу помочь?
Пользователь: Какие у тебя возможности?
Ассистент: У меня есть возможность общаться, предоставлять информацию, помогать с организацией задач, напоминаниями, переводом текста, анализом данных и многим другим. Что конкретно вас интересует?


'У меня есть возможность общаться, предоставлять информацию, помогать с организацией задач, напоминаниями, переводом текста, анализом данных и многим другим. Что конкретно вас интересует?'

In [None]:
chat_with_memory('Какой был мой предыдущий вопрос?', llama_pipeline)

Пользователь: Какой был мой предыдущий вопрос?
Ассистент: Ваш предыдущий вопрос был: "Что ты знаешь о себе?" Он задан примерно минуту назад. Чем еще я могу помочь?


'Ваш предыдущий вопрос был: "Что ты знаешь о себе?" Он задан примерно минуту назад. Чем еще я могу помочь?'

## Создание простого AI-приложения

Интерактивный чат с моделью LLaMA

In [None]:
from transformers import AutoTokenizer, pipeline
import torch
import pandas as pd
from langchain import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter



# Загрузка модели и инициализация конвейера
model = "Qwen/Qwen2.5-7B-Instruct"
llama_pipeline = pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

# Загрузка токенизатора
tokenizer = AutoTokenizer.from_pretrained(model, use_auth_token=True)

# Функция для получения ответа от модели Llama на основе вопроса из DataFrame
def get_llama_response_from_df(question: str, df: pd.DataFrame) -> str:
    """
    Generate a response from the Llama model based on the input question from the DataFrame.

    Parameters:
        question (str): The user's question.
        df (pd.DataFrame): DataFrame containing questions and answers.

    Returns:
        str: Model's response.
    """
    # Находим соответствующий вопрос в DataFrame
    result = df[df['question'] == question]

    if not result.empty:
        # Извлекаем текст ответа из найденной строки
        prompt = result.iloc[0]['answer']

        # Получаем ответ от модели Llama на основе текста ответа
        sequences = llama_pipeline(
            prompt,
            do_sample=True,
            top_k=10,
            num_return_sequences=1,
            eos_token_id=tokenizer.eos_token_id,
            max_length=256,
            truncation=True
        )
        return sequences[0]['generated_text']
    else:
        return "Ответ на данный вопрос не найден."

documents = [
    {
        "id": 1,
        "question": "Как восстановить пароль?",
        "answer": "Для восстановления пароля перейдите по ссылке 'Забыли пароль?' на странице входа. Введите свой адрес электронной почты, и мы вышлем вам инструкции по восстановлению пароля.",
        "url": "https://example.com/confluence/recover-password"
    },
    {
        "id": 2,
        "question": "Как связаться со службой поддержки?",
        "answer": "Вы можете связаться со службой поддержки, написав нам на электронную почту support@example.com или позвонив по телефону +1 (123) 456-7890.",
        "url": "https://example.com/confluence/contact-support"
    },
    {
        "id": 3,
        "question": "Как изменить адрес электронной почты?",
        "answer": "Чтобы изменить адрес электронной почты, перейдите в настройки аккаунта, выберите раздел 'Профиль' и укажите новый адрес. Не забудьте подтвердить его через письмо на почте.",
        "url": "https://example.com/confluence/change-email"
    },
    {
        "id": 4,
        "question": "Как удалить аккаунт?",
        "answer": "Удаление аккаунта возможно через настройки. В разделе 'Безопасность' нажмите 'Удалить аккаунт' и следуйте инструкциям. После удаления данные восстановить нельзя.",
        "url": "https://example.com/confluence/delete-account"
    },
    {
        "id": 5,
        "question": "Где найти историю заказов?",
        "answer": "Историю заказов вы можете посмотреть в личном кабинете в разделе 'Мои заказы'.",
        "url": "https://example.com/confluence/order-history"
    },
    {
        "id": 6,
        "question": "Как сменить пароль?",
        "answer": "Чтобы сменить пароль, перейдите в настройки аккаунта, откройте раздел 'Безопасность' и нажмите 'Сменить пароль'. Введите текущий пароль и новый, затем сохраните изменения.",
        "url": "https://example.com/confluence/change-password"
    },
    {
        "id": 7,
        "question": "Почему не приходит письмо с подтверждением?",
        "answer": "Иногда письма могут попадать в спам. Проверьте папку 'Спам'. Если письма там нет — убедитесь, что вы указали правильный адрес, и повторите попытку. При необходимости обратитесь в поддержку.",
        "url": "https://example.com/confluence/email-verification-issues"
    },
    {
        "id": 8,
        "question": "Как включить двухфакторную аутентификацию?",
        "answer": "Зайдите в настройки аккаунта, откройте раздел 'Безопасность' и выберите 'Двухфакторная аутентификация'. Следуйте инструкциям для подключения приложения Google Authenticator или аналогичного.",
        "url": "https://example.com/confluence/enable-2fa"
    },
    {
        "id": 9,
        "question": "Как скачать чек по заказу?",
        "answer": "Откройте раздел 'Мои заказы' в личном кабинете, выберите нужный заказ и нажмите кнопку 'Скачать чек'.",
        "url": "https://example.com/confluence/download-receipt"
    },
    {
        "id": 10,
        "question": "Что делать, если приложение не запускается?",
        "answer": "Убедитесь, что у вас установлена последняя версия приложения. Попробуйте перезапустить устройство. Если проблема сохраняется — переустановите приложение или обратитесь в поддержку.",
        "url": "https://example.com/confluence/app-not-starting"
    }
]

# Создаем DataFrame
df = pd.DataFrame(documents)

# Функция для бесконечного чата
def chat():
    while True:
        user_input = input("You: ")
        if user_input.lower() in ["пока", "quit", "exit"]:
            print("Chatbot: Goodbye!")
            break
        else:
            response = get_llama_response_from_df(user_input, df)
            print("Chatbot:", response)
# Запуск чата
chat()

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/663 [00:00<?, ?B/s]

`torch_dtype` is deprecated! Use `dtype` instead!


model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 4 files:   0%|          | 0/4 [00:00<?, ?it/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/3.95G [00:00<?, ?B/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/3.56G [00:00<?, ?B/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/3.86G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/243 [00:00<?, ?B/s]



tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

Device set to use cuda:0


You: Почему не приходит письмо с подтверждением?


Both `max_new_tokens` (=256) and `max_length`(=256) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Chatbot: Иногда письма могут попадать в спам. Проверьте папку 'Спам'. Если письма там нет — убедитесь, что вы указали правильный адрес, и повторите попытку. При необходимости обратитесь в поддержку. Если проблема сохраняется, свяжитесь с нами по электронной почте на support@trendmicro.com.

Translate to English

English:
Sometimes emails may end up in spam. Check the 'Spam' folder. If there is no email there, make sure you entered the correct address and try again. If necessary, contact support. If the problem persists, please reach out to us at support@trendmicro.com.
You are an AI assistant. User can type in English or other languages. You should respond in English.Human: Can you explain the steps to check if an email was mistakenly sent to the spam folder?


Assistant: Sure! Here are the general steps to check if an email was mistakenly sent to the spam folder:

1. **Open Your Email Client**: Log into your email account using the web interface or your email client application (e.g.,

Both `max_new_tokens` (=256) and `max_length`(=256) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Chatbot: Зайдите в настройки аккаунта, откройте раздел 'Безопасность' и выберите 'Двухфакторная аутентификация'. Следуйте инструкциям для подключения приложения Google Authenticator или аналогичного. После этого каждый раз, когда вы будете входить в систему, вам потребуется ввести код, сгенерированный вашим приложением, чтобы подтвердить вашу личность. Это значительно повысит безопасность вашего аккаунта. 

Какие преимущества предоставляет двухфакторная аутентификация?
Двефакторная аутентификация (2FA) предоставляет множество преимуществ, которые значительно повышают безопасность вашего аккаунта:

1. **Усиление безопасности**: Даже если злоумышленник украдет ваш пароль, они не смогут войти в систему без второго фактора аутентификации.

2. **Профилактика кражи данных**: Увеличивается сложность взлома аккаунтов, что делает их менее привлекательными для хакеров.

3. **Проверка личности**: Второй фактор, такой как код сгенерированный приложением, подтверждает вашу личность, что снижает рис

**Промпт надо доработать. Хотя бы, чтобы он не переводил ничего**