In [1]:
from langchain.document_loaders import PyPDFLoader, DirectoryLoader, PDFMinerLoader, TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter 
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.vectorstores import Chroma
import numpy as np
import os 
import chromadb
from chromadb.config import Settings
from chromadb.utils import embedding_functions

In [4]:
with open('./SOURCE_DOCUMENTS/stoloto.txt', 'r') as file:
    text = file.readlines()

text = ''.join(text)

# <span style="color:orange">**=== chunk split ===**</span>

In [5]:
rec_text_splitter = RecursiveCharacterTextSplitter(chunk_size=750,
                                               chunk_overlap=750,
                                               length_function=len,
                                            #    is_separator_regex=False
                                               )

chunks = rec_text_splitter.split_text(text)

print(f'Total number of chunks: {len(chunks)}\n')
for i, _ in enumerate(chunks):
    print(f"chunk # {i}, size: {len(chunks[i])}")
    print(f"{chunks[i]}")
    print('--------------------------------------------------------------------------------------------------------------------------------------------')

Total number of chunks: 27

chunk # 0, size: 702
Изменить имя и пароль вы можете в своем личном кабинете (раздел «Профиль»).
Если вы забыли пароль, воспользуйтесь службой восстановления. В отправленном вам письме будет ссылка на смену пароля.
Логин изменить невозможно. Логин есть у тех пользователей, кто зарегистрировался на сайте до мая 2015 года. Участники, которые зарегистрировались позже, при авторизации вместо логина указывают свою электронную почту.
Раздел «Кошелек» находится в вашем личном кабинете. Номер Кошелька можно найти в левом верхнем углу раздела «Кошелек», под суммой вашего баланса.
Самостоятельное удаление билетов невозможно — они автоматически перемещаются в архив по истечении 180 дней с момента проведения тиража/розыгрыша.
--------------------------------------------------------------------------------------------------------------------------------------------
chunk # 1, size: 648
Логин изменить невозможно. Логин есть у тех пользователей, кто зарегистрировался на са

# <span style="color:orange">**=== chromadb ===**</span>

In [6]:
# Загружаем токенизатор
# embedding_function = embedding_functions.HuggingFaceEmbeddingFunction(model_name="sentence-transformers/all-MiniLM-L6-v2", api_key='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')

embedding_function = embedding_functions.SentenceTransformerEmbeddingFunction(model_name="sentence-transformers/all-MiniLM-L6-v2")

chroma_client = chromadb.HttpClient(settings=Settings(
    allow_reset=True,
    chroma_api_impl='chromadb.api.fastapi.FastAPI',
    chroma_server_host='localhost',
    chroma_server_http_port='8000')
)

chroma_client.delete_collection('book')

collection = chroma_client.create_collection(name='book',
                                             metadata={"hnsw:space": "cosine"},
                                             embedding_function=embedding_function
                                             )

  from .autonotebook import tqdm as notebook_tqdm
  return self.fget.__get__(instance, owner)()


In [7]:
collection = chroma_client.get_collection(name="book", embedding_function=embedding_function)

# <span style="color:orange">**=== data uploading to chromadb ===**</span>

In [8]:
counter = 0
for doc in chunks:
    counter += 1
    print(f'Done: {round(counter * 100 / len(chunks), 2)}%')
    collection.add(
        # embeddings = embedded_documents,
        documents=[doc],
        # metadatas=doc.metadata,
        ids=['id'+str(counter)]
    )

Done: 3.7%
Done: 7.41%
Done: 11.11%
Done: 14.81%
Done: 18.52%
Done: 22.22%
Done: 25.93%
Done: 29.63%
Done: 33.33%
Done: 37.04%
Done: 40.74%
Done: 44.44%
Done: 48.15%
Done: 51.85%
Done: 55.56%
Done: 59.26%
Done: 62.96%
Done: 66.67%
Done: 70.37%
Done: 74.07%
Done: 77.78%
Done: 81.48%
Done: 85.19%
Done: 88.89%
Done: 92.59%
Done: 96.3%
Done: 100.0%


### v1 без отсекания нерелевантных

In [55]:
# question = "Если я иностранец, то могу ли участвовать в лотереях?"
question = "Как восстановить пароль?"
# question = "как дела?"

response = collection.query(
    # query_embeddings=embedding_function(question),
    query_texts=[question],
    n_results=2,
    # include=["documents"],
    # where={"metadata_field":"is_equal_to_this"}, # где искать
    # where_document={"$contains":"$search_string"}
)

vector_db_response = " ".join(response["documents"][0])

print(f'============QUESTION:============\n{question}')
print(f'============RESPONSE:============\n{vector_db_response}')

Как восстановить пароль?
Чтобы настроить или отключить рассылки, откройте «Профиль» в личном кабинете и зайдите в раздел «Уведомления».
Также вы можете написать по адресу info@stoloto.ru или в чат поддержки. Сообщите консультанту почту или номер телефона, на которые вы больше не хотите получать рассылки.
Лотереи бывают тиражными и бестиражными (моментальными). Тиражной называется лотерея, в которой розыгрыш призового фонда между всеми участниками проводится единовременно после распространения лотерейных билетов. Проведение такой лотереи может включать в себя отдельные тиражи. Изменить имя и пароль вы можете в своем личном кабинете (раздел «Профиль»).
Если вы забыли пароль, воспользуйтесь службой восстановления. В отправленном вам письме будет ссылка на смену пароля.
Логин изменить невозможно. Логин есть у тех пользователей, кто зарегистрировался на сайте до мая 2015 года. Участники, которые зарегистрировались позже, при авторизации вместо логина указывают свою электронную почту.
Раздел

### v2 - с отсеканием нерелевантных

In [304]:
# question = "Если я иностранец, то могу ли участвовать в лотереях?"
question = "Как восстановить пароль?"
# question = "Составь эссе по истории и сухому закону"
# question = "как дела?"
# question = "как сделать сырники"
# question = "наполеон?"

response = collection.query(
    # query_embeddings=embedding_function(question),
    query_texts=[question],
    n_results=2,
    # include=["documents"],
    # where={"metadata_field":"is_equal_to_this"}, # где искать
    # where_document={"$contains":"$search_string"}
)

result_documents_ids = []
for d in range(len(response['distances'][0])):
    if response['distances'][0][d] < 0.35: # порог отсечения нерелевантности
        result_documents_ids.append(d)

response_documents = response["documents"][0].copy()
if len(result_documents_ids) > 0:
    for i in range(len(result_documents_ids)):
        if i not in result_documents_ids:
            response_documents.remove(result_documents_ids[i])
else:
    response_documents.clear()

if len(response_documents) == 0:
    vector_db_response = "НЕТ ИНФОРМАЦИИ! ОТВЕТ НА ВОПРОС: Я не могу ответить на ваш вопрос."
else:
    vector_db_response = " ".join(response_documents)

print(f'============QUESTION:============\n{question}')
print(f'============RESPONSE:============\n{vector_db_response}')

Как восстановить пароль?
НЕТ ИНФОРМАЦИИ! ОТВЕТ НА ВОПРОС: Я не могу ответить на ваш вопрос.


# <span style="color:orange">**=== LLM ===**</span>

In [10]:
import torch
from peft import PeftModel, PeftConfig
from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig

In [57]:
MODEL_NAME = "IlyaGusev/saiga_mistral_7b"
config = PeftConfig.from_pretrained(MODEL_NAME)
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


In [58]:
# SYSTEM_PROMPT = f"""You are a friendly chatbot assistant that responds in a conversational manner to users' questions. \
# Response in 1-2 complete sentences, unless specifically asked by the user to elaborate on something. \
# Use Context only to inform your answers. \
# If you can't find relevant information in the context say that you don't know the answer."""
# SYSTEM_PROMPT = "Ты - злой пират. Отвечай как злобный пират!"
# SYSTEM_PROMPT = "Ты - высокомерный ученый. Отвечай только на вопросы, связанные с наукой и ни на что больше"
# SYSTEM_PROMPT = "Ты - трехлетний ребенок. Отвечай как трехлетний ребенок и только на те вопросы, которые способен знать ребенок в возрасте трех лет."
SYSTEM_PROMPT = f"Ты - доброжелательный русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только следующую данную тебе информацию.\nИнформация: {vector_db_response}"


# QUESTION = 'Привет, как тебя зовут?'
# QUESTION = 'Почему?'
# QUESTION = 'Что такое нейтрон?'
# QUESTION = 'Напиши короткий рассказ, в котором должны быть слова "Таня", "Мяч"'
# QUESTION = 'what gave monopoly to british ships?'
# QUESTION = 'Tell me a story about sunshine'
QUESTION = question


chat = [
   {"role": "system", "content": f"{SYSTEM_PROMPT}"},
    {"role": "user", "content": f"{QUESTION}"},
    {"role": "assistant", "content":""}
]

# SYSTEM_PROMPT = f"Ты - русскоязычный ассистент Сайга. Тебе показывается важная информация и вопрос человека, на который ты должен дать ответ, используя информацию. Если в предоставленной информации нет ответа, то скажи что ты не можешь ответить на вопрос."
# chat = [
#    {"role": "system", "content": f"{SYSTEM_PROMPT}"},
#     {"role": "user", "content": f"Информация: {vector_db_response}\nВопрос:\n{QUESTION}"},
#     {"role": "assistant", "content":""}
# ]

tokenizer.bos_token = "<s>"
tokenizer.eos_token = "</s>"
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = 'right' # ???

input_message = ""
for i in chat:
    input_message += tokenizer.bos_token + i['role'] + '\n' + i['content'] + tokenizer.eos_token + '\n'

input_message = input_message[:-5].strip() + "\n"
print(input_message)

<s>system
Ты - доброжелательный русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только следующую данную тебе информацию.
Информация: Чтобы настроить или отключить рассылки, откройте «Профиль» в личном кабинете и зайдите в раздел «Уведомления».
Также вы можете написать по адресу info@stoloto.ru или в чат поддержки. Сообщите консультанту почту или номер телефона, на которые вы больше не хотите получать рассылки.
Лотереи бывают тиражными и бестиражными (моментальными). Тиражной называется лотерея, в которой розыгрыш призового фонда между всеми участниками проводится единовременно после распространения лотерейных билетов. Проведение такой лотереи может включать в себя отдельные тиражи. Изменить имя и пароль вы можете в своем личном кабинете (раздел «Профиль»).
Если вы забыли пароль, воспользуйтесь службой восстановления. В отправленном вам письме будет ссылка на смену пароля.
Логин изменить невозможно. Логин есть у тех пользователей, кто зарегистрировался на сай

---

In [62]:
tokenizer.bos_token = "<s>"
tokenizer.eos_token = "</s>"
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = 'left' # ???

SYSTEM_PROMPT = f"Ты - доброжелательный русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только следующую данную тебе информацию.\nИнформация: {vector_db_response}"
# QUESTION = "Что такое трансгуманизм?"
QUESTION = "ваши лотереи это лохотрон!!!"

chat = [
   {"role": "system", "content": f"{SYSTEM_PROMPT}"},
    {"role": "user", "content": f"{QUESTION}"},
    {"role": "assistant", "content":""}
]

input_message = ""
for i in chat:
    input_message += tokenizer.bos_token + i['role'] + '\n' + i['content'] + tokenizer.eos_token + '\n'

input_message = input_message[:-5].strip() + "\n"
print(input_message)

<s>system
Ты - доброжелательный русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только следующую данную тебе информацию.
Информация: Чтобы настроить или отключить рассылки, откройте «Профиль» в личном кабинете и зайдите в раздел «Уведомления».
Также вы можете написать по адресу info@stoloto.ru или в чат поддержки. Сообщите консультанту почту или номер телефона, на которые вы больше не хотите получать рассылки.
Лотереи бывают тиражными и бестиражными (моментальными). Тиражной называется лотерея, в которой розыгрыш призового фонда между всеми участниками проводится единовременно после распространения лотерейных билетов. Проведение такой лотереи может включать в себя отдельные тиражи. Изменить имя и пароль вы можете в своем личном кабинете (раздел «Профиль»).
Если вы забыли пароль, воспользуйтесь службой восстановления. В отправленном вам письме будет ссылка на смену пароля.
Логин изменить невозможно. Логин есть у тех пользователей, кто зарегистрировался на сай

---

In [13]:
config = PeftConfig.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(
    config.base_model_name_or_path,
    # load_in_8bit=True,
    # load_in_4bit=True,
    torch_dtype=torch.float16,
    device_map="cuda"
)
model = PeftModel.from_pretrained(
    model,
    MODEL_NAME,
    torch_dtype=torch.float16,
    device_map="cuda"
)

# tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
model.eval()

Loading checkpoint shards: 100%|██████████| 2/2 [01:44<00:00, 52.36s/it]


PeftModelForCausalLM(
  (base_model): LoraModel(
    (model): MistralForCausalLM(
      (model): MistralModel(
        (embed_tokens): Embedding(32002, 4096)
        (layers): ModuleList(
          (0-31): 32 x MistralDecoderLayer(
            (self_attn): MistralAttention(
              (q_proj): lora.Linear(
                (base_layer): Linear(in_features=4096, out_features=4096, bias=False)
                (lora_dropout): ModuleDict(
                  (default): Dropout(p=0.05, inplace=False)
                )
                (lora_A): ModuleDict(
                  (default): Linear(in_features=4096, out_features=16, bias=False)
                )
                (lora_B): ModuleDict(
                  (default): Linear(in_features=16, out_features=4096, bias=False)
                )
                (lora_embedding_A): ParameterDict()
                (lora_embedding_B): ParameterDict()
              )
              (k_proj): lora.Linear(
                (base_layer): Linear(in_featu

In [15]:
model = model.merge_and_unload() #  ОБЯЗАТЕЛЬНО!!!

In [63]:
from transformers import GenerationConfig

generation_config = GenerationConfig(
  bos_token_id = 1,
  do_sample = True,
  eos_token_id = 2,
  max_length = 1024,
  repetition_penalty=1.1,
  # length_penalty=0.1,
  no_repeat_ngram_size=15,
  pad_token_id = 2,
  temperature = 0.2,
  # top_p = 0.9,
  # top_k= 40,
  # low_memory=True
)

In [64]:
input_data = tokenizer(input_message, return_tensors="pt", add_special_tokens=False)
input_data = {k: v.to("cuda:0") for k, v in input_data.items()}

output_data = model.generate(
    **input_data,
    generation_config = generation_config
)[0]

output_data = output_data[len(input_data["input_ids"][0]):]

In [65]:
output_message = tokenizer.decode(output_data, skip_special_tokens=True)
print(output_message)

Ваше мнение о лотереях является субъективным и может отличаться от мнений других людей. Лотереи являются формой игр счастья, где победители определяются случайным образом. Они также служат для собирания средств для благотворительных целей и государственного бюджета.

Однако, важно понимать, что играть в лотереи – это риск, и вы должны готовы к тому, что можете потерять свои деньги. Не стоит тратить на лотереи больше денег, чем вы можете позволить себе потерять.


# множество вопросов

In [75]:
questions_list = ['Где надо вводить код выигрыша',
 'Здравствуйте,  почему не выводится сумма выиграша с кошелька?',
 'Добрый день , какая то проблема с выводом средств из кошелька , пишет что перечислено , но не перечисляет  и деньги остаются в кошелке',
 'Здравствуйте почему не могу купить билет оплатив его с кошелька столото?',
 'Позови оператора',
 'Добрый вечер! Не подскажите где выигрыш , 170 руб? Переводил его в кошелек и куда то пропали деньги',
 'Добрый день, У меня в кошельке 313 р. Почему я не могу купить билет?',
 'Добрый день!, Меня интересует сколько денег я потратила на билеты всего за все время, Я третий раз пишу, почему мне не отвечают до сих пор, ??????',
 'Здравствуйте. Почему в разделе победители у всех аватарки одинаковые, фон однотонный цвет, только сам цвет меняется?'
 ]

In [67]:
questions_list = [
    "Если я иностранец, то могу ли участвовать в лотереях?",
    "Расскажи мне про лотерею Забава",
    "Как не стать жертвой мошенников?",
    "Куда потратить бонусы?",
    "Как отключить рекламные письма или рассылки?",
    "Как сменить логин?"
]

In [76]:
for question in questions_list:
    response = collection.query(
    # query_embeddings=embedding_function(question),
    query_texts=[question],
    n_results=2,
    # include=["documents"],
    # where={"metadata_field":"is_equal_to_this"}, # где искать
    # where_document={"$contains":"$search_string"}
    )

    vector_db_response = " ".join(response["documents"][0])

    SYSTEM_PROMPT = f"Ты - русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только следующую данную тебе информацию.\nИнформация: {vector_db_response}"
    QUESTION = question

    chat = [
        {"role": "system", "content": f"{SYSTEM_PROMPT}"},
        {"role": "user", "content": f"{QUESTION}"},
        {"role": "assistant", "content": ""}
    ]
    
    input_message = ""
    for i in chat:
        input_message += tokenizer.bos_token + i['role'] + '\n' + i['content'] + tokenizer.eos_token + '\n'

    input_message = input_message[:-5].strip() + "\n"

    input_data = tokenizer(input_message, return_tensors="pt", add_special_tokens=False)
    input_data = {k: v.to("cuda") for k, v in input_data.items()}

    output_data = model.generate(
        **input_data,
        generation_config = generation_config
    )[0]

    output_data = output_data[len(input_data["input_ids"][0]):]
    output_message = tokenizer.decode(output_data, skip_special_tokens=True)

    print(f"ВОПРОС: {question}")
    print(f"==========================")
    print(f"Ответ ассистента: {output_message}")
    print(f"==========================")
    print("\n")

ВОПРОС: Где надо вводить код выигрыша
Ответ ассистента: Код выигрыша обычно вводится на специальном сайте или в мобильном приложении лотереи. Этот код можно найти на обратной стороне билета или в сообщении с результатами розыгрыша. После ввода кода выигрыша, система проверяет его и, если он совпадает с кодом выигрыша, то вы получаете свой приз.


ВОПРОС: Здравствуйте,  почему не выводится сумма выиграша с кошелька?
Ответ ассистента: В "КЕНО-Спортлото" выигрыши второго тура фиксированы. Человек может получить выигрыш только в случае, если он угадал все числа, которые были в первом туре. Если человек угадал все числа, то он получает выигрыш, который был зафиксирован ранее. Сумма выигрыша не выводится с кошелька, так как она была зафиксирована ранее и не меняется.


ВОПРОС: Добрый день , какая то проблема с выводом средств из кошелька , пишет что перечислено , но не перечисляет  и деньги остаются в кошелке
Ответ ассистента: Вывод средств из кошелька может зависеть от нескольких факторов. 

# langchain

In [1]:
import torch
from peft import PeftModel, PeftConfig
from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig

MODEL_NAME = "IlyaGusev/saiga_mistral_7b"
config = PeftConfig.from_pretrained(MODEL_NAME)
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)

model = AutoModelForCausalLM.from_pretrained(
    config.base_model_name_or_path,
    load_in_8bit=True,
    torch_dtype=torch.float16,
    device_map="cuda"
)
model = PeftModel.from_pretrained(
    model,
    MODEL_NAME,
    torch_dtype=torch.float16,
    device_map="cuda"
)
model = model.merge_and_unload() #  ОБЯЗАТЕЛЬНО!!!
# tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
model.eval()

  from .autonotebook import tqdm as notebook_tqdm
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
  return self.fget.__get__(instance, owner)()
Loading checkpoint shards: 100%|██████████| 2/2 [00:23<00:00, 11.62s/it]
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


PeftModelForCausalLM(
  (base_model): LoraModel(
    (model): MistralForCausalLM(
      (model): MistralModel(
        (embed_tokens): Embedding(32002, 4096)
        (layers): ModuleList(
          (0-31): 32 x MistralDecoderLayer(
            (self_attn): MistralAttention(
              (q_proj): lora.Linear8bitLt(
                (base_layer): Linear8bitLt(in_features=4096, out_features=4096, bias=False)
                (lora_dropout): ModuleDict(
                  (default): Dropout(p=0.05, inplace=False)
                )
                (lora_A): ModuleDict(
                  (default): Linear(in_features=4096, out_features=16, bias=False)
                )
                (lora_B): ModuleDict(
                  (default): Linear(in_features=16, out_features=4096, bias=False)
                )
                (lora_embedding_A): ParameterDict()
                (lora_embedding_B): ParameterDict()
              )
              (k_proj): lora.Linear8bitLt(
                (base_layer

In [15]:
from transformers import GenerationConfig

tokenizer.bos_token = "<s>"
tokenizer.eos_token = "</s>"

generation_config = GenerationConfig(
  bos_token_id = 1,
  do_sample = True,
  eos_token_id = 2,
  max_length = 2048,
  repetition_penalty=1.1,
  no_repeat_ngram_size=15,
  pad_token_id = 0,
  temperature = 0.1,
  top_p = 0.9
)

### <span style="color:orange">**=== vol.1 ===**</span>

In [289]:
from langchain import PromptTemplate

template = "Ты - русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только данную тебе информацию. Не пытайся придумать ответ.\nИнформация: {context}\nВопрос:{question}\nОтвет:"
prompt = PromptTemplate.from_template(template)
prompt

PromptTemplate(input_variables=['context', 'question'], template='Ты - русскоязычный ассистент Изя. Ты отвечаешь на вопрос пользователя, используя только данную тебе информацию. Не пытайся придумать ответ.\nИнформация: {context}\nВопрос:{question}\nОтвет:')

In [290]:
from chromadb.config import Settings
from chromadb.utils import embedding_functions
from transformers import pipeline
from langchain.llms import HuggingFacePipeline
from langchain.chains import RetrievalQA
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.vectorstores import Chroma
import numpy as np
import os 
import chromadb

embedding_function = embedding_functions.SentenceTransformerEmbeddingFunction(model_name="sentence-transformers/all-MiniLM-L6-v2")

chroma_client = chromadb.HttpClient(settings=Settings(
    allow_reset=True,
    chroma_api_impl='chromadb.api.fastapi.FastAPI',
    chroma_server_host='localhost',
    chroma_server_http_port='8000')
)
collection = chroma_client.get_collection(name="book", embedding_function=embedding_function)

pipe = pipeline(
        'text-generation',
        model = model,
        tokenizer = tokenizer,
        generation_config=generation_config
    )
llm = HuggingFacePipeline(pipeline=pipe)

embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")

db = Chroma(client=chroma_client,
            collection_name='book',
            embedding_function=embeddings)

retriever = db.as_retriever()

qa = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type='stuff',
    retriever=retriever,
    return_source_documents=True,
    chain_type_kwargs={"prompt": prompt}
)

In [291]:
print(generation_config)
generated_text = qa.invoke({"query": question})

print(f"============QUESTION:============\n{generated_text['query']}\n")
print(f"============RESPONSE:============\n{generated_text['result']}")

GenerationConfig {
  "bos_token_id": 1,
  "do_sample": true,
  "eos_token_id": 2,
  "max_length": 1024,
  "no_repeat_ngram_size": 15,
  "pad_token_id": 0,
  "repetition_penalty": 1.1,
  "temperature": 0.9,
  "top_k": 40,
  "top_p": 0.9
}

Если я иностранец, то могу ли участвовать в лотереях?

 Если вы иностранный гражданин, которые достигли 18-летнего возраста и обладаете необходимой для участия в лотерее способностью (дееспособность), то да, вы можете участвовать в лотерее.


In [292]:
print(generation_config)

questions_list = [
    "Если я иностранец, то могу ли участвовать в лотереях?",
    "Расскажи мне про лотерею Забава",
    "Как не стать жертвой мошенников?",
    "Куда потратить бонусы?",
    "Как отключить рекламные письма или рассылки?",
    "Как сменить логин?"
]

for question in questions_list:
    generated_text = qa.invoke({"query": question})

    print(f"ВОПРОС: {generated_text['query']}")
    print(f"==========================")
    print(f"Ответ ассистента: {generated_text['result']}")
    print(f"==========================")
    print("\n")

GenerationConfig {
  "bos_token_id": 1,
  "do_sample": true,
  "eos_token_id": 2,
  "max_length": 1024,
  "no_repeat_ngram_size": 15,
  "pad_token_id": 0,
  "repetition_penalty": 1.1,
  "temperature": 0.9,
  "top_k": 40,
  "top_p": 0.9
}



ВОПРОС: Если я иностранец, то могу ли участвовать в лотереях?
Ответ ассистента:  Да, вы можете. Если вы дееспособны и достигли возраста 20 лет (в зависимости от страны).


ВОПРОС: Расскажи мне про лотерею Забава
Ответ ассистента:  
Забава от Русского лото это интерактивная лотерея, где участники могут быть вовлечены не только в процессе определения обладателей главного и второго призов, но и получить возможность выиграть суперприз.


ВОПРОС: Как не стать жертвой мошенников?
Ответ ассистента:  
1. Разберитесь, есть ли у этой организации лицензия. Если у вас есть сомнения, обратитесь в регуляторные органы и проверьте.
2. Не давайте незнакомцам доступ к вашей личной информации, ключу от банковской карты или PIN-коду.
3. Никто не может гарантировать выигрыш без участия, поэтому, чтобы не стать жертвой мошенников, лучше всего позабыть о выигрышах в лотереях и схемах разного рода.
4. Если вы получили звонок, письмо или еще что-то, связанное с выигрышем, проверьте рекламные платформы и другие