In [2]:
import os
import random
import chromadb
import numpy as np
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.llms import LlamaCpp

In [3]:
import pickle
with open('recipe_str.pickle', 'rb') as handle:
    recipe_str = pickle.load(handle)

In [4]:
import random
recipe_str = random.sample(recipe_str, 500)

In [5]:
with open("recipes.txt", "w") as output_file:
    print("\n".join(recipe_str), file=output_file)

In [6]:
# 1️⃣ Загружаем рецепты
recipe_file = "recipes.txt"
loader = TextLoader(recipe_file, encoding="utf-8")
documents = loader.load()

In [7]:
# 2️⃣ Разбиваем текст для улучшения поиска
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
docs = text_splitter.split_documents(documents)

# 3️⃣ Векторное хранилище (ChromaDB)
embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", cache_folder="/workspace")
db = Chroma.from_documents(docs, embedding_model, persist_directory="./chroma_db")  # vector_store
db.persist()

  embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", cache_folder="/workspace")
  from .autonotebook import tqdm as notebook_tqdm
  db.persist()


In [8]:
retriever = db.as_retriever(search_kwargs={"k": 3})  # Топ-3 рецепта

In [10]:
# # 4️⃣ Подключаем LLaMA
# llama_model_path = "microsoft/Phi-3.5-mini-instruct"

# llm = LlamaCpp(
#     model_path=llama_model_path,
#     temperature=0.7,
#     max_tokens=512,
#     n_ctx=2048
# )
from transformers import AutoTokenizer, AutoModelForCausalLM
from huggingface_hub import login

TOKEN="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"
login(token=TOKEN)
# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3.5-mini-instruct", token=TOKEN, cache_dir="/workspace")
model = AutoModelForCausalLM.from_pretrained("microsoft/Phi-3.5-mini-instruct", token=TOKEN, cache_dir="/workspace")

Loading checkpoint shards: 100%|██████████| 2/2 [00:34<00:00, 17.30s/it]


In [12]:
# Example input
input_text = "Какая столица Франции?"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(inputs['input_ids'])

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Какая столица Франции? Париж, Париж, Париж. Париж - это столица Франции и извест


In [13]:
from langchain.chains import create_retrieval_chain
from langchain.chains.question_answering import load_qa_chain
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.chains.history_aware_retriever import create_history_aware_retriever
prompt = ChatPromptTemplate.from_messages([
        MessagesPlaceholder(variable_name="chat_history"),
        ("user", "{input}"),
        ("user", "Учитывая приведенный выше разговор, создайте поисковый запрос для поиска информации, релевантной разговору.")
    ])

    # Create the chain element which will fetch the relevant content from ChromaDB
chain_element = create_history_aware_retriever(model, retriever, prompt)

In [14]:
from langchain.chains.combine_documents import create_stuff_documents_chain
prompt = ChatPromptTemplate.from_messages([
    ("system", "Вы полезный помощник, который может ответить на вопросы пользователей. Используйте предоставленный контекст, чтобы ответить на вопрос как можно точнее.:\n\n{context}"),
    MessagesPlaceholder(variable_name="chat_history"),
    ("user", "{input}")
])

# This method creates a chain for passing documents to a LLM
docs_chain = create_stuff_documents_chain(model, prompt)

# Now we merge the context chain & docs chain to form the full prompt
rag_chain = create_retrieval_chain(chain_element, docs_chain)

In [15]:
# 5️⃣ DeepSeek-R1: Улучшение результатов
def deepseek_r1_optimization(query):
    results = retriever.get_relevant_documents(query)
    optimized = sorted(results, key=lambda x: len(x.page_content))  # Сортируем по длине
    return optimized

In [16]:
# 6️⃣ Генерация рецептов в детерминированном и недетерминированном режимах
def generate_recipe(query, mode="deterministic"):
    optimized_docs = deepseek_r1_optimization(query)
    
    if mode == "deterministic":
        # Чёткий рецепт без изменений
        response = rag_chain.invoke({
        "chat_history": [],
        "input": query
    })
    
    elif mode == "nondeterministic":
        # Стохастическая модификация ингредиентов
        response = rag_chain.invoke({
        "chat_history": [],
        "input": query
    })
        
        # Простая замена ингредиентов на случайные
        random.seed(42)
        variations = {
            "молоко": ["овсяное молоко", "миндальное молоко", "кокосовое молоко"],
            "сахар": ["мёд", "кленовый сироп", "эритритол"],
            "масло": ["оливковое масло", "кокосовое масло", "сливочное масло"]
        }
        
        for ingr, repl in variations.items():
            if ingr in response:
                response = response.replace(ingr, random.choice(repl))
    
    return response

In [18]:
retriever.get_relevant_documents("Как приготовить блины?")

[Document(metadata={'source': 'recipes.txt'}, page_content='приготовления легкий. Из данного количества ингредиентов получается много креблей, вся семья будет сытой и довольной!'),
 Document(metadata={'source': 'recipes.txt'}, page_content='простой рецепт перловки в микроволновке, - это быстро, вкусно, очень полезно и диетически, а добавленный лук только придаст блюду изюминку.'),
 Document(metadata={'source': 'recipes.txt'}, page_content='холодильнике есть всегда, как и приправа МАГГИ НА ВТОРОЕ. А больше ничего и не понадобится!')]

In [20]:
# Example input
input_text = "Как приготовить блины?"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(inputs['input_ids'])

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Как приготовить блины?

Как приготовить блины на сковороде?

1


In [21]:
res = rag_chain.invoke({
        "chat_history": [],
        "input": "Как приготовить панкейки?"
    })
res["answer"]

TypeError: embedding(): argument 'indices' (position 2) must be Tensor, not ChatPromptValue

In [None]:
# 7️⃣ Запрос в двух режимах
query = "Как приготовить панкейки?"

print("\n🔹 Детерминированный ответ:")
print(generate_recipe(query, mode="deterministic"))

print("\n🔹 Нетерминированный (вариативный) ответ:")
print(generate_recipe(query, mode="nondeterministic"))