In [9]:
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from typing import List
from langchain_core.documents import Document

def load_and_chunk_documents(file_path: str) -> List:
    """
    Загружает документ из файла и разбивает его на чанки.
    """
    loader = TextLoader(file_path, encoding='utf-8')
    documents = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1600,
        chunk_overlap=200,
        separators=[
            "\n# ", "\n## ", "\n- ", "\n\n", "\n", " ", ""
        ]
    )
    chunked_docs = text_splitter.split_documents(documents)
    print(f"Документ '{file_path}' разбит на {len(chunked_docs)} чанков.")
    return chunked_docs

In [10]:
chunked_docs = load_and_chunk_documents("data/docs.md")

Документ 'data/docs.md' разбит на 10 чанков.


In [11]:
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma
from typing import List
from langchain_core.documents import Document
import os
import shutil
from dotenv import load_dotenv

def create_vector_store(chunked_docs: List, collection_name: str = "credit_platform_docs"):
    """
    Создает векторное хранилище из чанков документов.
    """
    persist_dir = "chroma_db"
    if os.path.exists(persist_dir):
        shutil.rmtree(persist_dir)

    # Загрузка переменных окружения из .env
    load_dotenv()

    embeddings = OpenAIEmbeddings(
        model="text-embedding-3-small"
    )

    vector_store = Chroma.from_documents(
        documents=chunked_docs,
        embedding=embeddings,
        collection_name=collection_name,
        persist_directory=persist_dir
    )

    print(f"Векторное хранилище '{collection_name}' создано и содержит {len(vector_store.get()['ids'])} документов.")
    return vector_store

In [12]:
vector_store = create_vector_store(chunked_docs, "p2p_agent_db")

PermissionError: [WinError 32] Процесс не может получить доступ к файлу, так как этот файл занят другим процессом: 'chroma_db\\eca6f4ae-ca4f-4a4a-b157-ac5b8c20112f\\data_level0.bin'

In [None]:
# Файл: tools/qa_tool.py
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv
import os
from langchain_chroma import Chroma


# Шаблон промпта, который инструктирует модель
RAG_PROMPT_TEMPLATE = """
Ты — дружелюбный ассистент, отвечающий по вопросам взаимного кредитования. 
Используй предоставленный ниже контекст, чтобы ответить на вопрос пользователя. Ответь коротко и по существу, дружелюбным тоном. 
Не пересказывай весь документ, а приведи только ту информацию, что отвечает на вопрос пользователя. 
Не добавляй информацию вне предоставленного контекста.
Не включай личные мнения, только факты
Не повторяй вопрос и не перечисляй пункты, если об этом не просили. 

Контекст:
{context}

Вопрос:
{question}

Ответ:
"""


def format_docs(docs):
    """
    Форматирует список документов в единую строку.
    """
    return "\n\n".join(doc.page_content for doc in docs)

def create_qa_rag_chain(vector_store: Chroma):
    # Загрузка переменных окружения из .env
    load_dotenv()
    openai_api_key = os.getenv("OPENAI_API_KEY")

    retriever = vector_store.as_retriever(search_kwargs={"k": 2})

    llm = ChatOpenAI(
        model="gpt-3.5-turbo",
        temperature=0.2,
        openai_api_key=openai_api_key
    )
    prompt = ChatPromptTemplate.from_template(RAG_PROMPT_TEMPLATE)

    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )
    return rag_chain

In [None]:
p2p_agent_executor = create_qa_rag_chain(vector_store)

In [None]:
print("\n--- Тест 1 ---")
response1 = p2p_agent_executor.invoke("Какие у вас гарантии безопасности?")
print("Ответ интеллектуального агента:", response1)


--- Тест 1 ---
Ответ интеллектуального агента: Смарт-контракты DeFi Credit аудируются экспертами и имеют открытую логику. Ваша криптовалюта хранится под вашим контролем (в смарт-контракте), и для операций требуется ваша подпись. Мы не храним ваши пароли или приватные ключи. Кроме того, из-за принципа over-collateralization ваша долговая нагрузка надёжно покрывается залогом.


In [None]:
# print("\n--- Тест 2 ---")
# response2 = p2p_agent_executor.invoke("Хочу вложить 3000eth на 3 месяца и на 1000usdt")
# print("Ответ интеллектуального агента:", response2)


--- Тест 2 ---
Ответ интеллектуального агента: Извините, но наша платформа DeFi Credit работает только с USDT (стабильная монета), а не с ETH. Вы можете вложить 1000 USDT на 3 месяца, предоставив ETH в качестве залога.
