In [39]:
import getpass
import os
from dotenv import find_dotenv, load_dotenv

load_dotenv(find_dotenv())

if "GIGACHAT_CREDENTIALS" not in os.environ:
    os.environ["GIGACHAT_CREDENTIALS"] = getpass.getpass("Введите ключ авторизации GigaChat API: ")

from langchain_gigachat.chat_models import GigaChat

llm = GigaChat(verify_ssl_certs=False, temperature=0.0)

In [26]:
from langchain.schema import HumanMessage

question = "N 63-ФЗ \"Об электронной подписи\""
llm.invoke([HumanMessage(content=question)]).content[0:200]

'Федеральный закон №\xa063-ФЗ от 06 апреля 2011 года — **«О внесении изменений в отдельные законодательные акты Российской Федерации в связи с принятием Федерального закона „Об электронной подписи”**».\n\nН'

In [9]:
list_of_files = [
'Положение Банка России от 30 января 2025 г N 851 П Об установлении обязательных .pdf',
'Приказ ФАПСИ от 13 июня 2001 г N 152 Об утверждении Инструкции об организации и .pdf',
'Приказ ФСБ РФ от 27 декабря 2011 г N 795 Об утверждении Требований к форме квали.pdf',
'Приказ ФСБ РФ от 27 декабря 2011 г N 796 Об утверждении Требований к средствам э.pdf',
'Приказ ФСБ РФ от 9 февраля 2005 г N 66 Об утверждении Положения о разработке про.pdf',
'Федеральный закон от 27 июля 2006 г N 152 ФЗ О персональных данных с изменениями.pdf',
'Федеральный закон от 6 апреля 2011 г N 63 ФЗ Об электронной подписи с изменениям.pdf']

In [None]:
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import (
    RecursiveCharacterTextSplitter,
)

loader = PyPDFLoader("doc_files/" + list_of_files[0])
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
)
documents = text_splitter.split_documents(documents)
print(f"Total documents: {len(documents)}")

Total documents: 106


In [44]:
from langchain_gigachat.embeddings.gigachat import GigaChatEmbeddings

from chromadb.config import Settings
from langchain_chroma import Chroma

embeddings = GigaChatEmbeddings(verify_ssl_certs=False)

vectorstore = Chroma.from_documents(
    documents,
    embeddings,
    client_settings=Settings(anonymized_telemetry=False),
)

retriever = vectorstore.as_retriever()

In [45]:
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate

system_prompt = (
    "Ты должен ответить на вопрос пользователя с использованием данных из банковских документов.\n"
    "Вот части книги контекст для ответа:"
    "\n\n"
    "{context}"
)

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_prompt),
        ("human", "{input}"),
    ]
)


question_answer_chain = create_stuff_documents_chain(llm, prompt)
rag_chain = create_retrieval_chain(retriever, question_answer_chain)

In [48]:
q = "Для каких целей нужно обеспечить использование усиленной неквалифицированной электронной подписи?"
# pure = llm([HumanMessage(content=q)]).content
# print(f"Pure: {pure}")

rag = rag_chain.invoke({"input": q})["answer"]
print(f"RAG: {rag}")

RAG: Использование усиленной неквалифицированной электронной подписи необходимо обеспечить для следующих целей:

- Подтверждение составления электронных сообщений уполномоченным на это лицом;
- Обеспечение целостности электронных сообщений при их передаче кредитными организациями и филиалами иностранных банков.
