## RAGAS для оценки метрики

### Библиотеки

In [2]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.embeddings.gigachat import GigaChatEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from baserag import *
from necessity import *

# LangSmith
os.environ["LANGCHAIN_PROJECT"] = "Base_RAG_GPT"

## Собираем базовый RAG

Шаблон промта для всех дальнейших вопросов / контекстов / отвтветов

In [3]:
prompt = ChatPromptTemplate.from_template("""Вы являетесь помощником в выполнении поиска ответов на вопросы. Используйте приведенные ниже фрагменты извлеченного контекста, чтобы ответить на вопрос. Если вы не знаете ответа, просто скажите, что вы не знаете.
        Question: {question} 
        Context: {context} 
        Answer:""")

In [4]:
# from langchain_community.llms import GigaChat
# llm = GigaChat(model='GigaChat-Plus', verify_ssl_certs=False, scope="GIGACHAT_API_PERS")

embeddings_model = OpenAIEmbeddings()
llm = ChatOpenAI(model_name="gpt-3.5-turbo-0125")

In [5]:
rag = BaseRag(
    llm = llm,
    embeddings_model = embeddings_model,
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000),
    prompt = prompt
)

Собираем единый документ из всех "Пользовательских соглашений"

In [6]:
from langchain_community.document_loaders import PyPDFLoader

folder_path = "/Users/anastasia/Desktop/ML/Диплом/data/Пользовательское соглашение Тинькофф"
docs = []

for filename in os.listdir(folder_path):
    if filename.endswith(".pdf"):
        loader = PyPDFLoader(os.path.join(folder_path, filename))
        docs.extend(loader.load())

In [9]:
rag.chanking_data(docs)

[Document(page_content='3 из 10Меры безопасности при использовании карты\nИспользование карты будет безопасным, если Вы постараетесь следовать простым правилам, приведенным в\xa0этом \nразделе . Пожалуйста, не\xa0забудьте также внимательно ознакомиться с\xa0разделом «Что такое ПИН-код и\xa0как обеспечить его \nконфиденциальность» .\n• После получения карты поставьте свою подпись в\xa0прямоугольнике, расположенном на\xa0оборотной стороне карты . При \nотсутствии подписи карта может быть не\xa0принята к\xa0оплате в\xa0торгово-сервисном предприятии, а\xa0также повышается \nриск использования карты злоумышленниками в\xa0случае ее утраты/кражи .\n• Обращайтесь с\xa0картой также аккуратно и\xa0бережно, как и\xa0с наличными денежными средствами . Храните карту \nв\xa0безопасном месте, не\xa0оставляйте ее в\xa0автомобиле, в\xa0номере гостиницы, а\xa0также в\xa0местах, где посторонние имеют \nвозможность взять карту, скопировать информацию, указанную на\xa0карте .\n• Никогда не\xa0принимайте ре

In [11]:
# Создание цепочки
rag.chain()

In [12]:
rag('Как получить карту?')

'Чтобы получить карту, вам необходимо обратиться в банк.'

## Загрузка Датасета

In [14]:
import pandas as pd

df = pd.read_csv('/Users/anastasia/Desktop/ML/Диплом/dataset.csv')
display(df)

Unnamed: 0,question,contexts,ground_truth
0,Можно ли не расписываться на карте?,['После получения карты поставьте свою подпись...,При отсутствии подписи карта может быть не при...
1,Мой друг попросил меня дать свою карту для опл...,"['Никогда не принимайте рекомендации, советы, ...","Не передавайте карту другим лицам, в т.ч. родс..."
2,Безопасно ли хранить пинкод в заметках в телеф...,['Категорически запрещается записывать ПИН-код...,"Да, однако не указывайте в названии заметки, ч..."
3,Я потеряла карту,[' Вы потеряли карту или ее украли\nПрежде все...,"Если вы не уверены, что карту украли, не спеши..."
4,Почему при использовании карты важно не распис...,"['Проверяйте правильность суммы, указанной на ...",Важно проверять правильность суммы перед подпи...
5,"Что делать, если я потеряла телефон, на которо...","['При утрате Мобильного телефона, используемог...",Если вы потеряли телефон с установленным мобил...
6,Можно ли использовать интернет-кафе и другие о...,['Избегайте осуществления Интернет-операций с ...,"Нет, не рекомендуется использовать интернет-ка..."
7,"Что делать, если я получил SMS-оповещение о оп...","['Если Вы уверены, что операция не могла быть ...","Если вы получили SMS-оповещение о операции, ко..."
8,Как обезопасить себя от съема данных карты в б...,"['Поэтому, при пользовании банкоматом не ленит...",Чтобы обезопасить себя от съема данных карты в...
9,"Правда ли, что при бронировании гостиницы по к...",['При бронировании номера в гостинице по карте...,"Нет, неправда. При бронировании гостиницы по к..."


## Ответы базового RAG на вопросы из датасета

In [15]:
df['answer'] = df['question'].apply(lambda x: rag(x.strip()))

In [16]:
display(df)

Unnamed: 0,question,contexts,ground_truth,answer
0,Можно ли не расписываться на карте?,['После получения карты поставьте свою подпись...,При отсутствии подписи карта может быть не при...,"Да, можно не расписываться на карте при возвра..."
1,Мой друг попросил меня дать свою карту для опл...,"['Никогда не принимайте рекомендации, советы, ...","Не передавайте карту другим лицам, в т.ч. родс...","Вам следует быть осторожным, если ваш друг пр..."
2,Безопасно ли хранить пинкод в заметках в телеф...,['Категорически запрещается записывать ПИН-код...,"Да, однако не указывайте в названии заметки, ч...","Нет, не безопасно хранить ПИН-код в заметках в..."
3,Я потеряла карту,[' Вы потеряли карту или ее украли\nПрежде все...,"Если вы не уверены, что карту украли, не спеши...","Свяжитесь с банком, который установил банкомат..."
4,Почему при использовании карты важно не распис...,"['Проверяйте правильность суммы, указанной на ...",Важно проверять правильность суммы перед подпи...,При использовании карты важно не расписываться...
5,"Что делать, если я потеряла телефон, на которо...","['При утрате Мобильного телефона, используемог...",Если вы потеряли телефон с установленным мобил...,"Если вы потеряли телефон, на котором было уста..."
6,Можно ли использовать интернет-кафе и другие о...,['Избегайте осуществления Интернет-операций с ...,"Нет, не рекомендуется использовать интернет-ка...","Нет, не рекомендуется использовать интернет-ка..."
7,"Что делать, если я получил SMS-оповещение о оп...","['Если Вы уверены, что операция не могла быть ...","Если вы получили SMS-оповещение о операции, ко...",Если вы получили SMS-оповещение о операции по ...
8,Как обезопасить себя от съема данных карты в б...,"['Поэтому, при пользовании банкоматом не ленит...",Чтобы обезопасить себя от съема данных карты в...,1. Поставьте свою подпись на оборотной стороне...
9,"Правда ли, что при бронировании гостиницы по к...",['При бронировании номера в гостинице по карте...,"Нет, неправда. При бронировании гостиницы по к...",При бронировании гостиницы по карте необходимо...


In [17]:
df.to_csv('/Users/anastasia/Desktop/ML/Диплом/rag_answer/base_rag/base_rag_gpt.csv', index=False)