In [None]:
!pip install -U langchain
!pip install -U langchain-ollama
!pip install -U langchain-community
!pip install -U chromadb
!pip install -U sentence-transformers tqdm
!pip install -U ragas
!pip install -U datasets
!pip install -U torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

Collecting langchain
  Downloading langchain-0.2.15-py3-none-any.whl.metadata (7.1 kB)
Collecting langchain-core<0.3.0,>=0.2.35 (from langchain)
  Downloading langchain_core-0.2.37-py3-none-any.whl.metadata (6.2 kB)
Collecting langchain-text-splitters<0.3.0,>=0.2.0 (from langchain)
  Downloading langchain_text_splitters-0.2.2-py3-none-any.whl.metadata (2.1 kB)
Collecting langsmith<0.2.0,>=0.1.17 (from langchain)
  Downloading langsmith-0.1.108-py3-none-any.whl.metadata (13 kB)
Collecting tenacity!=8.4.0,<9.0.0,>=8.1.0 (from langchain)
  Downloading tenacity-8.5.0-py3-none-any.whl.metadata (1.2 kB)
Collecting jsonpatch<2.0,>=1.33 (from langchain-core<0.3.0,>=0.2.35->langchain)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl.metadata (3.0 kB)
Collecting httpx<1,>=0.23.0 (from langsmith<0.2.0,>=0.1.17->langchain)
  Downloading httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting orjson<4.0.0,>=3.9.14 (from langsmith<0.2.0,>=0.1.17->langchain)
  Downloading orjson-3.10.7-cp310-cp31

In [None]:
import os
import torch
from langchain.text_splitter import (
    CharacterTextSplitter,
    RecursiveCharacterTextSplitter,
    SentenceTransformersTokenTextSplitter,
    TextSplitter,
    TokenTextSplitter,
)
from langchain_community.document_loaders import TextLoader
from langchain_community.vectorstores import Chroma
from langchain.embeddings import HuggingFaceEmbeddings
from tqdm import tqdm
from ragas.metrics import (
    answer_relevancy,
    faithfulness,
    context_recall,
    context_precision,
)
from ragas import evaluate
import pandas as pd
import time
import logging
from datasets import Dataset

# Define the directory containing the text file
current_dir = os.path.dirname('./')
file_path = os.path.join(current_dir, "hmao_npa.txt")
db_dir = os.path.join(current_dir, "db")

# Check if the text file exists
if not os.path.exists(file_path):
    raise FileNotFoundError(
        f"The file {file_path} does not exist. Please check the path."
    )

# Read the text content from the file
loader = TextLoader(file_path)
documents = loader.load()

# Define the embedding model
device = 'cuda' if torch.cuda.is_available() else 'cpu'
embeddings = HuggingFaceEmbeddings(
    model_name="cointegrated/LaBSE-en-ru",
    model_kwargs={'device': device}
)
store_name = "chroma_db_double_split"
persistent_directory = os.path.join(db_dir, store_name)

rec_char_splitter = RecursiveCharacterTextSplitter(chunk_size=4000, chunk_overlap=100)
docs = rec_char_splitter.split_documents(documents)

print(f"Number of chunks after recursive splitting: {len(docs)}")
print("Creating Store")

db = Chroma.from_documents(
            docs, embeddings, persist_directory=persistent_directory
        )

  embeddings = HuggingFaceEmbeddings(
  from tqdm.autonotebook import tqdm, trange
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/461 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/1.71k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/806 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/516M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/521k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/2.36M [00:00<?, ?B/s]

2_Dense/config.json:   0%|          | 0.00/114 [00:00<?, ?B/s]

  torch.load(os.path.join(input_path, "pytorch_model.bin"), map_location=torch.device("cpu"))


Number of chunks after recursive splitting: 7729
Creating Store


In [None]:
def query_vector_store(
    store_name, query, embedding_function, search_type, search_kwargs
):
    if os.path.exists(persistent_directory):
        print(f"\n--- Querying the Vector Store {store_name} ---")
        db = Chroma(
            persist_directory=persistent_directory,
            embedding_function=embedding_function,
        )
        retriever = db.as_retriever(
            search_type=search_type,
            search_kwargs=search_kwargs,
        )
        relevant_docs = retriever.invoke(query)
        # Display the relevant results with metadata
        print(f"\n--- Relevant Documents for {store_name} ---")
        for i, doc in enumerate(relevant_docs, 1):
            print(f"Document {i}:\n{doc.page_content}\n")
            if doc.metadata:
                print(f"Source: {doc.metadata.get('source', 'Unknown')}\n")
    else:
        print(f"Vector store {store_name} does not exist.")



query = "Как зарплата влияет на мотивацию педагогов?"

print("\n--- Using Max Marginal Relevance (MMR) ---")
query_vector_store(
    store_name,
    query,
    embeddings,
    "similarity",
    {"k": 3},
)


--- Using Max Marginal Relevance (MMR) ---

--- Querying the Vector Store chroma_db_double_split ---

--- Relevant Documents for chroma_db_double_split ---
Document 1:
по формуле: (ЗПпнспо / ЗПнн) * 100, где: ЗПпнспо = {(ФЗПнспо / ЧСПпнспо) / 12} * 1000 ЗПпнспо - среднемесячная заработная плата преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций; ФЗПпнспо - фонд начисленной заработной платы преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций, всего (периодическая отчетность, форма N ЗП-образование); ЧСПпнспо - средняя численность преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций (без внешних совместителей) (периодическая отчетность, форма N ЗП-образование); ЗПнн - среднемесячный доход от трудовой деятельности

In [None]:
!sudo apt-get install -y pciutils
!curl -fsSL https://ollama.com/install.sh | sh # download ollama api
from IPython.display import clear_output

import os
import threading
import subprocess
import requests
import json

def ollama():
    os.environ['OLLAMA_HOST'] = '0.0.0.0:11434'
    os.environ['OLLAMA_ORIGINS'] = '*'
    subprocess.Popen(["ollama", "serve"])
ollama()
# ollama_thread = threading.Thread(target=ollama)
# ollama_thread.start()

from IPython.display import clear_output
!ollama pull owl/t-lite
clear_output()
import time

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM
from langchain_core.messages import HumanMessage, SystemMessage

query = "Как зарплата влияет на мотивацию педагогов?"
retriever = db.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 1},
)
relevant_docs = retriever.invoke(query)

# request(localhost.com)

print("\n--- Relevant Documents ---")
for i, doc in enumerate(relevant_docs, 1):
    print(f"Document {i}:\n{doc.page_content}\n")

combined_input = (
    "Вот несколько документов, которые могут помочь ответить на вопрос: "
    + query
    + "\n\nСоответствующие документы:\n"
    + "\n\n".join([doc.page_content for doc in relevant_docs])
    + "\n\nПожалуйста, предоставьте ответ, основываясь только на предоставленных документах. Если ответ не найден в документах, ответьте 'Я не уверен'."
)

model = OllamaLLM(model="owl/t-lite")

messages = [
    SystemMessage(content="Ты ассистент отвечающий на вопросы по информации которая есть в нормативно-правовых-актах"),
    HumanMessage(content=combined_input),
]

# Invoke the model with the combined input
result = model.invoke(messages)

# Display the full result and content only
print("\n--- Generated Response ---")
# print("Full result:")
# print(result)
print("Content only:")
print(result)


--- Relevant Documents ---
Document 1:
по формуле: (ЗПпнспо / ЗПнн) * 100, где: ЗПпнспо = {(ФЗПнспо / ЧСПпнспо) / 12} * 1000 ЗПпнспо - среднемесячная заработная плата преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций; ФЗПпнспо - фонд начисленной заработной платы преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций, всего (периодическая отчетность, форма N ЗП-образование); ЧСПпнспо - средняя численность преподавателей и мастеров производственного обучения списочного состава (без внешних совместителей) профессиональных образовательных организаций (без внешних совместителей) (периодическая отчетность, форма N ЗП-образование); ЗПнн - среднемесячный доход от трудовой деятельности по автономному округу. Данные рассчитывает Депэкономики Югры, окончательные итоги - Росстат. 6. Отношение среднемесячной заработ

In [None]:
from langchain_ollama import OllamaLLM

model = OllamaLLM(model="owl/t-lite", num_gpu=1)

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM
from langchain_core.messages import HumanMessage, SystemMessage

query = "Как зарплата влияет на мотивацию педагогов?"
retriever = db.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 1},
)
relevant_docs = retriever.invoke(query)

# request(localhost.com)

print("\n--- Relevant Documents ---")
for i, doc in enumerate(relevant_docs, 1):
    print(f"Document {i}:\n{doc.page_content}\n")

combined_input = (
    "Вот несколько документов, которые могут помочь ответить на вопрос: "
    + query
    + "\n\nСоответствующие документы:\n"
    + "\n\n".join([doc.page_content for doc in relevant_docs])
    + "\n\nПожалуйста, предоставьте ответ, основываясь только на предоставленных документах. Если ответ не найден в документах, ответьте 'Я не уверен'."
)

model = OllamaLLM(model="owl/t-lite")

messages = [
    SystemMessage(content="Ты ассистент отвечающий на вопросы по информации которая есть в нормативно-правовых-актах"),
    HumanMessage(content=combined_input),
]

# Invoke the model with the combined input
result = model.invoke(messages)

# Display the full result and content only
print("\n--- Generated Response ---")
# print("Full result:")
# print(result)
print("Content only:")
print(result)

In [None]:
class Evaluator:
    """
    Class for evaluating pipeline on test set.
    """
    def __init__(self, test_set_path: str):
        self.test_data = pd.read_excel(test_set_path).drop(columns=['contexts', 'evolution_type', 'metadata', 'episode_done'])

    def evaluate_pipe(self, pipeline) -> None:
        """
        Evaluate pipeline on test set.
        """
        answers = []
        contexts = []
        times = []
        for item in tqdm(self.test_data['question'].values):
            start_time = time.time()
            result = pipeline(item)
            end_time = time.time()
            answers.append(result['answer'])
            contexts.append(result['context'])
            times.append(end_time - start_time)

        mean_time = sum(times) / len(times)
        logging.info(f"Mean time for getting answer: {mean_time}")

        test_answers = self.test_data
        test_answers['answer'] = answers
        test_answers['contexts'] = contexts
        test_answers.to_csv("answers.csv")
        dataset = Dataset.from_dict(test_answers.to_dict(orient='list'))

        result = evaluate(
            dataset,
            metrics=[
                context_precision,
                faithfulness,
                answer_relevancy,
                context_recall,
            ],
        )
        df = result.to_pandas()
        df['mean_time'] = mean_time
        df.to_csv(f'results_{pipeline.__class__.__name__}.csv')
        logging.info(f"Saved results to 'results_{pipeline.__class__.__name__}.csv'")
        logging.info(f"Metrics: {result}")

In [None]:
evaler = Evaluator("./v2_ragas_npa_dataset_firstPart.xlsx")

In [None]:
def get_answer(question):
  retriever = db.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 1},
  )
  relevant_docs = retriever.invoke(question)

  # request(localhost.com)

  # print("\n--- Relevant Documents ---")
  cont = []
  for i, doc in enumerate(relevant_docs, 1):
      cont.append(doc.page_content)

  combined_input = (
      "Вот несколько документов, которые могут помочь ответить на вопрос: "
      + query
      + "\n\nСоответствующие документы:\n"
      + "\n\n".join([doc.page_content for doc in relevant_docs])
      + "\n\nПожалуйста, предоставьте ответ, основываясь только на предоставленных документах. Если ответ не найден в документах, ответьте 'Я не уверен'."
  )

  model = OllamaLLM(model="owl/t-lite")

  messages = [
      SystemMessage(content="Ты ассистент отвечающий на вопросы по информации которая есть в нормативно-правовых-актах"),
      HumanMessage(content=combined_input),
  ]

  # Invoke the model with the combined input
  result = model.invoke(messages)
  return {"answer": result, "context": cont}

In [None]:
get_answer("Как зарплата влияет на мотивацию педагогов?")

In [None]:
import os

os.environ["OPENAI_API_KEY"] = ""
os.environ["OPENAI_API_BASE"] = ""

In [None]:
evaler.evaluate_pipe(get_answer)