In [9]:
%pip install --quiet python-dotenv openai langchain_community pgvector psycopg2

Note: you may need to restart the kernel to use updated packages.




In [36]:
import os
from dotenv import load_dotenv
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import PGVector
from langchain_core.documents import Document
from langchain_openai import OpenAIEmbeddings

load_dotenv('../.env')

class PGVectorKnowledgeBase:
    def __init__(self):
        self.text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=20)
        self.vectorstore = PGVector(
            collection_name='workshop_knowledge_base',
            connection_string='postgresql://postgres:postgres@localhost:5432/postgres',
            embedding_function=OpenAIEmbeddings(model="text-embedding-3-small", openai_api_key=os.getenv('OPENAI_API_KEY')),
        )

    def add_txt(self, path_to_txt):
        with open(path_to_txt, 'r', encoding='utf-8') as f:
            full_text = f.read()
        self.vectorstore.add_documents([Document(page_content=chunk) for chunk in self.text_splitter.split_text(full_text)])

    def search_with_score(self, query: str, k: int = 3) -> list[tuple[Document, float]]:  # dodany score
        return self.vectorstore.similarity_search_with_score(query, k=k)

In [39]:
import os

from dotenv import load_dotenv
from openai import OpenAI

load_dotenv('../.env')
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

knowledge_base = PGVectorKnowledgeBase()

def augument(docs_with_score, user_question) -> str:
    # Filtracja dokumentów ze zbyt niskim scorem
    docs_filtered_by_score = [(doc, score) for doc, score in docs_with_score if score > 0.5]
    
    # Formatowanie dokumentów do wyświetlenia
    docs_formatted = "\n".join([f"Document: {doc.page_content} Score: {score}" for doc, score in docs_filtered_by_score])
    system_prompt = "Jesteś pomocnym asystentem. Odpowiedź zwięźle i na temat TYLKO na bazie podanego kontekstu\n"
    user_prompt = (f"kontekst z miarą podobieństwa do pytania użytkownika: {docs_formatted}\n"
                          f"pytanie użytkownika: {user_question}")
    return system_prompt, user_prompt

  self.vectorstore = PGVector(


In [None]:
def chat_with_model(user_question: str) -> str:
    # Faza Retreive, szukanie dokumentów w bazie wiedzy na podstawie pytania użytkownika
    docs_with_score = knowledge_base.search_with_score(user_question)

    # Faza Augument
    system_prompt, user_prompt = augument(docs_with_score, user_question)

    # Faza Generate, wysłanie zapytania do modelu
    response = client.chat.completions.create(
        model='gpt-3.5-turbo',
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt},
        ],
    )

    return response.choices[0].message.content

'Podczas warsztatów będziesz budować AI chatbota z wykorzystaniem techniki RAG, łącząc modele językowe z danymi zewnętrznymi. Dowiesz się, jak przygotować dane do użytku przez bota, stworzysz działającego chatbota i zintegrujesz wszystko w prostym projekcie. Warto wiedzieć, że potrzebna jest znajomość podstaw Pythona oraz laptop z Pythonem i IDE, np. VSCode lub PyCharm.'

In [None]:
chat_with_model("powiedz jaka jest agenda warsztatów")