In [28]:
import bs4
from langchain_community.document_loaders import WebBaseLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_postgres import PGVector
from langchain_ollama import OllamaEmbeddings
from langchain import hub
from typing_extensions import List, TypedDict
from langchain_core.documents import Document
from langchain_ollama import ChatOllama
from langgraph.graph import START, StateGraph
from langchain_core.prompts import PromptTemplate
from langchain_community.document_loaders import DirectoryLoader, TextLoader
from pydantic import BaseModel
from typing import List

In [16]:
# Load and chunk contents of the blog
loader = WebBaseLoader(
    web_paths=("https://lilianweng.github.io/posts/2023-06-23-agent/",),
    bs_kwargs=dict(
        parse_only=bs4.SoupStrainer(
            class_=("post-content", "post-title", "post-header")
        )
    ),
)

In [66]:
class Utf8TextLoader(TextLoader):
    def __init__(self, *args, **kwargs):
        kwargs['encoding'] = 'utf-8'
        super().__init__(*args, **kwargs)

loader = DirectoryLoader(
    "./DATA", glob="**/*.txt", loader_cls=Utf8TextLoader, show_progress=True
)
docs = loader.load()

100%|██████████| 5/5 [00:00<00:00, 1250.09it/s]


In [67]:
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
all_splits = text_splitter.split_documents(docs)

100%|██████████| 5/5 [00:00<00:00, 4993.22it/s]


In [2]:
embedding_function = OllamaEmbeddings(model="nomic-embed-text")
CONNECTION_STRING = "postgresql+psycopg2://admin:admin@127.0.0.1:5433/vectordb"
COLLECTION_NAME = "test_lc"

vectorstore = PGVector(
    connection=CONNECTION_STRING,
    embeddings=embedding_function,
    collection_name=COLLECTION_NAME,
)


In [None]:
# Index chunks
vectorstore.add_documents(documents=all_splits)

In [10]:
template = """Eres un asistente del departamento de Bienestar del Ministerio de Energia.
Utilice las siguientes piezas de contexto para responder la pregunta al final.
Si no sabe la respuesta, simplemente diga que no la sabe, no intente inventar una respuesta.
Di siempre "¡gracias por preguntar!" al final de la respuesta..

{context}

Pregunta: {question}

Respuesta:"""
custom_rag_prompt = PromptTemplate.from_template(template)

In [24]:
#llm = ChatOllama(model="deepseek-r1:7b",temperature=0,stream=True )
llm = ChatOllama(model="mistral",temperature=0,stream=True )

In [5]:
# Define state for application
class State(TypedDict):
    question: str
    context: List[Document]
    answer: str

# Define application steps
def retrieve(state: State):
    retrieved_docs = vectorstore.similarity_search(state["question"])
    return {"context": retrieved_docs}

def generate(state: State):
    docs_content = "\n\n".join(doc.page_content for doc in state["context"])
    messages = custom_rag_prompt.invoke({"question": state["question"], "context": docs_content})
    response = llm.invoke(messages)
    return {"answer": response.content}

In [6]:
# Compile application and test
graph_builder = StateGraph(State).add_sequence([retrieve, generate])
graph_builder.add_edge(START, "retrieve")
graph = graph_builder.compile()

In [18]:
response = graph.invoke({"question": "que es el bono de matrimonio"})
print(response["answer"])

<think>
Bueno, tengo que responder a la pregunta "¿Qué es el bono de matrimonio?" basándome en los datos proporcionados. Primero, reviso las piezas de contexto que me han given.

En el contexto, veo que hay diferentes tipos de préstamos con sus términos y condiciones, pero no hay menuda información sobre los bonos de matrimonio. Sin embargo, sí hay una sección titulada "Bono de Matrimonio" que dice:

"Sólo en caso de matrimonio del afiliado(a) titular. Deben enviar el certificado de matrimonio, y un mail solicitando el beneficio. Monto del Bono: $70.000."

Entonces, el bono de matrimonio es un beneficio otorgado al afiliado titular cuando se casan. Se pide el certificado de matrimonio y un correo para solicitar el beneficio, con un monto de $70.000.

También noto que hay otros bonos relacionados como el de nacimiento o adopción ($90.000), y el de fallecimiento ($504.064). Además, hay becas de estudios hasta $100.000, pero no es relevante para este caso.

No hay menciones de más detalle

In [16]:
response = graph.invoke({"question": "que es el bono de matrimonio"})
print(response["answer"])

 El Bono de Matrimonio es un beneficio que se otorga solo en caso de matrimonio del afiliado(a) titular. Deben enviar el certificado de matrimonio, y un mail solicitando el beneficio. El monto del Bono es de $70.000.-. ¡Gracias por preguntar!
