# RAG
La generación aumentada por recuperación (RAG) es el proceso de optimización de la salida de un modelo de lenguaje de gran tamaño, de modo que haga referencia a una base de conocimientos autorizada fuera de los orígenes de datos de entrenamiento antes de generar una respuesta. 

### Instalación de dependencias:

```bash
uv pip install langchain-community langchain-core langchain-ollama pypdf

```

### Cargar los pdfs

Recibimos el path del documento pdf por parametro. A partir del documento recibido, lo convertimos en un iterable. 
Al final, retornamos la variable text con el contenido del documento crudo, sin dividir. 

In [1]:
from langchain_community.document_loaders import PyPDFLoader

def upload_pdf(url: str):        
    try:
        loader = PyPDFLoader(url)
        loader = loader.lazy_load()

        text = ""

        for page in loader: 
            text += page.page_content + "\n"

        return text
    except Exception as e:
        print(e)
        return []
    


### text_splitter

Recibimos el contenido del documento generado en la celda anterior. Creamos el text_splitter y lo dividimos en 2000 caracteres con 100 de overlap. Al final, retornamos los docs en la variable texts. 

In [2]:
from langchain_text_splitters import CharacterTextSplitter

def text_splitter(text): 

    text_splitter = CharacterTextSplitter(
    chunk_size = 2000,
    chunk_overlap = 100,
    separators=["\n"]
)
    texts = text_splitter.create_documents([text])
    return texts


### embedding

Creamos la conexión con nuestro modelo de embedding. 

In [3]:
from langchain_ollama import OllamaEmbeddings

embedding = OllamaEmbeddings(
    model = "nomic-embed-text"
)

### vector store

Creamos nuestra vector store. 

In [5]:
from langchain_chroma import Chroma 

def get_vector_store(name_collection: str): 
    
    vector_store = Chroma(
    collection_name= name_collection,
    embedding_function=embedding,
    persist_directory="./vectorstore"
)
    return vector_store


### Retrieval

Creamos una función retriebal, que nos devuelve los documentos en una busqueda de similitudes. 

In [6]:
def retrieval(input_user: str): 
    vector_store = get_vector_store("langchain")
    docs = vector_store.similarity_search(input_user)
    return docs

### Prompt template

Creamos nuestro prompt template, donde recibiremos el contexto (Lo que retorna la función retrieval) y el input del usuario.

In [7]:
from langchain_core.prompts import PromptTemplate

prompt = PromptTemplate.from_template("""
    Eres un asistente encargado de responder pregutnas sobre Langchain.
    Utiliza siempre el contexto para responder.
    contexto = {contexto}
    pregunta del usuario: {input_user}
""")

### LLM 

Declaramos la función response, responsable de la interacción con el LLM. 

In [8]:
from langchain_google_genai import ChatGoogleGenerativeAI
from dotenv import load_dotenv
import os

load_dotenv()
api_key = os.getenv("API_KEY")

def response(input_user: str, contexto: str):
    llm = ChatGoogleGenerativeAI(
    api_key=api_key,
    model="gemini-2.0-flash",
    temperature= 0.5
)

    for chunk in llm.stream(prompt.format(contexto=contexto, input_user=input_user)):
        yield chunk.content


ModuleNotFoundError: No module named 'langchain_google_genai'

Ahora utilizamos las funciones para cargar el documento, aplicar el text_splitter y al final, guardar nuestros datos como embedding en la base de datos vectorial. 

In [17]:
loader = upload_pdf("asd.pdf")
texts = text_splitter(loader)
vector_store = get_vector_store("langchain")

Interactuamos con nuestro RAG.

In [23]:
input_user = input("Human: ")

docs = retrieval(input_user=input_user)

for chunk in response(input_user= input_user, contexto= docs):
    print(chunk, end="", flush=True)
    

Langchain es una herramienta o framework diseñado para ayudar a los desarrolladores a construir aplicaciones impulsadas por modelos de lenguaje.
