# 1. Construye tu primer sistema RAG

## Objetivo

Aprender a implementar un pipeline Retrieval-Augmented Generation (RAG) completo, que combine:

1. Retrieval: búsqueda semántica de información relevante en una base de conocimiento.

2. Generation: generación de una respuesta natural con un modelo de lenguaje grande (LLM).

## Requisitos previos

Instalar las siguientes librerías (pueden usar pip):



In [None]:
! pip install sentence-transformers openai

## Contexto

Vas a crear un asistente virtual para una biblioteca.
El asistente debe responder preguntas de los usuarios usando información contenida en documentos locales (no internet).

La base de conocimiento es:



In [None]:
documentos = [
    "Los préstamos de libros duran 15 días y se pueden renovar una vez.",
    "Para acceder al catálogo digital, los usuarios deben iniciar sesión con su correo institucional.",
    "Las multas por retraso son de 0,50 euros por día y por libro.",
    "La biblioteca abre de lunes a viernes de 8:00 a 20:00 horas.",
    "Los usuarios pueden solicitar préstamos interbibliotecarios completando un formulario online."
]

## Actividad paso a paso 

Completa el código según las instrucciones en los comentarios.


In [None]:
from sentence_transformers import SentenceTransformer, util


### 1. PREGUNTAS PRÁCTICAS


#### 1. Crear la base de conocimiento

Convierte tus textos en una colección de Document que LangChain pueda manejar.

💡 Usa la clase Document de langchain.schema para asociar cada texto con su fuente o índice.

#### 2. Crear los embeddings e indexar con FAISS

Crea un modelo de embeddings (all-MiniLM-L6-v2) y genera el índice FAISS.

💡 Este índice actuará como tu vector store, donde cada documento se representa como un vector semántico.



#### 3. Crear el retriever

Transforma tu vectorstore en un retriever:


#### 4. Solicitar una pregunta al usuario

Pide al usuario una pregunta, por ejemplo: ¿Cuánto tiempo duran los préstamos de libros?



##### 5. Recuperar documentos relevantes

Usa el retriever para obtener los textos más relacionados con la pregunta:

docs = retriever.get_relevant_documents(pregunta)


💡 Cada doc contiene el texto (doc.page_content) y metadatos (doc.metadata).

##### 6. Generar una respuesta con un modelo LLM

Usa un modelo de lenguaje (por ejemplo ChatOpenAI con tu API key) para crear una respuesta basada solo en los documentos recuperados.

Ejemplo de prompt:


prompt = f"""
Eres un asistente de biblioteca. Usa solo la siguiente información para responder.
Contexto:
{contexto}

Pregunta: {pregunta}
"""

💡 Aquí conectas las dos partes: retrieval (docs) + generation (LLM) = RAG

#### 7. Mostrar la respuesta final

Imprime:

Los documentos recuperados (fuentes).

La respuesta generada por el LLM.

Ejemplo:

Documentos relevantes:
[1] Los préstamos de libros duran 15 días y se pueden renovar una vez.

Respuesta del asistente:
Puedes tener el libro 15 días y renovarlo una vez.