# 🧠 Introducción a LLM y Retrieval-Augmented Generation (RAG)


En este cuaderno, exploraremos el funcionamiento de los **Modelos de Lenguaje Grandes (LLM)** y cómo se integran con **Retrieval-Augmented Generation (RAG)** para enriquecer respuestas basadas en información externa.

**Objetivos**:
1. Entender cómo los LLM procesan texto.
2. Implementar un sistema básico de RAG.
3. Visualizar el flujo de datos desde la consulta hasta la respuesta.

---
**Requisitos previos**: 
- Familiaridad básica con Python.
- Conocimiento básico de NLP y redes neuronales.
---


In [None]:
# Instalar bibliotecas necesarias (descomentar si no están instaladas)
# !pip install sentence-transformers transformers scikit-learn
# !pip install shap

^C








## 🌀 Paso 1: Introducción a los LLM


Los Modelos de Lenguaje Grandes (LLM) son redes neuronales entrenadas en enormes cantidades de texto para predecir palabras o generar texto.  
Por ejemplo, dada una oración como *"El gato está en el"*, el modelo puede predecir *"tejado"* basándose en patrones aprendidos.

Los LLM utilizan:
- **Representaciones vectoriales**: Cada palabra/frase se convierte en un vector en un espacio multidimensional.
- **Mecanismo de atención**: Ayuda al modelo a centrarse en partes relevantes del texto.

A continuación, exploraremos cómo integrar un LLM con bases de datos para mejorar las respuestas usando RAG.


## 📂 Paso 2: Crear una base de datos ficticia

In [1]:
# Base de datos simulada - que también se puede agregar en estructura de promts, en formato .py para ser usado como base de datos.
documents = [
            "La cúrcuma tiene propiedades antiinflamatorias.",
            "Se ha demostrado que la cúrcuma ayuda a la digestión.",
            "La cúrcuma contiene curcumina, un antioxidante."
            ]

# Mostrar los documentos
for i, doc in enumerate(documents, 1):
    print(f"Documento {i}: {doc}")

Documento 1: La cúrcuma tiene propiedades antiinflamatorias.
Documento 2: Se ha demostrado que la cúrcuma ayuda a la digestión.
Documento 3: La cúrcuma contiene curcumina, un antioxidante.


## 🔢 Paso 3: Transformar documentos en vectores

In [2]:
import numpy as np
import shap
import matplotlib.pyplot as plt
from sklearn.metrics.pairwise import cosine_similarity
from sentence_transformers import SentenceTransformer
from transformers import pipeline

# Modelo para embeddings
model = SentenceTransformer('all-MiniLM-L6-v2')

# Generar vectores para los documentos
document_vectors = model.encode(documents)
print("Vectores generados para los documentos (dimensiones):", document_vectors.shape)

Vectores generados para los documentos (dimensiones): (3, 384)


## 📝 Paso 4: Procesar la consulta del usuario

In [3]:
# Consulta del usuario
query = "¿Cómo ayuda la cúrcuma a la salud?"

# Transformar la consulta en un vector
query_vector = model.encode(query)
print("Vector de la consulta generado:", query_vector[:5], "...")

Vector de la consulta generado: [ 0.03837643  0.01184166 -0.06359773  0.01685266 -0.04091966] ...


## 🔍 Paso 5: Buscar documentos relevantes

In [4]:
# Calcular similitud coseno
similarities = cosine_similarity([query_vector], document_vectors)[0]

# Recuperar los documentos más similares
top_indices = np.argsort(similarities)[::-1][:2]  # Los 2 más relevantes
relevant_docs = [documents[i] for i in top_indices]

# Mostrar los documentos más relevantes
print("Documentos relevantes:")
for doc in relevant_docs:
    print("-", doc)

Documentos relevantes:
- Se ha demostrado que la cúrcuma ayuda a la digestión.
- La cúrcuma tiene propiedades antiinflamatorias.


## 💡 Paso 6: Generar respuesta con el LLM

In [5]:
# Cargar el modelo LLM
qa_pipeline = pipeline("text2text-generation", model="t5-small")

# Concatenar los documentos relevantes
context = " ".join(relevant_docs)
final_input = f"Contexto: {context} Pregunta: {query}"

# Generar respuesta
response = qa_pipeline(final_input)
print("Respuesta generada:")
print(response[0]['generated_text'])



Respuesta generada:
ayuda la crcuma a la digesti



## 🎯 Conclusión
En este cuaderno, hemos explorado cómo combinar **LLM** con una base de datos mediante **RAG**. Este enfoque permite enriquecer respuestas aprovechando tanto el conocimiento general del modelo como información específica de una base de datos. 🚀
