# 🧠 Introducción a LLM y Retrieval-Augmented Generation (RAG)


En este cuaderno, exploraremos el funcionamiento de los **Modelos de Lenguaje Grandes (LLM)** y cómo se integran con **Retrieval-Augmented Generation (RAG)** para enriquecer respuestas basadas en información externa.

**Objetivos**:
1. Entender cómo los LLM procesan texto.
2. Implementar un sistema básico de RAG.
3. Visualizar el flujo de datos desde la consulta hasta la respuesta.

---
**Requisitos previos**: 
- Familiaridad básica con Python.
- Conocimiento básico de NLP y redes neuronales.
---


In [1]:

# Instalar bibliotecas necesarias (descomentar si no están instaladas)
!pip install sentence-transformers transformers scikit-learn


Collecting sentence-transformers
  Downloading sentence_transformers-3.3.1-py3-none-any.whl.metadata (10 kB)
Downloading sentence_transformers-3.3.1-py3-none-any.whl (268 kB)
Installing collected packages: sentence-transformers
Successfully installed sentence-transformers-3.3.1




## 🌀 Paso 1: Introducción a los LLM


Los Modelos de Lenguaje Grandes (LLM) son redes neuronales entrenadas en enormes cantidades de texto para predecir palabras o generar texto.  
Por ejemplo, dada una oración como *"El gato está en el"*, el modelo puede predecir *"tejado"* basándose en patrones aprendidos.

Los LLM utilizan:
- **Representaciones vectoriales**: Cada palabra/frase se convierte en un vector en un espacio multidimensional.
- **Mecanismo de atención**: Ayuda al modelo a centrarse en partes relevantes del texto.

A continuación, exploraremos cómo integrar un LLM con bases de datos para mejorar las respuestas usando RAG.


## 📂 Paso 2: Crear una base de datos ficticia

In [2]:

# Base de datos simulada
documents = [
    "La cúrcuma tiene propiedades antiinflamatorias.",
    "Se ha demostrado que la cúrcuma ayuda a la digestión.",
    "La cúrcuma contiene curcumina, un antioxidante."
]

# Mostrar los documentos
for i, doc in enumerate(documents, 1):
    print(f"Documento {i}: {doc}")


Documento 1: La cúrcuma tiene propiedades antiinflamatorias.
Documento 2: Se ha demostrado que la cúrcuma ayuda a la digestión.
Documento 3: La cúrcuma contiene curcumina, un antioxidante.


## 🔢 Paso 3: Transformar documentos en vectores

In [3]:

from sentence_transformers import SentenceTransformer

# Modelo para embeddings
model = SentenceTransformer('all-MiniLM-L6-v2')

# Generar vectores para los documentos
document_vectors = model.encode(documents)

print("Vectores generados para los documentos (dimensiones):", document_vectors.shape)


modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/10.7k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/612 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

Vectores generados para los documentos (dimensiones): (3, 384)


## 📝 Paso 4: Procesar la consulta del usuario

In [4]:

# Consulta del usuario
query = "¿Cómo ayuda la cúrcuma a la salud?"

# Transformar la consulta en un vector
query_vector = model.encode(query)
print("Vector de la consulta generado:", query_vector[:5], "...")


Vector de la consulta generado: [ 0.03837643  0.01184166 -0.06359773  0.01685266 -0.04091966] ...


## 🔍 Paso 5: Buscar documentos relevantes

In [5]:

from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

# Calcular similitud coseno
similarities = cosine_similarity([query_vector], document_vectors)[0]

# Recuperar los documentos más similares
top_indices = np.argsort(similarities)[::-1][:2]  # Los 2 más relevantes
relevant_docs = [documents[i] for i in top_indices]

# Mostrar los documentos más relevantes
print("Documentos relevantes:")
for doc in relevant_docs:
    print("-", doc)


Documentos relevantes:
- Se ha demostrado que la cúrcuma ayuda a la digestión.
- La cúrcuma tiene propiedades antiinflamatorias.


## 💡 Paso 6: Generar respuesta con el LLM

In [7]:

from transformers import pipeline

# Cargar el modelo LLM
qa_pipeline = pipeline("text2text-generation", model="t5-small")

# Concatenar los documentos relevantes
context = " ".join(relevant_docs)
final_input = f"Contexto: {context} Pregunta: {query}"

# Generar respuesta
response = qa_pipeline(final_input)
print("Respuesta generada:")
print(response[0]['generated_text'])


config.json:   0%|          | 0.00/1.21k [00:00<?, ?B/s]

To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development


model.safetensors:   0%|          | 0.00/242M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/2.32k [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/792k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.39M [00:00<?, ?B/s]



Respuesta generada:
ayuda la crcuma a la digesti



## 🎯 Conclusión
En este cuaderno, hemos explorado cómo combinar **LLM** con una base de datos mediante **RAG**. Este enfoque permite enriquecer respuestas aprovechando tanto el conocimiento general del modelo como información específica de una base de datos. 🚀
