<a href="https://colab.research.google.com/github/ailkrobot/RAG-Retrieval-Augmented-Generation/blob/main/RAG_reparado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# RAG – Retrieval-Augmented Generation
Este es un tutorial para aplicar el concepto de RAG usado para LLMs.



Este código es una implementación simple de RAG sin LangChain, usando directamente chromadb y sentence-transformers. Vamos línea por línea:

🧩 Objetivo del código:
Crear una base de datos vectorial usando ChromaDB y SentenceTransformers, para almacenar frases técnicas con embeddings, y luego poder hacer búsquedas semánticas.

Vamos instalar Chromadb que es una base de datos de vectores open source para almacenar e indexar embeddings

In [None]:
pip install chromadb sentence-transformers


Aqui ya importamos esta Chromadb y Transformes, luego utilizaremos la llamada con clients, utilizamos el modelo predeterminado y enviaremos los textos indicados.

🔹 Importar las dos librerías clave:
*   chromadb para almacenar y consultar vectores semánticos.
*   SentenceTransformer para generar embeddings de frases.





In [None]:
import chromadb
from sentence_transformers import SentenceTransformer

🔹 Crea un cliente local de ChromaDB (puede correr en memoria o en disco, según la configuración).

In [None]:
client = chromadb.Client()


🔹 Crea una colección de vectores llamada "docs", como si fuera una tabla en una base de datos, donde se guardan documentos y sus embeddings.

In [None]:
collection = client.create_collection("docs")

Carga un modelo preentrenado de** HuggingFace** que transforma texto en vectores de forma eficiente (ligero y rápido).
**"all-MiniLM-L6-v2"** es ideal para tareas de recuperación semántica.

In [None]:
model = SentenceTransformer("all-MiniLM-L6-v2")

🔹 Crea una lista de frases que vamos a almacenar y poder buscar luego.
Esto simula que tienes documentos técnicos breves.

In [None]:
texts = ["La inteligencia artificial es fascinante.", "El control robótico es crucial."]


🔹 Convierte cada frase en un vector numérico (embedding).
Este es el paso fundamental para búsqueda semántica: frases similares tendrán vectores similares.

In [None]:
embeddings = model.encode(texts)

🔹 Recorre cada frase:

Asigna un id como "0", "1", etc.
Inserta el texto y su embedding en la colección de Chroma.

In [None]:
for i, text in enumerate(texts):
    collection.add(documents=[text], ids=[str(i)], embeddings=[embeddings[i]])

💡 Esto te deja lista una colección vectorial donde luego podrás hacer búsquedas por similitud, por ejemplo: "¿Dónde se habla de robótica?" y obtener "El control robótico es crucial.".

EL programa completo lo puedes ver asi:

In [None]:
import chromadb
from sentence_transformers import SentenceTransformer

client = chromadb.Client()
collection = client.create_collection("docs")

model = SentenceTransformer("all-MiniLM-L6-v2")

texts = ["La inteligencia artificial es fascinante.", "El control robótico es crucial."]
embeddings = model.encode(texts)

for i, text in enumerate(texts):
    collection.add(documents=[text], ids=[str(i)], embeddings=[embeddings[i]])



Luego verificaremos con una busqueda deseada o requerimientos necesarios

In [None]:
query = model.encode("¿Qué es el control?")
results = collection.query(query_embeddings=[query], n_results=1)
print(results)

{'ids': [['1']], 'embeddings': None, 'documents': [['El control robótico es crucial.']], 'uris': None, 'included': ['metadatas', 'documents', 'distances'], 'data': None, 'metadatas': [[None]], 'distances': [[0.5939409732818604]]}


In [None]:
query = model.encode("¿Qué opinas de la inteligencia artificial?")
results = collection.query(query_embeddings=[query], n_results=1)
print(results)

{'ids': [['0']], 'embeddings': None, 'documents': [['La inteligencia artificial es fascinante.']], 'uris': None, 'included': ['metadatas', 'documents', 'distances'], 'data': None, 'metadatas': [[None]], 'distances': [[0.3903503119945526]]}


In [None]:
query = model.encode("¿Qué opinas del control?")
results = collection.query(query_embeddings=[query], n_results=1)
print(results)

{'ids': [['1']], 'embeddings': None, 'documents': [['El control robótico es crucial.']], 'uris': None, 'included': ['metadatas', 'documents', 'distances'], 'data': None, 'metadatas': [[None]], 'distances': [[0.8778367042541504]]}


Creamos un  CLI (Command Line Interface) que es una interfaz basada en texto que se usa desde la línea de comandos (terminal o consola), donde tú escribes comandos y el programa responde con texto.
$ python buscador.py
👉 Ingresa tu pregunta: ¿Qué se dice sobre inteligencia artificial?
🔍 Resultado: La inteligencia artificial es fascinante.
✅ Ventajas de un CLI:
✅ Rápido de desarrollar (ideal para prototipos).

✅ Ligero, sin necesidad de interfaz gráfica.

✅ Perfecto para ejecutar scripts técnicos, pruebas o automatizaciones.
🧠 En este proyecto RAG:
Podemos crear un CLI donde tú escribes preguntas y el sistema busca en tu base de documentación técnica (Chroma + embeddings) para darte una respuesta.
Aqui un ejemplo funcional de un CLI en Python que hace búsqueda semántica con ChromaDB y sentence-transformers. Este CLI permite consultar frases almacenadas en tu colección de documentación técnica.

✅ ¿Qué hace el siguiente script?


Carga tus textos técnicos.

-Los convierte en embeddings y los guarda en ChromaDB.

-Te permite hacer preguntas desde consola.

-Usa sentence-transformers para convertir la pregunta en embedding.

-Busca el documento más parecido y te lo muestra.




In [None]:
import chromadb
from sentence_transformers import SentenceTransformer

# Inicializar cliente y colección
client = chromadb.Client()
collection = client.create_collection("docs2")

# Modelo de embeddings
model = SentenceTransformer("all-MiniLM-L6-v2")

# Documentos técnicos que quieres almacenar
texts = [
    "La inteligencia artificial es fascinante.",
    "El control robótico es crucial.",
    "Los agentes inteligentes ayudan en la automatización.",
    "Los sensores son vitales en robótica.",
    "Python es ampliamente usado en IA."
]

# Generar embeddings y almacenar en ChromaDB
embeddings = model.encode(texts)
for i, text in enumerate(texts):
    collection.add(documents=[text], ids=[str(i)], embeddings=[embeddings[i]])

# 🧠 CLI interactivo
print("🔍 Buscador inteligente de documentación técnica")
print("Escribe tu pregunta (o 'salir' para terminar):\n")

while True:
    pregunta = input("👉 Tu pregunta: ")
    if pregunta.lower() in ["salir", "exit", "q"]:
        print("👋 ¡Hasta luego!")
        break

    query_embedding = model.encode(pregunta)
    resultado = collection.query(query_embeddings=[query_embedding], n_results=1)

    print("\n🧠 Resultado más relevante:")
    print(f"📄 {resultado['documents'][0][0]}\n")


🔍 Buscador inteligente de documentación técnica
Escribe tu pregunta (o 'salir' para terminar):

👉 Tu pregunta: que sabes de python

🧠 Resultado más relevante:
📄 Python es ampliamente usado en IA.

👉 Tu pregunta: que sabes de IA

🧠 Resultado más relevante:
📄 Python es ampliamente usado en IA.

👉 Tu pregunta: y que sobre sensores

🧠 Resultado más relevante:
📄 Los sensores son vitales en robótica.

👉 Tu pregunta: salir
👋 ¡Hasta luego!


Aqui el programa consigue leer desde un archivo.

📁 Paso 1: **Prepara tu archivo**

**Crea un archivo llamado por ejemplo:**

docs/tecnologia.txt
(con contenido como este):

-La inteligencia artificial está revolucionando muchas industrias.

-El control robótico se usa en fábricas automatizadas.

-Los sensores permiten que los robots perciban su entorno.

-El lenguaje Python es muy popular para programación en IA.

▶️ **¿Cómo ejecutarlo?**

Asegúrate de tener esta estructura:

Copiar

Editar

📂 proyecto/

├─ buscador.py

└─ docs/

    └─ tecnologia.txt
    
Ejecuta con:

python buscador.py



In [None]:
import chromadb
from sentence_transformers import SentenceTransformer

# 1. Leer el archivo de texto
def cargar_textos(ruta_archivo):
    with open(ruta_archivo, "r", encoding="utf-8") as f:
        lineas = [line.strip() for line in f.readlines() if line.strip()]
    return lineas

# 2. Inicializar cliente y colección
client = chromadb.Client()
collection = client.create_collection("docs")

# 3. Cargar textos desde archivo
ruta = "docs/tecnologia.txt"
textos = cargar_textos(ruta)

# 4. Embeddings con modelo
model = SentenceTransformer("all-MiniLM-L6-v2")
embeddings = model.encode(textos)

# 5. Insertar en Chroma
for i, texto in enumerate(textos):
    collection.add(documents=[texto], ids=[str(i)], embeddings=[embeddings[i]])

# 6. CLI interactivo
print("🔍 Buscador de documentación técnica")
print("Escribe tu pregunta (o 'salir'):\n")

while True:
    pregunta = input("👉 Tu pregunta: ")
    if pregunta.lower() in ["salir", "exit", "q"]:
        print("👋 ¡Hasta luego!")
        break

    query_embedding = model.encode(pregunta)
    resultado = collection.query(query_embeddings=[query_embedding], n_results=1)

    print("\n🧠 Resultado más relevante:")
    print(f"📄 {resultado['documents'][0][0]}\n")


🧠 Este CLI ahora te permite:

-Leer un archivo con frases o párrafos técnicos.

-Almacenar y vectorizar el contenido.

-Consultar semánticamente desde terminal

Para mas informaciones visita mi blog de Agentes IA:

 https://ailkrobotcontrol.com/rag-retrieval-augmented-generation-la-guia-definitiva-para-mejorar-modelos-de-ia-en-2025/