# **1. Demo B√°sica de Retrieval-Augmented Generation (BasicRAG) con Gemini:**

## ¬øC√≥mo funciona?

En este ejemplo veremos c√≥mo funciona un sistema b√°sico de RAG (Retrieval-Augmented Generation).
La idea principal es:

1. Subir un documento de texto (ejemplo: un archivo con informaci√≥n de f√≠sica cu√°ntica o historia).

2. Dividir el documento en fragmentos peque√±os (chunks).

3. Convertir esos fragmentos en embeddings (vectores num√©ricos que representan el significado del texto).

4. Guardar los embeddings en una base de datos vectorial (ChromaDB).

5. Hacer una pregunta en lenguaje natural ‚Üí el sistema busca los fragmentos m√°s relevantes.

6. Gemini responde usando esos fragmentos como contexto, para dar una respuesta m√°s precisa y confiable.

Esto es lo que hace especial a RAG: el modelo no depende solo de su memoria entrenada, sino que consulta informaci√≥n externa que nosotros le damos.

## **Preparaci√≥n del entorno:**

**Antes de ejecutar el c√≥digo:**

1. **Obtener tu API Key de Gemini:**

- Entra a üëâ Google AI Studio: https://aistudio.google.com/.

- Crea una clave desde la secci√≥n API Keys.

- Copia tu API Key y reemplaza en la l√≠nea: **os.environ["GEMINI_API_KEY"] = "TU_API_KEY_AQUI"**


**Este paso solo es necesario si la que est√° puesta falla, o si cada estudiante quiere usar su propia clave.**

2. **Archivos de prueba disponibles en Drive (Debajo se indican los documentos utilizados en la demo en calse): https://drive.google.com/drive/folders/1uF7-oSMpzSdID2ltQf9NsU5Snf16fHfx?usp=sharing**

- cuantica.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- innovadores.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- historia_Colombia.txt ‚Üí texto sobre historia de Colombia.

- historia_internet.txt ‚Üí documento con explicaci√≥n b√°sica de Einstein.

üëâ **Suban uno de estos archivos (o el suyo propio) cuando el c√≥digo lo pida.**

In [1]:
# ================= DEMO RAG CON GEMINI ==================
!pip install chromadb sentence-transformers google-generativeai

import os
import google.generativeai as genai
from sentence_transformers import SentenceTransformer
import chromadb
from google.colab import files



In [2]:
# ========= 1. CONFIGURACI√ìN DE GEMINI =========
# üëâ Paso previo: obtener API Key en https://aistudio.google.com/
#  Cambia tu API Key SOLO si la actual no funciona.
os.environ["GEMINI_API_KEY"] = "AIzaSyC6m-5DgnLvehvHKkb8ZrAGKmaFMIEGi0A"
genai.configure(api_key=os.environ["GEMINI_API_KEY"])

In [3]:
# ========= 2. SUBIR ARCHIVO =========
print("Sube un archivo de texto con informaci√≥n (ej: cuantica.txt)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()


Sube un archivo de texto con informaci√≥n (ej: cuantica.txt)


Saving cuantica.txt to cuantica.txt


In [4]:
# ========= 3. FUNCI√ìN DE CHUNKING =========
def chunk_text(text, chunk_size=80, overlap=20):
    words = text.split()
    chunks = []
    for i in range(0, len(words), chunk_size - overlap):
        chunk = " ".join(words[i:i+chunk_size])
        chunks.append(chunk)
    return chunks

docs = chunk_text(text, chunk_size=80, overlap=20)

print("Ejemplo de 3 chunks creados:")
for c in docs[:3]:
    print("-", c, "\n")

Ejemplo de 3 chunks creados:
- Max Planck introdujo en 1900 la idea de que la energ√≠a no se emite de manera continua, sino en cuantos discretos. Este fue el inicio de la teor√≠a cu√°ntica. Albert Einstein en 1905 explic√≥ el efecto fotoel√©ctrico utilizando el concepto de cuantos de luz, lo que posteriormente llam√≥ fotones. Niels Bohr en 1913 propuso su modelo at√≥mico, donde los electrones orbitaban en niveles de energ√≠a cuantizados alrededor del n√∫cleo. Werner Heisenberg enunci√≥ en 1927 el principio de incertidumbre, que indica 

- orbitaban en niveles de energ√≠a cuantizados alrededor del n√∫cleo. Werner Heisenberg enunci√≥ en 1927 el principio de incertidumbre, que indica que no es posible conocer con precisi√≥n la posici√≥n y el momento de una part√≠cula al mismo tiempo. Erwin Schr√∂dinger desarroll√≥ la ecuaci√≥n de onda en 1926, fundamental para describir el comportamiento cu√°ntico de las part√≠culas. Richard Feynman contribuy√≥ a la electrodin√°mica cu√°ntica y populariz√

In [18]:
# ========= 4. CREAR EMBEDDINGS Y BASE VECTORIAL =========
embedder = SentenceTransformer("all-MiniLM-L6-v2")
client = chromadb.Client()
# Use a consistent and valid collection name
collection = client.get_or_create_collection("basic_rag_chunks")

embeddings = embedder.encode(docs).tolist()
for i, d in enumerate(docs):
    collection.add(documents=[d], embeddings=[embeddings[i]], ids=[str(i)])

In [19]:
# ========= 5. CONSULTA Y RETRIEVAL =========
# üëâ Aqu√≠ puedes cambiar la pregunta y experimentar ========================================
# Ejemplos para probar:
# query = "¬øQu√© explica la teor√≠a de la relatividad?"
# query = "¬øCu√°l fue un hecho clave en la independencia de Colombia?"
query = "¬øRichard Feyman contribuy√≥ a la electrodin√°mica cu√°ntica y populariz√≥ el uso de diagramas?"
q_embed = embedder.encode([query]).tolist()
results = collection.query(query_embeddings=q_embed, n_results=3)
retrieved_context = " ".join(results['documents'][0])

print("\nüîπ Chunks relevantes recuperados:")
for doc in results['documents'][0]:
    print("-", doc)



üîπ Chunks relevantes recuperados:
- la electrodin√°mica cu√°ntica y populariz√≥ el uso de diagramas que llevan su nombre.
- orbitaban en niveles de energ√≠a cuantizados alrededor del n√∫cleo. Werner Heisenberg enunci√≥ en 1927 el principio de incertidumbre, que indica que no es posible conocer con precisi√≥n la posici√≥n y el momento de una part√≠cula al mismo tiempo. Erwin Schr√∂dinger desarroll√≥ la ecuaci√≥n de onda en 1926, fundamental para describir el comportamiento cu√°ntico de las part√≠culas. Richard Feynman contribuy√≥ a la electrodin√°mica cu√°ntica y populariz√≥ el uso de diagramas que llevan su nombre.
- Max Planck introdujo en 1900 la idea de que la energ√≠a no se emite de manera continua, sino en cuantos discretos. Este fue el inicio de la teor√≠a cu√°ntica. Albert Einstein en 1905 explic√≥ el efecto fotoel√©ctrico utilizando el concepto de cuantos de luz, lo que posteriormente llam√≥ fotones. Niels Bohr en 1913 propuso su modelo at√≥mico, donde los electrones orbitab

In [7]:
import google.generativeai as genai

for m in genai.list_models():
    print(m.name)

models/embedding-gecko-001
models/gemini-2.5-pro-preview-03-25
models/gemini-2.5-flash-preview-05-20
models/gemini-2.5-flash
models/gemini-2.5-flash-lite-preview-06-17
models/gemini-2.5-pro-preview-05-06
models/gemini-2.5-pro-preview-06-05
models/gemini-2.5-pro
models/gemini-2.0-flash-exp
models/gemini-2.0-flash
models/gemini-2.0-flash-001
models/gemini-2.0-flash-exp-image-generation
models/gemini-2.0-flash-lite-001
models/gemini-2.0-flash-lite
models/gemini-2.0-flash-preview-image-generation
models/gemini-2.0-flash-lite-preview-02-05
models/gemini-2.0-flash-lite-preview
models/gemini-2.0-pro-exp
models/gemini-2.0-pro-exp-02-05
models/gemini-exp-1206
models/gemini-2.0-flash-thinking-exp-01-21
models/gemini-2.0-flash-thinking-exp
models/gemini-2.0-flash-thinking-exp-1219
models/gemini-2.5-flash-preview-tts
models/gemini-2.5-pro-preview-tts
models/learnlm-2.0-flash-experimental
models/gemma-3-1b-it
models/gemma-3-4b-it
models/gemma-3-12b-it
models/gemma-3-27b-it
models/gemma-3n-e4b-it
mo

In [21]:

# ========= 6. GEMINI PARA RESPONDER CON CONTEXTO =========
model = genai.GenerativeModel("models/gemini-2.0-flash")

response = model.generate_content(
    f"UBas√°ndote en el siguiente contexto, responde la pregunta y a√±ade una breve explicaci√≥n adicional desde tu conocimiento si es relevante:.\n\nContexto:\n{retrieved_context}\n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada por Gemini:")
print(response.text)


üîπ Respuesta generada por Gemini:
S√≠, Richard Feynman contribuy√≥ a la electrodin√°mica cu√°ntica y populariz√≥ el uso de diagramas que llevan su nombre.

**Explicaci√≥n adicional:**

Los diagramas de Feynman son representaciones gr√°ficas de las interacciones entre part√≠culas subat√≥micas. Son una herramienta invaluable para calcular las probabilidades de diferentes procesos en la electrodin√°mica cu√°ntica (QED) y otras teor√≠as cu√°nticas de campos. Feynman no solo contribuy√≥ significativamente al desarrollo de la QED, sino que tambi√©n hizo que la teor√≠a fuera mucho m√°s accesible y comprensible a trav√©s de estos diagramas visualmente intuitivos. Su trabajo en este campo le vali√≥ el Premio Nobel de F√≠sica en 1965.



# 2. **GraphRAG con Gemini + Neo4j: Consultando Grafos de Conocimiento:**

En este ejemplo usamos Gemini para extraer triples sem√°nticos del texto (por ejemplo: (Elon Musk, fund√≥, Tesla)).

Luego esos triples se guardan en Neo4j, una base de datos orientada a grafos.
Despu√©s, podemos hacer consultas usando Cypher, el lenguaje de Neo4j, y finalmente Gemini genera una respuesta en lenguaje natural usando la informaci√≥n consultada.

Esto permite transformar un texto plano en un grafo de conocimiento consultable, lo que es muy √∫til para preguntas complejas que requieren relaciones entre entidades.

## **Preparaci√≥n del entorno:**

Antes de ejecutar el c√≥digo:

1. **Cuenta en Neo4j AuraDB (gratis): https://neo4j.com/product/auradb/**

- Ir a Neo4j AuraDB Free.

- Crear una cuenta y una base de datos gratuita.

- Copiar los datos de conexi√≥n (URI, Usuario, Contrase√±a).

**‚ö†Ô∏è Este paso, al igual que la creaci√≥n de la API Key de Gemini, solo ser√° necesario si las credenciales ya incluidas en el c√≥digo no funcionan.
De esta manera, cada estudiante tendr√° la opci√≥n de usar sus propias credenciales y su propia base de datos personalizada en caso de que sea necesario.**

2. **Nuevamente tener presente los archivos disponibles en Drive:https://drive.google.com/drive/folders/1uF7-oSMpzSdID2ltQf9NsU5Snf16fHfx?usp=sharing**

- cuantica.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- innovadores.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- historia_Colombia.txt ‚Üí texto sobre historia de Colombia.

- historia_internet.txt ‚Üí documento con explicaci√≥n b√°sica de Einstein.

üëâ **Suban uno de estos archivos (o el suyo propio) cuando el c√≥digo lo pida.****

## **Snippets de Cypher para practicar**

Los estudiantes pueden reemplazar el query y la pregunta con estos ejemplos (COPIAR Y PEGAR EN EL BLOQUE DE CODIGO DEL GRAPHRAG):

### **Para el documento innovadores.txt disponible en google drive:** ¬øCu√°les son las empresas fundadas por Elon Musk y por Steve Jobs, a qu√© se dedica cada una y por qu√© es importante lo que hacen?


In [22]:
cypher_query = """
MATCH (p:Entidad)-[r:RELACION]->(c:Entidad)
RETURN p.name AS persona, r.tipo AS relacion, c.name¬†AS¬†compania
"""

### **Para el documento hisotria_internet.txt disponible en google drive:** ¬øCu√°l fue la importancia de Tim Berners-Lee en la historia de Internet?

In [23]:
cypher_query = """
MATCH (a:Entidad)-[r:RELACION]->(b:Entidad)
WHERE a.name = "Tim Berners-Lee"
RETURN a.name AS a, r.tipo AS relacion, b.name AS b
"""

In [27]:
# ================== INSTALACI√ìN ==================
!pip install neo4j google-generativeai

import os
from neo4j import GraphDatabase
import google.generativeai as genai
from google.colab import files

# ================== CONFIGURACI√ìN ==================
# üëâ API Key de Gemini (puede usar la nuestra o crear la suya en https://aistudio.google.com/)
os.environ["GEMINI_API_KEY"] = "AIzaSyC6m-5DgnLvehvHKkb8ZrAGKmaFMIEGi0A"
genai.configure(api_key=os.environ["GEMINI_API_KEY"])

# üëâ Configura Neo4j con tus propios datos (SOLO si falla la configuraci√≥n por defecto del Colab)
NEO4J_URI = "neo4j+s://e2bc06b6.databases.neo4j.io"
NEO4J_USER = "neo4j"
NEO4J_PASSWORD = "4q5CRN_jRpsQDNXtSWbW_3GIaGZL1F9dm53TYLVJ_Lk"

driver = GraphDatabase.driver(NEO4J_URI, auth=(NEO4J_USER, NEO4J_PASSWORD))

# ================== SUBIR DOCUMENTO ==================
print("Sube un archivo de texto con informaci√≥n (ej: innovadores.txt)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()

# ================== EXTRAER TRIPLES CON GEMINI ==================
model = genai.GenerativeModel("models/gemini-2.0-flash")

prompt = f"""
Extrae relaciones del siguiente texto en formato de triples:
(SUJETO, RELACI√ìN, OBJETO).
Texto:
{text}
"""

response = model.generate_content(prompt)
print("üîπ Triples extra√≠dos por Gemini:")
print(response.text)

# ================== GUARDAR TRIPLES EN NEO4J ==================
def insert_triple(tx, s, r, o):
    query = """
    MERGE (a:Entidad {name: $s})
    MERGE (b:Entidad {name: $o})
    MERGE (a)-[rel:RELACION {tipo: $r}]->(b)
    """
    tx.run(query, s=s, r=r, o=o)

triples = []
for line in response.text.split("\n"):
    if "(" in line and ")" in line:
        line = line.strip("()")
        parts = [p.strip() for p in line.split(",")]
        if len(parts) == 3:
            triples.append(parts)

with driver.session() as session:
    for s, r, o in triples:
        session.execute_write(insert_triple, s, r, o)

print(f"‚úÖ Se insertaron {len(triples)} triples en Neo4j")

# ================== CONSULTA AL GRAFO ==================
def query_graph(query):
    with driver.session() as session:
        result = session.run(query)
        return [dict(r) for r in result]

# AQUI PUEDEN CAMBIAR LAS QUERY POR LOS EJEMPLOS DE ARRIBA ============================== ‚è∞‚è∞‚è∞ =============================
cypher_query = """
MATCH (p:Entidad)-[r:RELACION]->(c:Entidad)
RETURN p.name AS persona, r.tipo AS relacion, c.name¬†AS¬†compania
"""

results = query_graph(cypher_query)

print("\nüîπ Resultados de la consulta Cypher:")
for r in results:
    print(f"{r['persona']} {r['relacion']} {r['compania']}")

# ================== GEMINI PARA RESPUESTA FINAL ==================
context = "\n".join([f"{r['persona']} {r['relacion']} {r['compania']}" for r in results])

# AQUI PUEDEN CAMBIAR LAS PREGUNTAS POR LOS EJEMPLOS DE ARRIBA ============================== ‚è∞‚è∞‚è∞ =============================

final_prompt = f"""
Bas√°ndote en el siguiente contexto de un grafo de conocimiento, responde la pregunta y proporciona contexto:

Contexto:
{context}

Pregunta:  ¬øCu√°les son las empresas fundadas por Elon Musk y por Steve Jobs, a qu√© se dedica cada una y por qu√© es importante lo que hacen?
"""

response_final = model.generate_content(final_prompt)
print("\nüîπ Respuesta generada por Gemini:")
print(response_final.text)

Sube un archivo de texto con informaci√≥n (ej: innovadores.txt)


Saving innovadores.txt to innovadores (2).txt
üîπ Triples extra√≠dos por Gemini:
Aqu√≠ est√°n las relaciones extra√≠das del texto en formato de triples (SUJETO, RELACI√ìN, OBJETO):

*   (Elon Musk, fund√≥, Tesla)
*   (Tesla, dedicada a, fabricaci√≥n de autom√≥viles el√©ctricos)
*   (Tesla, dedicada a, soluciones de energ√≠a renovable)
*   (Elon Musk, fund√≥, SpaceX)
*   (SpaceX, dedicada a, exploraci√≥n espacial)
*   (SpaceX, desarrolla, cohetes)
*   (SpaceX, desarrolla, sat√©lites)
*   (Elon Musk, particip√≥ en la creaci√≥n de, PayPal)
*   (PayPal, sistema de, pagos en l√≠nea)
*   (PayPal, revolucion√≥, transacciones digitales)
*   (Steve Jobs, cofundador de, Apple)
*   (Apple, reconocida por, productos tecnol√≥gicos innovadores)
*   (Apple, crea, iPhone)
*   (Apple, crea, iPad)
*   (Apple, crea, MacBook)
*   (Apple, clave en, desarrollo de la industria de los dispositivos inteligentes)
*   (Jeff Bezos, fund√≥, Amazon)
*   (Amazon, inicialmente como, librer√≠a en l√≠nea)
*   (Amazon,

# 3. **FusionRAG (BM25 + Embeddings)**

En este ejemplo se combina lo mejor de dos enfoques de recuperaci√≥n de informaci√≥n:

- BM25 (keyword-based): Recupera pasajes bas√°ndose en la coincidencia de palabras clave.

- Vector Search (embeddings con ChromaDB): Recupera fragmentos usando similitud sem√°ntica.

Ambos resultados se fusionan para obtener un contexto m√°s robusto y completo, que luego se pasa al modelo Gemini para generar una respuesta.

üëâ Deben subir un archivo de texto (ej: cuantica.txt, historia_colombia.txt, innovadores.txt o historia_internet.txt) y luego probar con diferentes preguntas modificando el campo query.

## **Preparaci√≥n del entorno:**

Si ya configuraste los entornos de los ejemplos anteriores, no necesitas hacer nada adicional para este bloque. üöÄ

In [28]:
# ================= DEMO FUSION RAG ==================
!pip install rank_bm25 chromadb sentence-transformers google-generativeai

from rank_bm25 import BM25Okapi
import google.generativeai as genai
from sentence_transformers import SentenceTransformer
import chromadb
import os
from google.colab import files

# ================= CONFIGURACI√ìN GEMINI ==================
# üëâ API Key de Gemini (puede usar la nuestra o crear la suya en https://aistudio.google.com/)
os.environ["GEMINI_API_KEY"] = "AIzaSyC6m-5DgnLvehvHKkb8ZrAGKmaFMIEGi0A"
genai.configure(api_key=os.environ["GEMINI_API_KEY"])
model = genai.GenerativeModel("models/gemini-2.0-flash")

# ================= SUBIR DOCUMENTO ==================
print("üìÇ Sube un archivo de texto con informaci√≥n (ej: cuantica.txt, historia_colombia.txt, etc.)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()

# ================= CHUNKING ==================
def chunk_text(text, chunk_size=80, overlap=20):
    words = text.split()
    return [" ".join(words[i:i+chunk_size]) for i in range(0, len(words), chunk_size - overlap)]

docs = chunk_text(text)

# ========= Vector Store (embeddings con ChromaDB)
embedder = SentenceTransformer("all-MiniLM-L6-v2")
client = chromadb.Client()
collection = client.get_or_create_collection("fusion_chunks")
embeddings = embedder.encode(docs).tolist()
for i, d in enumerate(docs):
    collection.add(documents=[d], embeddings=[embeddings[i]], ids=[str(i)])

# ========= BM25 retriever
tokenized_corpus = [d.split(" ") for d in docs]
bm25 = BM25Okapi(tokenized_corpus)

# ========= Fusion Retrieval
query = "¬øQu√© cient√≠fico propuso un modelo at√≥mico en 1913?"
q_embed = embedder.encode([query]).tolist()
results_vector = collection.query(query_embeddings=q_embed, n_results=3)
results_bm25 = bm25.get_top_n(query.split(" "), docs, n=3)

# Fusi√≥n (simple: concatenaci√≥n + eliminaci√≥n de duplicados)
fusion_results = list(set(results_vector['documents'][0] + results_bm25))
retrieved_context = " ".join(fusion_results)

# ================= GEMINI PARA RESPUESTA FINAL ==================
response = model.generate_content(
    f"Bas√°ndote en el siguiente contexto (resultado de fusi√≥n de m√∫ltiples recuperadores), responde la pregunta y a√±ade explicaci√≥n:\n\n{retrieved_context}\n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada con FusionRAG:")
print(response.text)


Collecting rank_bm25
  Downloading rank_bm25-0.2.2-py3-none-any.whl.metadata (3.2 kB)
Downloading rank_bm25-0.2.2-py3-none-any.whl (8.6 kB)
Installing collected packages: rank_bm25
Successfully installed rank_bm25-0.2.2
üìÇ Sube un archivo de texto con informaci√≥n (ej: cuantica.txt, historia_colombia.txt, etc.)


Saving cuantica.txt to cuantica (1).txt

üîπ Respuesta generada con FusionRAG:
El cient√≠fico que propuso un modelo at√≥mico en 1913 fue **Niels Bohr**.

**Explicaci√≥n:**

El texto indica expl√≠citamente: "Niels Bohr en 1913 propuso su modelo at√≥mico, donde los electrones orbitaban en niveles de energ√≠a cuantizados alrededor del n√∫cleo."

