# **1. Demo B√°sica de Retrieval-Augmented Generation (BasicRAG) con Gemini:**

## ¬øC√≥mo funciona?

En este ejemplo veremos c√≥mo funciona un sistema b√°sico de RAG (Retrieval-Augmented Generation).
La idea principal es:

1. Subir un documento de texto (ejemplo: un archivo con informaci√≥n de f√≠sica cu√°ntica o historia).

2. Dividir el documento en fragmentos peque√±os (chunks).

3. Convertir esos fragmentos en embeddings (vectores num√©ricos que representan el significado del texto).

4. Guardar los embeddings en una base de datos vectorial (ChromaDB).

5. Hacer una pregunta en lenguaje natural ‚Üí el sistema busca los fragmentos m√°s relevantes.

6. Gemini responde usando esos fragmentos como contexto, para dar una respuesta m√°s precisa y confiable.

Esto es lo que hace especial a RAG: el modelo no depende solo de su memoria entrenada, sino que consulta informaci√≥n externa que nosotros le damos.

## **Preparaci√≥n del entorno:**

**Antes de ejecutar el c√≥digo:**

1. **Obtener tu API Key de Gemini:**

- Entra a üëâ Google AI Studio: https://aistudio.google.com/.

- Crea una clave desde la secci√≥n API Keys.

- Copia tu API Key y reemplaza en la l√≠nea: **os.environ["GEMINI_API_KEY"] = "TU_API_KEY_AQUI"**


**Este paso solo es necesario si la que est√° puesta falla, o si cada estudiante quiere usar su propia clave.**

2. **Archivos de prueba disponibles en Drive (Debajo se indican los documentos utilizados en la demo en calse): https://drive.google.com/drive/folders/1uF7-oSMpzSdID2ltQf9NsU5Snf16fHfx?usp=sharing**

- cuantica.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- innovadores.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- historia_Colombia.txt ‚Üí texto sobre historia de Colombia.

- historia_internet.txt ‚Üí documento con explicaci√≥n b√°sica de Einstein.

üëâ **Suban uno de estos archivos (o el suyo propio) cuando el c√≥digo lo pida.**

In [53]:
# ================= DEMO RAG CON FLAN vs FLAN sin RAG vs GEMINI ==================
!pip install chromadb sentence-transformers google-generativeai
!pip install transformers datasets evaluate rouge_score peft accelerate huggingface_hub safetensors
!pip install torch
import os
import google.generativeai as genai
from sentence_transformers import SentenceTransformer
import chromadb
from google.colab import files
from google.colab import userdata
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer, GenerationConfig, TrainingArguments, Trainer
import evaluate
import torch
import numpy as np
import pandas as pd



In [25]:
# ========= 1. CONFIGURACI√ìN DE FLAN =========
model_name='google/flan-t5-base'
original_model = AutoModelForSeq2SeqLM.from_pretrained(model_name, dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(model_name)

config.json: 0.00B [00:00, ?B/s]

model.safetensors:   0%|          | 0.00/990M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

spiece.model:   0%|          | 0.00/792k [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json: 0.00B [00:00, ?B/s]

In [88]:
# ========= 2. CONFIGURACI√ìN DE GEMINI =========
# üëâ Paso previo: obtener API Key en https://aistudio.google.com/
from google.colab import userdata
os.environ["GEMINI_API_KEY"] = userdata.get('GEMINI_API_KEY')
genai.configure(api_key=os.environ["GEMINI_API_KEY"])

In [4]:
# ========= 3. SUBIR ARCHIVO =========
print("Sube un archivo de texto con informaci√≥n (ej: cuantica.txt)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()


Sube un archivo de texto con informaci√≥n (ej: cuantica.txt)


Saving historia_Colombia.txt to historia_Colombia (1).txt


In [5]:
# ========= 4. FUNCI√ìN DE CHUNKING =========
def chunk_text(text, chunk_size=80, overlap=20):
    words = text.split()
    chunks = []
    for i in range(0, len(words), chunk_size - overlap):
        chunk = " ".join(words[i:i+chunk_size])
        chunks.append(chunk)
    return chunks

docs = chunk_text(text, chunk_size=80, overlap=20)

print("Ejemplo de 3 chunks creados:")
for c in docs[:3]:
    print("-", c, "\n")

Ejemplo de 3 chunks creados:
- La independencia de Colombia fue un proceso pol√≠tico y militar que tuvo lugar a comienzos del siglo XIX. Entre 1810 y 1819 se desarrollaron m√∫ltiples luchas contra el dominio colonial espa√±ol. El 20 de julio de 1810 se dio el primer grito de independencia en Santa Fe, marcando el inicio de una serie de movimientos revolucionarios en las provincias. Figuras clave como Sim√≥n Bol√≠var, Francisco de Paula Santander y Antonio Nari√±o jugaron un papel fundamental en la organizaci√≥n militar y 

- clave como Sim√≥n Bol√≠var, Francisco de Paula Santander y Antonio Nari√±o jugaron un papel fundamental en la organizaci√≥n militar y pol√≠tica. Uno de los momentos decisivos fue la Campa√±a Libertadora de 1819, liderada por Sim√≥n Bol√≠var. La batalla de Boyac√°, ocurrida el 7 de agosto de 1819, sell√≥ la independencia al derrotar al ej√©rcito realista. Este triunfo permiti√≥ la creaci√≥n de la Gran Colombia, un proyecto pol√≠tico que uni√≥ a los actuales territor

In [6]:
# ========= 5. CREAR EMBEDDINGS Y BASE VECTORIAL =========
embedder = SentenceTransformer("all-MiniLM-L6-v2")
client = chromadb.Client()
collection = client.get_or_create_collection("physics_chunks")

embeddings = embedder.encode(docs).tolist()
for i, d in enumerate(docs):
    collection.add(documents=[d], embeddings=[embeddings[i]], ids=[str(i)])


In [7]:
# ========= 6. CONSULTA Y RETRIEVAL =========
# üëâ Aqu√≠ puedes cambiar la pregunta y experimentar ========================================
# Ejemplos para probar:
# query = "¬øQu√© explica la teor√≠a de la relatividad?"
# query = "¬øCu√°l fue un hecho clave en la independencia de Colombia?"
query = "¬øCu√°l fue un hecho clave en la independencia de Colombia?"
q_embed = embedder.encode([query]).tolist()
results = collection.query(query_embeddings=q_embed, n_results=3)
retrieved_context = " ".join(results['documents'][0])

print("\nüîπ Chunks relevantes recuperados:")
for doc in results['documents'][0]:
    print("-", doc)



üîπ Chunks relevantes recuperados:
- La independencia de Colombia fue un proceso pol√≠tico y militar que tuvo lugar a comienzos del siglo XIX. Entre 1810 y 1819 se desarrollaron m√∫ltiples luchas contra el dominio colonial espa√±ol. El 20 de julio de 1810 se dio el primer grito de independencia en Santa Fe, marcando el inicio de una serie de movimientos revolucionarios en las provincias. Figuras clave como Sim√≥n Bol√≠var, Francisco de Paula Santander y Antonio Nari√±o jugaron un papel fundamental en la organizaci√≥n militar y
- de la Gran Colombia, un proyecto pol√≠tico que uni√≥ a los actuales territorios de Colombia, Venezuela, Ecuador y Panam√°. Sin embargo, la Gran Colombia enfrent√≥ problemas internos y conflictos entre caudillos regionales. Finalmente, en 1831, la uni√≥n se disolvi√≥ y cada pa√≠s tom√≥ su propio rumbo pol√≠tico. La independencia dej√≥ profundas huellas en la identidad colombiana y sent√≥ las bases de la construcci√≥n de la naci√≥n.
- clave como Sim√≥n Bol√≠var

In [82]:
# ========= 7. FLAN PARA RESPONDER CON CONTEXTO =========

prompt = f"Bas√°ndote en el siguiente contexto, responde la pregunta y a√±ade una breve explicaci√≥n adicional desde tu conocimiento si es relevante.\n\nContexto:\n{retrieved_context}\n\nPregunta: {query}"

inputs = tokenizer(str(prompt), return_tensors='pt')
flan_context = tokenizer.decode(
    original_model.generate(
        inputs["input_ids"],
        max_new_tokens=10000,
    )[0],
    skip_special_tokens=True
)

print("\nüîπ Respuesta generada por Flan:")
print(flan_context)


üîπ Respuesta generada por Flan:
Sim√≥n Bolvar, Francisco de Paula Santander y Antonio Nario jugaron un papel fundamental en la organizaci√≥n militar y de la Gran Colombia


In [83]:
# ========= 8. FLAN PARA RESPONDER SIN CONTEXTO =========

prompt = f"Responde la pregunta y a√±ade una breve explicaci√≥n adicional desde tu conocimiento si es relevante. \n\nPregunta: {query}"

inputs = tokenizer(str(prompt), return_tensors='pt')
flan_base = tokenizer.decode(
    original_model.generate(
        inputs["input_ids"],
        max_new_tokens=10000,
    )[0],
    skip_special_tokens=True
)

print("\nüîπ Respuesta generada por Flan:")
print(flan_base)


üîπ Respuesta generada por Flan:
Qu√© es un hecho clave en la independencia de Colombia?


In [89]:
# ========= 9. GEMINI PARA RESPONDER CON CONTEXTO =========
model = genai.GenerativeModel("models/gemini-1.5-flash-latest")

gemini_context = model.generate_content(
    f"Bas√°ndote en el siguiente contexto, responde la pregunta y a√±ade una breve explicaci√≥n adicional desde tu conocimiento si es relevante.\n\nContexto:\n{retrieved_context}\n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada por Gemini:")
print(gemini_context.text)


üîπ Respuesta generada por Gemini:
Un hecho clave en la independencia de Colombia fue la Batalla de Boyac√°, el 7 de agosto de 1819.  Esta batalla, ganada por el ej√©rcito independentista liderado por Sim√≥n Bol√≠var, signific√≥ una derrota decisiva para las fuerzas realistas espa√±olas y abri√≥ el camino para la creaci√≥n de la Gran Colombia.  

**Explicaci√≥n adicional:**  Si bien el Grito de Independencia del 20 de julio de 1810 marc√≥ el inicio del proceso, la Batalla de Boyac√° represent√≥ un punto de inflexi√≥n militar que consolid√≥ las victorias independentistas y asegur√≥, en la pr√°ctica, el fin del dominio espa√±ol en una gran parte del territorio que luego conformar√≠a la Gran Colombia.  Fue una victoria estrat√©gica que permiti√≥ a Bol√≠var avanzar hacia Bogot√° y asegurar la independencia de Nueva Granada (actual Colombia).  Sin la victoria en Boyac√°, el camino hacia la independencia habr√≠a sido considerablemente m√°s largo y complejo.



In [90]:
# ========= 10. GEMINI PARA RESPONDER SIN CONTEXTO =========
model = genai.GenerativeModel("models/gemini-1.5-flash-latest")

gemini_base = model.generate_content(
    f"Responde la pregunta y a√±ade una breve explicaci√≥n adicional desde tu conocimiento si es relevante. \n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada por Gemini:")
print(gemini_base.text)


üîπ Respuesta generada por Gemini:
Un hecho clave en la independencia de Colombia fue **la Batalla de Boyac√°, librada el 7 de agosto de 1819**.  Esta batalla, una victoria decisiva del ej√©rcito patriota liderado por Sim√≥n Bol√≠var sobre las fuerzas realistas espa√±olas, asegur√≥ la independencia del Virreinato de Nueva Granada (que inclu√≠a el territorio de la actual Colombia, junto a partes de Venezuela, Ecuador y Panam√°).  La derrota espa√±ola en Boyac√° abri√≥ el camino para la liberaci√≥n de Bogot√° y, posteriormente, la declaraci√≥n formal de la independencia.

**Explicaci√≥n adicional:** Si bien hubo muchos otros eventos importantes en el proceso independentista (como la Campa√±a Libertadora de los Andes,  las luchas de precursores como Camilo Torres y Antonio Nari√±o), la Batalla de Boyac√° es considerada clave por su car√°cter definitorio.  Represent√≥ un punto de inflexi√≥n estrat√©gico, rompiendo el poder√≠o realista en la Nueva Granada y allanando el camino para la con

Para la evaluaci√≥n de m√©tricas se tomar√° como Y real el resultado de realizar la misma pregunta a gpt 5 con la opci√≥n de piensa m√°s tiempo y contexto

In [92]:
chat_response = '''
Un hecho clave fue la Batalla de Boyac√°, ocurrida el 7 de agosto de 1819.

Breve explicaci√≥n: ese triunfo, parte de la Campa√±a Libertadora dirigida por Sim√≥n Bol√≠var, derrot√≥ al ej√©rcito realista y asegur√≥ el camino hacia la independencia efectiva del territorio, permitiendo luego la creaci√≥n de la Gran Colombia y consolidando el proceso militar y pol√≠tico de emancipaci√≥n.
'''

In [66]:
rouge = evaluate.load('rouge')
bleu = evaluate.load('bleu')

Downloading builder script: 0.00B [00:00, ?B/s]

Downloading extra modules:   0%|          | 0.00/1.55k [00:00<?, ?B/s]

Downloading extra modules: 0.00B [00:00, ?B/s]

In [93]:
rouge_flan_context = rouge.compute(
    predictions=[flan_context],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_flan_context = bleu.compute(
    predictions=[flan_context],
    references=[chat_response],
)

rouge_flan_base = rouge.compute(
    predictions=[flan_base],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_flan_base = bleu.compute(
    predictions=[flan_base],
    references=[chat_response],
)

rouge_gemini_context = rouge.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_context = bleu.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
)

rouge_gemini_base = rouge.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_base = bleu.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
)

In [98]:
def compare_bleu(result1, result2, name1="Model 1", name2="Model 2"):
    print(f"\nüîé Comparando {name1} vs {name2}\n")

    # BLEU directo
    print(f"{name1} BLEU: {result1['bleu']}")
    print(f"{name2} BLEU: {result2['bleu']}")

    # Precisions
    for i in range(4):
        print(f"Precisi√≥n {i+1}-gram: {name1}={result1['precisions'][i]:.3f} | {name2}={result2['precisions'][i]:.3f}")

    # Longitud
    print(f"\nLongitud traducci√≥n: {name1}={result1['translation_length']} | {name2}={result2['translation_length']}")
    print(f"Referencia: {result1['reference_length']} (id√©ntica para ambos)")

    # Brevity penalty
    print(f"\nBrevity penalty: {name1}={result1['brevity_penalty']:.4f} | {name2}={result2['brevity_penalty']:.4f}")

    # Ranking simple
    context_score = sum(result1['precisions'])
    base_score = sum(result2['precisions'])

    if context_score > base_score:
        print(f"\nüèÜ {name1} tiene mejores coincidencias de n-gramas.")
    else:
        print(f"\nüèÜ {name2} tiene mejores coincidencias de n-gramas.")

    if result1['translation_length'] > result2['translation_length']:
        print(f"üìè {name1} es m√°s largo y cubre m√°s de la referencia.")
    else:
        print(f"üìè {name2} es m√°s largo y cubre m√°s de la referencia.")

In [101]:
def compare_rouge(result1, result2, name1="Modelo 1", name2="Modelo 2"):
    print(f"\nüîé Comparando ROUGE entre {name1} y {name2}\n")

    metrics = ["rouge1", "rouge2", "rougeL", "rougeLsum"]

    for m in metrics:
        score1 = float(result1[m])
        score2 = float(result2[m])
        mejor = name1 if score1 > score2 else name2 if score2 > score1 else "Empate"

        print(f"{m.upper():<8} | {name1}: {score1:.3f} | {name2}: {score2:.3f} ‚Üí üèÜ {mejor}")

    # Promedio general
    avg1 = sum(float(result1[m]) for m in metrics) / len(metrics)
    avg2 = sum(float(result2[m]) for m in metrics) / len(metrics)

    print("\nüìä Promedio de m√©tricas:")
    print(f"{name1}: {avg1:.3f}")
    print(f"{name2}: {avg2:.3f}")

    if avg1 > avg2:
        print(f"\n‚úÖ {name1} tiene mejor solapamiento global con la referencia.")
    elif avg2 > avg1:
        print(f"\n‚úÖ {name2} tiene mejor solapamiento global con la referencia.")
    else:
        print("\n‚öñÔ∏è Ambos modelos tienen un desempe√±o similar.")

In [102]:
print("Cambios al incluir CONTEXTO para FLAN rouge")
compare_rouge(rouge_flan_context, rouge_flan_base, "FLAN CONTEXTO", "FLAN BASE")

Cambios al incluir CONTEXTO para FLAN rouge

üîé Comparando ROUGE entre FLAN CONTEXTO y FLAN BASE

ROUGE1   | FLAN CONTEXTO: 0.286 | FLAN BASE: 0.182 ‚Üí üèÜ FLAN CONTEXTO
ROUGE2   | FLAN CONTEXTO: 0.112 | FLAN BASE: 0.080 ‚Üí üèÜ FLAN CONTEXTO
ROUGEL   | FLAN CONTEXTO: 0.198 | FLAN BASE: 0.182 ‚Üí üèÜ FLAN CONTEXTO
ROUGELSUM | FLAN CONTEXTO: 0.220 | FLAN BASE: 0.182 ‚Üí üèÜ FLAN CONTEXTO

üìä Promedio de m√©tricas:
FLAN CONTEXTO: 0.204
FLAN BASE: 0.156

‚úÖ FLAN CONTEXTO tiene mejor solapamiento global con la referencia.


In [103]:
compare_bleu(bleu_flan_context, bleu_flan_base, "FLAN CONTEXTO", "FLAN BASE")


üîé Comparando FLAN CONTEXTO vs FLAN BASE

FLAN CONTEXTO BLEU: 0.021995247780975908
FLAN BASE BLEU: 0.0
Precisi√≥n 1-gram: FLAN CONTEXTO=0.478 | FLAN BASE=0.545
Precisi√≥n 2-gram: FLAN CONTEXTO=0.182 | FLAN BASE=0.200
Precisi√≥n 3-gram: FLAN CONTEXTO=0.095 | FLAN BASE=0.000
Precisi√≥n 4-gram: FLAN CONTEXTO=0.050 | FLAN BASE=0.000

Longitud traducci√≥n: FLAN CONTEXTO=23 | FLAN BASE=11
Referencia: 66 (id√©ntica para ambos)

Brevity penalty: FLAN CONTEXTO=0.1542 | FLAN BASE=0.0067

üèÜ FLAN CONTEXTO tiene mejores coincidencias de n-gramas.
üìè FLAN CONTEXTO es m√°s largo y cubre m√°s de la referencia.


In [104]:
compare_rouge(rouge_gemini_context, rouge_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando ROUGE entre GEMINI CONTEXTO y GEMINI BASE

ROUGE1   | GEMINI CONTEXTO: 0.464 | GEMINI BASE: 0.373 ‚Üí üèÜ GEMINI CONTEXTO
ROUGE2   | GEMINI CONTEXTO: 0.261 | GEMINI BASE: 0.203 ‚Üí üèÜ GEMINI CONTEXTO
ROUGEL   | GEMINI CONTEXTO: 0.312 | GEMINI BASE: 0.261 ‚Üí üèÜ GEMINI CONTEXTO
ROUGELSUM | GEMINI CONTEXTO: 0.366 | GEMINI BASE: 0.343 ‚Üí üèÜ GEMINI CONTEXTO

üìä Promedio de m√©tricas:
GEMINI CONTEXTO: 0.351
GEMINI BASE: 0.295

‚úÖ GEMINI CONTEXTO tiene mejor solapamiento global con la referencia.


In [105]:
compare_bleu(bleu_gemini_context, bleu_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando GEMINI CONTEXTO vs GEMINI BASE

GEMINI CONTEXTO BLEU: 0.14972460673717317
GEMINI BASE BLEU: 0.07065330249551115
Precisi√≥n 1-gram: GEMINI CONTEXTO=0.309 | GEMINI BASE=0.227
Precisi√≥n 2-gram: GEMINI CONTEXTO=0.168 | GEMINI BASE=0.095
Precisi√≥n 3-gram: GEMINI CONTEXTO=0.119 | GEMINI BASE=0.048
Precisi√≥n 4-gram: GEMINI CONTEXTO=0.082 | GEMINI BASE=0.024

Longitud traducci√≥n: GEMINI CONTEXTO=162 | GEMINI BASE=211
Referencia: 66 (id√©ntica para ambos)

Brevity penalty: GEMINI CONTEXTO=1.0000 | GEMINI BASE=1.0000

üèÜ GEMINI CONTEXTO tiene mejores coincidencias de n-gramas.
üìè GEMINI BASE es m√°s largo y cubre m√°s de la referencia.


Podemos observar como los modelos con contexto se impusieron sobre los b√°sicos

# 2. **GraphRAG con Gemini + Neo4j: Consultando Grafos de Conocimiento:**

En este ejemplo usamos Gemini para extraer triples sem√°nticos del texto (por ejemplo: (Elon Musk, fund√≥, Tesla)).

Luego esos triples se guardan en Neo4j, una base de datos orientada a grafos.
Despu√©s, podemos hacer consultas usando Cypher, el lenguaje de Neo4j, y finalmente Gemini genera una respuesta en lenguaje natural usando la informaci√≥n consultada.

Esto permite transformar un texto plano en un grafo de conocimiento consultable, lo que es muy √∫til para preguntas complejas que requieren relaciones entre entidades.

## **Preparaci√≥n del entorno:**

Antes de ejecutar el c√≥digo:

1. **Cuenta en Neo4j AuraDB (gratis): https://neo4j.com/product/auradb/**

- Ir a Neo4j AuraDB Free.

- Crear una cuenta y una base de datos gratuita.

- Copiar los datos de conexi√≥n (URI, Usuario, Contrase√±a).

**‚ö†Ô∏è Este paso, al igual que la creaci√≥n de la API Key de Gemini, solo ser√° necesario si las credenciales ya incluidas en el c√≥digo no funcionan.
De esta manera, cada estudiante tendr√° la opci√≥n de usar sus propias credenciales y su propia base de datos personalizada en caso de que sea necesario.**

2. **Nuevamente tener presente los archivos disponibles en Drive:https://drive.google.com/drive/folders/1uF7-oSMpzSdID2ltQf9NsU5Snf16fHfx?usp=sharing**

- cuantica.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- innovadores.txt ‚Üí introducci√≥n a la f√≠sica cu√°ntica. **(Usado en al demo en clase)**.

- historia_Colombia.txt ‚Üí texto sobre historia de Colombia.

- historia_internet.txt ‚Üí documento con explicaci√≥n b√°sica de Einstein.

üëâ **Suban uno de estos archivos (o el suyo propio) cuando el c√≥digo lo pida.****

## **Snippets de Cypher para practicar**

Los estudiantes pueden reemplazar el query y la pregunta con estos ejemplos (COPIAR Y PEGAR EN EL BLOQUE DE CODIGO DEL GRAPHRAG):

### **Para el documento innovadores.txt disponible en google drive:** ¬øCu√°les son las empresas fundadas por Elon Musk y por Steve Jobs, a qu√© se dedica cada una y por qu√© es importante lo que hacen?


In [106]:
cypher_query = """
MATCH (p:Entidad)-[r:RELACION]->(c:Entidad)
RETURN p.name AS persona, r.tipo AS relacion, c.name¬†AS¬†compania
"""

### **Para el documento hisotria_internet.txt disponible en google drive:** ¬øCu√°l fue la importancia de Tim Berners-Lee en la historia de Internet?

In [107]:
cypher_query = """
MATCH (a:Entidad)-[r:RELACION]->(b:Entidad)
WHERE a.name = "Tim Berners-Lee"
RETURN a.name AS a, r.tipo AS relacion, b.name AS b
"""

In [108]:
# ================== INSTALACI√ìN ==================
!pip install neo4j google-generativeai

import os
from neo4j import GraphDatabase
import google.generativeai as genai
from google.colab import files

# üëâ Configura Neo4j con tus propios datos (SOLO si falla la configuraci√≥n por defecto del Colab)
NEO4J_URI = userdata.get('NEO4J_URI')
NEO4J_USER = userdata.get('NEO4J_USERNAME')
NEO4J_PASSWORD = userdata.get('NEO4J_PASSWORD')

driver = GraphDatabase.driver(NEO4J_URI, auth=(NEO4J_USER, NEO4J_PASSWORD))

# ================== SUBIR DOCUMENTO ==================
print("Sube un archivo de texto con informaci√≥n (ej: innovadores.txt)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()

# ================== EXTRAER TRIPLES CON GEMINI ==================
model = genai.GenerativeModel("models/gemini-1.5-flash-latest")

prompt = f"""
Extrae relaciones del siguiente texto en formato de triples:
(SUJETO, RELACI√ìN, OBJETO).
Texto:
{text}
"""

response = model.generate_content(prompt)
print("üîπ Triples extra√≠dos por Gemini:")
print(response.text)

# ================== GUARDAR TRIPLES EN NEO4J ==================
def insert_triple(tx, s, r, o):
    query = """
    MERGE (a:Entidad {name: $s})
    MERGE (b:Entidad {name: $o})
    MERGE (a)-[rel:RELACION {tipo: $r}]->(b)
    """
    tx.run(query, s=s, r=r, o=o)

triples = []
for line in response.text.split("\n"):
    if "(" in line and ")" in line:
        line = line.strip("()")
        parts = [p.strip() for p in line.split(",")]
        if len(parts) == 3:
            triples.append(parts)

with driver.session() as session:
    for s, r, o in triples:
        session.write_transaction(insert_triple, s, r, o)

print(f"‚úÖ Se insertaron {len(triples)} triples en Neo4j")

# ================== CONSULTA AL GRAFO ==================
def query_graph(query):
    with driver.session() as session:
        result = session.run(query)
        return [dict(r) for r in result]

# AQUI PUEDEN CAMBIAR LAS QUERY POR LOS EJEMPLOS DE ARRIBA ============================== ‚è∞‚è∞‚è∞ =============================
cypher_query = """
MATCH (p:Entidad)-[r:RELACION]->(c:Entidad)
RETURN p.name AS persona, r.tipo AS relacion, c.name¬†AS¬†compania
"""

results = query_graph(cypher_query)

print("\nüîπ Resultados de la consulta Cypher:")
for r in results:
    print(f"{r['persona']} {r['relacion']} {r['compania']}")

Collecting neo4j
  Downloading neo4j-5.28.2-py3-none-any.whl.metadata (5.9 kB)
Downloading neo4j-5.28.2-py3-none-any.whl (313 kB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m313.2/313.2 kB[0m [31m8.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: neo4j
Successfully installed neo4j-5.28.2
Sube un archivo de texto con informaci√≥n (ej: innovadores.txt)


Saving innovadores.txt to innovadores.txt
üîπ Triples extra√≠dos por Gemini:
Aqu√≠ hay algunas relaciones extra√≠das del texto en formato de triples (SUJETO, RELACI√ìN, OBJETO):

* (Elon Musk, fund√≥, Tesla)
* (Tesla, tipo_de_compa√±√≠a, fabricante de autom√≥viles el√©ctricos)
* (Tesla, se_dedica_a, soluciones de energ√≠a renovable)
* (Elon Musk, fund√≥, SpaceX)
* (SpaceX, tipo_de_empresa, empresa de exploraci√≥n espacial)
* (SpaceX, desarrolla, cohetes)
* (SpaceX, desarrolla, sat√©lites)
* (Elon Musk, particip√≥_en_la_creaci√≥n_de, PayPal)
* (PayPal, tipo_de_sistema, sistema de pagos en l√≠nea)
* (PayPal, revolucion√≥, transacciones digitales)
* (Steve Jobs, fue_cofundador_de, Apple)
* (Apple, reconocida_por, productos tecnol√≥gicos innovadores)
* (Apple, desarroll√≥, iPhone)
* (Apple, desarroll√≥, iPad)
* (Apple, desarroll√≥, MacBook)
* (Apple, clave_en_el_desarrollo_de, industria de los dispositivos inteligentes)
* (Jeff Bezos, fund√≥, Amazon)
* (Amazon, inicialmente, librer√≠a en 

  session.write_transaction(insert_triple, s, r, o)


‚úÖ Se insertaron 34 triples en Neo4j

üîπ Resultados de la consulta Cypher:
Aqu√≠ tienes las relaciones extra√≠das del texto en formato de triples (SUJETO RELACI√ìN OBJETO):
Aqu√≠ hay algunas relaciones extra√≠das del texto en formato de triples (SUJETO RELACI√ìN OBJETO):
* (Elon Musk fund√≥ Tesla
* (Tesla tipo_de_compa√±√≠a fabricante de autom√≥viles el√©ctricos
* (Tesla se_dedica_a soluciones de energ√≠a renovable
* (Elon Musk fund√≥ SpaceX
* (SpaceX tipo_de_empresa empresa de exploraci√≥n espacial
* (SpaceX desarrolla cohetes
* (SpaceX desarrolla sat√©lites
* (Elon Musk particip√≥_en_la_creaci√≥n_de PayPal
* (PayPal tipo_de_sistema sistema de pagos en l√≠nea
* (PayPal revolucion√≥ transacciones digitales
* (Steve Jobs cofundador_de Apple
* (Steve Jobs fue_cofundador_de Apple
* (Apple reconocida_por productos tecnol√≥gicos innovadores
* (Apple produjo iPhone
* (Apple desarroll√≥ iPhone
* (Apple produjo iPad
* (Apple desarroll√≥ iPad
* (Apple produjo MacBook
* (Apple desarroll√≥ Mac

In [109]:
context = "\n".join([f"{r['persona']} {r['relacion']} {r['compania']}" for r in results])

Ya no se usar√° flan por el tiempo de entrenamiento

In [120]:
# ================== GEMINI CON CONTEXTO PARA RESPUESTA FINAL ==================
context = "\n".join([f"{r['persona']} {r['relacion']} {r['compania']}" for r in results])

final_prompt = f"""
Bas√°ndote en el siguiente contexto de un grafo de conocimiento, responde la pregunta y proporciona contexto:

Contexto:
{context}

Pregunta:  ¬øCu√°les son las empresas fundadas por Elon Musk y por Steve Jobs, a qu√© se dedica cada una y por qu√© es importante lo que hacen?
"""

gemini_context = model.generate_content(final_prompt)
print("\nüîπ Respuesta generada por Gemini con contexto:")
print(gemini_context.text)


üîπ Respuesta generada por Gemini con contexto:
Elon Musk fund√≥ Tesla y SpaceX.

* **Tesla:** Es una fabricante de autom√≥viles el√©ctricos y se dedica a soluciones de energ√≠a renovable.  Su importancia radica en su contribuci√≥n a la lucha contra el cambio clim√°tico a trav√©s del desarrollo de veh√≠culos el√©ctricos y soluciones de energ√≠a limpia.

* **SpaceX:** Es una empresa de exploraci√≥n espacial que desarrolla cohetes y sat√©lites. Su importancia reside en su avance en la tecnolog√≠a espacial, abriendo nuevas posibilidades para la exploraci√≥n del espacio y el desarrollo de infraestructura espacial.


Steve Jobs fue cofundador de Apple.

* **Apple:** Es una empresa reconocida por sus productos tecnol√≥gicos innovadores, como el iPhone, el iPad y el MacBook.  Su importancia radica en su influencia transformadora en la industria de los dispositivos inteligentes, estableciendo est√°ndares de dise√±o, usabilidad y experiencia de usuario que han impactado globalmente.  Su desar

In [121]:
# ================== GEMINI SIN CONTEXTO PARA RESPUESTA FINAL ==================

final_prompt = f"""
Pregunta:  ¬øCu√°les son las empresas fundadas por Elon Musk y por Steve Jobs, a qu√© se dedica cada una y por qu√© es importante lo que hacen?
"""

gemini_base = model.generate_content(final_prompt)
print("\nüîπ Respuesta generada por Gemini sin contexto:")
print(gemini_base.text)


üîπ Respuesta generada por Gemini sin contexto:
## Empresas fundadas por Elon Musk y Steve Jobs:

**Elon Musk:**

* **SpaceX:** Se dedica a la fabricaci√≥n de cohetes y naves espaciales reutilizables, con el objetivo de reducir los costos del acceso al espacio y facilitar la colonizaci√≥n de Marte.  Su importancia radica en el potencial de revolucionar la industria espacial, haciendola m√°s accesible y abriendo posibilidades para la exploraci√≥n espacial a gran escala y la b√∫squeda de recursos fuera de la Tierra.  Esto podr√≠a impactar significativamente en la ciencia, la tecnolog√≠a y la econom√≠a global a largo plazo.

* **Tesla, Inc.:** Se enfoca en el dise√±o, desarrollo, fabricaci√≥n y venta de veh√≠culos el√©ctricos, bater√≠as de energ√≠a, paneles solares y sistemas de energ√≠a solar. La importancia de Tesla reside en su liderazgo en la transici√≥n hacia una energ√≠a limpia y sostenible,  impulsando la adopci√≥n masiva de veh√≠culos el√©ctricos y el desarrollo de tecnolog√≠as 

In [126]:
chat_response = '''
# Elon Musk ‚Äî empresas, a qu√© se dedican y por qu√© importan

* **Tesla** ‚Äî fabricante de autom√≥viles el√©ctricos y proveedor de soluciones de energ√≠a renovable.
  **Por qu√© importa:** impulsa la electrificaci√≥n del transporte y la adopci√≥n de energ√≠as limpias, reduciendo emisiones y acelerando la transici√≥n hacia sistemas de movilidad y energ√≠a m√°s sostenibles.

* **SpaceX** ‚Äî empresa de exploraci√≥n espacial que desarrolla cohetes y sat√©lites.
  **Por qu√© importa:** ha abaratado y acelerado el acceso al espacio (reutilizaci√≥n de cohetes), habilita comunicaciones por sat√©lite y abre posibilidades para la investigaci√≥n y la exploraci√≥n interplanetaria.

* **PayPal** (particip√≥ en su creaci√≥n) ‚Äî sistema de pagos en l√≠nea que transform√≥ las transacciones digitales.
  **Por qu√© importa:** facilit√≥ pagos electr√≥nicos seguros y escalables, impulsando el comercio electr√≥nico y la econom√≠a digital.

# Steve Jobs ‚Äî empresas, a qu√© se dedican y por qu√© importan

* **Apple** (cofundador) ‚Äî compa√±√≠a tecnol√≥gica reconocida por productos como iPhone, iPad y MacBook; desarrolla dispositivos y ecosistemas de software/hardware.
  **Por qu√© importa:** redefini√≥ la experiencia de usuario en dispositivos personales, impuls√≥ la era del smartphone y cre√≥ un ecosistema que influye en dise√±o, interfaces y modelos de negocio tecnol√≥gicos a nivel global.

# Contexto (extra√≠do del grafo)

Las respuestas se basan en las relaciones del grafo provisto: `(Elon Musk fund√≥ Tesla)`, `(Tesla tipo_de_compa√±√≠a fabricante de autom√≥viles el√©ctricos)`, `(Tesla se_dedica_a soluciones de energ√≠a renovable)`, `(Elon Musk fund√≥ SpaceX)`, `(SpaceX tipo_de_empresa empresa de exploraci√≥n espacial)`, `(SpaceX desarrolla cohetes)`, `(Elon Musk particip√≥_en_la_creaci√≥n_de PayPal)`, `(PayPal tipo_de_sistema sistema de pagos en l√≠nea)`, `(Steve Jobs cofundador_de Apple)`, `(Apple produjo iPhone/iPad/MacBook)` y `(Apple reconocida_por productos tecnol√≥gicos innovadores)`.

Si quieres, puedo ordenar esto en una tabla compacta o a√±adir ejemplos concretos (p. ej. modelos de Tesla o hitos de SpaceX) ‚Äî dime si quieres m√°s detalle.
'''

In [127]:
rouge_gemini_context = rouge.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_context = bleu.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
)

rouge_gemini_base = rouge.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_base = bleu.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
)

In [128]:
compare_rouge(rouge_gemini_context, rouge_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando ROUGE entre GEMINI CONTEXTO y GEMINI BASE

ROUGE1   | GEMINI CONTEXTO: 0.434 | GEMINI BASE: 0.344 ‚Üí üèÜ GEMINI CONTEXTO
ROUGE2   | GEMINI CONTEXTO: 0.200 | GEMINI BASE: 0.121 ‚Üí üèÜ GEMINI CONTEXTO
ROUGEL   | GEMINI CONTEXTO: 0.260 | GEMINI BASE: 0.170 ‚Üí üèÜ GEMINI CONTEXTO
ROUGELSUM | GEMINI CONTEXTO: 0.389 | GEMINI BASE: 0.302 ‚Üí üèÜ GEMINI CONTEXTO

üìä Promedio de m√©tricas:
GEMINI CONTEXTO: 0.321
GEMINI BASE: 0.234

‚úÖ GEMINI CONTEXTO tiene mejor solapamiento global con la referencia.


In [129]:
compare_rouge(rouge_gemini_context, rouge_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando ROUGE entre GEMINI CONTEXTO y GEMINI BASE

ROUGE1   | GEMINI CONTEXTO: 0.434 | GEMINI BASE: 0.344 ‚Üí üèÜ GEMINI CONTEXTO
ROUGE2   | GEMINI CONTEXTO: 0.200 | GEMINI BASE: 0.121 ‚Üí üèÜ GEMINI CONTEXTO
ROUGEL   | GEMINI CONTEXTO: 0.260 | GEMINI BASE: 0.170 ‚Üí üèÜ GEMINI CONTEXTO
ROUGELSUM | GEMINI CONTEXTO: 0.389 | GEMINI BASE: 0.302 ‚Üí üèÜ GEMINI CONTEXTO

üìä Promedio de m√©tricas:
GEMINI CONTEXTO: 0.321
GEMINI BASE: 0.234

‚úÖ GEMINI CONTEXTO tiene mejor solapamiento global con la referencia.


# 3. **FusionRAG (BM25 + Embeddings)**

En este ejemplo se combina lo mejor de dos enfoques de recuperaci√≥n de informaci√≥n:

- BM25 (keyword-based): Recupera pasajes bas√°ndose en la coincidencia de palabras clave.

- Vector Search (embeddings con ChromaDB): Recupera fragmentos usando similitud sem√°ntica.

Ambos resultados se fusionan para obtener un contexto m√°s robusto y completo, que luego se pasa al modelo Gemini para generar una respuesta.

üëâ Deben subir un archivo de texto (ej: cuantica.txt, historia_colombia.txt, innovadores.txt o historia_internet.txt) y luego probar con diferentes preguntas modificando el campo query.

## **Preparaci√≥n del entorno:**

Si ya configuraste los entornos de los ejemplos anteriores, no necesitas hacer nada adicional para este bloque. üöÄ

In [131]:
# ================= DEMO FUSION RAG ==================
!pip install rank_bm25 chromadb sentence-transformers google-generativeai

from rank_bm25 import BM25Okapi
import google.generativeai as genai
from sentence_transformers import SentenceTransformer
import chromadb
import os
from google.colab import files

# ================= CONFIGURACI√ìN GEMINI ==================
# üëâ API Key de Gemini (puede usar la nuestra o crear la suya en https://aistudio.google.com/)
model = genai.GenerativeModel("models/gemini-1.5-flash-latest")

# ================= SUBIR DOCUMENTO ==================
print("üìÇ Sube un archivo de texto con informaci√≥n (ej: cuantica.txt, historia_colombia.txt, etc.)")
uploaded = files.upload()

file_name = list(uploaded.keys())[0]
with open(file_name, "r", encoding="utf-8") as f:
    text = f.read()

# ================= CHUNKING ==================
def chunk_text(text, chunk_size=80, overlap=20):
    words = text.split()
    return [" ".join(words[i:i+chunk_size]) for i in range(0, len(words), chunk_size - overlap)]

docs = chunk_text(text)

# ========= Vector Store (embeddings con ChromaDB)
embedder = SentenceTransformer("all-MiniLM-L6-v2")
client = chromadb.Client()
collection = client.get_or_create_collection("fusion_chunks")
embeddings = embedder.encode(docs).tolist()
for i, d in enumerate(docs):
    collection.add(documents=[d], embeddings=[embeddings[i]], ids=[str(i)])

# ========= BM25 retriever
tokenized_corpus = [d.split(" ") for d in docs]
bm25 = BM25Okapi(tokenized_corpus)

# ========= Fusion Retrieval
query = "¬øQu√© cient√≠fico propuso un modelo at√≥mico en 1913?"
q_embed = embedder.encode([query]).tolist()
results_vector = collection.query(query_embeddings=q_embed, n_results=3)
results_bm25 = bm25.get_top_n(query.split(" "), docs, n=3)

# Fusi√≥n (simple: concatenaci√≥n + eliminaci√≥n de duplicados)
fusion_results = list(set(results_vector['documents'][0] + results_bm25))
retrieved_context = " ".join(fusion_results)


üìÇ Sube un archivo de texto con informaci√≥n (ej: cuantica.txt, historia_colombia.txt, etc.)


Saving cuantica.txt to cuantica.txt


In [132]:
# ================= GEMINI CON CONTEXTO PARA RESPUESTA FINAL ==================
gemini_context = model.generate_content(
    f"Bas√°ndote en el siguiente contexto (resultado de fusi√≥n de m√∫ltiples recuperadores), responde la pregunta y a√±ade explicaci√≥n:\n\n{retrieved_context}\n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada con FusionRAG:")
print(gemini_context.text)


üîπ Respuesta generada con FusionRAG:
Niels Bohr propuso un modelo at√≥mico en 1913.  El texto lo indica expl√≠citamente: "Niels Bohr en 1913 propuso su modelo at√≥mico, donde los electrones orbitaban en niveles de energ√≠a cuantizados alrededor del n√∫cleo".  Este modelo fue un avance significativo en la comprensi√≥n de la estructura at√≥mica, introduciendo la idea de niveles de energ√≠a discretos para los electrones.



In [133]:
# ================== GEMINI SIN CONTEXTO PARA RESPUESTA FINAL ==================
gemini_base = model.generate_content(
    f"Responde la pregunta y a√±ade explicaci√≥n:\n\n{retrieved_context}\n\nPregunta: {query}"
)

print("\nüîπ Respuesta generada con FusionRAG:")
print(gemini_base.text)


üîπ Respuesta generada con FusionRAG:
Niels Bohr propuso un modelo at√≥mico en 1913.  Su modelo postulaba que los electrones orbitan el n√∫cleo at√≥mico en niveles de energ√≠a cuantizados.  Esto significaba que los electrones s√≥lo pod√≠an ocupar ciertas √≥rbitas espec√≠ficas, a diferencia de los modelos anteriores que permit√≠an √≥rbitas a cualquier distancia del n√∫cleo.  Este concepto de cuantizaci√≥n de la energ√≠a fue un paso crucial en el desarrollo de la mec√°nica cu√°ntica y explicaba, por ejemplo, el espectro de emisi√≥n del √°tomo de hidr√≥geno.  El modelo de Bohr, aunque posteriormente reemplazado por modelos m√°s precisos, fue fundamental para comprender la estructura at√≥mica y sent√≥ las bases para desarrollos posteriores en la f√≠sica cu√°ntica.



In [135]:
chat_response = '''
Niels Bohr propuso en 1913 su modelo at√≥mico.

Explicaci√≥n breve: el modelo de Bohr plante√≥ que los electrones orbitan el n√∫cleo en niveles de energ√≠a cuantizados (√≥rbitas discretas) y que los saltos entre esos niveles producen las l√≠neas espectrales ‚Äîesto ayud√≥ a explicar el espectro del hidr√≥geno y fue un paso clave hacia la f√≠sica cu√°ntica moderna, construyendo sobre ideas de Planck y Rutherford.
'''

In [136]:
rouge_gemini_context = rouge.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_context = bleu.compute(
    predictions=[gemini_context.text],
    references=[chat_response],
)

rouge_gemini_base = rouge.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
    use_aggregator=True,
    use_stemmer=True,
)

bleu_gemini_base = bleu.compute(
    predictions=[gemini_base.text],
    references=[chat_response],
)

In [137]:
compare_rouge(rouge_gemini_context, rouge_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando ROUGE entre GEMINI CONTEXTO y GEMINI BASE

ROUGE1   | GEMINI CONTEXTO: 0.482 | GEMINI BASE: 0.495 ‚Üí üèÜ GEMINI BASE
ROUGE2   | GEMINI CONTEXTO: 0.222 | GEMINI BASE: 0.306 ‚Üí üèÜ GEMINI BASE
ROUGEL   | GEMINI CONTEXTO: 0.336 | GEMINI BASE: 0.343 ‚Üí üèÜ GEMINI BASE
ROUGELSUM | GEMINI CONTEXTO: 0.365 | GEMINI BASE: 0.374 ‚Üí üèÜ GEMINI BASE

üìä Promedio de m√©tricas:
GEMINI CONTEXTO: 0.351
GEMINI BASE: 0.380

‚úÖ GEMINI BASE tiene mejor solapamiento global con la referencia.


In [138]:
compare_bleu(bleu_gemini_context, bleu_gemini_base, "GEMINI CONTEXTO", "GEMINI BASE")


üîé Comparando GEMINI CONTEXTO vs GEMINI BASE

GEMINI CONTEXTO BLEU: 0.11053882014042914
GEMINI BASE BLEU: 0.12925607807122994
Precisi√≥n 1-gram: GEMINI CONTEXTO=0.462 | GEMINI BASE=0.368
Precisi√≥n 2-gram: GEMINI CONTEXTO=0.172 | GEMINI BASE=0.181
Precisi√≥n 3-gram: GEMINI CONTEXTO=0.079 | GEMINI BASE=0.096
Precisi√≥n 4-gram: GEMINI CONTEXTO=0.032 | GEMINI BASE=0.044

Longitud traducci√≥n: GEMINI CONTEXTO=65 | GEMINI BASE=117
Referencia: 70 (id√©ntica para ambos)

Brevity penalty: GEMINI CONTEXTO=0.9260 | GEMINI BASE=1.0000

üèÜ GEMINI CONTEXTO tiene mejores coincidencias de n-gramas.
üìè GEMINI BASE es m√°s largo y cubre m√°s de la referencia.


Podemos observar como las t√©cnicas de RAG pueden no siempre resultar √∫tiles, en especial en modelos con bases de datos superiores a las nuestras, esto lo podemos observar sobre como GEMINI BASE obtuvo una victoria seg√∫n las m√©tricas en este √∫ltimo enfoque de RAG