# Chatbot RAG para Guaran√≠ - Idioma de Bajo Recursos

Este notebook implementa un sistema de chatbot con RAG (Retrieval-Augmented Generation) para el idioma guaran√≠.

## Objetivos:
1. Comparar 2 modelos de LLM (GPT-3.5 Turbo vs Claude 3.5 Sonnet)
2. Evaluar rendimiento con y sin RAG
3. Comparar few-shot, zero-shot y RAG
4. Evaluar si el idioma de bajo recursos se beneficia del RAG

## Estructura:
- Instalaci√≥n de dependencias
- Carga de datos desde PDF de gram√°tica guaran√≠
- Implementaci√≥n de RAG con FAISS
- Configuraci√≥n de LLMs con OpenRouter
- Evaluaci√≥n y comparaci√≥n de modelos

## 1. Instalaci√≥n de Dependencias

In [None]:
# Instalaci√≥n de librer√≠as necesarias
!pip install -q langchain langchain-community
!pip install -q chromadb
!pip install -q sentence-transformers
!pip install -q openai
!pip install -q python-dotenv
!pip install -q transformers torch accelerate
!pip install -q datasets
!pip install -q faiss-cpu
!pip install -q tiktoken
!pip install -q pymupdf  # Para extracci√≥n de texto desde PDFs

print("‚úì Dependencias instaladas correctamente")

## 2. Configuraci√≥n e Importaciones

In [None]:
import os
import json
from typing import List, Dict, Any
from getpass import getpass
import fitz  # PyMuPDF

# LangChain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import FAISS, Chroma
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.docstore.document import Document
from langchain.prompts import PromptTemplate
from langchain.chains import RetrievalQA

# Transformers
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

# Utilidades
import numpy as np
from datasets import load_dataset
import warnings
warnings.filterwarnings('ignore')

print("‚úì Importaciones completadas")

In [None]:
# Configuraci√≥n de API Keys (OpenRouter y HuggingFace)
print("Configurando API Keys...")
print("Necesitas:")
print("1. OpenRouter API Key (para GPT-3.5 y Claude)")
print("2. HuggingFace Token (opcional, para modelos privados)")
print()

OPENROUTER_API_KEY = getpass("Ingresa tu API Key de OpenRouter: ")
os.environ["OPENROUTER_API_KEY"] = OPENROUTER_API_KEY

# HuggingFace token (opcional)
HF_TOKEN = getpass("Ingresa tu HuggingFace Token (Enter para omitir): ")
if HF_TOKEN:
    os.environ["HUGGINGFACE_TOKEN"] = HF_TOKEN

# Configuraci√≥n de dispositivo
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"\n‚úì Usando dispositivo: {device}")
if device == "cuda":
    print(f"  GPU: {torch.cuda.get_device_name(0)}")
    print(f"  Memoria disponible: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")

## 3. Carga de Datos - PDF de Gram√°tica Guaran√≠

En esta secci√≥n cargamos el PDF real de gram√°tica guaran√≠ y lo procesamos para crear chunks sem√°nticamente coherentes.

In [None]:
def extract_text_from_pdf(pdf_path: str) -> str:
    """
    Extrae texto de un archivo PDF usando PyMuPDF.
    
    Args:
        pdf_path: Ruta al archivo PDF
        
    Returns:
        Texto extra√≠do del PDF
    """
    try:
        doc = fitz.open(pdf_path)
        text = ""
        
        print(f"Procesando PDF: {pdf_path}")
        print(f"Total de p√°ginas: {len(doc)}")
        
        for page_num, page in enumerate(doc, 1):
            page_text = page.get_text()
            text += f"\n--- P√°gina {page_num} ---\n{page_text}"
            
            if page_num % 10 == 0:
                print(f"  Procesadas {page_num} p√°ginas...")
        
        doc.close()
        print(f"‚úì Extracci√≥n completada: {len(text)} caracteres")
        return text.strip()
        
    except Exception as e:
        print(f"‚ùå Error al procesar el PDF: {e}")
        return ""

# Ruta al PDF (ajustar si es necesario)
# En Colab, primero debes subir el archivo o montarlo desde Drive
PDF_PATH = "dataset/GramaticaGuarani.pdf"

# Si est√°s en Colab, descomenta estas l√≠neas para subir el archivo:
# from google.colab import files
# uploaded = files.upload()
# PDF_PATH = list(uploaded.keys())[0]

# O monta Google Drive:
# from google.colab import drive
# drive.mount('/content/drive')
# PDF_PATH = '/content/drive/MyDrive/path/to/GramaticaGuarani.pdf'

# Extraer texto del PDF
pdf_text = extract_text_from_pdf(PDF_PATH)

# Mostrar muestra del texto extra√≠do
print("\n" + "="*60)
print("MUESTRA DEL TEXTO EXTRA√çDO (primeros 500 caracteres):")
print("="*60)
print(pdf_text[:500])
print("...")

In [None]:
# Dividir el texto en chunks sem√°nticamente coherentes
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,  # Tama√±o de cada chunk en caracteres
    chunk_overlap=200,  # Solapamiento entre chunks para mantener contexto
    length_function=len,
    separators=["\n\n", "\n", ". ", " ", ""]  # Prioridad de separadores
)

# Crear chunks
text_chunks = text_splitter.split_text(pdf_text)

print(f"‚úì Texto dividido en {len(text_chunks)} chunks")
print(f"  Tama√±o promedio: {sum(len(chunk) for chunk in text_chunks) / len(text_chunks):.0f} caracteres")
print(f"  Chunk m√°s peque√±o: {min(len(chunk) for chunk in text_chunks)} caracteres")
print(f"  Chunk m√°s grande: {max(len(chunk) for chunk in text_chunks)} caracteres")

# Crear documentos de LangChain
documents = []
for i, chunk in enumerate(text_chunks):
    documents.append(
        Document(
            page_content=chunk,
            metadata={
                "source": "GramaticaGuarani.pdf",
                "chunk_id": i
            }
        )
    )

print(f"\n‚úì Creados {len(documents)} documentos de LangChain")

# Mostrar ejemplo de un chunk
print("\n" + "="*60)
print("EJEMPLO DE CHUNK #5:")
print("="*60)
print(documents[5].page_content[:300] + "...")

## 4. Implementaci√≥n del Sistema RAG

In [None]:
# Crear embeddings multiling√ºes
print("Cargando modelo de embeddings multiling√ºe...")
print("Modelo: sentence-transformers/paraphrase-multilingual-mpnet-base-v2")
print("Este modelo soporta 50+ idiomas, incluyendo espa√±ol y guaran√≠.\n")

embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/paraphrase-multilingual-mpnet-base-v2",
    model_kwargs={'device': device}
)

print("‚úì Modelo de embeddings cargado")

In [None]:
# Crear vector store con FAISS
print("Creando vector store con FAISS...")
print(f"Procesando {len(documents)} documentos...\n")

vectorstore = FAISS.from_documents(documents, embeddings)

# Guardar el vector store para uso posterior
vectorstore.save_local("vectorstore_guarani")

print("‚úì Vector store creado y guardado en 'vectorstore_guarani/'")
print("  Este vector store se usar√° en la aplicaci√≥n Chainlit")

In [None]:
# Probar el retriever con una consulta de ejemplo
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 3}  # Recuperar los 3 documentos m√°s relevantes
)

print("‚úì Retriever configurado\n")

# Prueba de recuperaci√≥n
test_query = "¬øCu√°les son los pronombres personales en guaran√≠?"
print(f"Consulta de prueba: {test_query}\n")

relevant_docs = retriever.get_relevant_documents(test_query)

print(f"Documentos recuperados: {len(relevant_docs)}\n")
for i, doc in enumerate(relevant_docs, 1):
    print(f"--- Documento {i} ---")
    print(f"Fuente: {doc.metadata['source']}")
    print(f"Chunk ID: {doc.metadata['chunk_id']}")
    print(f"Contenido (primeros 200 caracteres):\n{doc.page_content[:200]}...\n")

## 5. Configuraci√≥n de LLMs con OpenRouter

In [None]:
import requests

class OpenRouterLLM:
    """Wrapper para usar OpenRouter con diferentes modelos"""
    
    def __init__(self, model_name: str, api_key: str):
        self.model_name = model_name
        self.api_key = api_key
        self.api_url = "https://openrouter.ai/api/v1/chat/completions"
    
    def __call__(self, prompt: str, **kwargs) -> str:
        """Genera respuesta del modelo"""
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }
        
        data = {
            "model": self.model_name,
            "messages": [
                {"role": "user", "content": prompt}
            ],
            "max_tokens": kwargs.get("max_tokens", 500),
            "temperature": kwargs.get("temperature", 0.7)
        }
        
        try:
            response = requests.post(self.api_url, headers=headers, json=data, timeout=30)
            
            if response.status_code == 200:
                return response.json()["choices"][0]["message"]["content"]
            else:
                error_msg = f"Error {response.status_code}: {response.text}"
                print(f"‚ùå {error_msg}")
                return error_msg
        except Exception as e:
            error_msg = f"Error de conexi√≥n: {str(e)}"
            print(f"‚ùå {error_msg}")
            return error_msg
    
    def generate(self, prompt: str, **kwargs) -> str:
        """Alias para compatibilidad"""
        return self.__call__(prompt, **kwargs)

# Configurar dos modelos diferentes para comparaci√≥n
print("Configurando modelos LLM...\n")

# Modelo 1: GPT-3.5 Turbo (m√°s r√°pido y econ√≥mico)
model_1 = OpenRouterLLM(
    model_name="openai/gpt-3.5-turbo",
    api_key=OPENROUTER_API_KEY
)

# Modelo 2: Claude Sonnet (m√°s potente)
model_2 = OpenRouterLLM(
    model_name="anthropic/claude-3.5-sonnet",
    api_key=OPENROUTER_API_KEY
)

print("‚úì Modelos configurados:")
print("  - Modelo 1: GPT-3.5 Turbo (OpenAI)")
print("  - Modelo 2: Claude 3.5 Sonnet (Anthropic)")

# Probar conexi√≥n con ambos modelos
print("\nProbando conexi√≥n con los modelos...\n")

test_prompt = "Di 'hola' en una palabra."
print(f"Prompt de prueba: {test_prompt}\n")

print("Modelo 1 (GPT-3.5):")
response_1 = model_1.generate(test_prompt, max_tokens=50)
print(f"  Respuesta: {response_1}\n")

print("Modelo 2 (Claude 3.5):")
response_2 = model_2.generate(test_prompt, max_tokens=50)
print(f"  Respuesta: {response_2}\n")

if "Error" not in response_1 and "Error" not in response_2:
    print("‚úì Ambos modelos funcionan correctamente")
else:
    print("‚ö†Ô∏è Verifica tus API keys y conexi√≥n a internet")

## 6. Implementaci√≥n de Diferentes Estrategias

In [None]:
class GuaraniChatbot:
    """Sistema de chatbot para guaran√≠ con diferentes estrategias"""
    
    def __init__(self, llm, retriever=None):
        self.llm = llm
        self.retriever = retriever
    
    def zero_shot(self, question: str) -> str:
        """Estrategia Zero-Shot: sin ejemplos ni contexto adicional"""
        prompt = f"""Eres un asistente experto en el idioma guaran√≠.
        
Pregunta: {question}

Responde de manera clara y concisa."""
        
        return self.llm.generate(prompt)
    
    def few_shot(self, question: str) -> str:
        """Estrategia Few-Shot: con ejemplos de referencia"""
        prompt = f"""Eres un asistente experto en el idioma guaran√≠. Aqu√≠ hay algunos ejemplos:

Ejemplo 1:
Pregunta: ¬øC√≥mo se dice "yo" en guaran√≠?
Respuesta: En guaran√≠, "yo" se dice "Che".

Ejemplo 2:
Pregunta: ¬øC√≥mo se dice "hola" en guaran√≠?
Respuesta: En guaran√≠, una forma com√∫n de saludar es "Mba'√©ichapa", que significa "¬øc√≥mo est√°s?".

Ejemplo 3:
Pregunta: ¬øCu√°l es la estructura b√°sica de las oraciones en guaran√≠?
Respuesta: El guaran√≠ usa una estructura SOV (Sujeto-Objeto-Verbo). Por ejemplo: "Che tembi'u ajuka" (Yo comida como).

Ahora responde esta pregunta:
Pregunta: {question}
Respuesta:"""
        
        return self.llm.generate(prompt)
    
    def rag(self, question: str) -> str:
        """Estrategia RAG: con recuperaci√≥n de documentos relevantes"""
        if self.retriever is None:
            return "Error: Retriever no configurado"
        
        # Recuperar documentos relevantes
        relevant_docs = self.retriever.get_relevant_documents(question)
        
        # Construir contexto
        context = "\n\n".join([doc.page_content for doc in relevant_docs])
        
        prompt = f"""Eres un asistente experto en el idioma guaran√≠. Usa la siguiente informaci√≥n de referencia para responder la pregunta.

CONTEXTO:
{context}

PREGUNTA: {question}

INSTRUCCIONES:
- Basa tu respuesta en la informaci√≥n del contexto proporcionado
- Si la informaci√≥n no est√° en el contexto, ind√≠calo claramente
- Responde de manera clara y educativa
- Si es apropiado, incluye ejemplos en guaran√≠

RESPUESTA:"""
        
        return self.llm.generate(prompt)

print("‚úì Clase GuaraniChatbot implementada")

## 7. Evaluaci√≥n y Comparaci√≥n

In [None]:
# Preguntas de prueba m√°s espec√≠ficas basadas en gram√°tica guaran√≠
test_questions = [
    "¬øCu√°les son los pronombres personales en guaran√≠?",
    "¬øC√≥mo se dice 'nosotros' en guaran√≠ y cu√°l es la diferencia entre las formas inclusiva y exclusiva?",
    "¬øCu√°l es el orden t√≠pico de las palabras en una oraci√≥n guaran√≠?",
    "¬øC√≥mo se conjuga el verbo 'ir' en primera, segunda y tercera persona?",
    "¬øCu√°les son los saludos m√°s comunes en guaran√≠?",
    "¬øQu√© son los prefijos personales en guaran√≠ y c√≥mo se usan?",
    "¬øC√≥mo se forma el plural en guaran√≠?",
    "¬øCu√°les son las caracter√≠sticas principales de la fonolog√≠a del guaran√≠?"
]

print("‚úì Preguntas de evaluaci√≥n preparadas:")
print(f"  Total: {len(test_questions)} preguntas\n")
for i, q in enumerate(test_questions, 1):
    print(f"  {i}. {q}")

In [None]:
import time

def evaluate_model(model, model_name: str, retriever=None):
    """Eval√∫a un modelo con las tres estrategias"""
    
    chatbot = GuaraniChatbot(model, retriever)
    results = {
        "model": model_name,
        "strategies": {}
    }
    
    print(f"\n{'='*60}")
    print(f"EVALUANDO: {model_name}")
    print(f"{'='*60}\n")
    
    for strategy_name in ["zero_shot", "few_shot", "rag"]:
        print(f"\n--- Estrategia: {strategy_name.upper()} ---\n")
        strategy_results = []
        
        for i, question in enumerate(test_questions, 1):
            print(f"Pregunta {i}/{len(test_questions)}: {question}")
            
            start_time = time.time()
            
            if strategy_name == "zero_shot":
                answer = chatbot.zero_shot(question)
            elif strategy_name == "few_shot":
                answer = chatbot.few_shot(question)
            else:  # rag
                answer = chatbot.rag(question)
            
            elapsed_time = time.time() - start_time
            
            print(f"Respuesta ({elapsed_time:.2f}s): {answer[:150]}...\n")
            
            strategy_results.append({
                "question": question,
                "answer": answer,
                "response_time": elapsed_time
            })
            
            # Peque√±a pausa para no saturar la API
            time.sleep(1)
        
        results["strategies"][strategy_name] = strategy_results
        
        avg_time = sum(r["response_time"] for r in strategy_results) / len(strategy_results)
        print(f"\n‚úì Estrategia {strategy_name.upper()} completada")
        print(f"  Tiempo promedio de respuesta: {avg_time:.2f}s")
    
    return results

print("‚úì Funci√≥n de evaluaci√≥n lista")

In [None]:
# Evaluar Modelo 1 (GPT-3.5 Turbo)
print("\n" + "#"*60)
print("# INICIANDO EVALUACI√ìN DEL MODELO 1")
print("#"*60)

results_model_1 = evaluate_model(model_1, "GPT-3.5 Turbo", retriever)

print("\n" + "="*60)
print("‚úì EVALUACI√ìN DEL MODELO 1 COMPLETADA")
print("="*60)

In [None]:
# Evaluar Modelo 2 (Claude 3.5 Sonnet)
print("\n" + "#"*60)
print("# INICIANDO EVALUACI√ìN DEL MODELO 2")
print("#"*60)

results_model_2 = evaluate_model(model_2, "Claude 3.5 Sonnet", retriever)

print("\n" + "="*60)
print("‚úì EVALUACI√ìN DEL MODELO 2 COMPLETADA")
print("="*60)

In [None]:
# Guardar resultados
import json

all_results = {
    "model_1": results_model_1,
    "model_2": results_model_2,
    "metadata": {
        "pdf_source": "GramaticaGuarani.pdf",
        "total_questions": len(test_questions),
        "embedding_model": "sentence-transformers/paraphrase-multilingual-mpnet-base-v2",
        "vector_store": "FAISS",
        "chunk_size": 1000,
        "chunk_overlap": 200
    }
}

with open("evaluation_results.json", "w", encoding="utf-8") as f:
    json.dump(all_results, f, ensure_ascii=False, indent=2)

print("‚úì Resultados guardados en 'evaluation_results.json'")
print(f"  Tama√±o del archivo: {os.path.getsize('evaluation_results.json') / 1024:.2f} KB")

## 8. An√°lisis de Resultados

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

def analyze_results(all_results):
    """Analiza y visualiza los resultados de la evaluaci√≥n"""
    
    print("\n" + "="*60)
    print("AN√ÅLISIS DE RESULTADOS")
    print("="*60 + "\n")
    
    # An√°lisis cuantitativo
    comparison_data = []
    
    for model_key in ["model_1", "model_2"]:
        model_data = all_results[model_key]
        model_name = model_data["model"]
        
        print(f"\n{model_name}:")
        print("-" * 40)
        
        for strategy_name, strategy_results in model_data["strategies"].items():
            # Calcular m√©tricas
            avg_length = sum(len(r["answer"]) for r in strategy_results) / len(strategy_results)
            avg_time = sum(r["response_time"] for r in strategy_results) / len(strategy_results)
            
            print(f"\n  Estrategia: {strategy_name.upper()}")
            print(f"    Total de respuestas: {len(strategy_results)}")
            print(f"    Longitud promedio: {avg_length:.0f} caracteres")
            print(f"    Tiempo promedio: {avg_time:.2f} segundos")
            
            comparison_data.append({
                "Modelo": model_name,
                "Estrategia": strategy_name,
                "Longitud Promedio": avg_length,
                "Tiempo Promedio": avg_time
            })
    
    # Crear DataFrame para visualizaci√≥n
    df = pd.DataFrame(comparison_data)
    
    # Visualizaci√≥n
    fig, axes = plt.subplots(1, 2, figsize=(15, 5))
    
    # Gr√°fico 1: Longitud de respuestas
    df_pivot = df.pivot(index="Estrategia", columns="Modelo", values="Longitud Promedio")
    df_pivot.plot(kind="bar", ax=axes[0], rot=0)
    axes[0].set_title("Longitud Promedio de Respuestas", fontsize=14, fontweight="bold")
    axes[0].set_ylabel("Caracteres")
    axes[0].set_xlabel("Estrategia")
    axes[0].legend(title="Modelo")
    axes[0].grid(axis="y", alpha=0.3)
    
    # Gr√°fico 2: Tiempo de respuesta
    df_pivot_time = df.pivot(index="Estrategia", columns="Modelo", values="Tiempo Promedio")
    df_pivot_time.plot(kind="bar", ax=axes[1], rot=0, color=["#FF6B6B", "#4ECDC4"])
    axes[1].set_title("Tiempo Promedio de Respuesta", fontsize=14, fontweight="bold")
    axes[1].set_ylabel("Segundos")
    axes[1].set_xlabel("Estrategia")
    axes[1].legend(title="Modelo")
    axes[1].grid(axis="y", alpha=0.3)
    
    plt.tight_layout()
    plt.savefig("evaluation_comparison.png", dpi=300, bbox_inches="tight")
    plt.show()
    
    print("\n" + "="*60)
    print("CONCLUSIONES Y PR√ìXIMOS PASOS")
    print("="*60)
    print("""
Para un an√°lisis completo, considera evaluar:

1. PRECISI√ìN: ¬øLas respuestas son correctas seg√∫n la gram√°tica guaran√≠?
   ‚Üí Revisar manualmente las respuestas compar√°ndolas con el PDF

2. RELEVANCIA: ¬øLas respuestas abordan directamente la pregunta?
   ‚Üí Verificar que las respuestas respondan lo que se pregunta

3. COMPLETITUD: ¬øLas respuestas proporcionan informaci√≥n suficiente?
   ‚Üí Evaluar si incluyen ejemplos y explicaciones adecuadas

4. CONSISTENCIA: ¬øEl modelo es consistente en sus respuestas?
   ‚Üí Comparar respuestas similares entre estrategias

Compara especialmente:
- Zero-shot vs Few-shot: ¬øLos ejemplos mejoran el rendimiento?
- Few-shot vs RAG: ¬øEl contexto recuperado es m√°s √∫til que los ejemplos fijos?
- Modelo 1 vs Modelo 2: ¬øQu√© modelo maneja mejor el idioma de bajo recursos?
- RAG con PDF vs sin PDF: ¬øEl RAG realmente beneficia al guaran√≠?

Gr√°fico guardado en: evaluation_comparison.png
    """)
    
    return df

In [None]:
# Ejecutar an√°lisis
df_results = analyze_results(all_results)

# Mostrar tabla de comparaci√≥n
print("\n" + "="*60)
print("TABLA DE COMPARACI√ìN")
print("="*60)
print(df_results.to_string(index=False))

## 9. Exportar Modelos y Configuraci√≥n

In [None]:
# Descargar archivos necesarios para la aplicaci√≥n Chainlit
print("Preparando archivos para descarga...\n")

# Comprimir el vector store
!zip -r vectorstore_guarani.zip vectorstore_guarani/

print("\n" + "="*60)
print("ARCHIVOS GENERADOS")
print("="*60)
print("\n1. vectorstore_guarani.zip")
print("   - Contiene el vector store FAISS con embeddings del PDF")
print("   - Descomprimir en el directorio del proyecto local")
print("\n2. evaluation_results.json")
print("   - Resultados completos de la evaluaci√≥n")
print("   - Incluye respuestas de ambos modelos con las 3 estrategias")
print("\n3. evaluation_comparison.png")
print("   - Gr√°ficos comparativos de rendimiento")
print("="*60)

# Si est√°s en Colab, descarga los archivos
try:
    from google.colab import files
    
    print("\nDescargando archivos...")
    print("1. Vector store (vectorstore_guarani.zip)")
    files.download('vectorstore_guarani.zip')
    
    print("2. Resultados de evaluaci√≥n (evaluation_results.json)")
    files.download('evaluation_results.json')
    
    print("3. Gr√°ficos de comparaci√≥n (evaluation_comparison.png)")
    files.download('evaluation_comparison.png')
    
    print("\n‚úì Archivos descargados correctamente")
except ImportError:
    print("\n‚ö†Ô∏è No est√°s en Google Colab")
    print("Los archivos est√°n disponibles en el directorio actual")

print("\n" + "="*60)
print("PR√ìXIMOS PASOS")
print("="*60)
print("""
1. Descargar los archivos generados
2. Descomprimir vectorstore_guarani.zip en tu proyecto local
3. Configurar el archivo .env con tu OPENROUTER_API_KEY
4. Ejecutar la aplicaci√≥n Chainlit:
   
   cd /ruta/a/tu/proyecto
   chainlit run app.py -w
   
5. Probar el chatbot con preguntas en guaran√≠
6. Usar /rag on y /rag off para comparar modos

¬°El sistema RAG para guaran√≠ est√° listo! üáµüáæ
""")