# 1. RAG B√°sico - Implementaci√≥n con Streamlit

## Objetivos de Aprendizaje
- Comprender los componentes fundamentales de un sistema RAG
- Implementar una b√∫squeda por palabras clave simple
- Generar respuestas basadas en contexto recuperado
- Construir una interfaz interactiva con Streamlit

## ¬øQu√© es RAG (Retrieval-Augmented Generation)?

RAG es una arquitectura que combina dos fases para generar respuestas:
1. **Retrieval (Recuperaci√≥n)**: Busca y recupera informaci√≥n relevante de una base de conocimiento.
2. **Generation (Generaci√≥n)**: Utiliza la informaci√≥n recuperada como contexto para que un LLM genere una respuesta precisa y fundamentada.

### Ventajas:
- **Reduce alucinaciones**: Las respuestas se basan en datos concretos.
- **Conocimiento actualizado**: La base de conocimiento puede actualizarse f√°cilmente.
- **Transparencia**: Se puede citar la fuente de la informaci√≥n.

### Componentes de nuestro RAG B√°sico:
- **Base de documentos**: Una lista de strings en memoria.
- **Mecanismo de retrieval**: B√∫squeda simple por coincidencia de palabras clave.
- **Generador**: Un LLM (GPT-4o) que recibe el contexto y la pregunta.

# Instalaci√≥n de dependencias
!pip install openai streamlit

In [1]:
# Celda 2: Importaciones y configuraci√≥n
import os
from openai import OpenAI
import json

print("‚úÖ Librer√≠as importadas correctamente")

‚úÖ Librer√≠as importadas correctamente


In [4]:
# Inicializaci√≥n del cliente OpenAI
def initialize_client():
    client = OpenAI(
        base_url=os.getenv("GITHUB_BASE_URL", "https://models.inference.ai.azure.com"),
        api_key=os.getenv("GITHUB_TOKEN")
    )
    return client

client = initialize_client()
print("‚úÖ Cliente OpenAI inicializado")

‚úÖ Cliente OpenAI inicializado


# Base de documentos

Cargamos la base de documentos que vamos a utilizar para el RAG. En este caso, vamos a utilizar una base de documentos que contiene informaci√≥n sobre la historia de Argentina.

In [12]:
documents = [
    "La inteligencia artificial es una rama de la inform√°tica que busca crear m√°quinas capaces de realizar tareas que requieren inteligencia humana.",
    "Los modelos de lenguaje grande (LLM) son sistemas de IA entrenados en enormes cantidades de texto para generar y comprender lenguaje natural.",
    "RAG (Retrieval-Augmented Generation) combina la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.",
    "LangChain es un framework que facilita el desarrollo de aplicaciones con modelos de lenguaje, proporcionando herramientas para cadenas y agentes.",
    "El prompt engineering es la pr√°ctica de dise√±ar instrucciones efectivas para obtener los mejores resultados de los modelos de IA."
]

print(f"üìö Base de documentos creada con {len(documents)} documentos:")
for i, doc in enumerate(documents, 1):
    print(f"{i}. {doc[:60]}...")

üìö Base de documentos creada con 5 documentos:
1. La inteligencia artificial es una rama de la inform√°tica que...
2. Los modelos de lenguaje grande (LLM) son sistemas de IA entr...
3. RAG (Retrieval-Augmented Generation) combina la b√∫squeda de ...
4. LangChain es un framework que facilita el desarrollo de apli...
5. El prompt engineering es la pr√°ctica de dise√±ar instruccione...


# Funci√≥n de recuperaci√≥n simple

La funci√≥n simple_retrieval() es una funci√≥n que toma una pregunta y un √≠ndice, y devuelve una lista de documentos relevantes. En este caso, la funci√≥n simplemente devuelve los primeros 3 documentos del √≠ndice.

In [13]:
def simple_retrieval(query, documents):
    relevant_docs = []
    query_lower = query.lower()
    
    for doc in documents:
        if any(word in doc.lower() for word in query_lower.split()):
            relevant_docs.append(doc)
    
    return relevant_docs[:3]

# Prueba de la funci√≥n de recuperaci√≥n
test_query = "¬øQu√© es la inteligencia artificial?"
relevant_docs = simple_retrieval(test_query, documents)

print(f"üîç Prueba de recuperaci√≥n para: '{test_query}'")
print(f"Documentos relevantes encontrados: {len(relevant_docs)}")
for i, doc in enumerate(relevant_docs, 1):
    print(f"{i}. {doc}")

üîç Prueba de recuperaci√≥n para: '¬øQu√© es la inteligencia artificial?'
Documentos relevantes encontrados: 3
1. La inteligencia artificial es una rama de la inform√°tica que busca crear m√°quinas capaces de realizar tareas que requieren inteligencia humana.
2. Los modelos de lenguaje grande (LLM) son sistemas de IA entrenados en enormes cantidades de texto para generar y comprender lenguaje natural.
3. RAG (Retrieval-Augmented Generation) combina la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.


# Funci√≥n de generaci√≥n de respuesta
La funci√≥n generate_response se encarga de generar una respuesta a partir de una pregunta y un contexto. Para ello, utiliza un modelo de lenguaje preentrenado y una plantilla de prompt.

In [14]:
def generate_response(client, query, context):
    prompt = f"""Contexto:
{context}

Pregunta: {query}

Responde bas√°ndote √∫nicamente en el contexto proporcionado. Si la informaci√≥n no est√° en el contexto, indica que no tienes esa informaci√≥n."""

    response = client.chat.completions.create(
        model="gpt-4.1",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.7,
        max_tokens=500
    )
    
    return response.choices[0].message.content

print("‚úÖ Funci√≥n de generaci√≥n definida")

‚úÖ Funci√≥n de generaci√≥n definida


# Sistema RAG completo - Ejemplo 1

In [10]:
query1 = "¬øQu√© es la inteligencia artificial?"

print(f"‚ùì Pregunta: {query1}")
print("\n" + "="*50)

# Paso 1: Recuperaci√≥n
relevant_docs = simple_retrieval(query1, documents)
print(f"üìã Documentos relevantes ({len(relevant_docs)}):")
for i, doc in enumerate(relevant_docs, 1):
    print(f"{i}. {doc}")

# Paso 2: Generaci√≥n
if relevant_docs:
    context = "\n".join(relevant_docs)
    response = generate_response(client, query1, context)
    print(f"\nü§ñ Respuesta:")
    print(response)
else:
    print("‚ùå No se encontraron documentos relevantes")

‚ùì Pregunta: ¬øQu√© es la inteligencia artificial?

üìã Documentos relevantes (3):
1. La inteligencia artificial es una rama de la inform√°tica que busca crear m√°quinas capaces de realizar tareas que requieren inteligencia humana.
2. Los modelos de lenguaje grande (LLM) son sistemas de IA entrenados en enormes cantidades de texto para generar y comprender lenguaje natural.
3. RAG (Retrieval-Augmented Generation) combina la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.

ü§ñ Respuesta:
La inteligencia artificial es una rama de la inform√°tica que busca crear m√°quinas capaces de realizar tareas que requieren inteligencia humana.


# Sistema RAG completo - Ejemplo 2

In [16]:
query2 = "¬ø C√≥mo funciona RAG ?"

print(f"‚ùì Pregunta: {query2}")
print("\n" + "="*50)

# Paso 1: Recuperaci√≥n
relevant_docs = simple_retrieval(query2, documents)
print(f"üìã Documentos relevantes ({len(relevant_docs)}):")
for i, doc in enumerate(relevant_docs, 1):
    print(f"{i}. {doc}")

# Paso 2: Generaci√≥n
if relevant_docs:
    context = "\n".join(relevant_docs)
    response = generate_response(client, query2, context)
    print(f"\nü§ñ Respuesta:")
    print(response)
else:
    print("‚ùå No se encontraron documentos relevantes")

‚ùì Pregunta: ¬ø C√≥mo funciona RAG ?

üìã Documentos relevantes (1):
1. RAG (Retrieval-Augmented Generation) combina la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.

ü§ñ Respuesta:
RAG (Retrieval-Augmented Generation) funciona combinando la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.


# Sistema RAG completo - Ejemplo 3 (pregunta sin contexto)

In [17]:
query3 = "¬øCu√°l es la capital de Francia?"

print(f"‚ùì Pregunta: {query3}")
print("\n" + "="*50)

# Paso 1: Recuperaci√≥n
relevant_docs = simple_retrieval(query3, documents)
print(f"üìã Documentos relevantes ({len(relevant_docs)}):")
for i, doc in enumerate(relevant_docs, 1):
    print(f"{i}. {doc}")

# Paso 2: Generaci√≥n
if relevant_docs:
    context = "\n".join(relevant_docs)
    response = generate_response(client, query3, context)
    print(f"\nü§ñ Respuesta:")
    print(response)
else:
    print("‚ùå No se encontraron documentos relevantes")
    print("ü§ñ Respuesta: No tengo informaci√≥n sobre esa pregunta en mi base de documentos.")

‚ùì Pregunta: ¬øCu√°l es la capital de Francia?

üìã Documentos relevantes (3):
1. La inteligencia artificial es una rama de la inform√°tica que busca crear m√°quinas capaces de realizar tareas que requieren inteligencia humana.
2. Los modelos de lenguaje grande (LLM) son sistemas de IA entrenados en enormes cantidades de texto para generar y comprender lenguaje natural.
3. RAG (Retrieval-Augmented Generation) combina la b√∫squeda de informaci√≥n relevante con la generaci√≥n de texto para producir respuestas m√°s precisas.

ü§ñ Respuesta:
Seg√∫n el contexto proporcionado, no tengo informaci√≥n sobre cu√°l es la capital de Francia.
