---
format:
  html:
    toc: true
    toc-depth: 2
    number-sections: true
execute:
  echo: false
   
---



```{=html}

<style>
    h2 {
        border: none !important;
        box-shadow: none !important;
        border-bottom: none !important;
    }
</style>
<div style="
    background-color:rgb(255, 255, 255);
    border-radius: 15px;
    padding: 30px;
    text-align: center;
    font-family: Arial, sans-serif;
    color: #333;
    box-shadow: 0px 4px 10px rgba(0, 0, 0, 0.2);">
    <h1 style="color:rgb(26, 54, 97); font-size: 50px;">Trabajo 4: Implementación del Agente Creativo de Historias con LLMs</h1>
    <h2 style="color: #555;">Redes Neuronales y Algoritmos Bioinspirados</h2>

    <h3 style="color: #222; margin: 10px 0;">Equipo:</h3>
    <ul style="list-style: none; padding: 0; font-size: 20px;">
        <li>Juan José Correa Hurtado</li>
        <li>Jacobo Ochoa Ramírez</li>
    </ul>
    <h3 style="color: #222; margin: 10px 0;">Profesor:</h3>
    <ul style="list-style: none; padding: 0; font-size: 20px;">
      <li>Juan David Ospina Arango</li>
    </ul>
    <h2 style="color: #555;">Universidad Nacional de Colombia</h2>
    <img src="imagenes/logo_UNAL.png" alt="logo UNAL" />
</div>

```

# Introducción

La inteligencia artificial generativa ha abierto nuevas posibilidades para la creación automatizada de contenidos. En este contexto, el presente proyecto explora el desarrollo de un agente interactivo que colabore con los usuarios en la creación de relatos cortos, combinando capacidades de procesamiento de lenguaje natural con una interfaz web accesible. 

El sistema, implementado con modelos de lenguaje de gran escala (LLMs) y desplegado mediante Streamlit, permite generar historias coherentes y estilísticamente ajustadas según distintos géneros narrativos. Los usuarios pueden definir elementos clave como personajes, escenarios y tono, ya sea a través de formularios estructurados o descripciones en lenguaje natural.

Este informe detalla el diseño, la implementación, las funcionalidades principales y las oportunidades de mejora del sistema propuesto.

# Descripción del Proyecto
Este proyecto consiste en el desarrollo de un agente interactivo de generación de historias, diseñado para colaborar con los usuarios en la escritura de relatos cortos atractivos. El sistema permite generar historias de distintos géneros literarios, incorporando elementos narrativos especificados por el usuario, como personajes, escenarios y dispositivos de trama.

## Funcionalidad Principal
El agente implementa las siguientes funcionalidades clave:

1. Módulo de Procesamiento de Entradas
Se desarrolló un componente capaz de aceptar y validar entradas del usuario, permitiendo describir los elementos de la historia mediante distintos formatos: formularios estructurados, lenguaje natural o combinaciones de ambos. El sistema incluye validaciones dinámicas que proporcionan mensajes de error claros y sugerencias útiles ante entradas incompletas.

1. Motor de Generación de Historias
El núcleo generador del agente se conecta con modelos de lenguaje de gran escala (LLMs), especificamente con Deepseek chat. Se utilizan estrategias diferenciadas de generación según el género narrativo seleccionado. Las historias generadas tienen una longitud de entre 300 y 800 palabras, con especial atención en mantener la coherencia narrativa, una estructura sólida y un estilo narrativo acorde al género y tono.

1. Interfaz de Usuario
Se diseñó una interfaz web interactiva que permite a los usuarios ingresar sus preferencias de manera intuitiva. La interfaz muestra las historias generadas en un formato claro y legible, y ofrece opciones para regenerar o refinar el relato. 

### Elementos Narrativos Considerados

El sistema permite a los usuarios personalizar la historia a partir de los siguientes elementos:

* Personajes: Nombre, rol, rasgos de personalidad y relaciones entre ellos.

* Escenario: Ubicación, época histórica y atmósfera general del relato.

* Género: Fantasía, misterio, romance, terror, ciencia ficción, comedia o aventura.

* Elementos de Trama: Tipo de conflicto.

* Tono: Humorístico, oscuro, caprichoso, dramático o satírico.

* Longitud Preferida: Corta (300–400 palabras), mediana (400–600 palabras) o larga (600–800 palabras).



# Objetivos del proyecto

El sistema tiene como objetivo:

- Generar historias coherentes y atractivas basadas en entradas del usuario, ya sea en formato libre o estructurado.
- Soportar múltiples géneros narrativos (fantasía, misterio, romance, terror, ciencia ficción, comedia, aventura).
- Validar y procesar entradas del usuario para garantizar calidad en las historias generadas.
- Permitir refinamiento interactivo de historias generadas.
- Construir historias coherentes y aptas para su público objetivo.
- Identificar estrategias para la construcción de prompts efectivos en el uso de LLMs.
- Ofrecer una interfaz web intuitiva utilizando Streamlit.

---

# Arquitectura del Sistema
La implementación sigue una arquitectura modular dividida en varios componentes:

1. **Módulo de Procesamiento de Entradas** ('validator.py'):
   - Extrae elementos narrativos clave (personaje, rol, género, escenario, conflicto) utilizando un LLM para procesar texto libre.
   - Evalúa la aptitud de una historia para un público especifico mediante un LLM.
2. **Motor de Generación de Historias** ('generation.py', 'prompts.py'):
   - Construye prompts específicos por género e interactúa con la API de OpenRouter (modelo '"deepseek/deepseek-chat-v3-0324:free"') para generar historias.
   - Maneja la longitud de las historias (corta: ~400 palabras, mediana: ~600 palabras, larga: ~800 palabras) y realiza refinamiento si la respuesta excede los límites.
   - Crea prompts a partir de las especificaciones del usuario.
   - Permite al usuario realizar correcciones o sugerencias a las historias que ha construido mediante un proceso iterativo.
3. **Interfaz de Usuario** ('modo_formulario.py', 'modo_texto_libre.py','formularios_genero'):
   - Implementa una interfaz web con Streamlit que ofrece dos modos: formulario estructurado y texto libre.
   - Permite a los usuarios generar y refinar historias de manera interactiva.
   - Permite la especificación a profundidad y personalización de la historia generada.
4. **Integraciones Externas**:
   - Utiliza la API de OpenRouter para interactuar con el LLM '"deepseek/deepseek-chat-v3-0324:free"'.
   - Gestiona claves de API a través de variables de entorno.

**Diagrama de Arquitectura**:

In [None]:
from graphviz import Digraph

dot = Digraph()

dot.node("U", "Usuario")
dot.node("S", "Streamlit UI:\nFormulario/Texto Libre")
dot.node("V", "Procesamiento de Entradas:\nvalidator.py / modo_*.py")
dot.node("G", "Motor de Generación:\ngeneration.py / prompts.py")
dot.node("A", "API OpenRouter:\ndeepseek / deepseek-chat")
dot.node("H", "Salida:\nHistoria Generada / Refinada")
dot.node("R", "Usuario:\nVisualización en Streamlit")

dot.edge("U", "S")
dot.edge("S", "V")
dot.edge("V", "G")
dot.edge("G", "A")
dot.edge("A", "H")
dot.edge("H", "R")

dot.render("flujo_sistema", format="png", cleanup=True)

---

# Implementación
La implementación está escrita en Python y utiliza varias bibliotecas y herramientas para cumplir con los requisitos del proyecto. A continuación, se describen los detalles clave de cada módulo:

## Módulo de Procesamiento de Entradas
- **Archivo**: `validator.py`, `modo_texto_libre.py`, `modo_formulario.py`, `formularios_genero.py`
- **Funcionalidad**:
  - **Validación de texto libre** (`validator.py`):
    - Utiliza el LLM `deepseek/deepseek-chat` para analizar texto libre y extraer elementos narrativos (personaje, rol, género, escenario, conflicto).
    - Devuelve un JSON con un indicador `es_historia` (si el texto es una solicitud válida) y los elementos extraídos.
    - Maneja reintentos (máximo 2) en caso de respuestas inválidas o errores de formato JSON.
  - **Modo formulario** (`modo_formulario.py`, `formularios_genero.py`):
    - Proporciona un formulario interactivo en Streamlit con campos comunes (personaje, rol, personalidad, escenario, atmósfera, conflicto, tono, longitud) y campos específicos por género (ejemplo: raza y magia para fantasía, crimen y pistas para misterio).
    - Almacena los datos en un diccionario para su uso en la generación de prompts.
  - **Modo texto libre** (`modo_texto_libre.py`):
    - Permite al usuario ingresar una descripción en lenguaje natural.
    - Valida la entrada y muestra advertencias si faltan elementos clave, con opción de generar la historia de todas formas.
- **Tecnologías**:
  - `openai`: Cliente para interactuar con la API de OpenRouter.
  - `streamlit`: Para crear formularios y mostrar resultados.
  - `json`: Para procesar respuestas del LLM en formato JSON.
  - `dotenv`: Para gestionar claves de API.

## Motor de Generación de Historias
- **Archivo**: `generation.py`, `prompts.py`
- **Funcionalidad**:
  - **Construcción de prompts** (`prompts.py`):
    - Define funciones específicas por género (`prompt_extra_*`) que añaden detalles narrativos relevantes (ejemplo: criaturas mágicas para fantasía, enigmas para misterio).
    - Construye un prompt base que incluye estructura narrativa (introducción, desarrollo, resolución), personaje, escenario, conflicto, tono, y longitud deseada.
    - Utiliza un diccionario `funciones_genero` para mapear géneros a sus respectivas funciones de prompts.
  - **Generación de historias** (`generation.py`):
    - Interactúa con la API de OpenRouter usando el modelo `deepseek/deepseek-chat`.
    - Mapea longitudes de historias (corta: 550 tokens/~400 palabras, mediana: 800 tokens/~600 palabras, larga: 1100 tokens/~800 palabras).
    - Maneja casos en que la respuesta excede el límite de tokens, generando una versión más corta con un prompt ajustado.
  - **Refinamiento de historias** (`generation.py`):
    - Permite modificar una historia existente según sugerencias del usuario, manteniendo el contexto original (formulario o texto libre).
    - Usa un nuevo mensaje al LLM con la historia original y la sugerencia de cambio.
- **Tecnologías**:
  - `openai`: Cliente para la API de OpenRouter.
  - `requests`: Para manejar errores de conexión.
  - `dotenv`: Para cargar claves de API desde un archivo `.env`.

## Interfaz de Usuario
- **Archivo**: `modo_formulario.py`, `modo_texto_libre.py`
- **Funcionalidad**:
  - **Modo formulario**:
    - Presenta un formulario en Streamlit con campos predefinidos y específicos por género.
    - Al enviar el formulario, genera la historia y la muestra en la interfaz.
    - Permite refinamiento mediante un formulario adicional para sugerencias.
  - **Modo texto libre**:
    - Ofrece un área de texto para descripciones en lenguaje natural.
    - Valida la entrada y sugiere mejoras si faltan elementos clave.
    - Muestra la historia generada y permite refinamiento.
- **Tecnologías**:
  - `streamlit`: Framework para la interfaz web.
  - Sesiones de estado (`st.session_state`) para almacenar datos como la historia generada y los parámetros de entrada.


---

# Evaluación
## Cumplimiento de Requisitos
- **Procesamiento de Entradas**:
  - Soporta entradas estructuradas (formularios) y en lenguaje natural (texto libre).
  - Valida entradas con retroalimentación clara (advertencias sobre elementos faltantes).
  - Usa un LLM para extraer elementos narrativos en modo texto libre.
- **Generación de Historias**:
  - Genera historias coherentes de 300-800 palabras según la longitud seleccionada.
  - Implementa estrategias específicas por género mediante prompts personalizados.
  - Integra la API de OpenRouter (`deepseek/deepseek-chat`) para generación de texto.
- **Interfaz de Usuario**:
  - Ofrece una interfaz web intuitiva con Streamlit, con soporte para formularios y texto libre.
  - Permite regenerar y refinar historias de manera interactiva.
- **Funcionalidad Opcional (Imágenes)**:
  - No se implementó la generación de imágenes, lo cual era un bonus opcional.

## Métricas de Evaluación
- **Coherencia narrativa**: Las historias generadas mantienen una estructura clara (introducción, desarrollo, resolución) gracias a los prompts estructurados.
- **Robustez**: El sistema maneja errores de conexión y respuestas inválidas con reintentos y mensajes de error claros.
- **Usabilidad**: La interfaz de Streamlit es intuitiva, con formularios bien organizados y retroalimentación inmediata.
- **Tiempo de respuesta**: Depende de la API de OpenRouter, pero el diseño asíncrono de Streamlit asegura una experiencia fluida.

## Limitaciones Observadas
- **Dependencia de la API**: El sistema depende completamente de OpenRouter, lo que lo hace vulnerable a problemas de conectividad o límites de la API.
- **Validación limitada**: Aunque valida elementos clave, no implementa reglas avanzadas para detectar incoherencias semánticas en las entradas.
- **Falta de generación de imágenes**: La funcionalidad opcional de generar imágenes no está implementada.
- **Escalabilidad**: No hay optimizaciones para manejar múltiples usuarios simultáneamente.

---


---

# Posibles Mejoras
- **Generación de Imágenes**: Integrar APIs como DALL-E o Stable Diffusion para generar ilustraciones basadas en las historias.
- **Validación Avanzada**: Implementar reglas más sofisticadas para detectar incoherencias en las entradas (ejemplo: conflictos incompatibles con el género).
- **Multilingüismo**: Permitir generar historias en diferentes idiomas utilizando modelos multilingües como mT5 o LLaMA.
- **Almacenamiento de Historias**: Implementar una base de datos (SQLite o MongoDB) para guardar historias generadas y permitir a los usuarios recuperarlas.
- **Optimización de Rendimiento**: Usar caché para prompts frecuentes y optimizar llamadas a la API para reducir costos y tiempos de respuesta.
- **Soporte Offline**: Integrar un modelo local (como LLaMA) para reducir la dependencia de APIs externas.

---

# Conclusión
La implementación del **Agente Creativo de Historias con LLMs** es un sistema robusto y funcional que cumple con la mayoría de los requisitos establecidos. La arquitectura modular, el uso de Streamlit para la interfaz, y la integración con la API de OpenRouter permiten generar historias coherentes y personalizadas de manera interactiva. Aunque carece de la funcionalidad opcional de generación de imágenes, el sistema es extensible y puede mejorarse con las sugerencias propuestas. Este proyecto demuestra un uso efectivo de LLMs para aplicaciones creativas, con potencial en educación, entretenimiento y escritura asistida.
Por otro lado, queda claro que hay un límite a cuánto se puede modificar los prompts para evitar que se den incorehencias en la historia, pues en caso del usuario desearlo puede darle especificaciones contradictorias al agente a tal punto que no se pueda crear una historia coherente a partir de estas. La facilidad y rápidez que estos modelos se acomodan a las instrucciones entregadas puede ahorrar una cantidad de tiempo y esfuerzo incalculable para ciertos trabajos pero siempre es importante recordar sus limitaciones y que son una herramienta.

---

**Referencias**:
- Repositorio: https://github.com/jaco8ar/Trabajo-4-aplicaciones-de-grandes-modelos-de-lenguaje
- Documentación de OpenRouter: https://openrouter.ai/docs
- Documentación de Streamlit: https://docs.streamlit.io
- Gomila, J. G. (2024b, diciembre 17). Dominando la IA Generativa y la ingeniería de LLMs - Recursos. Frogames. https://cursos.frogamesformacion.com/pages/blog/ingenieria-de-llms-recursos
- Large Language Models (LLMs) with Google AI. (s. f.). Google Cloud. https://cloud.google.com/ai/llms
- Azure Microsoft. ¿Qué son los modelos de lenguaje de grandes (LLM). Microsoft. https://azure.microsoft.com/es-es/resources/cloud-computing-dictionary/what-are-large-language-models-llms#Resources
