Este proyecto tiene como objetivo crear entornos virtuales de 360 grados a partir de cuentos, utilizando inteligencia artificial para generar tanto las imágenes como los sonidos que componen estos entornos. El proyecto utiliza una combinación de modelos avanzados de lenguaje, modelos de difusión para imágenes, y una base de datos vectorial de sonidos para proporcionar una experiencia inmersiva completa.
El proyecto se divide en las siguientes fases principales:
-
Análisis del Texto:
- Utilización de modelos de lenguaje (LLMs) para detectar capítulos y crear descripciones detalladas.
-
Generación de Imágenes:
- Empleo de modelos de difusión para crear entornos visuales basados en las descripciones generadas.
-
Generación de Sonidos:
- Uso de una base vectorial de sonidos para encontrar y ubicar efectos sonoros en el espacio 360.
Para la detección de capítulos y creación de descripciones se utilizarán los siguientes modelos:
- OpenAI GPT-4: Reconocido por su calidad superior en generación de texto, con un context window de 120k tokens.
Para la generación de entornos visuales se utilizarán modelos de difusión ajustados para la creación de imágenes 360 grados:
- Stable Diffusion XL: Utilizado para generar imágenes de alta calidad (768 px) y con capacidad de integración de LoRAs para personalización.
- LoRA 360Redmond: Ajustado específicamente para generación de imágenes en 360 grados. Disponible en Hugging Face.
Herramientas adicionales para mejorar la calidad de las imágenes:
- Clarity Upscaler: Mejora los detalles y la resolución de las imágenes. Disponible aquí.
Para la generación de sonidos se ha optado por la creación de una base vectorial de sonidos. Esta base permite realizar búsquedas semánticas para encontrar y ubicar sonidos adecuados en el espacio 360, proporcionando una experiencia sonora envolvente.
- Stable Diffusion XL: Pruebas disponibles en Hugging Face.
- Modelo 360 de Stable Diffusion: Pruebas disponibles en Replicate.
- Clarity Upscaler: Pruebas disponibles en Replicate.
Este proyecto está desarrollado con el objetivo de facilitar la creación de experiencias VR inmersivas a partir de cuentos.