TeachPrompt

1- Introducción

Problema a Abordar: Las IA generadoras de imágenes requieren instrucciones claras y estructuradas para producir representaciones precisas, pero las respuestas de modelos de lenguaje pueden ser demasiado complejas o abstractas.
Solución: Un sistema que genera respuestas textuales optimizadas para su posterior conversión en imágenes, utilizando técnicas de fast prompting y simplificación de respuestas.
Viabilidad: Se implementa con Google Gemini para respuestas textuales y un generador de imágenes gratuito, evitando costos adicionales y asegurando compatibilidad con herramientas de generación visual.

2- Objetivos

-Generar respuestas textuales claras, concisas y fáciles de visualizar.
-Optimizar prompts para mejorar la conversión de texto a imagen.
-Minimizar respuestas abstractas para garantizar representaciones precisas.

3- Metodología

-Diseño del Prompt Base: Se establece un contexto fijo para obtener respuestas concretas y visuales.
-Optimización con Fast Prompting: Uso de estructura clara, ejemplos previos y formato guiado.
-Generación de Respuesta: Implementación con Gemini 1.5 Flash.
-Integración con API de Imágenes: Se obtiene una respuesta lista para ingresar en un generador de imágenes.

4- Herramientas y Tecnologías

Jupyter Notebook: Entorno de desarrollo interactivo.
Google Gemini: Generación de texto optimizado.
Nightcafe: Generación de imágenes
Técnicas de Prompting:
Fast Prompting: Respuestas en frases cortas y concretas.
Ejemplificación: Uso de ejemplos claros dentro del prompt.
Evitar abstracción: Se limita el uso de términos abstractos y metáforas.

5- Implementación:

In [11]:
# Importar las bibliotecas necesarias
import os
import time
import requests
import google.generativeai as genai

In [12]:
#configuracion gemini
genai.configure(api_key="AIzaSyD-8txM2BeAT-Z213LzQgdZBLLhNuxob6A")
model = genai.GenerativeModel("gemini-1.5-flash") 

In [13]:
context="Eres un profesor experto en educación. Responde de manera simple, clara y en frases cortas. Evita conceptos abstractos y metáforas. Usa ejemplos concretos y fáciles de visualizar."

In [14]:
#almacenamiento de respuestas
cache_respuestas = {}

In [15]:
# Configuración de carpeta para imágenes
carpeta_imagenes = "imagenes_generadas"
if not os.path.exists(carpeta_imagenes):
    os.makedirs(carpeta_imagenes)

In [16]:
# Configuración de StarryAI
api_key_starryai = "yLPLXTUoAFM3mE4DsGUhK9dqAvzZhA"

In [18]:
def respuesta_educacion(user_question):
    if user_question in cache_respuestas:
        print("Usando respuesta del caché.")
        return cache_respuestas[user_question]

    prompt = f"""
    Pregunta: "{user_question}"
    Contexto: {context}
    
    Formato de respuesta:
    - Explicación breve y simple en frases cortas.
    - No más de 3 oraciones.
    - Evita términos abstractos.
    - Incluye ejemplos concretos y visuales.

    Ejemplo:
    Pregunta: "¿Qué es la fotosíntesis?"
    Respuesta: "Las plantas usan la luz del sol para crear energía. Absorben dióxido de carbono y liberan oxígeno. Un árbol en el bosque convierte la luz solar en alimento."
    """

    response = model.generate_content(prompt)
    respuesta_texto = response.text.strip()

    #guardar y reutilizar respuestas
    cache_respuestas[user_question] = respuesta_texto
    return respuesta_texto

Error al crear la imagen: {'detail': 'Not Found'}


In [23]:
# Pregunta del usuario
pregunta = "¿Qué es un volcán?"

# Generar respuesta educativa con Gemini
respuesta = respuesta_educacion(pregunta)
print(f"Respuesta: {respuesta}")

Respuesta: Un volcán es una abertura en la Tierra.  Sale roca fundida, ceniza y gases calientes.  El Monte Vesubio en Italia es un ejemplo.


In [41]:
def generar_imagen_starryai(descripcion, nombre_archivo):
    # URL para crear una imagen (según la documentación)
    url_creacion = "https://api.starryai.com/creations/"

    # Encabezados de la solicitud
    headers = {
        "accept": "application/json",
        "content-type": "application/json",
        "X-API-Key": "yLPLXTUoAFM3mE4DsGUhK9dqAvzZhA"  # Tu API key
    }

    # Datos de la solicitud (según la documentación)
    data = {
        "model": "lyra",  # Modelo a utilizar
        "prompt": descripcion,  # Descripción de la imagen
        "aspectRatio": "square",  # Relación de aspecto
        "highResolution": False,  # ¿Alta resolución?
        "images": 1,  # Número de imágenes a generar
        "steps": 20  # Número de pasos para la generación
    }

    # Enviar la solicitud para crear la imagen
    response = requests.post(url_creacion, headers=headers, json=data)

    print("Respuesta en bruto:", response.text)

    if response.status_code == 201:
        # Obtener el ID de la creación
        creation_id = response.json().get("id")

        # URL para verificar el estado de la creación
        url_estado = f"https://api.starryai.com/creations/{creation_id}/"

        # Esperar hasta que la imagen esté lista (con un límite de tiempo)
        timeout = 300  # 5 minutos (ajusta según sea necesario)
        start_time = time.time()

        while True:
            estado_response = requests.get(url_estado, headers=headers)
            estado_data = estado_response.json()

            print("Estado actual de la creación:", estado_data)

            if estado_data.get("status") == "completed":
                # Obtener la URL de la imagen generada
                images = estado_data.get("images", [])
                if images and images[0].get("url"):
                    url_imagen = images[0]["url"]

                    # Descargar y guardar la imagen
                    imagen_response = requests.get(url_imagen)
                    if imagen_response.status_code == 200:
                        # Define la carpeta donde se guardará la imagen
                        carpeta_imagenes = "imagenes_generadas"  # Cambia esto según tu necesidad
                        if not os.path.exists(carpeta_imagenes):
                            os.makedirs(carpeta_imagenes)

                        ruta_completa = os.path.join(carpeta_imagenes, nombre_archivo)
                        with open(ruta_completa, 'wb') as archivo:
                            archivo.write(imagen_response.content)
                        print(f"Imagen guardada en: {ruta_completa}")
                    else:
                        print("No se pudo descargar la imagen.")
                    break
                else:
                    print("La imagen no tiene una URL válida.")
                    break
            elif estado_data.get("status") == "failed":
                print("Error al generar la imagen:", estado_data)
                break
            else:
                print("La imagen aún se está generando. Esperando...")
                time.sleep(5)  # Esperar 5 segundos antes de verificar nuevamente

            # Verificar si se ha excedido el límite de tiempo
            if time.time() - start_time > timeout:
                print("Tiempo de espera agotado. La imagen no se generó a tiempo.")
                break
    else:
        print("Error al crear la imagen:", response.text)

# Ejemplo de uso
respuesta = "Un volcán es una abertura en la Tierra. Sale roca fundida, ceniza y gases calientes."
nombre_archivo = "volcan.jpg"
generar_imagen_starryai(respuesta, nombre_archivo)

Respuesta en bruto: {"id":111974,"status":"submitted","prompt":"Un volcán es una abertura en la Tierra. Sale roca fundida, ceniza y gases calientes.","negativePrompt":null,"width":512,"height":512,"highResolution":false,"seed":0,"steps":20,"model":"lyra","initialImage":null,"initialImageMode":null,"initialImageStrength":null,"createdAt":"2025-02-13T20:01:54","updatedAt":"2025-02-13T20:01:54","images":[{"id":null,"url":null}],"expired":false}
Error al crear la imagen: {"id":111974,"status":"submitted","prompt":"Un volcán es una abertura en la Tierra. Sale roca fundida, ceniza y gases calientes.","negativePrompt":null,"width":512,"height":512,"highResolution":false,"seed":0,"steps":20,"model":"lyra","initialImage":null,"initialImageMode":null,"initialImageStrength":null,"createdAt":"2025-02-13T20:01:54","updatedAt":"2025-02-13T20:01:54","images":[{"id":null,"url":null}],"expired":false}
