<a href="https://colab.research.google.com/github/peludev/ai-prompt-gen/blob/main/EntregaFinal_PedroAcosta.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Gastronomi K**

---

**Resumen**

Este proyecto desarrolla un sistema automático que genera recetas de cocina personalizadas basadas en los ingredientes seleccionados por el usuario. Mediante la integración de modelos de inteligencia artificial preexistentes (GPT y DALL-E) y utilizando las APIs de OpenAI, se producen tanto las instrucciones de preparación como una imagen representativa del plato. La ingeniería de prompts desempeñó un papel clave al ajustar las instrucciones para garantizar que las respuestas sean claras, accesibles y adaptadas a principiantes en la cocina. Este enfoque no solo simplifica la experiencia culinaria, sino que también destaca el potencial de la IA para resolver problemas cotidianos de manera práctica, creativa y eficiente.

---




## Presentación del Problema

Muchas personas, especialmente aquellas inexpertas en la cocina, enfrentan dificultades para preparar platos sabrosos y creativos con los ingredientes que tienen a su disposición en casa. Este problema se intensifica por varios factores:

*   Falta de conocimientos culinarios básicos: Los principiantes suelen carecer de experiencia en la combinación de ingredientes, uso de técnicas de cocción o planeación de recetas.
*   Tiempo y esfuerzo para buscar recetas: Explorar recetas en internet puede ser abrumador debido a la gran cantidad de información, que no siempre se ajusta a los ingredientes disponibles o a las preferencias del usuario.
*   Falta de inspiración: Incluso personas con experiencia pueden encontrarse en situaciones donde les faltan ideas creativas para cocinar algo diferente.

El cocinar en casa tiene un impacto directo en la salud, el presupuesto y el bienestar de las personas, pero estas barreras pueden disuadir a muchos de hacerlo. La falta de confianza o habilidades puede llevar a decisiones menos saludables, como depender de alimentos procesados o de comida rápida.

En el ámbito social y cultural, cocinar también fomenta la conexión con la familia, amigos y la identidad cultural. Sin embargo, cuando las personas carecen de herramientas para disfrutar del proceso, esta experiencia puede transformarse en algo estresante en lugar de enriquecedor.

El desarrollo de un sistema automático que genere recetas personalizadas y visuales, basado en preferencias e ingredientes disponibles, tiene las siguientes implicaciones positivas:

*   Promueve la inclusión culinaria: Ofrece un recurso accesible y amigable para principiantes, ayudándolos a superar las barreras iniciales y desarrollar habilidades básicas en la cocina.
*   Fomenta la creatividad: Al combinar texto e imágenes, el sistema inspira a los usuarios a experimentar con nuevas combinaciones y técnicas, animándolos a disfrutar más del proceso de cocinar.
*   Optimiza recursos: Ayuda a aprovechar los ingredientes disponibles, reduciendo el desperdicio de alimentos.
*   Mejora la accesibilidad tecnológica: Este proyecto aplica tecnologías modernas (IA generativa) en un contexto cotidiano, haciendo que sean más útiles y relevantes para las personas.

Con estas bases, este sistema no solo busca resolver un problema inmediato, sino también transformar la percepción de la cocina como un desafío en una oportunidad de disfrute, aprendizaje y creatividad.


## Desarrollo de la Propuesta de Solución


El proyecto aprovecha el potencial de la inteligencia artificial generativa para resolver de manera efectiva y creativa el problema identificado. Esto se logra mediante la interacción de dos tipos de modelos: texto-texto (OpenAI GPT) y texto-imagen (DALL-E). A continuación, se detalla cómo cada componente de IA contribuye a la solución:

### 1. Modelo Texto-Texto (GPT): Generación de Recetas Personalizadas

Función: Este modelo se encargará de crear recetas detalladas basadas en los ingredientes con los que dispone el usuario.

Entrada: El usuario proporcionará una lista con los ingredientes que tiene en casa.

Salida: El modelo generará:
*   Una descripción coherente que no sólo guía al usuario, sino que también alimenta al modelo de imagen con datos precisos.
*   Una lista de pasos organizados y fáciles de entender para preparar la receta.

Impacto en la solución: GPT convierte inputs del usuario en una receta clara y personalizada, disminuyendo las barreras para iniciarse en la cocina.






### 2. Modelo Texto-Imagen (DALL-E): Visualización del Plato Final

Función: Este modelo generará una imagen realista del plato sugerido por GPT, basada en la descripción generada.

Entrada: Descripción textual del plato generado por GPT, incluyendo información clave como:
*   Ingredientes principales.
*   Técnicas de presentación (e.g., “plato servido en un tazón rústico”).
*   Colores y texturas esperadas (e.g., “cremoso, con un toque dorado por encima”).

Salida: Una imagen visual atractiva y profesional del plato final.

Impacto en la solución: La imagen refuerza la confianza del usuario en el resultado esperado, lo que es crucial para principiantes que dependen de una guía visual para saber si están en el camino correcto.

## Justificación de la Viabilidad del Proyecto

Esta propuesta es técnicamente factible de realizarse dentro de los tiempos del curso y además es viable económicamente. Si bien se consultará a APIs externas, dado que la aplicación es para mi uso personal, el valor a pagar es poco. El mayor costo a pagar es el correspondiente a la generación de la imagen, pero puesto que en este caso no se desea crear una imagen para fondo de escritorio, o algo similar, no es necesario que sea tan grande. Hice una estimación y si ejecuto cada prompt dos veces al día (p.e. para el almuerzo y la cena) durante 30 días, generando imágenes de 512 x 512 con el modelo DALL-E 2, el valor total a pagar sería de $USD 0,56.  Adicionalmente, considero que si más adelante deseo ponerla a disposición de la comunidad, podría implementar otras herramientas como Gemini para disminuir los costos.

## Objetivos

### Objetivo General

Implementar la ingeniería de prompts de dos modelos (texto-texto y texto-imagen) para la generación de una receta culinaria.

### Objetivos Específicos

*   Generar una descripción de un plato considerando los ingredientes escogidos por el usuario.
*   Convertir la descripción del plato en una imagen atractiva visualmente.
*   Listar los pasos requeridos para preparar el plato sugerido.

## Metodología



1.   Recopilación de datos: Obtener los nombres de los ingredientes del plato que se desea preparar.
2.   Generación de texto: Utilizar GPT para crear una descripción textual del plato sugerido.
3.   Generación de imagen: Utilizar Dall-E para convertir la descripción generada en el paso anterior en una imagen.
4.   Procesamiento de texto: Utilizar GPT para enunciar la secuencia de pasos que se debe seguir para preparar el plato sugerido.









## Herramientas y Tecnologías

*   Python
*   OpenAI GPT-3.5-turbo para la generación de texto
*   OpenAI Dall-E para la generación de imágenes






## Implementación

In [None]:
# Instalar versión que permita acceder a openai.ChatCompletion
!pip install openai==0.28

Collecting openai==0.28
  Downloading openai-0.28.0-py3-none-any.whl.metadata (13 kB)
Downloading openai-0.28.0-py3-none-any.whl (76 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 1.57.4
    Uninstalling openai-1.57.4:
      Successfully uninstalled openai-1.57.4
Successfully installed openai-0.28.0


In [None]:
# Importar dependencias de openAI
import openai

In [None]:
# Agregar API Key (tomada de la página de openAI)
openai.api_key = ""

In [None]:
# Definir función para generar texto
def text_generator(context, prompt, maximum):
    conversation = [
        {"role": "system", "content": context},
        {"role": "user", "content": prompt}
    ]
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=conversation,
        max_tokens=maximum
    )
    message = response['choices'][0]['message']['content'].strip()
    return message

In [None]:
# Definir función para generar imágenes
def image_generator(prompt):
    image_response = openai.Image.create(
      prompt=prompt,
      n=1,
      size="512x512"
    )
    image_url = image_response['data'][0]['url']
    return image_url

In [None]:
# Solicitar ingredientes del plato al usuario
ingredientes = input("Ingrese los ingredientes: ") #p.e. arroz, pollo, cebolla, pepino, tomate"

Ingrese los ingredientes: salmón, limón, arroz, coco, plátano


In [None]:
# Establecer el contexto del prompt
contexto_1 = "Actúa como chef profesional. Con los ingredientes dados, describe un plato en máximo 20 palabras. Sé preciso, conciso y creativo."
prompt_1 = f"Ingredientes: {ingredientes}"

In [None]:
# Generar descripción del plato y almacenarla en una variable para usarla posteriormente
platillo = text_generator(contexto_1, prompt_1, 40)

# Mostrar respuesta
print("Plato sugerido: ", platillo)

Plato sugerido:  Salmón al coco con arroz de limón y plátano caramelizado. Una explosión de sabores tropicales en cada bocado.


In [None]:
# Utilizar la respuesta para el prompt de la imagen
image_prompt = f"Genera una imagen fotorrealista, visualmente atractiva, con colores vibrantes, texturas detalladas, estética casera y luz natural cálida, que inspire confort, para el siguiente plato: {platillo}"

# Generar imagen del plato sugerido
imagen = image_generator(image_prompt)

# Imprimir URL de la imagen
print(imagen)

https://oaidalleapiprodscus.blob.core.windows.net/private/org-0ckmmTx84yJDvEcsiju3Q5A6/user-OuWGkvieyfn7oZBtJKfaSZWQ/img-JF5j2HfqBOtHE1ydGtAFjmwL.png?st=2025-01-01T03%3A52%3A40Z&se=2025-01-01T05%3A52%3A40Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=d505667d-d6c1-4a0a-bac7-5c84a87759f8&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2024-12-31T22%3A12%3A54Z&ske=2025-01-01T22%3A12%3A54Z&sks=b&skv=2024-08-04&sig=Rj1MGzfyp7LCh/58sLp7IbLl7XFylxd%2B5A%2BsVun87Ew%3D


In [None]:
# Establecer el contexto del prompt para crear la receta del plato
contexto_2 = "Actúa como chef profesional. Enumera pasos simples y claros para preparar este platillo en máximo 180 palabras. Usa lenguaje apto para principiantes."
prompt_2 = f"Platillo: {platillo}"

# Generar e imprimir instrucciones de preparación
receta = text_generator(contexto_2, prompt_2, 360)
print("Receta: ", receta)

Receta:  1. Para el salmón al coco, mezcla harina de coco con sal. Pasa los filetes de salmón por la mezcla y fríelos en aceite caliente hasta que estén dorados y crujientes.

2. Cocina el arroz en agua con sal y añade jugo y ralladura de limón al final de la cocción. Mezcla bien y reserva.

3. Para el plátano caramelizado, corta plátanos en rodajas y cocina en una sartén con mantequilla y azúcar hasta que estén dorados y caramelizados.

4. Sirve el salmón al coco sobre una cama de arroz de limón y acompaña con las rodajas de plátano caramelizado.

¡Disfruta de este exquisito platillo tropical!


## Resultados

Gracias a herramientas de inteligencia artificial, se logró generar un plato, sus instrucciones de preparación y una imagen visualmente atractiva del mismo. Los prompts para el modelo texto a texto se diseñaron incorporando un contexto claro y se ajustaron mediante pruebas hasta obtener respuestas satisfactorias. Como resultado, el sistema produce una descripción precisa del plato y una lista de pasos organizados y fáciles de seguir, adecuada para principiantes de cocina.

El diseño del prompt para el modelo texto a imagen requirió más iteraciones para lograr una representación visual fiel y atractiva del plato sugerido. Ajustar el prompt de DALL-E fue clave para alinear las imágenes generadas con las descripciones del modelo texto a texto, asegurando coherencia entre ambos resultados.

La integración entre texto y visualización demostró ser esencial. El modelo de texto no solo guía al usuario con instrucciones claras, sino que también proporciona datos precisos para generar imágenes realistas del plato. Además, si el usuario no queda satisfecho con el resultado visual, el sistema puede ajustar la receta o la presentación, creando un ciclo de refinamiento que mejora la experiencia general.

## Conclusiones



*   Este trabajo demuestra cómo la inteligencia artificial puede transformar actividades diarias, integrando capacidades generativas de texto e imagen para simplificar y enriquecer experiencias como cocinar.
*   La solución ilustra cómo la IA puede democratizar el acceso a herramientas avanzadas, haciéndolas relevantes y útiles para el público general, incluso para quienes tienen poca o ninguna experiencia culinaria.
*   Aunque actualmente el sistema se limita a generar recetas a partir de ingredientes proporcionados, el enfoque tiene un alto potencial de expansión. Funcionalidades como preferencias dietéticas (vegetariano, sin gluten) o niveles de dificultad (fácil, medio, avanzado) pueden añadirse para ofrecer una experiencia más personalizada.
*   Este proyecto no solo pone sobre la mesa el papel de la IA en resolver problemas prácticos, sino también su capacidad para fomentar la creatividad y hacer más accesibles tareas que a priori podrían parecer complejas.

## Referencias


*   [The official Python library for the OpenAI API](https://github.com/openai/openai-python)


