# Trabajo Final: Explorador IA: Guía Personalizada de Viajes usando OpenAI GPT-4 y DALL-E

## Resumen

El objetivo de este proyecto es desarrollar un sistema que genere un perfil de viajero basado en sus gustos y preferencias de viaje y dado un detino, periodo de tiempo y presupuesto devuelven itinerarios personalizados por día. Sugerencias gastronómicas, actividades locales únicas, tips de seguridad y transporte y opcionalemente frases útiles en el idioma local.
En esta POC Utilizaremos la API de OpenAI para GPT-4 para generar una recomendacion de itinerario luego la API de DALL-E generar una imagen descriptiva.

## Índice

1. Introducción
2. Objetivos
3. Metodología
4. Herramientas y Tecnologías
5. Implementación
6. Resultados
7. Conclusiones
8. Referencias

### 1. Introducción

Muchas personas que planifican viajes no encuentran recomendaciones adaptadas a sus intereses específicos (aventura, comida, arte, descanso, etc.). Las guías tradicionales son generales y no personalizadas.
Esto puede generar pérdida de tiempo, frustración o experiencias poco satisfactorias.

### 2. Objetivos

- Generar una descripción textual que devuelven itinerarios personalizados por día, sugerencias gastronómicas, actividades locales únicas, tips de seguridad y transporte.
Opcional: frases útiles en el idioma local.

- Convertir la descripción textual en una imagen utilizando DALL-E.
    •	Prompts que ilustran los lugares sugeridos en la guía (playas, calles, comida, actividades).
    •	Imágenes para representar distintos tipos de viajeros (mochilero, familia, pareja, etc.).
  
### 3. Metodología

1. Recopilación de Datos: Obtener información sobre el perfil del viajero (intereses, presupuesto, clima deseado, duración del viaje, si viaja solo o acompañado).
2. Procesamiento de Texto: Utilizar GPT-4 para generar una descripción textual de itinerarios personalizados sugeridos.
3. Generación de Imagen: Utilizar DALL-E y GENAI para convertir la descripción en una imagen.

### 4. Herramientas y Tecnologías

- Python
- OpenAI GPT-4 API
- OpenAI DALL-E API
- GenAI Gemini 2.0 preview image generation



### 5. Implementación
    1. Se deben insalar las bibliotecas de Phyton ejecutando desde una celda:
    •	!pip install python-dotenv
    •	!pip install openai requests
Comment: Se descarta openai-0.28.0 y se utiliza openai-1.84.0 porque es mas seguro, mas sencillo y devuelve mejores resultados.
    •	!pip install google-genai
Comment: Se utiliza la ultima version de genai que permite generar imagenes google-genai-1.20.0 websockets-15.0.1
    2. Para el correcto funcionamiento de este proyecto se debe editar el archivo .env en el directorio de trabajo local y colocarle apikeys validas de openai y genai como se muestra a continuacion:
- API_KEY_GEMINI=tu_api_key_aqui  
- OPENAI_API_KEY=tu_api_key_aqui



In [2]:
#!pip install python-dotenv
#!pip install openai requests
#!pip install --upgrade openai
#!pip install --upgrade google-genai

Collecting google-genai
  Downloading google_genai-1.20.0-py3-none-any.whl.metadata (35 kB)
Collecting websockets<15.1.0,>=13.0.0 (from google-genai)
  Downloading websockets-15.0.1-cp310-cp310-win_amd64.whl.metadata (7.0 kB)
Downloading google_genai-1.20.0-py3-none-any.whl (203 kB)
Downloading websockets-15.0.1-cp310-cp310-win_amd64.whl (176 kB)
Installing collected packages: websockets, google-genai

   ---------------------------------------- 0/2 [websockets]
   -------------------- ------------------- 1/2 [google-genai]
   -------------------- ------------------- 1/2 [google-genai]
   ---------------------------------------- 2/2 [google-genai]

Successfully installed google-genai-1.20.0 websockets-15.0.1


In [8]:
import os
from dotenv import load_dotenv
import openai
import requests
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

load_dotenv()  # Carga el archivo .env
API_KEY  = os.getenv("OPENAI_API_KEY")
print("API Key cargada:", API_KEY[:4] + "..." if API_KEY else "No se pudo cargar.")

openai.api_key = API_KEY
client = openai.OpenAI() # Usa api_key automáticamente desde la variable de entorno OPENAI_API_KEY


API_KEY_GENAI  = os.getenv("API_KEY_GEMINI")
print("API Key cargada:", API_KEY_GENAI[:4] + "..." if API_KEY_GENAI else "No se pudo cargar.")

clientgenai = genai.Client(api_key=API_KEY_GENAI)

API Key cargada: sk-s...
API Key cargada: AIza...


In [19]:
def openai_chat_gpt4(system, prompt):


    response = client.chat.completions.create(
        model="gpt-4.1",
        messages=[
            {"role": "system", "content": system},
            {"role": "user", "content": prompt}
        ]
    )
    
    return response.choices[0].message.content

def openai_image_prof(prompt):
    for attempt in range(3):
        try:
            response = client.images.generate(
                model="dall-e-3",
                prompt=prompt,
                size="1024x1024",
                quality="hd",  # Opcional: 'hd' para más detalle
                n=1
            )
            return response.data[0].url
        except RateLimitError:
            print("🚦 Límite de uso alcanzado. Reintentando en 5 segundos...")
            time.sleep(5)
    return "❌ No se pudo generar la imagen tras varios intentos."
    
def genai_image_prof(prompt):
        
    contents = (prompt)

    response = clientgenai.models.generate_content(
        model="gemini-2.0-flash-preview-image-generation",
        contents=contents,
        config=types.GenerateContentConfig(
            response_modalities=['TEXT', 'IMAGE']
        )
    )

    for part in response.candidates[0].content.parts:
        if part.text is not None:
            print(part.text)
        elif part.inline_data is not None:
            image = Image.open(BytesIO((part.inline_data.data)))
    return image
        

In [29]:
import ipywidgets as widgets
from IPython.display import display, clear_output

# Widgets del formulario
nombre = widgets.Text(description='Nombre:')

sexo = widgets.Dropdown(
    options=['Masculino', 'Femenino', 'Otro', 'Prefiero no decir'],
    description='Sexo:'
)

edad = widgets.IntText(description='Edad:')

con_quien = widgets.Dropdown(
    options=['Familia', 'Amigos', 'Pareja', 'Solo/a', 'Otro'],
    description='Viaja con:'
)

otro_con_quien = widgets.Text(description='Otro:', placeholder='Especificar si elegiste "Otro"')

preferencias = widgets.Textarea(
    description='Preferencias:',
    placeholder='Actividades, tipo de viaje, etc.',
    layout=widgets.Layout(width='400px', height='80px')
)

dias = widgets.IntText(description='Días de viaje:')

destinos = widgets.Text(description='Destino/s:')

presupuesto = widgets.Text(description='Presupuesto:')

comentarios = widgets.Textarea(
    description='Comentarios:',
    layout=widgets.Layout(width='400px', height='80px')
)

# Botón y salida
boton = widgets.Button(description='Guardar')
salida = widgets.Output()
texto_generado = ""

def guardar_datos(b):
    global texto_generado
    with salida:
        clear_output()
        con_quien_texto = otro_con_quien.value if con_quien.value == 'Otro' else con_quien.value
        texto_generado = (
            f"Nombre: {nombre.value}. "
            f"Sexo: {sexo.value}. "
            f"Edad: {edad.value}. "
            f"Viaja con: {con_quien_texto}. "
            f"Preferencias: {preferencias.value}. "
            f"Cantidad de días: {dias.value}. "
            f"Destino/Destinos: {destinos.value}. "
            f"Presupuesto: {presupuesto.value}. "
            f"{comentarios.value}"
        )
        print("Texto generado:")
        print(texto_generado)

# Mostrar campo adicional si elige "Otro"
def actualizar_otro_campo(change):
    if change['new'] == 'Otro':
        otro_con_quien.layout.display = 'block'
    else:
        otro_con_quien.layout.display = 'none'

con_quien.observe(actualizar_otro_campo, names='value')
otro_con_quien.layout.display = 'none'

# Vincular botón
boton.on_click(guardar_datos)

# Mostrar el formulario
formulario = widgets.VBox([
    nombre, sexo, edad, con_quien, otro_con_quien,
    preferencias, dias, destinos, presupuesto, comentarios,
    boton, salida
])

display(formulario)


VBox(children=(Text(value='', description='Nombre:'), Dropdown(description='Sexo:', options=('Masculino', 'Fem…

In [30]:
prompt="""Eres una guia turistico especializado en personalizar viejes para perfiles de viajeros especificos. Deberas proponer una rutina personalizada para un viajero.
La rutina debe especificar que hacer cada dia y debe considerar los tiempos que demanda cada actividad inclusive los tiempos de traslado para que sea realizable en el dia.
Si las actividades incluyen lugares especificos para visitar se debe tener en cuenta sus horarios de apertura y cierre para que la visita sea exitosa.
Si se incluyen traslados se debe indicar que medio de transporte se recomienda para el traslado o si puede hacerse caminando indicando los tiempos aproximados.
Al final de cada dia se debe indicar el costo aproximado en dolares o euros en caso de destinos de europa de las actividades programadas para el dia y los traslados si los hubiere.
Nuestros viajeros deben contar con reserva de alojamiento para aprovechar el dia por tanto antes de iniciar las rutinas diaria debes especificar en que zona seria recomendable que el viajero reserve su alojamiento para aprovechar al maximo los dias considerando un minimo de 3 noches en cada alojamiento.
Incluir recomendaciones finales que puedan ser de utilidad para el viajante.
Evitar repreguntar en la respuesta.
Nuestro viajero tiene las siguientes caracteristicas: """
texto="Sexo: Femenino. Edad: 40. Viaja con: 2 Amigas. Preferencias: Caminar y visitar lugares, mezclarse con la cultura del lugar, gastronomia, lugares tipicos. Cantidad de dias: 5. Destino/Destinos: Austria, Budapest. Presupuesto: 1000 Euros, excluyendo alojamiento, pero incluyendo el costo de traslado. El viajero inicia su paseo al llegar a Viena."
salida= openai_chat_gpt4(prompt,texto_generado)

In [31]:
print(salida)

¡Hola, Juan! Aquí tienes una rutina personalizada de 5 días para ti y tu pareja, iniciando en Roma y finalizando en Venecia con un broche romántico, maximizando la experiencia y el presupuesto de 500 €. Cada jornada equilibra cultura, aire libre, gastronomía y traslados óptimos. Todas las tarifas son en euros.

---

## **ALOJAMIENTO RECOMENDADO**

**Roma:** Reserva en el barrio de Trastevere durante 3 noches. Es céntrico, auténtico, ideal para descubrir a pie y tiene excelente ambiente gastronómico sin precios elevados.

**Venecia:** Reserva en la zona de Cannaregio o cerca de la estación de Santa Lucia durante 2 noches. Es accesible, menos congestionado y más económico que San Marco.

---

## **DÍA 1: ROMA - PASEO Y GASTRONOMÍA LOCAL**

**08:30** Desayuno italiano en una cafetería local en Trastevere.  
**09:30** Visita al Coliseo y Foro Romano (abren 09:00-19:00). Acceso: caminando, 25 min desde Trastevere.  
**12:00** Paseo hasta Piazza Venezia y Fontana di Trevi (caminando, 20 min)

In [32]:
promptimagen= openai_chat_gpt4("Voy a brindarte una lista de actividades y un perfil de viejero devuelveme unicamente el prompt para enviar al modelo dall-e-3 y generar una imagen que represente un momento de ese viaje, especifica en la descripcion que la fisionomia de los viajantes debe ser latina: ",salida+texto_generado)

In [33]:
print(promptimagen)

Couple of Latin travelers (man and woman, both with Latin features: medium skin tones, dark hair), sitting together at sunset in a traditional Venetian osteria by a canal in Cannaregio, Venice. They are sharing a romantic dinner with Italian wine and seafood, soft golden light reflecting on the water, colorful Venetian architecture in the background, and a gondola passing by. The mood is cozy, intimate, and joyful, perfectly capturing the romantic finale of their Italian journey.


In [34]:
# Genera la imagen con dalle y obtiene la URL de la imagen genrada
image_url=openai_image_prof(promptimagen)
print(image_url)

https://oaidalleapiprodscus.blob.core.windows.net/private/org-E8thXH85ZSj9viQ3YKWloNQw/user-Z7ZhkJcBqnZTXFBboiOVlBBm/img-DGczmRzRsrWdGYgRZaHkbisO.png?st=2025-06-20T21%3A42%3A50Z&se=2025-06-20T23%3A42%3A50Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=475fd488-6c59-44a5-9aa9-31c4db451bea&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2025-06-20T15%3A00%3A45Z&ske=2025-06-21T15%3A00%3A45Z&sks=b&skv=2024-08-04&sig=BugvjrluCqPRTACv3DdzlTEybuL4Jg1sno4t%2B8SFcow%3D


In [35]:
# Genera la imagen usando genai y obtiene directamente la imagen generada
image_genai=genai_image_prof(promptimagen)

I will generate an image depicting a Latin couple enjoying a romantic sunset dinner at a traditional Venetian osteria. The scene will feature the couple with medium skin tones and dark hair, seated by a canal in the Cannaregio district of Venice. They will be sharing Italian wine and seafood under a soft golden light that reflects beautifully on the water. The background will showcase colorful Venetian architecture, and a gondola will be gently passing by. The overall atmosphere will be cozy, intimate, and joyful, embodying the perfect romantic end to their Italian adventure.



In [36]:
from PIL import Image
from io import BytesIO
from datetime import datetime

# Crear carpeta "images" si no existe
os.makedirs("images", exist_ok=True)

# Obtener la imagen desde la URL
response = requests.get(image_url)
image_dalle = Image.open(BytesIO(response.content))

# Mostrar la imagen
image_dalle.show()
image_genai.show()

# Generar nombre con fecha y hora
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
filename1 = f"images/image_dalle_{timestamp}.png"
filename2 = f"images/image_genai_{timestamp}.png"

# Guardar imagen en carpeta "images"
image_dalle.save(filename1)
print(f"Imagen 1 guardada como {filename1}")
image_genai.save(filename2)
print(f"Imagen 2 guardada como {filename2}")

Imagen 1 guardada como images/image_dalle_20250620_194331.png
Imagen 2 guardada como images/image_genai_20250620_194331.png


### 6. Resultados

    1. Resultados texto - texto NLP
        Utilizando OPENAI se obtuvieron distintos resultados NLP con exactamente el mismo prompt de entrada que determina el contexto con el rol de system y recibe un resultado con el rol de user.
    Se probaron los modelos gpt-3.5 gpt-4.0 y gpt 4.1
    
    2. Resultados texto - Imagen
        Luego de algunas pruebas se decidió que la mejor estrategia para texto - imagen requeria encadenamiento de prompts de manera que obtener una imagen representativa. Se ulizaron 2 pasos.
            Paso 1. Se realizó una nueva iteraccion con el mismo modelo utilizado para generar el primer resultado texto a texto pero en este caso se solicitó al modelo texto a texto un prompt optimizado para generar una imagen. Como input se le brindo el contexto y el resultado de la primer iteración para brindar el contexto de la imagen deseada y sumando algunas instrucciones para que el resultado sea mas familiar para un usuario de latinoamerica.
            Paso 2. Utilizando OPENAI y GENAI se obtuvieron distintos resultados utilizando el prompt obtenido del paso 1.
    Para texto a imagen se probaton los modelos DALL-E 2 y DALL-E 3 de OPENAI y GEMINI 2.0 de GENAI
        
    
### 7. Conclusiones

    1. Conclusiones texto a texto
        Luego de una comparativa entre resultados con los distintos modelos testeados, tanto los modelos 3.5 como 4.0 daban resultados menos uniformes requiriendo mas pesición en el prompt, de hecho, no respetaban o no interpretaban correctamente las instrucciones dadas con el rol system, sin embargo el modelo gpt-4.1 devolvía resultados precisos respetando las instrucciones del prompt system.
    La conclusión es que los resultados modelo gpt-4.1 son excepcionalmente superiores a los otros modelos utilizando exactamente el mismo prompt de entrada.
    2. Conclusiones texto a Imagen
        Se requirió una iteracion previa de texto a texto para obtener un prompt que permita una imagen mas representativa a la problemetica que pretende resolver el proyecto. Si bien esta iteraccion extra es mas costosa devuelve un resultado mas profesional.
        Para la generación de imagen se descarto dall-e 2 por la baja calidad de las imagenes generadas, con dall-e 3 se obtubieron mejores resultados pero con fallas muy notorias como que cuando se daban instrucciones de como deberian ser las personas de la imagen, estas se parecian mucho y detalles en los dedos, rostro, los ojos, etc. Por otro lado la imagen generada con genai sorprendió por su buen desempeño.
    A los efectos de la entrega se dejó vigente la generacion de 2 imagenes una con dall-e 3 y otra con genai para que el usuario saque su propia conclusión.
    Se descartó el uso de stable-diff ya que no dispone de api y requiere uso de gpu, en caso de disponer de capacidad gpu podria considerarse una opción aunque considerando los resultados profesionales obtenidos con genai sería la primer opcion ya que no tiene ningun requisito y por el momento es sin costo.
    
### 8. Referencias

    Para todo el trabajo se utilizó como referencia el contenido de las clases en vivo y los propios resultados del prompt de ChatGPT 
    Se trabajó con colab como alternativa a jupyter en la nube con muy buenos resultados salvo por algun detalle para mostrar las imagenes donde es recomendable una instalacion local de jupyter. Otra desventaja es que en colab no se puede trabajar con versiones viejas de las librerias como la openai 0.28
    Adicionalmente para las consultas que chatgpt no supo resolver, probablemente por no contar con informacion actualizada, se utilzó como referencia la documentación oficial de las api 
    https://cloud.google.com/vertex-ai/generative-ai/docs/sdks/overview?hl=es-419
