# IMÁGENES con Gemini

## Importaciones

In [1]:
import os
from dotenv import load_dotenv
import google.generativeai as genai #specific provider library
import httpx, base64
import PIL.Image

## Clave de la API

In [2]:
# Cargamos las variables de entorno desde .env e inicialiÇzamos la constante API_KEY
load_dotenv(override=True)
API_KEY = os.getenv('GEMINI_API_KEY') #si se llama así, no hace falta introducirla en el constructor de OpenAI

if not API_KEY:
    print("ERROR: No se ha encontrado la clave de la API")
else:
    print("Se ha encontrado la clave de la API correctamente")

Se ha encontrado la clave de la API correctamente


## Iniciación

In [3]:
MODEL_NAME = "gemini-1.5-flash"
genai.configure(api_key=API_KEY) 

In [4]:
system_prompt = "Utiliza un tono simpático"
#system_prompt = "Utiliza un tono enfadado"

In [5]:
model = genai.GenerativeModel(
    model_name = MODEL_NAME,
    system_instruction = system_prompt,
    generation_config = genai.GenerationConfig(
        max_output_tokens = 1000,
        temperature = 0.1,
    ),
)

## Una imagen en local

In [6]:
image = PIL.Image.open("recursos/huerta.jpg")

In [7]:
user_prompt = "Por favor, explícame que hay en la imagen. Trata de detallar tanto como puedas. Además dime qué título pondrías a la imagen"

In [8]:
response = model.generate_content(
    [user_prompt, image],
)

In [9]:
print(response.text)

Claro que sí. Aquí tienes una descripción de la imagen y un posible título:

**Descripción de la imagen:**

La imagen muestra a cuatro adultos, dos hombres y dos mujeres, trabajando juntos en un jardín comunitario. Parecen estar plantando o trasplantando plántulas en cajas de madera elevadas. Están sonriendo y parecen disfrutar de su tiempo juntos.

El hombre de la izquierda lleva una camiseta de color beige y pantalones vaqueros. La mujer de la izquierda lleva una camisa a cuadros y pantalones negros. La mujer del centro lleva un jersey de color crema y pantalones oscuros. El hombre de la derecha lleva una chaqueta vaquera y una camiseta blanca. Todos llevan guantes de jardinería.

El jardín está situado al aire libre, con edificios de fondo. La luz del sol es cálida y dorada, lo que sugiere que es de tarde. El ambiente general de la imagen es alegre y positivo. Las plantas parecen estar sanas y bien cuidadas.

**Título sugerido:**

Hay varias opciones para el título de la imagen, dep

## Dos imágenes en local

In [10]:
image2 = PIL.Image.open("recursos/campo.jpg")

In [11]:
user_prompt = "Por favor, explícame las similtudes y diferencias entre ambas imágenes"

In [12]:
response = model.generate_content(
    [user_prompt, image, image2],
)

In [13]:
print(response.text)

Claro que sí. Aquí tienes una comparación de las dos imágenes, destacando sus similitudes y diferencias:

**Similitudes:**

* **Conexión con la naturaleza:** Ambas imágenes muestran una conexión con la naturaleza. La primera muestra a personas cultivando plantas, mientras que la segunda muestra un paisaje natural con arrozales. Ambas imágenes transmiten una sensación de paz y tranquilidad.
* **Trabajo y esfuerzo:** Ambas imágenes implican un cierto nivel de trabajo y esfuerzo. En la primera, las personas están trabajando juntas en el jardín. En la segunda, se muestra el trabajo que se ha realizado para crear los arrozales en terrazas.
* **Belleza:** Ambas imágenes son visualmente atractivas y muestran la belleza de la naturaleza y el trabajo humano.

**Diferencias:**

* **Escala:** La primera imagen es a pequeña escala, mostrando a un pequeño grupo de personas trabajando en un jardín. La segunda imagen es a gran escala, mostrando un paisaje amplio con arrozales en terrazas.
* **Ubicaci

## Una imagen en remoto

In [14]:
image_path = "https://turismocuatro.com/wp-content/uploads/2015/05/cudillero.jpg"
image = httpx.get(image_path)

In [15]:
user_prompt = "Por favor, ponle título a la imagen"

In [16]:
import pathlib

response = model.generate_content([
    {'mime_type':'image/jpeg', 'data': base64.b64encode(image.content).decode('utf-8')}, 
    #se pueden poner varias imágenes, una a una
     user_prompt]
)

In [17]:
print(response.text)

Claro que sí. Aquí tienes algunos títulos para la imagen:

* **Casas de colores en la colina**
* **Pueblo pintoresco en la ladera de una colina**
* **Arquitectura vibrante en un pueblo costero**
* **Un día en Cudillero** (si la imagen es de Cudillero, Asturias, España)
* **Cafetería en un pueblo costero**

Espero que esto te ayude. Avísame si necesitas algo más.
