In [None]:
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Usando Gemini para escenarios educativos

<table align="left">
  <td style="text-align: center">
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/gemini/use-cases/education/use_cases_for_education.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/colab-logo-32px.png" alt="Google Colaboratory logo"><br> Ejecutar en Colab
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/use-cases/education/use_cases_for_education.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo"><br> Ver en GitHub
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/use-cases/education/use_cases_for_education.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo"><br> Abrir en Vertex AI Workbench
    </a>
  </td>
</table>


## Visión general

### Gemini

Gemini es una familia de modelos de IA generativa desarrollados por Google DeepMind y diseñados para casos de uso multimodales. La API de Gemini proporciona acceso a los modelos Gemini Pro Vision y Gemini Pro.

### API de Gemini de Vertex AI

La API Vertex AI Gemini proporciona una interfaz unificada para interactuar con los modelos Gemini. Actualmente hay dos modelos disponibles en la API de Gemini:

- **Modelo Gemini Pro** (`gemini-pro`): Diseñado para manejar tareas de lenguaje natural, chat de texto y código de múltiples turnos y generación de código.
- **Modelo Gemini Pro Vision** (`gemini-pro-vision`): admite indicaciones multimodales. Puede incluir texto, imágenes y videos en sus solicitudes rápidas y obtener respuestas en texto o código.

Puede interactuar con la API de Gemini utilizando los siguientes métodos:

- Utilice [Vertex AI Studio](https://cloud.google.com/generative-ai-studio) para realizar pruebas rápidas y generar comandos
- Utilice el SDK de Vertex AI

Este noteobok se centra en el uso del **Vertex AI SDK para Python** para llamar a la API Vertex AI Gemini.

Para obtener más información, consulte la documentación [IA generativa en Vertex AI] (https://cloud.google.com/vertex-ai/docs/generative-ai/learn/overview).

### Objetivos

El objetivo principal de este notebook es demostrar una variedad de casos de uso educativo que pueden beneficiarse de los modelos Gemini.

Los pasos tomados incluyen:

- Instalación del SDK de Python
- Uso de la API Vertex AI Gemini
    - Usando el modelo de texto (`gemini-pro`)
      - Razonamiento a diferentes niveles.
      - Razonamiento sobre el texto.
      - Razonamiento sobre números.
    - Utilizando el modelo multimodal (`gemini-pro-vision`)
      - Razonamiento sobre una sola imagen.
      - Razonamiento sobre múltiples imágenes.
      - Razonamiento en un vídeo.

### Costos

Este tutorial utiliza los siguientes componentes de Google Cloud que pueden generar cargos en su factura:

- Vertex AI

Obtenga más información sobre [precios de Vertex AI](https://cloud.google.com/vertex-ai/pricing) y utilice la [calculadora de precios](https://cloud.google.com/products/calculator/) para generar una estimación de costos basada en el uso proyectado.

## Primeros pasos

### Instalar el SDK de Vertex AI
**Importante:** solo descomente la línea a continuación si **no** está ejecutando esta práctica de laboratorio en Qwiklabs

In [None]:
# ! pip3 install --upgrade --user google-cloud-aiplatform

### **Reinicie el kernel de su Jupyter notebook**

Como la instalación se realiza con la opción `--user`, es necesario reiniciar el kernel para que los nuevos módulos sean accesibles.

**Importante:** solo descomente la línea a continuación si **no** está ejecutando esta práctica de laboratorio en Qwiklabs

In [None]:
# import IPython

# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)

<div class="alert alert-block alert-warning">
<b>⚠️ Se está reiniciando el kernel del notebook. Espere a que se complete este proceso antes de continuar con los siguientes pasos. ⚠️</b>
</div>

### **Solo para uso en Colab: autentique tu notebook**

En caso de que estés ejecutando este notebook en Google Colab, descomente esta celda para realizar la autenticación de tu sesión de notebook con Google Cloud. Este paso es importante **para utilizar no Colab** para garantizar que las API de Google Cloud funcionen Sem problemas.

In [None]:
# import sys

# # Additional authentication is required for Google Colab
# if "google.colab" in sys.modules:
#     # Authenticate user to Google Cloud
#     from google.colab import auth

#     auth.authenticate_user()

### **Solo para uso en Colab: define el proyecto Google Cloud para ser utilizado**

Si estás ejecutando este notebook en Google Colab, descomente esta celda baja para definir qué proyecto Google Cloud se utilizará en Colab en la ejecución de este notebook.

In [None]:
# if "google.colab" in sys.modules:
#     # Define project information
#     PROJECT_ID = "[your-project-id]"  # @param {type:"string"}
#     LOCATION = "us-central1"  # @param {type:"string"}

#     # Initialize Vertex AI
#     import vertexai

#     vertexai.init(project=PROJECT_ID, location=LOCATION)

### Importando las bibliotecas necesarias

In [None]:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 

import warnings
warnings.simplefilter("ignore", UserWarning)

from vertexai.generative_models import (
    GenerationConfig,
    GenerationResponse,
    GenerativeModel,
    Image,
    Part,
)

### Definir algunas funciones auxiliares

Defina funciones auxiliares para cargar y mostrar imágenes.

In [None]:
import http.client
import io
import typing
import urllib.request

import IPython.display
from PIL import Image as PIL_Image
from PIL import ImageOps as PIL_ImageOps

Contents = str | list[str | Image | Part]


def generate_content(
    model: GenerativeModel,
    contents: Contents,
    temperature: float = 0.0,
    top_p: float = 0.0,
    top_k: int = 1,
) -> list[GenerationResponse]:
    generation_config = GenerationConfig(
        temperature=temperature,
        top_p=top_p,
        top_k=top_k,
        candidate_count=1,
        max_output_tokens=2048,
    )

    responses = model.generate_content(
        contents,
        generation_config=generation_config,
        stream=True,
    )
    return [responses] if isinstance(responses, GenerationResponse) else list(responses)


def print_contents(contents: Contents):
    if not isinstance(contents, list):
        contents = [contents]

    print(" Contenido ".center(80, "-"))
    for content in contents:
        if display_content_as_image(content):
            continue
        if display_content_as_video(content):
            continue
        print(content)


def display_content_as_image(content: str | Image | Part) -> bool:
    if not isinstance(content, Image):
        return False
    display_image(content)
    return True


def display_content_as_video(content: str | Image | Part) -> bool:
    if not isinstance(content, Part):
        return False
    part = typing.cast(Part, content)
    file_path = part.file_data.file_uri.removeprefix("gs://")
    video_url = f"https://storage.googleapis.com/{file_path}"
    IPython.display.display(IPython.display.Video(video_url, width=600))
    return True


def print_responses(responses: list[GenerationResponse], as_markdown: bool = True):
    # Consolidate the text
    text = "".join(
        part.text
        for response in responses
        for part in response.candidates[0].content.parts
    )
    # Remove potential leading/trailing spaces
    text = text.strip()

    print(" Inicio de respuestas ".center(80, "-"))
    if as_markdown:
        IPython.display.display(IPython.display.Markdown(text))
    else:
        print(text)
    print(" Fin de las respuestas ".center(80, "-"))
    print("")


def display_image(image: Image, max_width: int = 600, max_height: int = 350):
    pil_image = typing.cast(PIL_Image.Image, image._pil_image)
    if pil_image.mode != "RGB":
        # Modes such as RGBA are not yet supported by all Jupyter environments
        pil_image = pil_image.convert("RGB")

    image_width, image_height = pil_image.size
    if max_width < image_width or max_height < image_height:
        # Resize to display a smaller notebook image
        pil_image = PIL_ImageOps.contain(pil_image, (max_width, max_height))

    display_image_compressed(pil_image)


def display_image_compressed(pil_image: PIL_Image.Image):
    """Display the image in a compressed format to reduce the notebook size."""
    image_io = io.BytesIO()
    pil_image.save(image_io, "jpeg", quality=80, optimize=True)
    image_bytes = image_io.getvalue()
    ipython_image = IPython.display.Image(image_bytes)
    IPython.display.display(ipython_image)


def load_image_from_url(image_url: str) -> Image:
    image_bytes = get_image_bytes_from_url(image_url)
    return Image.from_bytes(image_bytes)


def get_image_bytes_from_url(image_url: str) -> bytes:
    with urllib.request.urlopen(image_url) as response:
        response = typing.cast(http.client.HTTPResponse, response)
        image_bytes = response.read()
    return image_bytes

## Importar el modelo `Gemini 1.0 Pro`

Gemini Pro (`gemini-1.0-pro`) lo ayuda a realizar tareas utilizando lenguaje natural, chats de código y texto de varios turnos y generación de código.

In [None]:
model = GenerativeModel("gemini-1.0-pro")

### *Razonamiento* a diferentes niveles

Puedes hacer preguntas directas:

In [None]:
contents = """
Que les paso a los dinosaurios? ¿Cuando?
Explíquelo simplemente en una oración.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

…así como preguntas que requieren respuestas más matizadas:

In [None]:
contents = """
¿Estamos 100% seguros de lo que pasó con los dinosaurios?
En caso contrario, detalle las principales hipótesis actuales.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

Puedes realizar interacciones pidiendo respuestas simples:

In [None]:
contents = """
Explique por qué es invierno en Francia y verano en Australia.
Explica de forma lúdica y divertida, para que un niño de 4 años pueda entender.
Responda incluyendo las 3 razones principales.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

…o pidiendo respuestas más detalladas:

In [None]:
contents = """
Explica por qué tenemos mareas.
Proporcione una respuesta detallada utilizando viñetas.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

Puedes hacer preguntas con un alcance muy cerrado:

In [None]:
contents = """
¿Cuándo fueron los dos últimos años bisiestos?
Enumere dos competencias internacionales que tuvieron lugar durante el penúltimo.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

…y también más preguntas abiertas:

In [None]:
contents = """
Que fue primero, la gallina o el huevo? Explica desde 3 perspectivas diferentes.
¿Cómo llamamos el problema del “huevo y la gallina”? Dé un ejemplo que pueda ocurrir en la educación.
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

### *Razonamiento* con textos

Puede utilizar Gemini para realizar resúmenes y traducciones:

In [None]:
contents = """
Resume el siguiente texto en tres oraciones, en español, utilizando únicamente el texto.

TEXTO:
- Les hommes naissent et demeurent libres et égaux en droits. Las distinciones sociales no pueden ser fondées que sur l'utilité commune.
- Le but de toute Association Politique est la conservación de los derechos naturales e imprescriptibles del hombre. Estos derechos son la libertad, la propiedad, la seguridad y la resistencia a la opresión.
- Le prince de toute souveraineté réside essentiellement dans la Nation. Nul corps, nul individu ne peut exercis d'autorité qui n'en émane expressément.
- La libertad consiste en poder hacer todo lo que no pasa en autrui: además, el ejercicio de los derechos naturales de cada hombre n'a de bornes que celles qui surent aux autres membres de la société la jouissance de ces mêmes droits. Estos nacidos no pueden ser determinados por la ley.
No es una defensa que las acciones nuisibles à la société. Todo esto que n'est pas defendido por la ley ne peut être empêché, et nul ne peut être contraint à faire ce qu'elle n'ordonne pas.
- La ley es la expresión de la voluntad general. Todos los ciudadanos tienen derecho a concurrir con el personal o con sus representantes en la formación. Elle doit être la même pour todosus, soit qu'elle protect, soit qu'elle punisse. Todos los citoyens, étant égaux à ses yeux, sont également admisibles à toutes dignités, place et emplois publics, selon leur capacité et sans autre distinción que celle de leurs vertus et de leurs talentos.
- Nul homme ne peut être accusé, arrêté ou détenu que dans les cas determinados par la loi et selon les formes qu'elle a prescrites. Ceux qui sollicitent, expédient, exécutent ou font exécuter des ordres arbitraires doivent être punis; mais tout cytoyen appelé ou saisi en vertu de la loi doit obéir à l'instant ; il se rendición acoplable por la resistencia.
- La ley ne doit établir que des peines estrictos y evidentemente necesarios, et nul ne peut être puni qu'en vertu d'une loi établie et promulguée antérieurement au délit, et légalement appliquée.
Todo hombre es presumiblemente inocente, ya que es lo que está declarado acoplable, si es jugé indispensable del arresto, todo rigor que no será necesario para asegurar a una persona que debe ser severamente reprimida por la ley.
- Nul ne doit être inquiété pour ses opinions, même religieuses, pourvu que su manifestación ne problem pas l'ordre public établi par la loi.

RESUMEN:
-
"""

responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

… además de pedirle al modelo que ayude con más ideas:

In [None]:
contents = """
Proporcione un resumen de 5 puntos clave para una presentación de “chocolate en el mundo”.
Una parte debería ser sobre tus orígenes en México (mi maestra tiene familia allí).
La última será una degustación con todos los presentes en el aula.
"""

# For more creative/diverse answers, let's increase the level of randomness.
# Successive requests will likely return different responses.
temperature = 0.7
top_p = 0.8
top_k = 40

responses = generate_content(model, contents, temperature, top_p, top_k)

print_contents(contents)
print_responses(responses)

También puedes solicitar correcciones de texto:

A continuación, puede proporcionar algunos ejemplos de respuestas esperadas (es decir, indicaciones breves) para que el modelo pueda comprender qué tipo de respuesta espera.

In [None]:
contents = """
No soy un hablante nativo de inglés.
Comprueba que las siguientes frases sean correctas.
Cuando sea incorrecto, proporcione una corrección y una explicación.
Utilice la misma estructura que los ejemplos dados.
EJEMPLOS:
- **Hi!**
  - Status: ✔️
- **Your my best freind!**
  - Status: ❌
  - Corrección: **You're my best friend!**
   - Explicación:
     - "**Your**" es incorrecto. Parece que intentaste decir "You're", que es la forma contraída de "You are".
     - "**freind**" es un error de escritura. La forma correcta es "**friend**".

ORACIONES:
- They're twins, isn't it?
- I assisted to the meeting.
- You recieved important informations.
- I digged a hole in the ice and saw lots of fishes.
- That's all folks!
"""
responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

…además de solicitar contextos más elaborados en varios idiomas:

In [None]:
contents = """
Traduzca el texto a continuación a los idiomas enumerados:

TEXTO:
Hello folks! I hope you're all doing well. Let's get this workshop started!
We'll stick to English because, actually, I can't speak all those languages.

IDIOMAS:
Español, alemán, griego, búlgaro y japonés.
"""
responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

### *Razonamiento* con números

> Nota: Como cualquier LLM, Gemini genera resultados que parecen plausibles, pero aún así pueden resultar alucinantes. Dependiendo de las entradas y parámetros, las salidas pueden ser inexactas, incluidas las operaciones matemáticas. Como práctica recomendada, podría considerar proporcionar al LLM instrucciones paso a paso para reducir las alucinaciones o utilizar una biblioteca de calculadoras en lugar de un LLM.

Puedes preguntar sobre problemas de la vida real:

In [None]:
contents = """
Patricia es una excelente corredora y corre una media de 12 km/h.
- El lunes corrió durante 1,5 horas. ¿Qué distancia corrió?
- El martes corrió 21 km. ¿Cuánto tiempo corrió?
- El miércoles corrió 150 minutos. ¿Qué distancia corrió?
- A continuación tiene previsto hacer una maratón (42 km). ¿Cuánto tiempo debería tomar?
- Para completar un maratón en 3 horas, ¿cuánto más rápido necesita correr?

Detalla las respuestas paso a paso.
"""
responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

…y también sobre problemas más clásicos:

In [None]:
contents = """
Acabo de pedirle prestados 1.000 reales a un amigo.
Acordamos una tasa de interés simple del 4,5% anual.
Quiero saber cuanto tendré que devolver en 1, 2 o 3 años.
"""
responses = generate_content(model, contents)
print_contents(contents)
print_responses(responses)

## Importando el modelo `Gemini 1.0 Pro Vision`

El modelo Gemini Pro Vision `gemini-1.0-pro-vision` es un modelo multimodal que admite agregar imágenes y videos al texto o mensajes de chat para una respuesta de texto.

In [None]:
multimodal_model = GenerativeModel("gemini-1.0-pro-vision")

### *Razonamiento* con una sola imagen

Puedes hacer preguntas sencillas sobre la imagen:

In [None]:
prompt = "¿Qué aparece en esta imagen?"
# Image by Crissy Jarvis on Unsplash: https://unsplash.com/photos/cHhbULJbPwM
image_abacus = load_image_from_url(
    "https://unsplash.com/photos/cHhbULJbPwM/download?w=600"
)

contents = [prompt, image_abacus]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

…o preguntas específicas:

In [None]:
prompt = """
Responde las siguientes preguntas sobre esta imagen.
Devuelve resultados en formato JSON que contienen pares de "pregunta" y "respuesta".

PREGUNTAS:
- ¿Qué muestra la imagen?
- ¿Como funciona?
- ¿Cuándo se invento?
- ¿Cómo se llama este objeto en francés, italiano, español, holandés y alemán?
- ¿Cuáles son los colores más destacados en la imagen?
"""

contents = [prompt, image_abacus]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

También puede incluir preguntas de *follow-up* en la solicitud:

In [None]:
# Image by Brett Jordan on Unsplash: https://unsplash.com/photos/E1por_SGvJE
image_tiles = load_image_from_url(
    "https://unsplash.com/photos/E1por_SGvJE/download?w=600"
)
prompt = """
- ¿Qué expresión se puede leer en esta imagen? ¿Cómo se presenta?
- ¿Cuál es la expresión opuesta?
- ¿Cuál es la recomendación, basada en esta expresión, que un profesor podría dar a sus alumnos para un examen?
- ¿Con la expresión contraria?
"""

contents = [image_tiles, prompt]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

La información puede tener diferentes formas. Pueden ser objetos, texto impreso, texto escrito a mano, etc .:

In [None]:
prompt = """
Sigue las instrucciones.
Escribir expresiones matemáticas en LaTex.
Utilice una tabla con una fila para cada afirmación y su resultado.

INSTRUCCIONES:
- Extraer la fórmula.
- ¿Cuál es el símbolo justo antes de Pi? ¿Que significa eso?
- ¿Es ésta una fórmula famosa? esto tiene nombre?
- ¿Porque es especial?
- Extraer el subtítulo.
- ¿Cuál es el objeto del fondo?
- ¿Para qué se usaba?
- ¿Cuáles son los colores de la leyenda y la fórmula?
"""

image_euler = load_image_from_url(
    "https://storage.googleapis.com/cloud-samples-data/generative-ai/image/math_beauty.jpg"
)

contents = [prompt, image_euler]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

También puedes solicitar interpretaciones y sugerencias:

In [None]:
prompt = """
Responde las siguientes preguntas sobre la imagen.
Presenta los resultados en una tabla con una línea para cada pregunta y su respuesta.

PREGUNTAS:
- ¿Qué se ve?
- ¿Cuáles son las razones por las que es gracioso?
- ¿Cuál podría ser un título divertido?
- ¿Qué podría pasar después?
- ¿Cómo cambiarías la imagen? ¿Seguiría siendo divertido y por qué?
- ¿Cómo harías esto más divertido?
"""

image_classroom = load_image_from_url(
    "https://unsplash.com/photos/4ApmfdVo32Q/download?w=600"
)

contents = [prompt, image_classroom]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

### *Razonamiento* con múltiples imágenes

También puedes utilizar varias imágenes:

In [None]:
prompt = f"""
Responde las siguientes preguntas para cada imagen.
Presenta los resultados en una tabla con una fila para cada imagen y una columna para cada pregunta.

PREGUNTAS:
- ¿Qué podemos ver en la imagen?
- ¿Dónde está?
"""

caption_b1 = "Imagem 1:"
caption_b2 = "Imagem 2:"
caption_b3 = "Imagem 3:"
image_b1 = load_image_from_url("https://unsplash.com/photos/zzjLGF_6dx4/download?w=600")
image_b2 = load_image_from_url("https://unsplash.com/photos/ndAHi2Wxcok/download?w=600")
image_b3 = load_image_from_url("https://unsplash.com/photos/5mZ_M06Fc9g/download?w=600")

contents = [prompt, caption_b1, image_b1, caption_b2, image_b2, caption_b3, image_b3]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

…o realizar comparaciones entre imágenes:

In [None]:
prompt = """
Responde las siguientes preguntas sobre las imágenes, con una respuesta breve y un motivo detallado de tu respuesta.
Presenta los resultados en una tabla con una fila para cada pregunta, respuesta y motivo.

PREGUNTAS:
- ¿Qué tienen en común las imágenes?
- ¿Cuál le interesaría a un matemático?
- ¿Cuál indica que es el fin de las vacaciones?
- ¿Cuál sugiere que podamos tomar un café allí?
"""

contents = [prompt, caption_b1, image_b1, caption_b2, image_b2, caption_b3, image_b3]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

Puedes utilizar el nivel de lenguaje y comprensión visual de Gemini para trabajar en conceptos o incluso obtener sugerencias para nuevas imágenes:

In [None]:
prompt = """
Responde las siguientes preguntas sobre las imágenes, con una respuesta breve y un motivo detallado de tu respuesta.
Presenta los resultados en una tabla con una fila para cada pregunta, respuesta y motivo.

PREGUNTAS:
- ¿Qué representa la primera imagen?
- ¿Qué representa la segunda imagen?
- ¿Cuál podría ser la siguiente imagen lógica?
"""

caption_w1 = "Imagen 1:"
caption_w2 = "Imagen 2:"
image_w1 = load_image_from_url("https://unsplash.com/photos/TA5bUTySOrg/download?w=600")
image_w2 = load_image_from_url("https://unsplash.com/photos/Nw_D8v79PM4/download?w=600")

contents = [prompt, caption_w1, image_w1, caption_w2, image_w2]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

Y el límite es tu imaginación:

In [None]:
prompt = """
Responda las siguientes preguntas, con una respuesta breve y un motivo detallado de su respuesta.
Presenta los resultados en una tabla con una fila para cada pregunta, respuesta y motivo.

PREGUNTAS:
- ¿Qué tema ilustran estas imágenes?
- ¿Cuál podría ser otra imagen que sustituya a la primera?
- ¿Qué otra imagen podría sustituir a la segunda?
- ¿Cuál sería una alternativa a la tercera imagen?
- ¿Y para el último?
"""

caption_s1 = "Imagem 1:"
caption_s2 = "Imagem 2:"
caption_s3 = "Imagem 3:"
caption_s4 = "Imagem 4:"
image_s1 = load_image_from_url("https://unsplash.com/photos/eriuKJwcdjI/download?w=600")
image_s2 = load_image_from_url("https://unsplash.com/photos/QldMpmrmWuc/download?w=600")
image_s3 = load_image_from_url("https://unsplash.com/photos/rN3m7aTH3io/download?w=600")
image_s4 = load_image_from_url("https://unsplash.com/photos/FhdN5QVrBfY/download?w=600")

contents = [
    prompt,
    caption_s1,
    image_s1,
    caption_s2,
    image_s2,
    caption_s3,
    image_s3,
    caption_s4,
    image_s4,
]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

### *Razonamiento* con vídeos

In [None]:
prompt = """
Responde las siguientes preguntas utilizando únicamente el vídeo.
Presenta los resultados en una tabla con una línea para cada pregunta y su respuesta.

PREGUNTAS:
- ¿Cuál es el animal principal visible a lo largo del video?
- ¿Qué dispositivos electrónicos son visibles?
- ¿A qué animales se toman selfies en primer plano los personajes de dibujos animados?
- ¿Qué marcas famosas son visibles?
- ¿Cuál es el texto visible al final?
"""

video = Part.from_uri(
    uri="gs://cloud-samples-data/video/animals.mp4",
    mime_type="video/mp4",
)

contents = [prompt, video]
responses = generate_content(multimodal_model, contents)

print_contents(contents)
print_responses(responses)

## Conclusión

En este tutorial, viste ejemplos de cómo usar Gemini para la educación y beneficiarte de modelos textuales y multimodales para generar contenido a partir de textos, imágenes y videos.

También puede explorar otros tutoriales que se centran en diferentes dominios o detalles específicos de la API Vertex AI Gemini.