In [None]:
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Construyendo un chatbot con Gemini y gradio

<table align="left">
  <td style="text-align: center">
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/gemini/getting-started/intro_gemini_python.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/colab-logo-32px.png" alt="Google Colaboratory logo"><br> Ejecutar en Colab
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/getting-started/intro_gemini_python.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo"><br> Ver en GitHub
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/getting-started/intro_gemini_python.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo"><br> Abrir en la Vertex AI workbench
    </a>
  </td>
</table>


## Visión general

### Gemini

Gemini es una familia de modelos de IA generativa desarrollados por Google DeepMind y diseñados para casos de uso multimodales. La API de Gemini proporciona acceso a los modelos Gemini Pro Vision y Gemini Pro.

### API de Gemini de Vertex AI

La API Vertex AI Gemini proporciona una interfaz unificada para interactuar con los modelos Gemini. Actualmente hay dos modelos disponibles en la API de Gemini:

- **Modelo Gemini Pro** (`gemini-pro`): Diseñado para manejar tareas de lenguaje natural, chat de texto y código de múltiples turnos y generación de código.
- **Modelo Gemini Pro Vision** (`gemini-pro-vision`): admite indicaciones multimodales. Puede incluir texto, imágenes y videos en sus solicitudes rápidas y obtener respuestas en texto o código.

Puede interactuar con la API de Gemini utilizando los siguientes métodos:

- Utilice [Vertex AI Studio](https://cloud.google.com/generative-ai-studio) para realizar pruebas rápidas y generar comandos
- Utilice el SDK de Vertex AI

### calificación

Gradio es una biblioteca de Python que le permite crear rápidamente aplicaciones web personalizables. En esta práctica de laboratorio, usaremos la biblioteca para crear un chatbot que utilice las capacidades multimodales del modelo Gemini. Más detalles sobre Gradio en la [página oficial del proyecto] (https://www.gradio.app).

Este cuaderno se centra en el uso del **Vertex AI SDK para Python** para llamar a la API Vertex AI Gemini.

Para obtener más información, consulte la documentación [IA generativa en Vertex AI] (https://cloud.google.com/vertex-ai/docs/generative-ai/learn/overview).

### Objetivos

En este tutorial, aprenderá a utilizar la API Vertex AI Gemini con el SDK Vertex AI para Python para interactuar con los modelos Gemini Pro (`gemini-pro`) y Gemini Pro Vision (`gemini-pro-vision`).

Completarás las siguientes tareas:

- Instale el SDK de Vertex AI para Python
- Utilice la API Vertex AI Gemini para interactuar con cada modelo
    - Modelo Gemini Pro (`gemini-pro`):
      - Generar texto a partir de indicaciones de texto.
      - Explore varias funciones y opciones de configuración
    - Modelo Gemini Pro Vision (`gemini-pro-vision`):
      - Generar texto a partir de imágenes y mensajes de texto.
      - Generar texto a partir de videos y mensajes de texto.
- Crear una aplicación con Gradio
    - Interactuar con el modelo Gemini a través de la aplicación Gradio

### Costos

Este tutorial utiliza los siguientes componentes de Google Cloud que pueden generar cargos en su factura:

- Artifacts Registry
- Cloud Build
- Cloud Run
- Vertex AI

Obtenga más información sobre los servicios utilizando la [calculadora de precios](https://cloud.google.com/products/calculator/) para generar una estimación de costos basada en el uso proyectado.

## Primeros pasos

### Instalar el SDK de Vertex AI
**Importante:** solo descomente la línea a continuación si **no** está ejecutando esta práctica de laboratorio en Qwiklabs

In [None]:
# ! pip3 install --upgrade --user google-cloud-aiplatform

### **Reinicie el kernel de su Jupyter notebook**

Como la instalación se realiza con la opción `--user`, es necesario reiniciar el kernel para que los nuevos módulos sean accesibles.

**Importante:** solo descomente la línea a continuación si **no** está ejecutando esta práctica de laboratorio en Qwiklabs

In [None]:
# import IPython

# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)

<div class="alert alert-block alert-warning">
<b>⚠️ Se está reiniciando el kernel del notebook. Espere a que se complete este proceso antes de continuar con los siguientes pasos. ⚠️</b>
</div>


### **Solo para uso en Colab: autentique tu notebook**

En caso de que estés ejecutando este notebook en Google Colab, descomente esta celda para realizar la autenticación de tu sesión de notebook con Google Cloud. Este paso es importante **para utilizar no Colab** para garantizar que las API de Google Cloud funcionen Sem problemas.

In [None]:
# import sys

# # Additional authentication is required for Google Colab
# if "google.colab" in sys.modules:
#     # Authenticate user to Google Cloud
#     from google.colab import auth

#     auth.authenticate_user()

### **Solo para uso en Colab: define el proyecto Google Cloud para ser utilizado**

Si estás ejecutando este notebook en Google Colab, descomente esta celda baja para definir qué proyecto Google Cloud se utilizará en Colab en la ejecución de este notebook.

In [None]:
# if "google.colab" in sys.modules:
#     # Define project information
#     PROJECT_ID = "[your-project-id]"  # @param {type:"string"}
#     LOCATION = "us-central1"  # @param {type:"string"}

#     # Initialize Vertex AI
#     import vertexai

#     vertexai.init(project=PROJECT_ID, location=LOCATION)

### Iniciar servicios requeridos

In [None]:
!gcloud services enable cloudbuild.googleapis.com
!gcloud services enable artifactregistry.googleapis.com
!gcloud services enable run.googleapis.com

### Configurar la CLI de Google Cloud (`gcloud`)

#### configuración PROJECT_ID

In [None]:
shell_output = ! gcloud config list --format 'value(core.project)' 2>/dev/null
PROJECT_ID = shell_output[0]
print("Project ID:", PROJECT_ID)

#### Configuración de la región que se utilizará

In [None]:
REGION = "us-central1"

if REGION == "[your-region]":
    REGION = "us-central1"

### Creando el servicio que usaremos con Gradio

**Importante:** Actualice las variables `PROJECT_ID` y `LOCATION` antes de continuar. Los valores que debes ingresar son los siguientes:

In [None]:
print(f"PROJECT_ID: {PROJECT_ID}")
print(f"REGION: {REGION}")

In [None]:
%%writefile main.py

import os
import time
import base64
import gradio as gr

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 

import warnings
warnings.simplefilter("ignore", UserWarning)

import vertexai
from vertexai.generative_models import (
    GenerativeModel,
    Image
)

# cabeçalho da página
TITLE = """<h1 align="center">Chatbot com Gemini 🤖</h1>"""
SUBTITLE = """<h2 align="center">Protótipo de um chatbot multimodal com Gemini e Gradio</h2>"""

# variaveis de projeto e regiao
PROJECT_ID="[nome do seu projeto]" # TODO: atualize para o seu PROJECT_ID
LOCATION="[região a ser utilizado]" # TODO: atualize para o seu REGION

# inicializando a SDK da Vertex AI
vertexai.init(project=PROJECT_ID, location=LOCATION)

# instanciando os clientes de Gemini e Gemini-Pro
model = GenerativeModel("gemini-1.0-pro")
multimodal_model = GenerativeModel("gemini-1.0-pro-vision")


# converte imagens para formato base64
def image_to_base64(image_path):
    with open(image_path, 'rb') as img:
        encoded_string = base64.b64encode(img.read())
    return encoded_string.decode('utf-8')


# mostra a entrada do usuario no historico do chatbot
def query_message(history,txt,img):
    if not img:
        history += [(txt,None)]
        return history
    print("imagem recebida:")
    print(img)
    base64 = image_to_base64(img)
    data_url = f"data:image/jpeg;base64,{base64}"
    history += [(f"{txt} ![]({data_url})", None)]
    return history
    
# usa o input do usuario, interage com o Gemini, gera resposta 
# e mostra no historico do chatbot
def llm_response(history,text,img):
    if not img:
        response = model.generate_content(text)
        history += [(None,response.text)]
        return history
    else:
        print("imagem no llm_response:")
        print(img)
        try:
            img = Image.load_from_file(img)
            response = multimodal_model.generate_content([text,img])
            print("resposta da chamada de API:")
            print(response.text)
            history += [(None,response.text)]
            return history
        except Exception as e:
            print("deu erro na llm_response")
            print(str(e))
            return history
    
    
# interface do gradio
print("Iniciando a construção da app gradio...")
with gr.Blocks() as app:
    gr.HTML(TITLE)
    gr.HTML(SUBTITLE)
    with gr.Row():
        image_box = gr.Image(type="filepath")
        chatbot = gr.Chatbot(
            scale = 2,
            height=750
        )
        
    text_box = gr.Textbox(
            placeholder="Digite sua mensagem e tecle enter ou faça o upload de uma imagem",
            container=False,
        )

    btn = gr.Button("Enviar")
    clicked = btn.click(query_message,
                        [chatbot,text_box,image_box],
                        chatbot
                        ).then(llm_response,
                                [chatbot,text_box,image_box],
                                chatbot
                                )

app.queue()
app.launch(server_name="0.0.0.0", server_port=7860)

### Definiendo el `Dockerfile` que usaremos

In [None]:
%%writefile Dockerfile

FROM python:3.8

EXPOSE 8080
WORKDIR /app

COPY . ./

EXPOSE 7860

RUN pip install -r requirements.txt

ENTRYPOINT ["python", "main.py"]

### Creando la imagen del contenedor que usaremos en el laboratorio

In [None]:
!gcloud artifacts repositories create gemini-gradio-repo --repository-format=docker --location=$REGION
!gcloud builds submit --tag us-central1-docker.pkg.dev/$PROJECT_ID/gemini-gradio-repo/gemini-gradio-app

### Creando la aplicación en Cloud Run

Básicamente lo que se está haciendo aquí es:
- Creando un servicio en Cloud Run llamado `gemini-gradio-app`
- Utilizará la imagen del contenedor que se creó anteriormente: `us-central1-docker.pkg.dev/<PROJECT_ID>/gemini-gradio-repo/gemini-gradio-app`
- Permitirá el acceso no autenticado con la cláusula `--allow-unauthenticated`

In [None]:
!gcloud run deploy gemini-gradio-app --port 7860 --image us-central1-docker.pkg.dev/$PROJECT_ID/gemini-gradio-repo/gemini-gradio-app --allow-unauthenticated --region=us-central1 --platform=managed

### Accediendo a tu servicio

Al finalizar de ejecutar la celda anterior, quedará la siguiente información:

`URL de servicio: https://gemini-gradio-app-XXX-uc.a.run.app`

Copie esta URL en una nueva pestaña del navegador y acceda a su aplicación Gradio con Gemini.