In [None]:
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Sumariza√ß√£o de textos com Generative AI na Vertex AI

<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/colab-logo-32px.png" alt="Colab logo"> Execute no Colab
    </a>
  </td>
  <td>
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo">
      Veja no GitHub
    </a>
  </td>
  <td>
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo">
      Execute no Vertex AI Workbench
    </a>
  </td>
</table>

## Vis√£o geral
A sumariza√ß√£o de textos produz um resumo conciso de um texto. Existem dois tipos principais de resumo de texto: extrativo e abstrativo. A sumariza√ß√£o extrativa envolve selecionar frases cr√≠ticas do texto original e combin√°-las para formar um resumo. A sumariza√ß√£o abstrativa envolve a gera√ß√£o de novas senten√ßas que representam os pontos principais do texto original. Neste notebook, voc√™ passar√° por alguns exemplos de como LLM podem ajudar na gera√ß√£o de sum√°rios de textos.

Saiba mais sobre resumo de texto na [documenta√ß√£o oficial](https://cloud.google.com/vertex-ai/docs/generative-ai/text/summarization-prompts).

### Objetivo

Neste tutorial, voc√™ aprender√° como usar LLM para sumarizar informa√ß√µes de texto trabalhando com os seguintes exemplos:
- Sum√°rio da transcri√ß√£o
- Sumariza√ß√£o de texto em bullets
- Sum√°rio de di√°logo com tarefas realizadas
- Tokeniza√ß√£o de hashtag
- Gera√ß√£o de t√≠tulos e cabe√ßalhos

Voc√™ tamb√©m aprender√° como avaliar resumos gerados por modelos comparando-os com resumos criados por humanos usando o `ROUGE` como uma estrutura de avalia√ß√£o.

### Custos
Este tutorial usa os seguintes componentes de Google Cloud:

* Vertex AI Generative AI Studio

Saiba mais sobre poss√≠veis custos envolvidos [pre√ßos da Vertex AI](https://cloud.google.com/vertex-ai/pricing),
e use a [Calculadora de pre√ßos](https://cloud.google.com/products/calculator/)
para gerar uma estimativa de custo com base no uso projetado.

## Primeiros Passos

### Instalando os SDK da Vertex AI e da Cloud Translate API

In [None]:
!pip install google-cloud-aiplatform google-cloud-translate --upgrade --user

**Somente Colab:** Descomente a c√©lula a seguir para reiniciar o kernel ou use o bot√£o para reiniciar o kernel.

In [None]:
# # Reinicia automaticamente o kernel ap√≥s as instala√ß√µes para que seu ambiente possa acessar os novos pacotes
# import IPython

# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)

### Autenticando seu ambiente de notebook
* Se voc√™ estiver usando o **Colab** para executar este notebook, descomente a c√©lula abaixo e continue.
* Se voc√™ estiver usando o **Vertex AI Workbench**, confira as instru√ß√µes de configura√ß√£o [aqui](../setup-env/README.md).

In [None]:
# from google.colab import auth
# auth.authenticate_user()

### Importando as bibliotecas necess√°rias

**Somente Colab:** Descomente a c√©lula a seguir para realizar o processo adequado de inicializa√ß√£o da SDK da Vertex AI.  

In [None]:
# import vertexai

# PROJECT_ID = "[seu-project-id]"  # @param {type:"string"}
# vertexai.init(project=PROJECT_ID, location="us-central1")

In [None]:
from vertexai.preview.language_models import TextGenerationModel

#### Carregando o modelo `text-bison`

In [None]:
generation_model = TextGenerationModel.from_pretrained("text-bison@001")

#### Criando a fun√ß√£o *wrapper* para utilizar os modelos em Portugu√™s

At√© o momento desde treinamento, as API do Generative AI Studio suportam somente intera√ß√µes no idioma ingl√™s. Para fazermos intera√ß√µes utilizando o idioma portugu√™s, vamos utilizar a [Cloud Translation API](https://cloud.google.com/translate) para traduzir as nossas solicita√ß√µes do portugu√™s para o ingl√™s e as respostas da API de ingl√™s para portugu√™s.

In [None]:
from google.cloud import translate

project_id = !gcloud config list project
project_id = project_id[1].split('=')[1].strip()
parent = f'projects/' + project_id


def traduza(texto, idioma_destino):
    client = translate.TranslationServiceClient()

    response = client.translate_text(
        parent=parent,
        contents=[texto],
        target_language_code=idioma_destino,
        mime_type="text/plain"
    )

    return response.translations[0].translated_text

## Sumariza√ß√£o de texto

### Sumarizar uma transcri√ß√£o

Neste primeiro exemplo, voc√™ resume um texto sobre computa√ß√£o qu√¢ntica.

In [None]:
prompt = traduza("""
Proporcione un resumen muy breve, no m√°s de tres oraciones, para el siguiente art√≠culo:

Nuestras computadoras cu√°nticas funcionan manipulando qubits de una manera orquestada que llamamos algoritmos cu√°nticos.
El desaf√≠o es que los qubits son tan sensibles que incluso la luz dispersa puede causar errores de c√°lculo, y el problema empeora a medida que crecen las computadoras cu√°nticas.
Esto tiene consecuencias significativas, ya que los mejores algoritmos cu√°nticos que conocemos para ejecutar aplicaciones √∫tiles requieren que las tasas de error de nuestros qubits sean mucho m√°s bajas que las que tenemos hoy.
Para llenar este vac√≠o, necesitaremos la correcci√≥n del error cu√°ntico.
La correcci√≥n de errores cu√°nticos protege la informaci√≥n al codificarla en m√∫ltiples qubits f√≠sicos para formar un "qubit l√≥gico" y se cree que es la √∫nica forma de producir una computadora cu√°ntica a gran escala con tasas de error lo suficientemente bajas como para realizar c√°lculos √∫tiles.
En lugar de calcular en los qubits individuales, calcularemos en qubits l√≥gicos. Al codificar un mayor n√∫mero de qubits f√≠sicos en nuestro procesador cu√°ntico en un qubit l√≥gico, esperamos reducir las tasas de error para permitir algoritmos cu√°nticos √∫tiles.

Resumen:

""", "en")

print(
    traduza(generation_model.predict(prompt, temperature=0.2, max_output_tokens=1024, top_k=40, top_p=0.8).text, "es")
)

Em vez de um resumo, podemos pedir um TL;DR (*"too long; didn't read"* ou "muito longo; n√£o li" em tradu√ß√£o livre). Voc√™ pode comparar as diferen√ßas entre as sa√≠das geradas.

In [None]:
prompt = traduza("""
Proporcione un TL;DR para el siguiente art√≠culo:

Nuestras computadoras cu√°nticas funcionan manipulando qubits de una manera orquestada que llamamos algoritmos cu√°nticos.
El desaf√≠o es que los qubits son tan sensibles que incluso la luz dispersa puede causar errores de c√°lculo, y el problema empeora a medida que crecen las computadoras cu√°nticas.
Esto tiene consecuencias significativas, ya que los mejores algoritmos cu√°nticos que conocemos para ejecutar aplicaciones √∫tiles requieren que las tasas de error de nuestros qubits sean mucho m√°s bajas que las que tenemos hoy.
Para llenar este vac√≠o, necesitaremos la correcci√≥n del error cu√°ntico.
La correcci√≥n de errores cu√°nticos protege la informaci√≥n al codificarla en m√∫ltiples qubits f√≠sicos para formar un "qubit l√≥gico" y se cree que es la √∫nica forma de producir una computadora cu√°ntica a gran escala con tasas de error lo suficientemente bajas como para realizar c√°lculos √∫tiles.
En lugar de calcular en los qubits individuales, calcularemos en qubits l√≥gicos. Al codificar un mayor n√∫mero de qubits f√≠sicos en nuestro procesador cu√°ntico en un qubit l√≥gico, esperamos reducir las tasas de error para permitir algoritmos cu√°nticos √∫tiles.

TL;DR:
""", "en")

print(
    traduza(generation_model.predict(prompt, temperature=0.2, max_output_tokens=1024, top_k=40, top_p=0.8).text, "es")
)

### Sumarizar em bullets
No exemplo a seguir, voc√™ usa o mesmo texto sobre computa√ß√£o qu√¢ntica, mas pede ao modelo para sumarizar com bullets. Sinta-se √† vontade para alterar o prompt.

In [None]:
prompt = traduza("""
Proporcione un resumen muy breve en cuatro bullets para el siguiente art√≠culo:

Nuestras computadoras cu√°nticas funcionan manipulando qubits de una manera orquestada que llamamos algoritmos cu√°nticos.
El desaf√≠o es que los qubits son tan sensibles que incluso la luz dispersa puede causar errores de c√°lculo, y el problema empeora a medida que crecen las computadoras cu√°nticas.
Esto tiene consecuencias significativas, ya que los mejores algoritmos cu√°nticos que conocemos para ejecutar aplicaciones √∫tiles requieren que las tasas de error de nuestros qubits sean mucho m√°s bajas que las que tenemos hoy.
Para llenar este vac√≠o, necesitaremos la correcci√≥n del error cu√°ntico.
La correcci√≥n de errores cu√°nticos protege la informaci√≥n al codificarla en m√∫ltiples qubits f√≠sicos para formar un "qubit l√≥gico" y se cree que es la √∫nica forma de producir una computadora cu√°ntica a gran escala con tasas de error lo suficientemente bajas como para realizar c√°lculos √∫tiles.
En lugar de calcular en los qubits individuales, calcularemos en qubits l√≥gicos. Al codificar un mayor n√∫mero de qubits f√≠sicos en nuestro procesador cu√°ntico en un qubit l√≥gico, esperamos reducir las tasas de error para permitir algoritmos cu√°nticos √∫tiles.

Bullets:

""", "en")

print(
    traduza(generation_model.predict(prompt, temperature=0.2, max_output_tokens=256, top_k=1, top_p=0.8).text, "es")
)

### Sumarizar di√°logos com tarefas realizadas
O sum√°rio do di√°logo envolve condensar uma conversa em um formato mais curto para que voc√™ n√£o precise ler toda a discuss√£o, mas possa aproveitar um resumo. Neste exemplo, voc√™ pede ao modelo para resumir uma conversa de exemplo entre um cliente de varejo online e um agente de suporte e incluir tarefas no final.

In [None]:
prompt = traduza("""
Genere un resumen de la siguiente conversaci√≥n y, al final, resuma las tareas para el agente de soporte:

Cliente: Hola, soy Joe y recib√≠ el art√≠culo equivocado.

Agente de soporte: Hola Jos√©. ¬øC√≥mo le gustar√≠a ver esto resuelto?

Cliente: Quiero devolver el art√≠culo y obtener un reembolso, por favor.

Agente de apoyo: Por supuesto. Puedo procesar el reembolso por usted ahora. ¬øPuedo tener su n√∫mero de orden por favor?

Cliente: Es [N√öMERO DE PEDIDO].

Agente de soporte: Gracias. He procesado el reembolso y te devolveremos el dinero en un plazo de 14¬†d√≠as.

Cliente: Muchas gracias.

Agente de apoyo: De nada, Jos√©. ¬°Tenga un buen d√≠a!

Resumen:
""", "en")

print(
    traduza(generation_model.predict(prompt, temperature=0.2, max_output_tokens=256, top_k=40, top_p=0.8).text, "es")
)

### Tokeniza√ß√£o de hashtag
A tokeniza√ß√£o de hashtag √© o processo de pegar um peda√ßo de texto e obter os "tokens" de hashtag. Voc√™ pode usar isso, por exemplo, se quiser gerar hashtags para suas campanhas de m√≠dia social. Neste exemplo, voc√™ pega [este tweet do Google Cloud](https://twitter.com/googlecloud/status/1649127992348606469) e gera algumas hashtags que pode usar.

In [None]:
prompt = traduza("""
Tokenizar los hashtags de este tuit:

Nube de Google
@googlecloud
¬øC√≥mo pueden los datos ayudar a nuestro planeta cambiante? üåé

En honor al #D√≠aDeLaTierra este fin de semana, nos enorgullece compartir c√≥mo nos asociamos con
@ClimateEngine para aprovechar el poder de los datos geoespaciales e impulsar hacia un futuro m√°s sostenible.

Mira c√≥mo ‚Üí https://goo.gle/3mOUfts
""", "en")

print(
    generation_model.predict(prompt, temperature=0.8, max_output_tokens=1024, top_k=40, top_p=0.8).text
)

### Gera√ß√£o de t√≠tulos e cabe√ßalhos
Abaixo, voc√™ pede ao modelo para gerar cinco op√ß√µes para poss√≠veis combina√ß√µes de t√≠tulo/cabe√ßalho para um determinado trecho de texto.

In [None]:
prompt = traduza("""
Escribe un t√≠tulo para este texto, dame cinco opciones:
Ya sea para ayudar a los m√©dicos a identificar enfermedades o encontrar fotos de "abrazos", la IA est√° detr√°s de gran parte del trabajo que hacemos en Google. Y en nuestro Laboratorio de Arte y Cultura en Par√≠s, hemos estado experimentando c√≥mo se puede usar la IA para beneficiar la cultura.
Hoy compartimos nuestros √∫ltimos experimentos: prototipos que se basan en siete a√±os de trabajo en asociaci√≥n con 1500 instituciones culturales de todo el mundo.
Cada una de estas aplicaciones experimentales ejecuta algoritmos de inteligencia artificial en segundo plano para permitirle descubrir conexiones culturales ocultas en archivos e incluso encontrar obras de arte que coincidan con la decoraci√≥n de su hogar".
""", "en")

print(
    traduza(generation_model.predict(prompt, temperature=0.8, max_output_tokens=256, top_k=1, top_p=0.8).text, "es")
)

## Avalia√ß√£o
Voc√™ pode avaliar os resultados das tarefas de resumo usando [ROUGE](https://en.wikipedia.org/wiki/ROUGE_(metric)) como uma estrutura de avalia√ß√£o. `ROUGE` (Recall-Oriented Understudy for Gisting Evaluation) s√£o medidas para determinar automaticamente a qualidade de um resumo comparando-o com outros resumos (ideais) criados por humanos. As medidas contam o n√∫mero de unidades sobrepostas, como n-gram, sequ√™ncias de palavras e pares de palavras entre o resumo gerado por computador a ser avaliado e os resumos ideais criados por humanos.


O primeiro passo √© instalar a biblioteca `ROUGE`.

In [None]:
!pip install rouge

Crie um resumo a partir de um LLM que voc√™ pode usar para comparar com um resumo gerado por humanos.

In [None]:
from rouge import Rouge

ROUGE = Rouge()

prompt = traduza("""
Proporcione un resumen muy breve, de cuatro oraciones como m√°ximo, para el siguiente art√≠culo:

Nuestras computadoras cu√°nticas funcionan manipulando qubits de una manera orquestada que llamamos algoritmos cu√°nticos.
El desaf√≠o es que los qubits son tan sensibles que incluso la luz dispersa puede causar errores de c√°lculo, y el problema empeora a medida que crecen las computadoras cu√°nticas.
Esto tiene consecuencias significativas, ya que los mejores algoritmos cu√°nticos que conocemos para ejecutar aplicaciones √∫tiles requieren que las tasas de error de nuestros qubits sean mucho m√°s bajas que las que tenemos hoy.
Para llenar este vac√≠o, necesitaremos la correcci√≥n del error cu√°ntico.
La correcci√≥n de errores cu√°nticos protege la informaci√≥n al codificarla en m√∫ltiples qubits f√≠sicos para formar un "qubit l√≥gico" y se cree que es la √∫nica forma de producir una computadora cu√°ntica a gran escala con tasas de error lo suficientemente bajas como para realizar c√°lculos √∫tiles.
En lugar de calcular en los qubits individuales, calcularemos en qubits l√≥gicos. Al codificar un mayor n√∫mero de qubits f√≠sicos en nuestro procesador cu√°ntico en un qubit l√≥gico, esperamos reducir las tasas de error para permitir algoritmos cu√°nticos √∫tiles.

Resumen:

""", "en")

candidate = traduza(generation_model.predict(prompt, temperature=0.1, max_output_tokens=1024, top_k=40, top_p=0.9).text, "es")

print(candidate)

You will also need a human-generated summary that we will use to compare to the `candidate` generated by the model. We will call this `reference`. 

In [None]:
reference = "Las computadoras cu√°nticas son sensibles al ruido y los errores. Para llenar este vac√≠o, necesitaremos la correcci√≥n de errores cu√°nticos. La correcci√≥n de errores cu√°nticos protege la informaci√≥n mediante la codificaci√≥n de m√∫ltiples qubits f√≠sicos para formar un 'qubit l√≥gico'."

Agora voc√™ pode pegar o candidato e a refer√™ncia para avaliar o desempenho. Neste caso, ROUGE lhe dar√°:

- `rouge-1`, que mede a sobreposi√ß√£o de unigramas
- `rouge-2`, que mede a sobreposi√ß√£o de bigramas
- `rouge-l`, que mede a maior subsequ√™ncia comum

In [None]:
ROUGE.get_scores(candidate, reference)