In [None]:
# Copyright 2023 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Sumariza√ß√£o de textos com Generative AI na Vertex AI

<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/colab-logo-32px.png" alt="Colab logo"> Execute no Colab
    </a>
  </td>
  <td>
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo">
      Veja no GitHub
    </a>
  </td>
  <td>
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/blob/main/language/intro_palm_api.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo">
      Execute no Vertex AI Workbench
    </a>
  </td>
</table>

## Vis√£o geral
A sumariza√ß√£o de textos produz um resumo conciso de um texto. Existem dois tipos principais de resumo de texto: extrativo e abstrativo. A sumariza√ß√£o extrativa envolve selecionar frases cr√≠ticas do texto original e combin√°-las para formar um resumo. A sumariza√ß√£o abstrativa envolve a gera√ß√£o de novas senten√ßas que representam os pontos principais do texto original. Neste notebook, voc√™ passar√° por alguns exemplos de como LLM podem ajudar na gera√ß√£o de sum√°rios de textos.

Saiba mais sobre resumo de texto na [documenta√ß√£o oficial](https://cloud.google.com/vertex-ai/docs/generative-ai/text/summarization-prompts).

### Objetivo

Neste tutorial, voc√™ aprender√° como usar LLM para sumarizar informa√ß√µes de texto trabalhando com os seguintes exemplos:
- Sum√°rio da transcri√ß√£o
- Sumariza√ß√£o de texto em bullets
- Sum√°rio de di√°logo com tarefas realizadas
- Tokeniza√ß√£o de hashtag
- Gera√ß√£o de t√≠tulos e cabe√ßalhos

Voc√™ tamb√©m aprender√° como avaliar resumos gerados por modelos comparando-os com resumos criados por humanos usando o `ROUGE` como uma estrutura de avalia√ß√£o.

### Custos
Este tutorial usa os seguintes componentes de Google Cloud:

* Vertex AI Studio

Saiba mais sobre poss√≠veis custos envolvidos [pre√ßos da Vertex AI](https://cloud.google.com/vertex-ai/pricing),
e use a [Calculadora de pre√ßos](https://cloud.google.com/products/calculator/)
para gerar uma estimativa de custo com base no uso projetado.

## Primeiros Passos

### Instalando os SDK da Vertex AI e da Cloud Translate API

In [None]:
!pip install google-cloud-aiplatform --upgrade --user

**Somente Colab:** Descomente a c√©lula a seguir para reiniciar o kernel ou use o bot√£o para reiniciar o kernel.

In [None]:
# # Reinicia automaticamente o kernel ap√≥s as instala√ß√µes para que seu ambiente possa acessar os novos pacotes
# import IPython

# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)

### Autenticando seu ambiente de notebook
* Se voc√™ estiver usando o **Colab** para executar este notebook, descomente a c√©lula abaixo e continue.
* Se voc√™ estiver usando o **Vertex AI Workbench**, confira as instru√ß√µes de configura√ß√£o [aqui](../setup-env/README.md).

In [None]:
# from google.colab import auth
# auth.authenticate_user()

### Importando as bibliotecas necess√°rias

**Somente Colab:** Descomente a c√©lula a seguir para realizar o processo adequado de inicializa√ß√£o da SDK da Vertex AI.  

In [None]:
# import vertexai

# PROJECT_ID = "[seu-project-id]"  # @param {type:"string"}
# vertexai.init(project=PROJECT_ID, location="us-central1")

In [None]:
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 

import warnings
warnings.simplefilter("ignore", UserWarning)

from vertexai.language_models import TextGenerationModel

#### Carregando o modelo `text-bison`

In [None]:
generation_model = TextGenerationModel.from_pretrained("text-bison@001")

## Sumariza√ß√£o de texto

### Sumarizar uma transcri√ß√£o

Neste primeiro exemplo, voc√™ resume um texto sobre computa√ß√£o qu√¢ntica.

In [None]:
prompt = """
Forne√ßa um resumo muito curto, n√£o mais do que tr√™s frases, para o seguinte artigo:

Nossos computadores qu√¢nticos funcionam manipulando qubits de uma forma orquestrada que chamamos de algoritmos qu√¢nticos.
O desafio √© que os qubits s√£o t√£o sens√≠veis que at√© mesmo a luz difusa pode causar erros de c√°lculo ‚Äì e o problema piora √† medida que os computadores qu√¢nticos crescem.
Isso tem consequ√™ncias significativas, pois os melhores algoritmos qu√¢nticos que conhecemos para executar aplicativos √∫teis exigem que as taxas de erro de nossos qubits sejam muito menores do que as que temos hoje.
Para preencher essa lacuna, precisaremos de corre√ß√£o de erro qu√¢ntica.
A corre√ß√£o de erros qu√¢nticos protege as informa√ß√µes codificando-as em v√°rios qubits f√≠sicos para formar um ‚Äúqubit l√≥gico‚Äù e acredita-se que seja a √∫nica maneira de produzir um computador qu√¢ntico de grande escala com taxas de erro baixas o suficiente para c√°lculos √∫teis.
Em vez de calcular nos pr√≥prios qubits individuais, calcularemos em qubits l√≥gicos. Ao codificar n√∫meros maiores de qubits f√≠sicos em nosso processador qu√¢ntico em um qubit l√≥gico, esperamos reduzir as taxas de erro para permitir algoritmos qu√¢nticos √∫teis.

Resumo:

"""

print(
    generation_model.predict(prompt, temperature=0.2, max_output_tokens=1024, top_k=40, top_p=0.8).text
)

Em vez de um resumo, podemos pedir um TL;DR (*"too long; didn't read"* ou "muito longo; n√£o li" em tradu√ß√£o livre). Voc√™ pode comparar as diferen√ßas entre as sa√≠das geradas.

In [None]:
prompt = """
Forne√ßa um TL;DR para o seguinte artigo:

Nossos computadores qu√¢nticos funcionam manipulando qubits de uma forma orquestrada que chamamos de algoritmos qu√¢nticos.
O desafio √© que os qubits s√£o t√£o sens√≠veis que at√© mesmo a luz difusa pode causar erros de c√°lculo ‚Äì e o problema piora √† medida que os computadores qu√¢nticos crescem.
Isso tem consequ√™ncias significativas, pois os melhores algoritmos qu√¢nticos que conhecemos para executar aplicativos √∫teis exigem que as taxas de erro de nossos qubits sejam muito menores do que as que temos hoje.
Para preencher essa lacuna, precisaremos de corre√ß√£o de erro qu√¢ntica.
A corre√ß√£o de erros qu√¢nticos protege as informa√ß√µes codificando-as em v√°rios qubits f√≠sicos para formar um ‚Äúqubit l√≥gico‚Äù e acredita-se que seja a √∫nica maneira de produzir um computador qu√¢ntico de grande escala com taxas de erro baixas o suficiente para c√°lculos √∫teis.
Em vez de calcular nos pr√≥prios qubits individuais, calcularemos em qubits l√≥gicos. Ao codificar n√∫meros maiores de qubits f√≠sicos em nosso processador qu√¢ntico em um qubit l√≥gico, esperamos reduzir as taxas de erro para permitir algoritmos qu√¢nticos √∫teis.

TL;DR:
"""

print(
    generation_model.predict(prompt, temperature=0.2, max_output_tokens=1024, top_k=40, top_p=0.8).text
)

### Sumarizar em bullets
No exemplo a seguir, voc√™ usa o mesmo texto sobre computa√ß√£o qu√¢ntica, mas pede ao modelo para sumarizar com bullets. Sinta-se √† vontade para alterar o prompt.

In [None]:
prompt = """
Forne√ßa um resumo muito curto em quatro bullets para o seguinte artigo:

Nossos computadores qu√¢nticos funcionam manipulando qubits de uma forma orquestrada que chamamos de algoritmos qu√¢nticos.
O desafio √© que os qubits s√£o t√£o sens√≠veis que at√© mesmo a luz difusa pode causar erros de c√°lculo ‚Äì e o problema piora √† medida que os computadores qu√¢nticos crescem.
Isso tem consequ√™ncias significativas, pois os melhores algoritmos qu√¢nticos que conhecemos para executar aplicativos √∫teis exigem que as taxas de erro de nossos qubits sejam muito menores do que as que temos hoje.
Para preencher essa lacuna, precisaremos de corre√ß√£o de erro qu√¢ntica.
A corre√ß√£o de erros qu√¢nticos protege as informa√ß√µes codificando-as em v√°rios qubits f√≠sicos para formar um ‚Äúqubit l√≥gico‚Äù e acredita-se que seja a √∫nica maneira de produzir um computador qu√¢ntico de grande escala com taxas de erro baixas o suficiente para c√°lculos √∫teis.
Em vez de calcular nos pr√≥prios qubits individuais, calcularemos em qubits l√≥gicos. Ao codificar n√∫meros maiores de qubits f√≠sicos em nosso processador qu√¢ntico em um qubit l√≥gico, esperamos reduzir as taxas de erro para permitir algoritmos qu√¢nticos √∫teis.

Bullets:

"""

print(
    generation_model.predict(prompt, temperature=0.2, max_output_tokens=256, top_k=1, top_p=0.8).text
)

### Sumarizar di√°logos com tarefas realizadas
O sum√°rio do di√°logo envolve condensar uma conversa em um formato mais curto para que voc√™ n√£o precise ler toda a discuss√£o, mas possa aproveitar um resumo. Neste exemplo, voc√™ pede ao modelo para resumir uma conversa de exemplo entre um cliente de varejo online e um agente de suporte e incluir tarefas no final.

In [None]:
prompt = """
Gere um resumo da conversa a seguir e, no final, resuma as tarefas para o agente de suporte:

Cliente: Ol√°, sou Jos√© e recebi o item errado.

Agente de suporte: Ol√°, Jos√©. Como voc√™ gostaria de ver isso resolvido?

Cliente: Eu quero devolver o item e obter um reembolso, por favor.

Agente de Suporte: Claro. Posso processar o reembolso para voc√™ agora. Posso ter o n√∫mero do seu pedido, por favor?

Cliente: √â [N√öMERO DO PEDIDO].

Agente de suporte: Obrigado. Processei o reembolso e voc√™ receber√° seu dinheiro de volta em 14 dias.

Cliente: Muito obrigado.

Agente de suporte: De nada, Jos√©. Tenha um bom dia!

Resumo:
"""

print(
    generation_model.predict(prompt, temperature=0.2, max_output_tokens=256, top_k=40, top_p=0.8).text
)

### Tokeniza√ß√£o de hashtag
A tokeniza√ß√£o de hashtag √© o processo de pegar um peda√ßo de texto e obter os "tokens" de hashtag. Voc√™ pode usar isso, por exemplo, se quiser gerar hashtags para suas campanhas de m√≠dia social. Neste exemplo, voc√™ pega [este tweet do Google Cloud](https://twitter.com/googlecloud/status/1649127992348606469) e gera algumas hashtags que pode usar.

In [None]:
prompt = """
Tokenize as hashtags deste tweet:

Google Cloud
@googlecloud
Como os dados podem ajudar nosso planeta em mudan√ßa? üåé

Em homenagem ao #EarthDay neste fim de semana, estamos orgulhosos de compartilhar como estamos fazendo parceria com
@ClimateEngine para aproveitar o poder dos dados geoespaciais e direcionar para um futuro mais sustent√°vel.

Confira como ‚Üí https://goo.gle/3mOUfts
"""

print(
    generation_model.predict(prompt, temperature=0.8, max_output_tokens=1024, top_k=40, top_p=0.8).text
)

### Gera√ß√£o de t√≠tulos e cabe√ßalhos
Abaixo, voc√™ pede ao modelo para gerar cinco op√ß√µes para poss√≠veis combina√ß√µes de t√≠tulo/cabe√ßalho para um determinado trecho de texto.

In [None]:
prompt = """
Escreva um t√≠tulo para este texto, me d√™ cinco op√ß√µes:
Seja ajudando m√©dicos a identificar doen√ßas ou encontrando fotos de ‚Äúabra√ßos‚Äù, a IA est√° por tr√°s de muito do trabalho que fazemos no Google. E em nosso Arts & Culture Lab em Paris, temos experimentado como a IA pode ser usada em benef√≠cio da cultura.
Hoje, estamos compartilhando nossos √∫ltimos experimentos - prot√≥tipos que se baseiam em sete anos de trabalho em parceria com 1.500 institui√ß√µes culturais em todo o mundo.
Cada um desses aplicativos experimentais executa algoritmos de IA em segundo plano para permitir que voc√™ descubra conex√µes culturais escondidas em arquivos e at√© mesmo encontre obras de arte que combinem com a decora√ß√£o da sua casa."
"""

print(
    generation_model.predict(prompt, temperature=0.8, max_output_tokens=256, top_k=1, top_p=0.8).text
)

## Avalia√ß√£o
Voc√™ pode avaliar os resultados das tarefas de resumo usando [ROUGE](https://en.wikipedia.org/wiki/ROUGE_(metric)) como uma estrutura de avalia√ß√£o. `ROUGE` (Recall-Oriented Understudy for Gisting Evaluation) s√£o medidas para determinar automaticamente a qualidade de um resumo comparando-o com outros resumos (ideais) criados por humanos. As medidas contam o n√∫mero de unidades sobrepostas, como n-gram, sequ√™ncias de palavras e pares de palavras entre o resumo gerado por computador a ser avaliado e os resumos ideais criados por humanos.


O primeiro passo √© instalar a biblioteca `ROUGE`.

In [None]:
!pip install rouge

Crie um resumo a partir de um LLM que voc√™ pode usar para comparar com um resumo gerado por humanos.

In [None]:
from rouge import Rouge

ROUGE = Rouge()

prompt = """
Forne√ßa um resumo muito curto, m√°ximo de quatro frases, para o seguinte artigo:

Nossos computadores qu√¢nticos funcionam manipulando qubits de uma forma orquestrada que chamamos de algoritmos qu√¢nticos.
O desafio √© que os qubits s√£o t√£o sens√≠veis que at√© mesmo a luz difusa pode causar erros de c√°lculo ‚Äì e o problema piora √† medida que os computadores qu√¢nticos crescem.
Isso tem consequ√™ncias significativas, pois os melhores algoritmos qu√¢nticos que conhecemos para executar aplicativos √∫teis exigem que as taxas de erro de nossos qubits sejam muito menores do que as que temos hoje.
Para preencher essa lacuna, precisaremos de corre√ß√£o de erro qu√¢ntica.
A corre√ß√£o de erros qu√¢nticos protege as informa√ß√µes codificando-as em v√°rios qubits f√≠sicos para formar um ‚Äúqubit l√≥gico‚Äù e acredita-se que seja a √∫nica maneira de produzir um computador qu√¢ntico de grande escala com taxas de erro baixas o suficiente para c√°lculos √∫teis.
Em vez de calcular nos pr√≥prios qubits individuais, calcularemos em qubits l√≥gicos. Ao codificar n√∫meros maiores de qubits f√≠sicos em nosso processador qu√¢ntico em um qubit l√≥gico, esperamos reduzir as taxas de erro para permitir algoritmos qu√¢nticos √∫teis.

Resumo:

"""

candidate = generation_model.predict(prompt, temperature=0.1, max_output_tokens=1024, top_k=40, top_p=0.9).text

print(candidate)

You will also need a human-generated summary that we will use to compare to the `candidate` generated by the model. We will call this `reference`. 

In [None]:
reference = "Computadores qu√¢nticos s√£o sens√≠veis a ru√≠dos e erros. Para preencher essa lacuna, precisaremos de corre√ß√£o de erros qu√¢nticos. A corre√ß√£o de erros qu√¢nticos protege as informa√ß√µes codificando v√°rios qubits f√≠sicos para formar um 'qubit l√≥gico'."

Agora voc√™ pode pegar o candidato e a refer√™ncia para avaliar o desempenho. Neste caso, ROUGE lhe dar√°:

- `rouge-1`, que mede a sobreposi√ß√£o de unigramas
- `rouge-2`, que mede a sobreposi√ß√£o de bigramas
- `rouge-l`, que mede a maior subsequ√™ncia comum

In [None]:
ROUGE.get_scores(candidate, reference)