This colab is the chat only version of this notebook: [bit.ly/gemma-pirate-demo](https://bit.ly/gemma-pirate-demo)
##### Copyright 2024 Google LLC.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://ai.google.dev/gemma/docs/get_started"><img src="https://ai.google.dev/static/site-assets/images/docs/notebook-site-button.png" height="32" width="32" />Acesse ai.google.dev</a>
  </td>
    <td>
    <a target="_blank" href="https://colab.research.google.com/github.com/lucianommartins/generative-ai-ptbr/blob/main/gemma/2_chatbot_with_Gemma.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />Execute este notebook no Google Colab</a>
  </td>
  <td>
    <a target="_blank" href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://github.com/lucianommartins/generative-ai-ptbr/blob/main/gemma/2_chatbot_with_Gemma.ipynb"><img src="https://ai.google.dev/images/cloud-icon.svg" width="40" />Execute este notebook na Vertex AI</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/lucianommartins/generative-ai-ptbr/blob/main/gemma/2_chatbot_with_Gemma.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />Consulte o c√≥digo no GitHub</a>
  </td>
</table>

# Criando um chatbot com modelos Gemma

Este tutorial mostra como criar um chatbot utilizando os modelos Google Gemma. LLMs s√£o muito bons para criar assistentes ou chatbots porque podem dar respostas muito boas e uma conversa com um LLM s√≥ faz sentido quando ele consegue lembrar o que foi perguntado antes.

**Importante:** Para uma melhor experi√™ncia de execu√ß√£o deste laborat√≥rio, √© recomendado que se utilize uma m√°quina com aceleradores (GPU ou TPU). Em uma m√°quina sem aceleradores (como GPU) esta gera√ß√£o de conte√∫do pode levar cerca de 80 segundos para ser conclu√≠da.

## Configurando o ambiente

### Instalando depend√™ncias

Instale os pacotes `pip` Keras e KerasNLP.

In [None]:
# Instale a √∫ltima vers√£o do Keras 3. Acesse https://keras.io/getting_started/ para maiores detalhes.
!pip install -U keras-nlp
!pip install -U keras>=3
!pip install -U jax
!pip install -U jaxlib

### Configura√ß√µes para o uso do Gemma

Para concluir este tutorial, primeiro voc√™ precisa seguir as instru√ß√µes de configura√ß√£o em [Configura√ß√£o do Gemma](https://ai.google.dev/gemma/docs/setup). As instru√ß√µes de configura√ß√£o do Gemma mostram como fazer o seguinte:

* Obtenha acesso a Gemma em kaggle.com.
* Selecione um tempo de execu√ß√£o do Colab com recursos suficientes para execu√ß√£o
   o modelo Gemma 2B.
* Gere e configure um nome de usu√°rio Kaggle e uma chave de API.

Depois de concluir a configura√ß√£o do Gemma, v√° para a pr√≥xima se√ß√£o, onde voc√™ definir√° vari√°veis de ambiente para seu ambiente Colab.

**TL;DR: Acesse https://www.kaggle.com/models/google/gemma e fa√ßa a solicita√ß√£o de acesso ao modelo Gemma**

### Configurando vari√°veis de ambiente necess√°rias para utilizar o Kaggle

Configure as vari√°veis `KAGGLE_USERNAME` (contendo seu usu√°rio Kaggle) e `KAGGLE_KEY` (com sua chave de acesso ao Kaggle).

In [None]:
import os

# Nota: `userdata.get` √© uma API Colab. Se voc√™ n√£o estiver usando o Colab, defina o ambiente
# vars conforme apropriado para seu sistema.

# descomente o par de linhas que fa√ßa mais sentido pra voc√™:
# # op√ß√£o A: utilizando direto no Colab
# from google.colab import userdata
# os.environ["KAGGLE_USERNAME"] = userdata.get('KAGGLE_USERNAME')
# os.environ["KAGGLE_KEY"] = userdata.get('KAGGLE_KEY')

# # op√ß√£o B: utilizando na Vertex AI ou no seu ambiente pessoal
# os.environ["KAGGLE_USERNAME"] = "seu usu√°rio"
# os.environ["KAGGLE_KEY"] = "sua chave de autentica√ß√£o"

### Escolhe o backend a ser utilizado com o Keras

Keras √© uma API de deep learning multi-backend de alto n√≠vel projetada para simplicidade e facilidade de uso. [Keras 3](https://keras.io/keras_3) permite escolher o backend: TensorFlow, JAX ou PyTorch. Todos os tr√™s funcionar√£o para este tutorial.

In [None]:
os.environ["KERAS_BACKEND"] = "jax"

# pr√©-aloque 100% da mem√≥eria da TPU pra diminuir fragmenta√ß√£o de mem√≥ria
os.environ["XLA_PYTHON_CLIENT_MEM_FRACTION"] = "1.0"

import keras
import keras_nlp

# por reproducibilidade
keras.utils.set_random_seed(42)

## Defina um modelo

KerasNLP fornece implementa√ß√µes de muitas [arquiteturas de modelos populares](https://keras.io/api/keras_nlp/models/). Neste tutorial, voc√™ criar√° um modelo usando `GemmaCausalLM`, um modelo Gemma ponta a ponta para modelagem de linguagem causal. Um modelo de linguagem causal prev√™ o pr√≥ximo token com base nos tokens anteriores.

Voc√™ usar√° a vers√£o Afinada com Instru√ß√£o porque √© a vers√£o que foi preparada para manter conversas e tirar d√∫vidas de forma mais natural.

Crie o modelo usando o m√©todo `from_preset`:

In [None]:
gemma_lm = keras_nlp.models.GemmaCausalLM.from_preset("gemma_instruct_2b_en")

### Uma fun√ß√£o de apoio para facilitar a formata√ß√£o das intera√ß√µes

In [None]:
# formatting utility
from IPython.display import Markdown
import textwrap

def display_chat(prompt, text):
  formatted_prompt = "<font size='+1' color='brown'>üôã‚Äç‚ôÇÔ∏è<blockquote>" + prompt + "</blockquote></font>"
  text = text.replace('‚Ä¢', '  *')
  text = textwrap.indent(text, '> ', predicate=lambda _: True)
  formatted_text = "<font size='+1' color='teal'>ü§ñ\n\n" + text + "\n</font>"
  return Markdown(formatted_prompt+formatted_text)

def to_markdown(text):
  text = text.replace('‚Ä¢', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

# Vamos conversar

Carregamos o modelo ajustado por instru√ß√£o `gemma_instruct_2b_en`, que compreende os seguintes tokens de turno:
```
<start_of_turn>usu√°rio\n  ... <end_of_turn>\n
<start_of_turn>modelo\n ... <end_of_turn>\n
```

### Fun√ß√£o de apoio para o chat (para gerenciar o estado da discuss√£o)

In [None]:
class ChatState():
  """
  Manages the conversation history for a turn-based chatbot
  Follows the turn-based conversation guidelines of the Gemma family of models.
  documented here: https://ai.google.dev/gemma/docs/formatting
  """

  __START_TURN_USER__ = "<start_of_turn>user\n"
  __START_TURN_MODEL__ = "<start_of_turn>model\n"
  __END_TURN__ = "<end_of_turn>\n"

  def __init__(self, model, system=""):
    """
    Initializes the chat state.

    Args:
        model: The language model to use for generating responses.
        system: (Optional) System instructions or bot description.
    """
    self.model = model
    self.system = system
    self.history = []

  def add_to_history_as_user(self, message):
      """
      Adds a user message to the history with start/end turn markers.
      """
      self.history.append(self.__START_TURN_USER__ + message + self.__END_TURN__)

  def add_to_history_as_model(self, message):
      """
      Adds a model response to the history with start/end turn markers.
      """
      self.history.append(self.__START_TURN_MODEL__ + message + self.__END_TURN__)

  def get_history(self):
      """
      Returns the entire chat history as a single string.
      """
      return "".join([*self.history])

  def get_full_prompt(self):
    """
    Builds the prompt for the language model, including history and system description.
    """
    prompt = self.get_history() + self.__START_TURN_MODEL__
    if len(self.system)>0:
      prompt = self.system + "\n" + prompt
    return prompt

  def send_message(self, message):
    """
    Handles sending a user message and getting a model response.

    Args:
        message: The user's message.

    Returns:
        The model's response.
    """
    self.add_to_history_as_user(message)
    prompt = self.get_full_prompt()
    response = self.model.generate(prompt, max_length=1024)
    result = response.replace(prompt, "")  # Extract only the new response
    self.add_to_history_as_model(result)
    return result


In [None]:
chat = ChatState(gemma_lm)
message = "Diga-me, em poucas palavras, como calcular todos os n√∫meros primos at√© 1000?"
display_chat(message, chat.send_message(message))

In [None]:
message = "Agora em Python! Sem usar Numpy, por favor!"
display_chat(message, chat.send_message(message))

In [None]:
message = "Obrigado, assim funciona. Pode me explicar esse c√≥digo?"
display_chat(message, chat.send_message(message))

In [None]:
message = "Massa! Agora adicione essas explica√ß√µes como coment√°rios no c√≥digo."
display_chat(message, chat.send_message(message))

Vamos tentar a resposta gerada. Apenas copiar o c√≥digo para a pr√≥xima c√©lula e execut√°-lo deve nos dar as respostas corretas:

In [None]:
def is_prime(n):
  """
  Checks if a number is prime.

  Args:
    n: The number to check.

  Returns:
    True if n is prime, False otherwise.
  """

  # If n is less than or equal to 1, it is not prime.
  if n <= 1:
    return False

  # Iterate through all the numbers from 2 to the square root of n.
  for i in range(2, int(n**0.5) + 1):
    # If n is divisible by any of the numbers in the range from 2 to the square root of n, it is not prime.
    if n % i == 0:
      return False

  # If no divisors are found, n is prime.
  return True


# Initialize an empty list to store prime numbers.
primes = []

# Iterate through all the numbers from 2 to 1000.
for i in range(2, 1001):
  # If the number is prime, add it to the list.
  if is_prime(i):
    primes.append(i)

# Print the prime numbers.
print(primes)

voc√™ tamb√©m pode ver como todo o contexto foi mantido pela classe Chat, mas chamando o m√©todo `get_history`:

In [None]:
print(chat.get_history())

# Pr√≥ximos passos

Neste tutorial, voc√™ aprendeu como conversar com o modelo ajustado de instru√ß√£o Gemma 2B usando Keras no JAX.

Na pr√≥xima etapa, voc√™ pode ajustar o modelo para ter um tom ou voz espec√≠fico e usar esse modelo na classe de bate-papo.

Aqui est√£o algumas sugest√µes sobre como ajustar o modelo usando Keras e JAX:
* [Treinamento distribu√≠do com Keras 3](https://keras.io/guides/distribution/).
* [Escrever um loop de treinamento personalizado para um modelo Keras em JAX](https://keras.io/guides/writing_a_custom_training_loop_in_jax/).

E mais alguns tutoriais b√°sicos do Gemma:

* [Primeiros passos com Keras Gemma](https://ai.google.dev/gemma/docs/get_started).
* [Tuning do modelo Gemma na GPU](https://ai.google.dev/gemma/docs/lora_tuning).
* Saiba mais sobre [integra√ß√£o do Gemma com Vertex AI](https://ai.google.dev/gemma/docs/integrations/vertex)
* Saiba como [usar modelos Gemma com Vertex AI](https://cloud.google.com/vertex-ai/docs/generative-ai/open-models/use-gemma).