<a href="https://colab.research.google.com/github/dayaneLima/colab-gemini-embed-basic/blob/main/ImersaoAluraEmbed.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Instalando o SDK do Google Generative AI

In [1]:
!pip install -q -U google-generativeai

# Importar as libs

In [19]:
# Suporte para arrays e matrizes multidimensionais, junto com uma grande coleção de funções matemáticas de alto nível
# Bem a grosso modo: ferramenta matemática
# Não foi preciso instalar pq já vem imputida no Google Colab
import numpy as np

# Análise e manipulação de dados fornecendo estruturas de dados de alto desempenho e funções poderosas
# Bem a grosso modo: espécie de google sheets
# Não foi preciso instalar pq já vem imputida no Google Colab
import pandas as pd

# Import the Python SDK
import google.generativeai as genai

# Configurar API Key

Para mais informações: [Get an API key](https://colab.research.google.com/corgiredirector?site=https%3A%2F%2Faistudio.google.com%2Fapp%2Fapikey)

In [3]:
from google.colab import userdata

GOOGLE_API_KEY = userdata.get("GOOGLE_API_KEY")
genai.configure(api_key=GOOGLE_API_KEY)

# Listar os modelos disponíveis

In [None]:
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)

# Embed: O que é?

No Gemini, um embed pode ser entendido como uma representação vetorial do significado de um texto. Essa representação, na forma de uma matriz multidimensional, é criada por meio de um processo chamado "embedding".

Imagine um enorme mapa onde cada palavra e frase possui um ponto específico. A posição desse ponto no mapa, representada por suas coordenadas em diversas dimensões, captura a essência do significado da palavra ou frase. Quanto mais próximos os pontos estiverem no mapa, mais similar será o significado das palavras ou frases que eles representam.

O processo de embedding funciona da seguinte maneira:

1. Entrada: O texto a ser representado é fornecido como entrada para o modelo de embedding.
2. Processamento: O modelo de embedding analisa o texto e identifica padrões e relações entre as palavras.
3. Saída: O modelo de embedding gera uma matriz multidimensional que representa o significado do texto.

Essas representações vetoriais podem ser usadas para diversas tarefas de processamento de linguagem natural (PLN), como:

- Pesquisa semântica: Encontrar documentos que sejam semanticamente semelhantes a um documento de consulta, mesmo que usem palavras diferentes.
- Classificação de texto: Classificar documentos em categorias predefinidas, como "notícia", "artigo científico" ou "receita".
- Agrupamento de texto: Agrupar documentos com base em tópicos semelhantes, identificando automaticamente temas recorrentes.

O Gemini oferece diversos modelos de embedding de texto, cada um com suas próprias características e vantagens. A escolha do modelo ideal depende da tarefa específica que você está realizando.

# Embed content

## Exemplo de tamanho de vetor gerado


Chamada do método embed_content com o modelo models/text-embedding-004 para gerar embeddings de texto.

In [None]:
text = "Hello world"
result = genai.embed_content(model="models/text-embedding-004", content=text)

# Print just a part of the embedding to keep the output manageable
print(str(result['embedding'])[:50], '... TRIMMED]')

# Print
print(result['embedding'])


In [None]:
print(len(result['embedding'])) # número de dimensões

Teste com outro texto.

Irá gerar uma outra matriz, com valores diferentes, mas com o mesmo tamanho, para facilitar a comparação.


In [None]:
text2 = "Teste de embedding com outro texto"
result2 = genai.embed_content(model="models/text-embedding-004", content=text)

# Print just a part of the embedding to keep the output manageable
print(str(result2['embedding'])[:50], '... TRIMMED]')

# Print
print(result2['embedding'])


In [None]:
print(len(result2['embedding'])) # número de dimensões

## Batch embed content

Você pode incorporar uma lista de vários prompts com uma chamada de API para maior eficiência.

In [None]:
result = genai.embed_content(
    model="models/text-embedding-004",
    content=[
      'What is the meaning of life?',
      'How much wood would a woodchuck chuck?',
      'How does the brain work?'])

for embedding in result['embedding']:
  print(len(embedding))

## Exemplo de Embedding

O task_type escolhido vai ser de acordo com o que deseja com o texto que será gerado o embedding.


* TASK_TYPE_UNSPECIFIED:	Unset value, which will default to one of the other enum values.
* RETRIEVAL_QUERY:	Specifies the given text is a query in a search/retrieval setting.
* RETRIEVAL_DOCUMENT:	Specifies the given text is a document from the corpus being searched.
* SEMANTIC_SIMILARITY:	Specifies the given text will be used for STS.
* CLASSIFICATION:	Specifies that the given text will be classified.
* CLUSTERING:	Specifies that the embeddings will be used for clustering.
* QUESTION_ANSWERING:	Specifies that the given text will be used for question answering.
* FACT_VERIFICATION:	Specifies that the given text will be used for fact verification.

In [None]:
title = "A próxima geração de IA para desenvolvedores e Google Workspace"
sample_text = ("Título: A próxima geração de IA para desenvolvedores e Google Workspace"
    "\n"
    "Artigo completo:\n"
    "\n"
    "Gemini API & Google AI Studio: Uma maneira acessível de explorar e criar protótipos com aplicações de IA generativa")

embeddings = genai.embed_content(model="models/embedding-001",
                                 content=sample_text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")

print(embeddings)

Criação de documentos que serão buscados

In [18]:
#Listagem de documentos que serão buscados
DOCUMENT1 = {
    "Título": "Operação do sistema de controle climático",
    "Conteúdo": "O Googlecar tem um sistema de controle climático que permite ajustar a temperatura e o fluxo de ar no carro. Para operar o sistema de controle climático, use os botões e botões localizados no console central.  Temperatura: O botão de temperatura controla a temperatura dentro do carro. Gire o botão no sentido horário para aumentar a temperatura ou no sentido anti-horário para diminuir a temperatura. Fluxo de ar: O botão de fluxo de ar controla a quantidade de fluxo de ar dentro do carro. Gire o botão no sentido horário para aumentar o fluxo de ar ou no sentido anti-horário para diminuir o fluxo de ar. Velocidade do ventilador: O botão de velocidade do ventilador controla a velocidade do ventilador. Gire o botão no sentido horário para aumentar a velocidade do ventilador ou no sentido anti-horário para diminuir a velocidade do ventilador. Modo: O botão de modo permite que você selecione o modo desejado. Os modos disponíveis são: Auto: O carro ajustará automaticamente a temperatura e o fluxo de ar para manter um nível confortável. Cool (Frio): O carro soprará ar frio para dentro do carro. Heat: O carro soprará ar quente para dentro do carro. Defrost (Descongelamento): O carro soprará ar quente no para-brisa para descongelá-lo."}

DOCUMENT2 = {
    "Título": "Touchscreen",
    "Conteúdo": "O seu Googlecar tem uma grande tela sensível ao toque que fornece acesso a uma variedade de recursos, incluindo navegação, entretenimento e controle climático. Para usar a tela sensível ao toque, basta tocar no ícone desejado.  Por exemplo, você pode tocar no ícone \"Navigation\" (Navegação) para obter direções para o seu destino ou tocar no ícone \"Music\" (Música) para reproduzir suas músicas favoritas."}

DOCUMENT3 = {
    "Título": "Mudança de marchas",
    "Conteúdo": "Seu Googlecar tem uma transmissão automática. Para trocar as marchas, basta mover a alavanca de câmbio para a posição desejada.  Park (Estacionar): Essa posição é usada quando você está estacionado. As rodas são travadas e o carro não pode se mover. Marcha à ré: Essa posição é usada para dar ré. Neutro: Essa posição é usada quando você está parado em um semáforo ou no trânsito. O carro não está em marcha e não se moverá a menos que você pressione o pedal do acelerador. Drive (Dirigir): Essa posição é usada para dirigir para frente. Low: essa posição é usada para dirigir na neve ou em outras condições escorregadias."}

documents = [DOCUMENT1, DOCUMENT2, DOCUMENT3]

Usando a lib pandas para formatar os documentos em formato de tabela

In [None]:
df = pd.DataFrame(documents)
df.columns = ["Titulo", "Conteudo"]
df

### Criação de uma função para automatizar a criação dos embeddings

Escolha do modelo:

In [21]:
model = "models/embedding-001"

Criação da função em python para gerar o embedding e o retornar

In [22]:
def embed_fn(title, text):
  return genai.embed_content(model=model,
                                 content=text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")["embedding"]

Para cada item no dataframe que foi gerado dos documentos, será chamado a função embed_fn criada, informando o Titulo e o Conteudo e armazenando em uma nova coluna desse dataframe(df), chamada Embeddings.

O comando lambda é para informar que será percorrido e armazenado linha por linha.

In [None]:
df["Embeddings"] = df.apply(lambda row: embed_fn(row["Titulo"], row["Conteudo"]), axis=1)
df

### Criação de uma função para realização de consultas nos documentos

Para gerar uma consulta, é necessário criar o embedding da mesma, para poder comparar com os documentos no momento da busca.

In [24]:
def gerar_e_buscar_consulta(consulta, base, model):

  # Geracao do embedding do texto da consulta
  # task_type de RETRIEVAL_QUERY por ser para consulta
  embedding_da_consulta = genai.embed_content(model=model,
                                 content=consulta,
                                 task_type="RETRIEVAL_QUERY")["embedding"]

  # Calcular a distância entre os vetores da consulta e dos documentos
  # É utilizado os embeddings dos documentos gerados (df["Embeddings"])
  # e o embedding da consulta
  # Utilizado a lib numpy para manipulação de array para realizar a comparação
  # calculando então a distancia entre os dataframes e a consulta,
  # para assim encontar a mais próxima
  produtos_escalares = np.dot(np.stack(df["Embeddings"]), embedding_da_consulta)

  # obter do np o índice do maior (o mais próximo da consulta)
  indice = np.argmax(produtos_escalares)

  # retorna do dataframe o elemento de índice maior encontrado
  return df.iloc[indice]["Conteudo"]

Criação do texto da consulta e chamando a função criada.

In [None]:
consulta = "Como faço para trocar marchas em um carro do Google?"

trecho = gerar_e_buscar_consulta(consulta, df, model)
print(trecho)

### Utilizar o trecho encontrado e solicitar para encrevê-lo de forma mais descontraída

Abaixo é adicionado a configuração para o GenerativeModel:

In [26]:
generation_config = {
  "temperature": 0,
  "candidate_count": 1
}

Criação do prompt da para encrever o trecho obtido de forma mais descontraída e chamando o GenerativeModel juntamente do generate_content informando o prompt.

In [None]:
prompt = f"Reescreva esse texto de uma forma mais descontraída, sem adicionar informações que não façam parte do texto: {trecho}"

model_2 = genai.GenerativeModel("gemini-1.0-pro",
                                generation_config=generation_config)
response = model_2.generate_content(prompt)
print(response.text)