# Embeddings

 Forma de representar um contexto semântico de uma palavra/frase (token).  Analisa a distância de um token para o outro em uma representação multidimensional. 

Uma das principais vantagens de uso no mundo das LLM é poder avaliar/comparar frases e entender a distância dos significados. 

Utilizado pela IA para avaliar os parâmetros: top n, top k, temperature


1. Instalar o SDK do Google, Numpy e Pandas

In [8]:
%pip install -q -U google-generativeai

Note: you may need to restart the kernel to use updated packages.


In [None]:
%pip install -q -U numpy
%pip install -q -U pandas

2. Instalar as bibliotecas
generativeai, 
pandas(usado para manipular dataframes), 
numpy(usado para trabalhar com vetores)

In [10]:
import numpy as np
import pandas as pd
import google.generativeai as genai

API_KEY = "XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"  #Sua API KEY 
genai.configure(api_key= API_KEY)

Listar os modelos de Embedding

In [11]:
for n in genai.list_models():
    if 'embedContent' in n.supported_generation_methods:
        print(n.name)

models/embedding-001
models/text-embedding-004


3. Criando o embedding

In [29]:
texto = "Verificar a alimentação do dispositivo"
texto_2 = {"Se a energia não estiver não estiver ligada"
           "\n"
           "verifique se o seu dispositivo está ligado na tomada"}

modelo = "models/embedding-001"
task_type = "RETRIEVAL_DOCUMENT"

embedding = genai.embed_content(model= modelo
                                , content= texto
                                #, title= texto
                                , task_type= task_type)
print(embedding['embedding'])
print(len(embedding['embedding']))
print ('\n')

embedding2 = genai.embed_content(model= modelo
                                 , content= texto_2
                                 , title= texto
                                , task_type= task_type)

for embed in embedding2['embedding']:
    print(embedding2['embedding'])

[0.019560367, -0.019289501, -0.06411491, 0.013781735, 0.08369945, 0.02031688, 0.017716903, -0.029554162, -0.004144528, 0.060406186, 0.0021444054, -0.012243461, 0.010731432, 0.036303323, -0.00091182766, -0.035642087, 0.03278644, 0.024364837, 0.031366218, -0.00784244, 0.010426094, 0.029770631, -0.0008709016, 0.0052168053, 0.0049822866, 0.006285713, 0.011542066, -0.034746572, -0.019078236, -0.0006067086, -0.024102667, 0.02449356, -0.053416055, 0.005643718, 0.02113446, -0.06977679, -0.014171939, 0.03201231, -0.0142736025, -0.002833953, 0.02424223, -0.027750446, -0.04082601, 0.013846619, -0.014129262, 0.023728387, -0.035064533, 0.025548765, 0.028424405, -0.04471825, 0.039575495, 0.009941673, 0.05685046, -2.6659005e-05, -0.034940057, -0.06031208, 0.07050916, -0.00014380027, 0.008418388, 0.031300295, -0.02062103, 0.006613315, 0.049680732, 0.03306727, -0.023541942, -0.059099883, -0.036500394, -0.004795558, 0.047399335, -0.012149078, -0.009111299, -0.07198493, 0.043865826, -0.010720763, 0.03928

Criando um banco de dados de Embeddings

In [35]:
DOCUMENTO1 = {
    "title": "Operando o Sistema de Controle Climático",
    "content": "Seu Googlecar possui um sistema de controle climático que permite ajustar a temperatura e o fluxo de ar no carro. Para operar o sistema de controle climático, use os botões e botões localizados no console central. Temperatura: O botão de temperatura controla o temperatura dentro do carro. Gire o botão no sentido horário para aumentar a temperatura ou no sentido anti-horário para diminuir o fluxo de ar: O botão de fluxo de ar controla a quantidade de fluxo de ar dentro do carro. velocidade: O botão de velocidade do ventilador controla a velocidade do ventilador. Gire o botão no sentido horário para aumentar a velocidade do ventilador ou no sentido anti-horário para diminuir a velocidade do ventilador. Modo: O botão de modo permite selecionar o modo desejado. O carro ajustará automaticamente a temperatura e o fluxo de ar para manter um nível confortável. Frio: O carro soprará ar frio para dentro do carro. Calor: O carro soprará ar quente para dentro do carro. para descongelar."}
DOCUMENTO2 = {
    "title": "Tela sensível ao toque",
    "content": "Seu Googlecar possui uma grande tela sensível ao toque que fornece acesso a uma variedade de recursos, incluindo navegação, entretenimento e controle de temperatura. Para usar a tela sensível ao toque, basta tocar no ícone desejado. Por exemplo, você pode tocar no \ ícone Navegação\ para obter rotas até seu destino ou toque no ícone \"Música\" para reproduzir suas músicas favoritas."}
DOCUMENTO3 = {
    "title": "Mudando de marcha",
    "content": "Seu Googlecar possui transmissão automática. Para mudar de marcha, basta mover a alavanca de mudança para a posição desejada. Estacionar: Esta posição é usada quando você está estacionado. As rodas estão travadas e o carro não pode se mover. Marcha-atrás: Esta posição A posição é usada para dar ré: Esta posição é usada quando você está parado em um semáforo ou no trânsito. O carro não está engatado e não se moverá a menos que você pressione o pedal do acelerador. . Baixo: Esta posição é usada para dirigir em neve ou outras condições escorregadias."}

documentos = [DOCUMENTO1, DOCUMENTO2, DOCUMENTO3]

  "content": "Seu Googlecar possui uma grande tela sensível ao toque que fornece acesso a uma variedade de recursos, incluindo navegação, entretenimento e controle de temperatura. Para usar a tela sensível ao toque, basta tocar no ícone desejado. Por exemplo, você pode tocar no \ ícone Navegação\ para obter rotas até seu destino ou toque no ícone \"Música\" para reproduzir suas músicas favoritas."}


Converte os documentos em um dataframe e atualizando o nome das colunas

In [44]:
df = pd.DataFrame(documentos)
df.columns = ["Titulo", "Conteudo"]
df

Unnamed: 0,Titulo,Conteudo
0,Operando o Sistema de Controle Climático,Seu Googlecar possui um sistema de controle cl...
1,Tela sensível ao toque,Seu Googlecar possui uma grande tela sensível ...
2,Mudando de marcha,Seu Googlecar possui transmissão automática. P...


In [48]:
modelo = "models/embedding-001"
task_type = "RETRIEVAL_DOCUMENT"

4. Criando uma função que cria embeddings

In [49]:
def CriaEmbedding(title, text):
    embed = genai.embed_content(model= modelo
                                , content= text
                                , title= title
                                , task_type= task_type)['embedding']
    return embed


df.apply --> função do pandas que serve para aplicar uma função para um dataframe

In [50]:
df['embeddings'] = df.apply(lambda row: CriaEmbedding(row["Titulo"], row["Conteudo"]), axis= 1)
df

Unnamed: 0,Titulo,Conteudo,embeddings
0,Operando o Sistema de Controle Climático,Seu Googlecar possui um sistema de controle cl...,"[-0.019136094, -0.029979248, -0.030025043, 0.0..."
1,Tela sensível ao toque,Seu Googlecar possui uma grande tela sensível ...,"[0.02062493, -0.034454532, 0.019564504, 0.0150..."
2,Mudando de marcha,Seu Googlecar possui transmissão automática. P...,"[-0.0064704963, -0.026031032, -0.00623164, 0.0..."


Agora vamos fazer uma pergunta para o modelo sobre os documentos. Para isso é necessário converter a pergunta em embedding também.

Para isso será feito o produto escalar par a par (documento - pergunta) para ver quem está mais próximo e quem está mais distânte

5. Criando função para gerar embdding da pergunta e consultar com o modelo

In [54]:
task_type_2 = "RETRIEVAL_QUERY"

In [52]:
def gerar_e_buscar_consulta(consulta, base, modelo, task_type):
    embedding_Consulta = genai.embed_content(model= modelo  
                                , content= consulta
                                , task_type= task_type) #gera o embedding da consulta
    produto_escalar = np.dot(np.stack(df['embeddings']), embedding_Consulta['embedding'] ) #np.dot faz o produto escalar de 2 vetores 

    indice = np.argmax(produto_escalar)
    
    return df.iloc[indice]["Conteudo"] #localiza o índice no dataframe e retorna o valor da coluna conteúdo

In [53]:
consulta = "Como trocar as marchas no carro do google?"

resposta = gerar_e_buscar_consulta(consulta, df, modelo,task_type_2)
print(resposta)

Seu Googlecar possui transmissão automática. Para mudar de marcha, basta mover a alavanca de mudança para a posição desejada. Estacionar: Esta posição é usada quando você está estacionado. As rodas estão travadas e o carro não pode se mover. Marcha-atrás: Esta posição A posição é usada para dar ré: Esta posição é usada quando você está parado em um semáforo ou no trânsito. O carro não está engatado e não se moverá a menos que você pressione o pedal do acelerador. . Baixo: Esta posição é usada para dirigir em neve ou outras condições escorregadias.


Fazendo a junção com o GeminiAi

In [61]:
generation_config = {
    "candidate_count": 1,
    "temperature": 0.5,
}

In [62]:
prompt = f"Reescreva o texto de uma forma mais descontraída, sem adicionar informações que não fazem parte do texto: {consulta}"

modelo_2 = genai.GenerativeModel('gemini-1.0-pro', generation_config= generation_config)
resposta_gemini = modelo_2.generate_content(prompt)
print(resposta_gemini.text)

**Trocando as Marchas no Carro do Google: Um Guia Relax**

Então, você pegou o volante do carro do Google. Parabéns! Mas espera aí, como diabos você troca as marchas nessa coisa?

Não se preocupe, é mais fácil do que parece. Aqui vai um guia rápido e descontraído:

* **Passo 1: Encontre o volante.** Sim, aquele redondo com um monte de botões.
* **Passo 2: Olhe para a parte de trás do volante.** Você verá duas alavancas, uma de cada lado.
* **Passo 3: Para aumentar a marcha, puxe a alavanca da esquerda para trás.** É como dar um tapinha no ombro dela, dizendo: "Ei, vamos acelerar!"
* **Passo 4: Para reduzir a marcha, empurre a alavanca da direita para frente.** É como dizer: "Calma lá, vamos desacelerar um pouco."
* **Passo 5: Repita os passos 3 e 4 até encontrar a marcha perfeita.** É como encontrar o equilíbrio entre velocidade e eficiência.

E aí está! Agora você é um mestre das marchas no carro do Google. Aproveite o passeio!
