<a href="https://colab.research.google.com/github/marcoss00/imersao-IA-alura/blob/master/Sistema_para_busca_em_documentos_usando_embeddings_e_a_Gemini_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Instala a biblioteca do Google Generative AI
!pip install -U -q google-generativeai

In [1]:
# Importa a biblioteca para interagir com a API do Gemini
import google.generativeai as genai


import numpy as np
import pandas as pd
# Importa a biblioteca para ocultar a api_key
from google.colab import userdata
# Atribui a api_key ocultada para a variavel
API_KEY = userdata.get('SECRET_KEY')

# Define a chave API do Google Cloud
GOOGLE_API_KEY = API_KEY
# Configura a API do Gemini com a chave API
genai.configure(api_key=GOOGLE_API_KEY)

In [2]:
# Imprime o nome dos modelos que suportam embedding de conte√∫do
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)

models/embedding-001
models/text-embedding-004


In [3]:
# Exemplo de embedding
title = 'A proxima gera√ß√£o de IA para desenvolvedores e Google Workspace'
sample_text = ('T√≠tulo: A pr√≥xima gera√ß√£o de IA para desenvolvedores e Google Workspace'
'\n'
'Artigo completo:\n'
'\n'
'Gemini API & Google AI Studio: Uma maneira acess√≠vel de explorar e criar prot√≥tipos com aplica√ß√µes de IA generativa'
)

embeddings = genai.embed_content(model='models/embedding-001', # Define o modelo para embedding
                                 content=sample_text, # O conte√∫do a ser convertido em embedding
                                 title=title, # O t√≠tulo do conte√∫do
                                 task_type='RETRIEVAL_DOCUMENT') # Tipo de tarefa: recupera√ß√£o de documentos

print(embeddings['embedding']) # Imprime o embedding gerado

[0.052137077, -0.041911047, -0.017747298, 0.022898074, 0.0662186, -0.0036233321, -0.025393372, -0.021608483, 0.06206625, 0.06001781, 0.012003619, 0.012485821, -0.047615122, -0.02251698, 0.0053527947, -0.023356067, 0.02037049, -0.008932678, -0.036506943, -0.0008588067, 0.01166203, 0.008224894, -0.03189937, -0.07361595, -0.015703088, 0.02186134, 0.018564543, -0.036533143, -0.03737856, 0.028954303, -0.051988646, 0.050233655, -0.034648288, 0.013746849, -0.036689512, -0.041641757, -0.022507045, -0.045012962, -0.0019062563, -0.0027377654, 0.010702224, -0.08500248, -0.012193831, 0.022504013, -0.0070223347, -0.02089268, 0.044729006, 0.046042364, 0.01628135, -0.05638016, 0.028556129, 0.022358764, 0.06714588, -0.0431141, -0.0028457614, -0.010425606, 0.022628482, -0.030194078, 0.023477852, 0.003157771, -0.0022021679, 0.025732236, -0.014661687, 0.054099325, 0.023848481, -0.056112245, -0.0429489, 0.0014184231, 0.011182679, 0.043554634, 0.00522269, 0.007859834, 0.059594445, -0.065255515, -0.04311270

In [4]:
# Define tr√™s documentos de exemplo
DOCUMENT1 = {
  "T√≠tulo": "Operando o Sistema de Controle Clim√°tico",
  "Conte√∫do": "O seu Googlecar possui um sistema de controle clim√°tico que permite ajustar a temperatura e o fluxo de ar dentro do carro. Para operar o sistema de controle clim√°tico, use os bot√µes e bot√µes girat√≥rios localizados no console central.  Temperatura: O bot√£o girat√≥rio de temperatura controla a temperatura dentro do carro. Gire o bot√£o no sentido hor√°rio para aumentar a temperatura ou no sentido anti-hor√°rio para diminu√≠-la. Fluxo de ar: O bot√£o girat√≥rio de fluxo de ar controla a quantidade de ar circulando dentro do carro. Gire o bot√£o no sentido hor√°rio para aumentar o fluxo de ar ou no sentido anti-hor√°rio para diminu√≠-lo. Velocidade do ventilador: O bot√£o girat√≥rio de velocidade do ventilador controla a velocidade do ventilador. Gire o bot√£o no sentido hor√°rio para aumentar a velocidade do ventilador ou no sentido anti-hor√°rio para diminu√≠-la. Modo: O bot√£o de modo permite selecionar o modo desejado. Os modos dispon√≠veis s√£o: Autom√°tico: O carro ajustar√° automaticamente a temperatura e o fluxo de ar para manter um n√≠vel confort√°vel. Refrigera√ß√£o: O carro soprar√° ar frio para dentro do carro. Aquecimento: O carro soprar√° ar quente para dentro do carro. Descongelamento: O carro soprar√° ar quente no para-brisa para desemba√ß√°-lo."
}

DOCUMENT2 = {
  "T√≠tulo": "Tela sens√≠vel ao toque",
  "Conte√∫do": "O seu Googlecar possui uma ampla tela sens√≠vel ao toque que fornece acesso a diversos recursos, incluindo navega√ß√£o, entretenimento e controle clim√°tico. Para usar a tela sens√≠vel ao toque, basta tocar no √≠cone desejado.  Por exemplo, voc√™ pode tocar no √≠cone \"Navega√ß√£o\" para obter instru√ß√µes para o seu destino ou tocar no √≠cone \"M√∫sica\" para tocar suas m√∫sicas favoritas."
}

DOCUMENT3 = {
  "T√≠tulo": "Troca de marchas",
  "Conte√∫do": "O seu Googlecar possui uma transmiss√£o autom√°tica. Para trocar de marchas, basta mover a alavanca seletora para a posi√ß√£o desejada.  Park (Estacionamento): Esta posi√ß√£o √© usada quando voc√™ est√° estacionado. As rodas est√£o travadas e o carro n√£o pode se mover. Reverse (R√©): Esta posi√ß√£o √© usada para dar r√©. Neutro: Esta posi√ß√£o √© usada quando voc√™ est√° parado em um sem√°foro ou no tr√¢nsito. O carro n√£o est√° engatado e n√£o se mover√° a menos que voc√™ pressione o pedal do acelerador. Drive (Condu√ß√£o): Esta posi√ß√£o √© usada para dirigir para frente. Low (Baixa): Esta posi√ß√£o √© usada para dirigir na neve ou em outras condi√ß√µes escorregadias."
}
documents = [DOCUMENT1, DOCUMENT2, DOCUMENT3]

In [5]:
# Cria um DataFrame com os documentos
df = pd.DataFrame(documents)
df.columns = ['Titulo', 'Conteudo']
df

Unnamed: 0,Titulo,Conteudo
0,Operando o Sistema de Controle Clim√°tico,O seu Googlecar possui um sistema de controle ...
1,Tela sens√≠vel ao toque,O seu Googlecar possui uma ampla tela sens√≠vel...
2,Troca de marchas,O seu Googlecar possui uma transmiss√£o autom√°t...


In [6]:
# Define o modelo para embedding
model = 'models/embedding-001'

In [7]:
# Define uma fun√ß√£o para gerar embeddings para os documentos
def embed_fn(title, text):
  return genai.embed_content(model=model, # Modelo para embedding
                                 content=text, # Conte√∫do a ser convertido em embedding
                                 title=title, # T√≠tulo do conte√∫do
                                 task_type='RETRIEVAL_DOCUMENT')['embedding'] # Tipo de tarefa: recupera√ß√£o de documentos

In [8]:
# Adiciona uma coluna com os embeddings para cada documento
df['Embeddings'] = df.apply(lambda row: embed_fn(row['Titulo'], row['Conteudo']), axis=1)
df

Unnamed: 0,Titulo,Conteudo,Embeddings
0,Operando o Sistema de Controle Clim√°tico,O seu Googlecar possui um sistema de controle ...,"[-0.020244068, -0.027876778, -0.02678409, 0.04..."
1,Tela sens√≠vel ao toque,O seu Googlecar possui uma ampla tela sens√≠vel...,"[0.024187531, -0.0379205, 0.022978948, 0.01133..."
2,Troca de marchas,O seu Googlecar possui uma transmiss√£o autom√°t...,"[-0.0071002846, -0.014253719, -0.0066602957, 0..."


In [11]:
# Define uma fun√ß√£o para gerar embedding para uma consulta e buscar o documento mais similar
def gerar_e_buscar_consulta(consulta, base, model):
  embedding_da_consulta = genai.embed_content(model=model, # Modelo para embedding
                                 content=consulta, # Consulta a ser convertida em embedding
                                 task_type='RETRIEVAL_QUERY')["embedding"] # Tipo de tarefa: consulta de recupera√ß√£o

  # Calcula o produto escalar entre o embedding da consulta e os embeddings dos documentos
  produtos_escalares = np.dot(np.stack(df["Embeddings"]), embedding_da_consulta)

  indice = np.argmax(produtos_escalares) # Encontra o √≠ndice do documento com o maior produto escalar
  return df.iloc[indice]["Conteudo"] # Retorna o conte√∫do do documento mais similar

In [14]:
# Define uma consulta de exemplo
consulta = 'Como fa√ßo para trocar marchas em um carro do Google?'
# Busca o documento mais similar √† consulta
trecho = gerar_e_buscar_consulta(consulta, df, model)
print(trecho)

O seu Googlecar possui uma transmiss√£o autom√°tica. Para trocar de marchas, basta mover a alavanca seletora para a posi√ß√£o desejada.  Park (Estacionamento): Esta posi√ß√£o √© usada quando voc√™ est√° estacionado. As rodas est√£o travadas e o carro n√£o pode se mover. Reverse (R√©): Esta posi√ß√£o √© usada para dar r√©. Neutro: Esta posi√ß√£o √© usada quando voc√™ est√° parado em um sem√°foro ou no tr√¢nsito. O carro n√£o est√° engatado e n√£o se mover√° a menos que voc√™ pressione o pedal do acelerador. Drive (Condu√ß√£o): Esta posi√ß√£o √© usada para dirigir para frente. Low (Baixa): Esta posi√ß√£o √© usada para dirigir na neve ou em outras condi√ß√µes escorregadias.


In [25]:
# Define as configura√ß√µes de gera√ß√£o de texto
generation_config = {
    'candidate_count': 1, # N√∫mero de respostas candidatas
    'temperature': 0.5, # N√≠vel de criatividade (0-1)
}

In [27]:
# Define o prompt para gera√ß√£o de texto
prompt = f'Reescreva esse texto de uma forma mais descontraida, sem adicionar informa√ß√µes que n√£o fa√ßam parte do texto: {trecho}'

# Define o modelo para gera√ß√£o de texto
model_2 = genai.GenerativeModel('gemini-1.5-pro', generation_config=generation_config)
# Gera o texto com base no prompt
response = model_2.generate_content(prompt)
print(response.text)

E a√≠! Seu Googlecar tem c√¢mbio autom√°tico, ent√£o esquece aquela hist√≥ria de trocar marcha na m√£o. √â s√≥ alegria! üòÅ

Para colocar o carro na marcha que voc√™ quer, √© s√≥ dar um toque na alavanca. Olha s√≥ como √© f√°cil:

* **Park (P):** Estacionou? Deixa tudo quietinho no P que as rodas ficam travadas e o carro n√£o sai do lugar. üöóüîí
* **Reverse (R):** Para dar aquela r√© esperta, √© s√≥ colocar no R. Mas cuidado com os obst√°culos! üëÄ
* **Neutro (N):** Parado no sinal ou no tr√¢nsito? Deixa no N que o carro fica de boa, sem sair do lugar. S√≥ n√£o esquece de tirar quando for andar! üòâ
* **Drive (D):** Hora de acelerar! Coloca no D e p√© na t√°bua! (Ou n√£o, n√©? Seguran√ßa em primeiro lugar! üòÖ)
* **Low (L):** Neve ou ch√£o escorregadio? A√≠ √© hora do L entrar em a√ß√£o, te dando mais controle na dire√ß√£o. ‚ùÑÔ∏è

Viu como √© f√°cil? Agora √© s√≥ aproveitar o rol√™ com seu Googlecar! üòé 

