<a href="https://colab.research.google.com/github/fvenkoff/projeto_collab_ia_2/blob/main/projeto_collab_ia_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

# üîé **Sistema para busca em documentos usando embeddings e Gemini API** : üîç

---






# Importa√ß√µes e configura√ß√µes iniciais

In [15]:
!pip install -U -q google-generativeai

In [26]:
import numpy as np
import pandas as pd
import google.generativeai as genai

from google.colab import userdata
GOOGLE_API_KEY = userdata.get('SECRET_KEY')
genai.configure(api_key=GOOGLE_API_KEY)

NameError: name 'discuss_types' is not defined

# Listando Modelos

In [None]:
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)

# Exemplo de embedding

In [None]:
title = "A pr√≥xima gera√ß√£o de IA para desenvolvedores e Google Workspace"
sample_text = ("T√≠tulo: A pr√≥xima gera√ß√£o de IA para desenvolvedores e Google Workspace"
    "\n"
    "Artigo completo:\n"
    "\n"
    "Gemini API & Google AI Studio: Uma maneira acess√≠vel de explorar e criar prot√≥tipos com aplica√ß√µes de IA generativa")

embeddings = genai.embed_content(model="models/embedding-001",
                                 content=sample_text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")

print(embeddings)

# Listagem de documentos que ser√£o buscados

In [None]:

DOCUMENT1 = {
    "T√≠tulo": "Opera√ß√£o do sistema de controle clim√°tico",
    "Conte√∫do": "O Googlecar tem um sistema de controle clim√°tico que permite ajustar a temperatura e o fluxo de ar no carro. Para operar o sistema de controle clim√°tico, use os bot√µes e bot√µes localizados no console central.  Temperatura: O bot√£o de temperatura controla a temperatura dentro do carro. Gire o bot√£o no sentido hor√°rio para aumentar a temperatura ou no sentido anti-hor√°rio para diminuir a temperatura. Fluxo de ar: O bot√£o de fluxo de ar controla a quantidade de fluxo de ar dentro do carro. Gire o bot√£o no sentido hor√°rio para aumentar o fluxo de ar ou no sentido anti-hor√°rio para diminuir o fluxo de ar. Velocidade do ventilador: O bot√£o de velocidade do ventilador controla a velocidade do ventilador. Gire o bot√£o no sentido hor√°rio para aumentar a velocidade do ventilador ou no sentido anti-hor√°rio para diminuir a velocidade do ventilador. Modo: O bot√£o de modo permite que voc√™ selecione o modo desejado. Os modos dispon√≠veis s√£o: Auto: O carro ajustar√° automaticamente a temperatura e o fluxo de ar para manter um n√≠vel confort√°vel. Cool (Frio): O carro soprar√° ar frio para dentro do carro. Heat: O carro soprar√° ar quente para dentro do carro. Defrost (Descongelamento): O carro soprar√° ar quente no para-brisa para descongel√°-lo."}

DOCUMENT2 = {
    "T√≠tulo": "Touchscreen",
    "Conte√∫do": "O seu Googlecar tem uma grande tela sens√≠vel ao toque que fornece acesso a uma variedade de recursos, incluindo navega√ß√£o, entretenimento e controle clim√°tico. Para usar a tela sens√≠vel ao toque, basta tocar no √≠cone desejado.  Por exemplo, voc√™ pode tocar no √≠cone \"Navigation\" (Navega√ß√£o) para obter dire√ß√µes para o seu destino ou tocar no √≠cone \"Music\" (M√∫sica) para reproduzir suas m√∫sicas favoritas."}

DOCUMENT3 = {
    "T√≠tulo": "Mudan√ßa de marchas",
    "Conte√∫do": "Seu Googlecar tem uma transmiss√£o autom√°tica. Para trocar as marchas, basta mover a alavanca de c√¢mbio para a posi√ß√£o desejada.  Park (Estacionar): Essa posi√ß√£o √© usada quando voc√™ est√° estacionado. As rodas s√£o travadas e o carro n√£o pode se mover. Marcha √† r√©: Essa posi√ß√£o √© usada para dar r√©. Neutro: Essa posi√ß√£o √© usada quando voc√™ est√° parado em um sem√°foro ou no tr√¢nsito. O carro n√£o est√° em marcha e n√£o se mover√° a menos que voc√™ pressione o pedal do acelerador. Drive (Dirigir): Essa posi√ß√£o √© usada para dirigir para frente. Low: essa posi√ß√£o √© usada para dirigir na neve ou em outras condi√ß√µes escorregadias."}

documents = [DOCUMENT1, DOCUMENT2, DOCUMENT3]

# Data Frame

In [None]:
df = pd.DataFrame(documents)
df.columns = ["Titulo", "Conteudo"]
df

# Definindo Fun√ß√µes

In [None]:
model = "models/embedding-001"

In [None]:
def embed_fn(title, text):
  return genai.embed_content(model=model,
                                 content=text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")["embedding"]

In [None]:
df["Embeddings"] = df.apply(lambda row: embed_fn(row["Titulo"], row["Conteudo"]), axis=1)
df

In [None]:
def gerar_e_buscar_consulta(consulta, base, model):
  embedding_da_consulta = genai.embed_content(model=model,
                                 content=consulta,
                                 task_type="RETRIEVAL_QUERY")["embedding"]

  produtos_escalares = np.dot(np.stack(df["Embeddings"]), embedding_da_consulta)

  indice = np.argmax(produtos_escalares)
  return df.iloc[indice]["Conteudo"]

# A Consulta

In [None]:
consulta = "Como fa√ßo para trocar marchas em um carro do Google?"

trecho = gerar_e_buscar_consulta(consulta, df, model)
print(trecho)

# Configura√ß√µes e prompt

In [None]:
generation_config = {
  "temperature": 0,
  "candidate_count": 1
}

In [None]:
prompt = f"Reescreva esse texto de uma forma mais descontra√≠da, sem adicionar informa√ß√µes que n√£o fa√ßam parte do texto: {trecho}"

model_2 = genai.GenerativeModel("gemini-1.0-pro",
                                generation_config=generation_config)
response = model_2.generate_content(prompt)
print(response.text)