<a href="https://colab.research.google.com/github/gabrielsbarcellos/alura-ia-7-analise-semantica-arquivo/blob/main/alura-ia-7-analise-semantica-arquivo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# fazer uma busca de informaçao dentro de uma base de conhecimento
# segura ou controlada.

# Envia os arquivos para o sistema analisar e gerar o embedding. Isto
# vai criar um conjunto de tokens sobre o texto e terá uma pontuação
# geral sobre os dados. Desta forma a IA treina/aprende sobre os dados
# e depois você sobe as perguntas sobre os dados pré-treinados. A IA
# vai tokeinizar também a pergunta e desta forma será capaz de evoluir
# na resposta com base em problemas matemáticos.

In [None]:
!pip install -q -U google-generativeai

import google.generativeai as gemini
# manipula dataframes (manipula tabelas, colunas, linhas,
# google sheets, excel...)
import pandas as pd
# trabalha com estruturas de vetores e formulas matematicas
# fazer calculos
import numpy as np

# Nota: pandas e numpy não precisam do !pip install... porque já
# vem pré-instaldo no colab.

from google.colab import userdata

GOOGLE_API_KEY = userdata.get('MY_GOOGLE_API_KEY')

gemini.configure(api_key=GOOGLE_API_KEY)

# não é necessária esta parte, está aqui meramente para didática
# para ver qual modelo será usado
for m in gemini.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)



models/embedding-001
models/text-embedding-004


In [None]:
# exemplo de embedding
# texto que será avaliado e treinado pela IA para futuras consultas

title = "Guia de embeddings"
sample_text = (
    "Título: Guia de embeddings"
    "\n"
    "Artigo completo\n"
    "\n"
    "O serviço de embedding na API Gemini gera embeddings de última geração para palavras, frases e sentenças. Os embeddings resultantes podem ser usados para tarefas de PLN, como pesquisa semântica, classificação de texto e clustering, entre muitos outros. Esta página descreve o que são embeddings e destaca alguns casos de uso importantes do serviço de embedding para ajudar você a começar."
)

# para passar por parametro no embed_content:
# modelo: para embeded PRECISA do 'models/',
#   para os outros modos nao precisa.
# titulo: não é obrigatório
# content: é obrigatório
# task_type:
# RETRIEVAL_QUERY: Especifica que o texto fornecido é uma consulta em uma configuração de pesquisa/recuperação.
# RETRIEVAL_DOCUMENT: Especifica que o texto fornecido é um documento em uma configuração de pesquisa/recuperação.
# SEMANTIC_SIMILARITY:Especifica que o texto fornecido será usado para Semântica Textual Similaridade (STS).
# CLASSIFICATION: Especifica que os embeddings serão utilizados para classificação.
# CLUSTERING: Especifica que os embeddings serão usados para clustering.

embeddings = gemini.embed_content(
    model="models/embedding-001",
    content=sample_text,
    title=title,
    task_type="RETRIEVAL_DOCUMENT"
    )

print(embeddings)

{'embedding': [0.036359634, -0.0405664, -0.0009210137, 0.035079386, 0.040145732, 0.011879172, -0.020461386, 0.0007292736, 0.004176341, 0.050958235, -0.011086758, -0.0018816066, -0.027538955, -0.043940157, -0.02974942, -0.057416815, 0.011259488, 0.0021437479, 0.003882123, -0.013187067, -0.04916269, -0.008641575, -0.0022661749, -0.061656557, -0.012682676, -0.017783947, 0.030596418, -0.036979187, -0.03606837, 0.038123682, -0.027053636, 0.055353343, -0.011905034, 0.008475838, -0.0036751204, -0.05362264, -0.021153811, -0.07035107, -0.006709961, 0.024028383, 0.011091309, -0.03445022, -0.0030856577, -0.038721304, -0.009606081, -0.025711853, 0.015234675, 0.0350038, 0.010898252, -0.06647887, 0.010154661, -0.02788788, 0.09322815, -0.019121941, -0.014207409, -0.040453203, 0.061130088, -0.047451667, -0.04730124, 0.016182961, 0.0010485754, -0.038255796, -0.0031691866, 0.02152339, 0.00090397144, -0.06006292, -0.033286974, 0.0053542885, 0.03762536, -0.004305015, 0.027828839, 0.009586476, 0.05712524, 

In [None]:
# listar os documentos que serao usados na busca do embedding

DOCUMENT1 = {
     "Título": "Operando o Sistema de Controle Climático",
     "Conteúdo": "Seu Googlecar possui um sistema de controle climático que permite ajustar a temperatura e o fluxo de ar no carro. Para operar o sistema de controle climático, use os botões e botões localizados no console central. Temperatura: O botão de temperatura controla o temperatura dentro do carro. Gire o botão no sentido horário para aumentar a temperatura ou no sentido anti-horário para diminuir o fluxo de ar: O botão de fluxo de ar controla a quantidade de fluxo de ar dentro do carro. velocidade: O botão de velocidade do ventilador controla a velocidade do ventilador. Gire o botão no sentido horário para aumentar a velocidade do ventilador ou no sentido anti-horário para diminuir a velocidade do ventilador. Modo: O botão de modo permite selecionar o modo desejado. O carro ajustará automaticamente a temperatura e o fluxo de ar para manter um nível confortável. Frio: O carro soprará ar frio para dentro do carro. Calor: O carro soprará ar quente para dentro do carro. para descongelar."}
DOCUMENT2 = {
     "Título": "Tela sensível ao toque",
     "Conteúdo": "Seu Googlecar possui uma grande tela sensível ao toque que fornece acesso a uma variedade de recursos, incluindo navegação, entretenimento e controle de temperatura. Para usar a tela sensível ao toque, basta tocar no ícone desejado. Por exemplo, você pode tocar no ícone \"Navegação\" para obter rotas até seu destino ou toque no ícone \"Música\" para reproduzir suas músicas favoritas."}
DOCUMENT3 = {
     "Título": "Mudando de marcha",
     "Conteúdo": "Seu Googlecar possui transmissão automática. Para mudar de marcha, basta mover a alavanca de mudança para a posição desejada. Estacionar: Esta posição é usada quando você está estacionado. As rodas estão travadas e o carro não pode se mover. Marcha-atrás: Esta posição A posição é usada para dar ré: Esta posição é usada quando você está parado em um semáforo ou no trânsito. O carro não está engatado e não se moverá a menos que você pressione o pedal do acelerador. . Baixo: Esta posição é usada para dirigir em neve ou outras condições escorregadias."}

documents = [DOCUMENT1, DOCUMENT2, DOCUMENT3]


In [19]:

# transforma a estrutura da var documents (nossa lista de tuplas 'title','content')
# em um formato DataFrae

df = pd.DataFrame(documents)

df.columns = ["Titulo","Conteudo"]

df

Unnamed: 0,Titulo,Conteudo
0,Operando o Sistema de Controle Climático,Seu Googlecar possui um sistema de controle cl...
1,Tela sensível ao toque,Seu Googlecar possui uma grande tela sensível ...
2,Mudando de marcha,Seu Googlecar possui transmissão automática. P...


In [21]:
# seleciona o modelo

model="models/embedding-001"

In [33]:

def embed_fn(title, text):

  # retorna apenas a coluna embedding gerada
  # sobre os dados de entrada
  return gemini.embed_content(
            model=model,
            content=text,
            title=title,
            task_type="RETRIEVAL_DOCUMENT")['embedding']

In [34]:
# roda a função para cada linha (document) do content,
# faz um callback para a df (do tipo dataframe).
# tokeniza toda a lista de documentos, ou todo o dataframe
# a funçao lambda garante que a função vai ser rodada linha por linha
# dataframe df gera mais uma coluna (Embeddings) e para cada registro
# adiciona o embedding criado pela função que foi executada com
# callback
df['Embeddings'] = df.apply(lambda row: embed_fn(row['Titulo'], row['Conteudo']), axis=1)

df

Unnamed: 0,Titulo,Conteudo,Embeddings
0,Operando o Sistema de Controle Climático,Seu Googlecar possui um sistema de controle cl...,"[-0.019136094, -0.029979248, -0.030025043, 0.0..."
1,Tela sensível ao toque,Seu Googlecar possui uma grande tela sensível ...,"[0.020082306, -0.033482343, 0.018756287, 0.016..."
2,Mudando de marcha,Seu Googlecar possui transmissão automática. P...,"[-0.0064704963, -0.026031032, -0.00623164, 0.0..."


In [37]:

def gerar_e_buscar_consulta(consulta, base, modelo):
  embedding_da_consulta = gemini.embed_content(
            model=modelo,
            content=consulta,
            task_type="RETRIEVAL_QUERY")['embedding']

  # o dataframe tem 3 documento e estamos mandando uma pergunta. A IA vai
  # calcular a distancia entre a pergunta e cada um dos documentos usando
  # produto escalar (por isso o uso do numpy) e vai
  # infefrir o fragmento que corresponde ao melhor contexto
  produtos_escalares = np.dot(np.stack(df['Embeddings']),embedding_da_consulta)

  # Qual é o argumento máximo desses embedding? Basicamente o que temos agora
  # dentro do produtos_escalares vai ter uma referencia de cada um dos textos dentro
  # do dataframe e um vavlor que representa a distância. Ao usar a função argmax a
  # vai buscar dentro desta lista produtos_escalares qual que se desaca mais ali dentro
  # e pegar só o ID dele

  # pega o indice do token que teve maior similaridade com o contexto
  indice = np.argmax(produtos_escalares)

  return df.iloc[indice]['Conteudo']

In [39]:
# note que você como usuário não precisa necessáriamente saber a palavra exata que
# está no documento, você pode perguntar com as suas palavras e a IA dá um jeito
# de entender e relacionar com o conteúdo
consulta = "Como faço para trocar a marcha em um carro da google?"

trecho = gerar_e_buscar_consulta(consulta, df, model)

# neste caso não tem risco de alucinação de modelo pois não estamos pedindo pro
# modelo gerar uma resposta e sim para encontrar em uma base segura onde espera-se
# que de fato tenha a resposta. Você tem controle do dado da resposta a ser dada,
# mas você tem uma resposta menos criativa. Toda vez que você fizer a mesma entrada
# mesma pergunta e mesma base de dados, vai receber sempre a mesma resposta,
# o sistema se torna linear.

print(trecho)

Seu Googlecar possui transmissão automática. Para mudar de marcha, basta mover a alavanca de mudança para a posição desejada. Estacionar: Esta posição é usada quando você está estacionado. As rodas estão travadas e o carro não pode se mover. Marcha-atrás: Esta posição A posição é usada para dar ré: Esta posição é usada quando você está parado em um semáforo ou no trânsito. O carro não está engatado e não se moverá a menos que você pressione o pedal do acelerador. . Baixo: Esta posição é usada para dirigir em neve ou outras condições escorregadias.


In [40]:
# Entretanto, tendo a resposta certa na mão voce pode fazer uma chamada na IA,
# não por embed mas por contentxxx para solicitar que reescreva a resposta de uma
# forma diferente, por exemplo, menos formal, mais descolado, em forma de gíria,
# em poema.... nestes casos você terá respostas criativas (isto é chamado de RAG,
# é o poder de combinar as duas coisas, generativa com uma base sólida e bem comportada)

pedido_reescrita = f"Reescreva este texto de uma forma mais descontradída, sem adicionar inforaçoes que não façam parte do texto: {trecho}"

model_2 = gemini.GenerativeModel("gemini-1.0-pro")
texto_reescrito = model_2.generate_content(pedido_reescrita)
print(texto_reescrito.text)

**Guia do Googlecar para Perebas**

Seu bagulho tem marcha automática, tá ligado? Pra trocar de marcha, é só jogar a alavanca pro lado que você quer.

**Estacionado:** Quando você tá parado feito um bobo, as rodas ficam presas e o carro não se mexe.

**Ré:** Essa é pra quando você tá no farol ou no trânsito e quer dar aquela rézinha do malandro. O carro fica parado, mas se você meter o pé na tábua, ele dispara.

**Neutro:** Pra quando você tá na neve ou numa ladeira escorregadia.
