<a href="https://colab.research.google.com/github/kleberquaresma/alura_imersao_ia_google/blob/main/Imers%C3%A3o_IA_Aula_05_Embeddings.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Instalando a biblioteca do Google para uso da IA Generativa (Gemini).

OBS.: *Para execução em um terminal local, fora do ambiente Colab, se faz necessário antes instalar o Python e certificar-se que o caminho da instalação dele está definido nas variáveis de ambiente do sistema operacional.*

In [1]:
!pip install -q -U google-generativeai

Importando os pacotes das bibliotecas necessárias à execução do código.

In [2]:
import pathlib
import textwrap
import pandas as pd
import numpy as np

import google.generativeai as genai

from IPython.display import display
from IPython.display import Markdown
# Used to securely store your API key
from google.colab import userdata


def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

Adicionando a chave da API que será utilizada para realização da integração com o ambiente do Gemini da Google:

Obs.: *Necessário antes inserir a chave da API, previamente criada através do Google AI Studio, no gerenciador de chaves do Colab. Caso contrário inserir a chave em substituição ao texto 'GOOGLE_API_KEY'.*

In [3]:
# Or use `os.getenv('GOOGLE_API_KEY')` to fetch an environment variable.
GOOGLE_API_KEY=userdata.get('GOOGLE_API_KEY')

genai.configure(api_key=GOOGLE_API_KEY)

Verificando os modelos de IA do Gemini que estão disponíveis para utilização:

In [5]:
for m in genai.list_models():
  if 'embedContent' in m.supported_generation_methods:
    print(m.name)

models/embedding-001
models/text-embedding-004


Definindo o modelo de IA generativa do Gemini que será utilizado e resgatando os "embeddings" de um determinado texto:

In [9]:
title = "A próxima geração de IA para desenvolvedores e Google Workspace"

sample_text = ("Título: A próxima geração de IA para desenvolvedores e Google Workspace"
    "\n"
    "Artigo completo: \n"
    "\n"
    "Gemini API e Google AI Studio: uma maneira acessível de explorar e criar protótipos com aplicações de IA generativa.")

embeddings = genai.embed_content(model="models/embedding-001",
                                 content=sample_text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")

print(embeddings)

{'embedding': [0.049552053, -0.037302706, -0.019613383, 0.020265033, 0.06336705, -0.007460382, -0.030662883, -0.013300226, 0.06828119, 0.06270782, 0.006289086, 0.0139875775, -0.04449172, -0.023383817, 0.007924714, -0.026433202, 0.019904057, -0.009529373, -0.03606881, -0.0034168428, 0.006420915, 0.006754872, -0.02978802, -0.06782452, -0.017691307, 0.020478556, 0.017061092, -0.036263194, -0.034057535, 0.028985927, -0.050695352, 0.054160632, -0.032833114, 0.008856182, -0.036866993, -0.04532041, -0.025988247, -0.044252716, -0.0037732222, -0.0038980742, 0.0069622607, -0.08682854, -0.009534392, 0.029157411, -0.0049065663, -0.018988743, 0.050256882, 0.041789245, 0.013041003, -0.062098876, 0.03020962, 0.022919264, 0.064464, -0.043563228, -0.005431844, -0.0060972907, 0.028257698, -0.03828342, 0.023603814, 0.0016510288, -0.0026826863, 0.02123616, -0.01818626, 0.05413083, 0.02214341, -0.052383967, -0.03824717, -0.0017207371, 0.011218084, 0.050387986, 0.0087485425, 0.013099966, 0.059136268, -0.064

Exemplos de documentos para uso com "embeddings":

In [10]:
DOCUMENT1 = {
    "Título": "Descritico sobre Inteligência Artifical",
    "Conteúdo": "A inteligência artificial (de sigla: IA; do inglês: artificial intelligence, de sigla: AI) é um campo de estudo multidisciplinar que abrange varias áreas do conhecimento.É também um conjunto de novas tecnologias que permitem aos aparelhos smart executarem várias funções avançadas de modo quase autônomo, representanto um marco histórico na computação moderna. Embora seu desenvolvimento tenha avançado mais na ciência da computação, sua abordagem interdisciplinar envolve contribuições de diversas disciplinas."
    }

DOCUMENT2 = {
    "Título": "Descritivo sobre Carros Voadores",
    "Conteúdo": "Carro voador, skycar, aerocarro, ou ainda, aerocar, é um tipo de veículo que pode funcionar tanto como um carro pessoal ou uma aeronave. Todos os modelos operáveis já produzidos necessitam de um processo manual ou automático de conversão entre os dois modos de operação. Há muita mistificação e especulação em torno do carro voador, muitos entusiastas consideram que ele é o futuro dos transportes individuais. Porém, existem muitos empecilhos para que essa previsão realmente se cumpra e é quase impossível que ele seja realidade no futuro como meio de transporte urbano"
    }

DOCUMENT3 = {
    "Título": "Descritivo sobre Computação Quantica",
    "Conteúdo": "A computação quântica é a ciência que estuda as aplicações das teorias e propriedades da mecânica quântica na Ciência da Computação. Dessa forma seu principal foco é o desenvolvimento do computador quântico. Na computação clássica o computador é baseado na arquitetura de Von Neumann que faz uma distinção clara entre elementos de processamento e armazenamento de dados, isto é, possui processador e memória destacados por um barramento de comunicação, sendo o seu processamento sequencial."
    }

documentos = [DOCUMENT1, DOCUMENT2, DOCUMENT3]

Utilizando o Pandas para exibir o conteúdo dos documentos em um DataFrame:

In [13]:
df = pd.DataFrame(documentos)
df

df.columns = ["Titulo", "Conteudo"]
df

Unnamed: 0,Titulo,Conteudo
0,Descritico sobre Inteligência Artifical,A inteligência artificial (de sigla: IA; do in...
1,Descritivo sobre Carros Voadores,"Carro voador, skycar, aerocarro, ou ainda, aer..."
2,Descritivo sobre Computação Quantica,A computação quântica é a ciência que estuda a...


In [16]:
modelo = "models/embedding-001"

def embed_fn(title, text):
    return genai.embed_content(model=modelo,
                                 content=text,
                                 title=title,
                                 task_type="RETRIEVAL_DOCUMENT")["embedding"] #inserindo no retorno da função uma nova coluna a ser inserida ao DataFrame com os dados do "embedding". Nome deve ser exatamente como descrito aqui.

In [17]:
# Adicionando efetivamente a nova coluna no DataFrame para cada linha dos documentos.
df["embeddings"] = df.apply(lambda row: embed_fn(row["Titulo"], row["Conteudo"]), axis=1)
df

Unnamed: 0,Titulo,Conteudo,embeddings
0,Descritico sobre Inteligência Artifical,A inteligência artificial (de sigla: IA; do in...,"[0.027466306, -0.043964677, -0.026205027, 0.03..."
1,Descritivo sobre Carros Voadores,"Carro voador, skycar, aerocarro, ou ainda, aer...","[-0.007459088, -0.04423881, -0.05833889, -0.00..."
2,Descritivo sobre Computação Quantica,A computação quântica é a ciência que estuda a...,"[0.006155892, -0.046263233, -0.006196822, 0.01..."


In [20]:
def gerar_e_buscar_consulta(consulta, base, model):
    embeddings_da_consulta = genai.embed_content(model="models/embedding-001",
                                 content=consulta,
                                 task_type="RETRIEVAL_QUERY")

    produtos_escalares = np.dot(np.stack(df["embeddings"]), embeddings_da_consulta["embedding"])

    indice = np.argmax(produtos_escalares)
    return df.iloc[indice]["Conteudo"]

In [31]:
consulta = "Me fale um pouco sobre computacao quantica"

resposta = gerar_e_buscar_consulta(consulta, df, modelo)

print(resposta)

A computação quântica é a ciência que estuda as aplicações das teorias e propriedades da mecânica quântica na Ciência da Computação. Dessa forma seu principal foco é o desenvolvimento do computador quântico. Na computação clássica o computador é baseado na arquitetura de Von Neumann que faz uma distinção clara entre elementos de processamento e armazenamento de dados, isto é, possui processador e memória destacados por um barramento de comunicação, sendo o seu processamento sequencial.


Criando diferentes resultados à partir da mistura dos modelos do Gemini (Embeddings + Gemini):

In [32]:
prompt = f"Reescreva a resposta anterior de uma forma mais criativa e informal, sem adicionar informações que não façam parte do texto e sem alterar o seu contexto{consulta}"

modelo2 = genai.GenerativeModel('gemini-pro')
resposta = modelo2.generate_content(prompt)
print(resposta.text)

Ah, a computação quântica! É como um truque de mágica da física, onde os computadores brincam com as leis de probabilidade para resolver problemas que deixam os computadores tradicionais de cabelo em pé.

Imagine um computador que não só pode lidar com 0s e 1s, mas também com uma mistura de ambos ao mesmo tempo. É como uma moeda que pode pousar em cara e coroa simultaneamente, o que permite que os computadores quânticos explorem todas as possibilidades de uma só vez.

Esses caras podem quebrar códigos de segurança mais rápido que um flash, projetar novos medicamentos em um piscar de olhos e até simular o universo de maneiras que fazem os físicos babarem. Mas não se preocupe, eles ainda são bebês no mundo da computação, então temos muito tempo para entender sua mágica maluca.
