# Aula 1 - Utilizando modelos de LLM

## Vídeo 1.2 - Obtendo uma resposta da LLM

In [None]:
!pip install litellm

Collecting litellm
  Downloading litellm-1.50.1-py3-none-any.whl.metadata (32 kB)
Collecting openai>=1.52.0 (from litellm)
  Downloading openai-1.52.0-py3-none-any.whl.metadata (24 kB)
Collecting python-dotenv>=0.2.0 (from litellm)
  Downloading python_dotenv-1.0.1-py3-none-any.whl.metadata (23 kB)
Collecting tiktoken>=0.7.0 (from litellm)
  Downloading tiktoken-0.8.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.6 kB)
Collecting httpx<1,>=0.23.0 (from openai>=1.52.0->litellm)
  Downloading httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting jiter<1,>=0.4.0 (from openai>=1.52.0->litellm)
  Downloading jiter-0.6.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (5.2 kB)
Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai>=1.52.0->litellm)
  Downloading httpcore-1.0.6-py3-none-any.whl.metadata (21 kB)
Collecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai>=1.52.0->litellm)
  Downloading h11-0.14.0-py3-none-any.whl.

In [None]:
from google.colab import userdata
GROQ_API_KEY = userdata.get('GROQ_API_KEY')

In [None]:
from litellm import completion

In [None]:
messages = [
    {"role": "system", "content": "Você é o Chat da Terra e do Universo e responde em português brasileiro perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra, além de informações sobre terremotos. "},
    {"role": "user", "content": "Qual a frequência dos máximos solares?"}
]

In [None]:
response = completion(
    model="groq/gemma2-9b-it",
    messages=messages,
    api_key=GROQ_API_KEY,
)

In [None]:
print(response.choices[0].message.content)

Olá! 🪐

Como Chat da Terra e do Universo, posso te ajudar com isso. 

Os máximos solares acontecem em ciclos que variam entre 9 e 11 anos. A frequência exata pode ser um pouco irregular, mas **em média, um máximo solar ocorre a cada 11 anos**.

Durante esses períodos, a atividade solar aumenta, com mais manchas solares, flares e ejeções de massa coronal.  

Preciso ressaltar que estes ciclos são complexos e ainda não compreendidos completamente!  😅

Qual outra pergunta você tem sobre o universo? 😊



In [None]:
response = completion(
    model="groq/llama3-groq-70b-8192-tool-use-preview",
    messages=messages,
    api_key=GROQ_API_KEY,
)

In [None]:
print(response.choices[0].message.content)

A frequência dos máximos solares, também conhecida como ciclo solar, é de aproximadamente 11 anos. Durante este período, a atividade solar, como manchas solares e erupções solares, aumenta e diminui em um padrão cíclico.


## Vídeo 1.3 - Construindo um chatbot

In [None]:
# Função para chamar a API com o histórico de mensagens
def call_groq_api(messages, model="groq/llama3-groq-70b-8192-tool-use-preview"):
    response = completion(
        model=model,
        messages=messages,
        api_key=GROQ_API_KEY,
    )
    return response.choices[0].message.content

In [None]:
# Função para iniciar o chat, mantendo o histórico
def chat():
    print("Iniciando chat com o modelo. Digite 'sair' para encerrar.")

    # Histórico de mensagens
    messages = [{"role": "system", "content": """
    Você é o Chat da Terra e do Universo e responde em português brasileiro
    perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra, além de informações sobre terremotos.
    """}]

    while True:
        user_message = input("Você: ")
        if user_message.lower() == "sair":
            print("Encerrando chat. Até a próxima!")
            break

        # Adicionar a mensagem do usuário ao histórico
        messages.append({"role": "user", "content": user_message})

        # Chamar a API com o histórico completo
        model_response = call_groq_api(messages)

        # Adicionar a resposta do modelo ao histórico
        messages.append({"role": "assistant", "content": model_response})

        # Exibir a resposta do assistente
        print(f"Assistente: {model_response}")

In [None]:
chat()

Iniciando chat com o modelo. Digite 'sair' para encerrar.
Você: Qual a previsão do tempo para São Paulo?
Assistente: A previsão do tempo para São Paulo é de céu nublado com possibilidade de chuvas isoladas ao longo do dia. A temperatura deve variar entre 18°C e 24°C.
Você: Sair
Encerrando chat. Até a próxima!


## Vídeo 1.4 - Pegando dados de uma API

https://openweathermap.org/price

In [None]:
import requests
import json

In [None]:
def previsao_do_tempo(city, country):
    WEATHER_API = userdata.get('WEATHER_API')
    url = f"http://api.openweathermap.org/data/2.5/weather?q={city},{country}&APPID={WEATHER_API}&lang=pt_br&units=metric"
    response = requests.get(url)
    data = response.json()

    return json.dumps(data)

In [None]:
previsao_do_tempo('Rio de Janeiro', 'BR')

'{"coord": {"lon": -43.2075, "lat": -22.9028}, "weather": [{"id": 803, "main": "Clouds", "description": "nublado", "icon": "04d"}], "base": "stations", "main": {"temp": 25.2, "feels_like": 25.86, "temp_min": 24.98, "temp_max": 26.12, "pressure": 1016, "humidity": 80, "sea_level": 1016, "grnd_level": 1017}, "visibility": 10000, "wind": {"speed": 3.6, "deg": 190}, "clouds": {"all": 75}, "dt": 1729536174, "sys": {"type": 1, "id": 8429, "country": "BR", "sunrise": 1729498493, "sunset": 1729544374}, "timezone": -10800, "id": 3451190, "name": "Rio de Janeiro", "cod": 200}'

# Aula 2 - Usando ferramentas

## Vídeo 2.1 - Criando um dicionário

In [None]:
tools = [
        {
            "type": "function",
            "function": {
                "name": "previsao_do_tempo",
                "description": "Retorna a previsão do tempo em uma cidade específica",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "city": {
                            "type": "string",
                            "description": "Nome da cidade",
                        },
                        "country": {
                            "type": "string",
                            "description": "Sigla do país",
                        },
                    },
                    "required": ["city", "country"],
                },
            }

        }
]

In [None]:
# Função para chamar a API com o histórico de mensagens
def call_groq_api(messages, model="groq/llama3-groq-70b-8192-tool-use-preview"):
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice="auto",
        api_key=GROQ_API_KEY,
    )
    resposta_texto = response.choices[0].message
    chamada_ferramentas = resposta_texto.tool_calls
    if chamada_ferramentas:
      available_functions = {
        "previsao_do_tempo": previsao_do_tempo,
      }
      for tool_call in chamada_ferramentas:
        function_name = tool_call.function.name
        function_to_call = available_functions[function_name]
        function_args = json.loads(tool_call.function.arguments)
        function_response = function_to_call(
            city=function_args.get("city"),
            country=function_args.get("country"),
        )
        return function_response

    else:
      return resposta_texto.content


In [None]:
chat()

Iniciando chat com o modelo. Digite 'sair' para encerrar.
Você: Qual a previsão do tempo para São Paulo?
Assistente: {"coord": {"lon": -46.6361, "lat": -23.5475}, "weather": [{"id": 803, "main": "Clouds", "description": "nublado", "icon": "04d"}], "base": "stations", "main": {"temp": 24.05, "feels_like": 24.5, "temp_min": 23.03, "temp_max": 24.94, "pressure": 1014, "humidity": 76, "sea_level": 1014, "grnd_level": 926}, "visibility": 10000, "wind": {"speed": 6.17, "deg": 170}, "clouds": {"all": 75}, "dt": 1729537054, "sys": {"type": 1, "id": 8394, "country": "BR", "sunrise": 1729499279, "sunset": 1729545233}, "timezone": -10800, "id": 3448439, "name": "S\u00e3o Paulo", "cod": 200}
Você: Devo levar um guarda chuva?
Assistente: Sim, é recomendável levar um guarda-chuva, pois a previsão do tempo indica que está nublado em São Paulo.
Você: Sair
Encerrando chat. Até a próxima!


## Vídeo 2.2 - Adicionando uma segunda API

In [None]:
def verificar_tempestade_solar():
    url = "https://services.swpc.noaa.gov/products/noaa-planetary-k-index.json"
    response = requests.get(url)
    if response.status_code == 200:
        data = response.json()
        latest_kp = float(data[-1][1])  # O último valor Kp
        if latest_kp >= 5:
            return f"Alerta de tempestade solar! Índice Kp atual: {latest_kp}"
        else:
            return f"Sem tempestade solar no momento. Índice Kp atual: {latest_kp}"
    else:
        return "Não foi possível obter informações sobre tempestades solares no momento."

In [None]:
verificar_tempestade_solar()

'Sem tempestade solar no momento. Índice Kp atual: 1.67'

In [None]:
tools = [
        {
            "type": "function",
            "function": {
                "name": "previsao_do_tempo",
                "description": "Retorna a previsão do tempo em uma cidade específica",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "city": {
                            "type": "string",
                            "description": "Nome da cidade",
                        },
                        "country": {
                            "type": "string",
                            "description": "Sigla do país",
                        },
                    },
                    "required": ["city", "country"],
                },
            }

        },

        {
        "type": "function",
        "function": {
            "name": "verificar_tempestade_solar",
            "description": "Verifica se há uma tempestade solar em andamento",
            "parameters": {
                "type": "object",
                "properties": {},
                "required": [],
            },
        }
    }



]

In [None]:
# Função para chamar a API com o histórico de mensagens
def call_groq_api(messages, model="groq/llama3-groq-70b-8192-tool-use-preview"):
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice="auto",
        api_key=GROQ_API_KEY,
    )
    resposta_texto = response.choices[0].message
    chamada_ferramentas = resposta_texto.tool_calls
    if chamada_ferramentas:
      available_functions = {
        "previsao_do_tempo": previsao_do_tempo,
        "verificar_tempestade_solar": verificar_tempestade_solar
      }
      for tool_call in chamada_ferramentas:
        function_name = tool_call.function.name
        function_to_call = available_functions[function_name]
        function_args = json.loads(tool_call.function.arguments)

        match function_name:
          case "previsao_do_tempo":

            function_response = function_to_call(
                city=function_args.get("city"),
                country=function_args.get("country"),
            )
          case "verificar_tempestade_solar":
            function_response = function_to_call()
        return function_response

    else:
      return resposta_texto.content

In [None]:
chat()

Iniciando chat com o modelo. Digite 'sair' para encerrar.
Você: Estamos tendo uma tempestade solar?
Assistente: Sem tempestade solar no momento. Índice Kp atual: 1.67
Você: Sair
Encerrando chat. Até a próxima!


## Vídeo 2.3 - Carregando dados com a Pandas

In [None]:
import pandas as pd

In [None]:
def extrair_sismos():
    # Fazer a requisição para obter o conteúdo da página
    url = 'https://earthquake.usgs.gov/earthquakes/feed/v1.0/summary/4.5_day.csv'

    df = pd.read_csv(url)

    # Retornar o DataFrame com os dados
    return df

In [None]:
extrair_sismos()

Unnamed: 0,time,latitude,longitude,depth,mag,magType,nst,gap,dmin,rms,...,updated,place,type,horizontalError,depthError,magError,magNst,status,locationSource,magSource
0,2024-10-21T16:02:44.673Z,-17.4094,-178.4698,530.519,4.5,mb,61,72,2.265,0.72,...,2024-10-21T16:24:53.040Z,"245 km ENE of Levuka, Fiji",earthquake,13.55,9.043,0.066,67,reviewed,us,us
1,2024-10-21T15:15:13.441Z,-1.1985,127.4176,10.0,4.6,mb,42,96,1.958,0.52,...,2024-10-21T15:40:07.040Z,"63 km S of Labuha, Indonesia",earthquake,7.47,1.914,0.1,30,reviewed,us,us
2,2024-10-21T14:11:32.834Z,42.7664,143.6458,117.705,4.6,mb,98,76,0.834,0.52,...,2024-10-21T16:48:45.004Z,"4 km S of Honchō, Japan",earthquake,8.04,1.493,0.046,140,reviewed,us,us
3,2024-10-21T08:35:08.646Z,-1.093,127.4696,10.0,5.0,mb,43,83,1.855,0.56,...,2024-10-21T08:53:33.040Z,"51 km S of Labuha, Indonesia",earthquake,5.88,1.755,0.097,34,reviewed,us,us
4,2024-10-21T08:24:06.089Z,-1.1634,127.3904,10.0,5.2,mb,68,77,1.922,0.5,...,2024-10-21T08:40:51.040Z,"60 km S of Labuha, Indonesia",earthquake,7.11,1.865,0.072,63,reviewed,us,us
5,2024-10-21T08:08:33.226Z,-1.1854,127.2924,10.0,4.9,mb,43,82,1.945,0.59,...,2024-10-21T08:30:52.040Z,"65 km SSW of Labuha, Indonesia",earthquake,6.74,1.886,0.087,41,reviewed,us,us
6,2024-10-21T06:32:35.642Z,-1.0991,127.4181,10.0,5.7,mb,72,78,1.859,0.67,...,2024-10-21T18:27:22.640Z,"52 km S of Labuha, Indonesia",earthquake,5.15,1.841,0.049,150,reviewed,us,us
7,2024-10-21T05:35:49.196Z,52.6667,172.4989,43.229,5.0,mb,114,110,3.794,0.58,...,2024-10-21T17:45:55.969Z,"50 km WSW of Attu Station, Alaska",earthquake,9.32,7.33,0.029,388,reviewed,us,us
8,2024-10-21T04:12:15.553Z,-1.1187,127.4283,10.0,5.2,mww,72,78,1.879,0.68,...,2024-10-21T04:31:53.040Z,"54 km S of Labuha, Indonesia",earthquake,6.8,1.859,0.083,14,reviewed,us,us
9,2024-10-21T04:10:22.686Z,-1.1127,127.4636,10.0,4.9,mb,39,106,1.874,1.09,...,2024-10-21T04:25:14.040Z,"53 km S of Labuha, Indonesia",earthquake,7.72,1.871,0.102,30,reviewed,us,us


In [None]:
tools = [
        {
            "type": "function",
            "function": {
                "name": "previsao_do_tempo",
                "description": "Retorna a previsão do tempo em uma cidade específica",
                "parameters": {
                    "type": "object",
                    "properties": {
                        "city": {
                            "type": "string",
                            "description": "Nome da cidade",
                        },
                        "country": {
                            "type": "string",
                            "description": "Sigla do país",
                        },
                    },
                    "required": ["city", "country"],
                },
            }

        },

      {
        "type": "function",
        "function": {
            "name": "verificar_tempestade_solar",
            "description": "Verifica se há uma tempestade solar em andamento",
            "parameters": {
                "type": "object",
                "properties": {},
                "required": [],
            },
        }
      },
      {
        "type": "function",
        "function": {
            "name": "extrair_sismos",
            "description": "Extrai dados de sismos da USGS",
            "parameters": {
                "type": "object",
                "properties": {},
                "required": [],
            },
        }
      }
]

In [None]:
# Função para chamar a API com o histórico de mensagens
def call_groq_api(messages, model="groq/llama3-groq-70b-8192-tool-use-preview"):
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice="auto",
        api_key=GROQ_API_KEY,
    )
    resposta_texto = response.choices[0].message
    chamada_ferramentas = resposta_texto.tool_calls
    if chamada_ferramentas:
      available_functions = {
        "previsao_do_tempo": previsao_do_tempo,
        "verificar_tempestade_solar": verificar_tempestade_solar,
        "extrair_sismos": extrair_sismos
      }
      for tool_call in chamada_ferramentas:
        function_name = tool_call.function.name
        function_to_call = available_functions[function_name]
        function_args = json.loads(tool_call.function.arguments)

        match function_name:
          case "previsao_do_tempo":

            function_response = function_to_call(
                city=function_args.get("city"),
                country=function_args.get("country"),
            )
          case "verificar_tempestade_solar":
            function_response = function_to_call()
          case "extrair_sismos":
            function_response = function_to_call()
        return function_response

    else:
      return resposta_texto.content

In [None]:
# Função para iniciar o chat, mantendo o histórico
def chat():
    print("Iniciando chat com o modelo. Digite 'sair' para encerrar.")

    # Histórico de mensagens
    messages = [{"role": "system", "content": """
    Você é o Chat da Terra e do Universo e responde em português brasileiro
    perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra, além de informações sobre terremotos.
    """}]

    while True:
        user_message = input("Você: ")
        if user_message.lower() == "sair":
            print("Encerrando chat. Até a próxima!")
            break

        # Adicionar a mensagem do usuário ao histórico
        messages.append({"role": "user", "content": user_message})

        # Chamar a API com o histórico completo
        model_response = call_groq_api(messages)

        # Exibir a resposta do assistente
        display(model_response)
        if isinstance(model_response, pd.DataFrame):
            print("O model_response é um DataFrame.")
            texto_corrido = ""
            for index, row in model_response.iterrows():
                texto_corrido += f"Evento {index + 1}: Magnitude {row['mag']}, Local {row['place']}, Tempo {row['time']}\n"

            model_response = texto_corrido


        # Adicionar a resposta do modelo ao histórico
        messages.append({"role": "assistant", "content": model_response})

In [None]:
chat()

Iniciando chat com o modelo. Digite 'sair' para encerrar.
Você: Tivemos muitos sismos recentemente?


Unnamed: 0,time,latitude,longitude,depth,mag,magType,nst,gap,dmin,rms,...,updated,place,type,horizontalError,depthError,magError,magNst,status,locationSource,magSource
0,2024-10-21T19:22:50.440Z,-1.1979,127.4281,10.0,4.5,mb,29,107,1.957,0.85,...,2024-10-21T19:49:37.040Z,"63 km S of Labuha, Indonesia",earthquake,7.91,1.921,0.121,20,reviewed,us,us
1,2024-10-21T16:02:44.673Z,-17.4094,-178.4698,530.519,4.5,mb,61,72,2.265,0.72,...,2024-10-21T16:24:53.040Z,"245 km ENE of Levuka, Fiji",earthquake,13.55,9.043,0.066,67,reviewed,us,us
2,2024-10-21T15:15:13.441Z,-1.1985,127.4176,10.0,4.6,mb,42,96,1.958,0.52,...,2024-10-21T15:40:07.040Z,"63 km S of Labuha, Indonesia",earthquake,7.47,1.914,0.1,30,reviewed,us,us
3,2024-10-21T14:11:32.834Z,42.7664,143.6458,117.705,4.6,mb,98,76,0.834,0.52,...,2024-10-21T16:48:45.004Z,"4 km S of Honchō, Japan",earthquake,8.04,1.493,0.046,140,reviewed,us,us
4,2024-10-21T08:35:08.646Z,-1.093,127.4696,10.0,5.0,mb,43,83,1.855,0.56,...,2024-10-21T08:53:33.040Z,"51 km S of Labuha, Indonesia",earthquake,5.88,1.755,0.097,34,reviewed,us,us
5,2024-10-21T08:24:06.089Z,-1.1634,127.3904,10.0,5.2,mb,68,77,1.922,0.5,...,2024-10-21T08:40:51.040Z,"60 km S of Labuha, Indonesia",earthquake,7.11,1.865,0.072,63,reviewed,us,us
6,2024-10-21T08:08:33.226Z,-1.1854,127.2924,10.0,4.9,mb,43,82,1.945,0.59,...,2024-10-21T08:30:52.040Z,"65 km SSW of Labuha, Indonesia",earthquake,6.74,1.886,0.087,41,reviewed,us,us
7,2024-10-21T06:32:35.642Z,-1.0991,127.4181,10.0,5.7,mb,72,78,1.859,0.67,...,2024-10-21T18:27:22.640Z,"52 km S of Labuha, Indonesia",earthquake,5.15,1.841,0.049,150,reviewed,us,us
8,2024-10-21T05:35:49.196Z,52.6667,172.4989,43.229,5.0,mb,114,110,3.794,0.58,...,2024-10-21T17:45:55.969Z,"50 km WSW of Attu Station, Alaska",earthquake,9.32,7.33,0.029,388,reviewed,us,us
9,2024-10-21T04:12:15.553Z,-1.1187,127.4283,10.0,5.2,mww,72,78,1.879,0.68,...,2024-10-21T04:31:53.040Z,"54 km S of Labuha, Indonesia",earthquake,6.8,1.859,0.083,14,reviewed,us,us


O model_response é um DataFrame.
Você: Qual desses tem a maior magnitude?


'O evento com a maior magnitude é o Evento 14, com magnitude 5.7, localizado 63 km NNW de Albardón, Argentina.'

Você: Sair
Encerrando chat. Até a próxima!


# Aula 3 - Adicionando uma base de conhecimento

## Vídeo 3.1 - Criando um index com o Pinecone

In [None]:
!pip install pinecone

Collecting pinecone
  Downloading pinecone-5.3.1-py3-none-any.whl.metadata (19 kB)
Collecting pinecone-plugin-inference<2.0.0,>=1.1.0 (from pinecone)
  Downloading pinecone_plugin_inference-1.1.0-py3-none-any.whl.metadata (2.2 kB)
Collecting pinecone-plugin-interface<0.0.8,>=0.0.7 (from pinecone)
  Downloading pinecone_plugin_interface-0.0.7-py3-none-any.whl.metadata (1.2 kB)
Downloading pinecone-5.3.1-py3-none-any.whl (419 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m419.8/419.8 kB[0m [31m13.4 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading pinecone_plugin_inference-1.1.0-py3-none-any.whl (85 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m85.4/85.4 kB[0m [31m6.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading pinecone_plugin_interface-0.0.7-py3-none-any.whl (6.2 kB)
Installing collected packages: pinecone-plugin-interface, pinecone-plugin-inference, pinecone
Successfully installed pinecone-5.3.1 pinecone-plugin-inference-1.1.0 pinecone-plugi

In [None]:
PINECONE_API = userdata.get('PINECONE_API')

In [None]:
from pinecone import Pinecone

pc = Pinecone(api_key=PINECONE_API)

In [None]:
data = [
    {
        "id": "occurrence1",
        "text": "Ouro presente em veios de quartzo em uma formação hidrotermal. Observa-se alta concentração de ouro em zonas de fraturas e falhas."
    },
    {
        "id": "occurrence2",
        "text": "Associação do ouro com sulfetos, especialmente pirita e arsenopirita, em ambiente de rochas metavulcânicas. Indica potencial para depósito orogênico de ouro."
    },
    {
        "id": "occurrence3",
        "text": "Ouro aluvial encontrado em depósitos de cascalho próximo a rios e córregos. Indica transporte e concentração secundária de ouro."
    },
    {
        "id": "occurrence4",
        "text": "Presença de ouro em formações de skarn associadas a intrusões ígneas graníticas. Indica formação relacionada a processos de metamorfismo de contato."
    },
    {
        "id": "occurrence5",
        "text": "Ouro disseminado em formações sedimentares de origem marinha, em conglomerados ricos em minerais pesados. Potencial para depósito do tipo placer ou paleoplacer."
    },
]

In [None]:
index = pc.Index("geologia")

In [None]:
embeddings = pc.inference.embed(
    "multilingual-e5-large",
    inputs=[d['text'] for d in data],
    parameters={
        "input_type": "passage"
    }
)

In [None]:
vectors = []
for d, e in zip(data, embeddings):
    vectors.append({
        "id": d['id'],
        "values": e['values'],
        "metadata": {'text': d['text']}
    })

index.upsert(
    vectors=vectors,
    namespace="ns1"
)

## Vídeo 3.2 - Perguntando sobre os dados

In [None]:
query = "o ouro ocorre em sedimentos de origem marinha?"

In [None]:
x = pc.inference.embed(
    model="multilingual-e5-large",
    inputs=[query],
    parameters={
        "input_type": "query"
    }
)

In [None]:
results = index.query(
    namespace="ns1",
    vector=x[0].values,
    top_k=3,
    include_values=False,
    include_metadata=True
)

In [None]:
results

{'matches': [{'id': 'occurrence5',
              'metadata': {'text': 'Ouro disseminado em formações sedimentares '
                                   'de origem marinha, em conglomerados ricos '
                                   'em minerais pesados. Potencial para '
                                   'depósito do tipo placer ou paleoplacer.'},
              'score': 0.901498914,
              'values': []},
             {'id': 'occurrence1',
              'metadata': {'text': 'Ouro presente em veios de quartzo em uma '
                                   'formação hidrotermal. Observa-se alta '
                                   'concentração de ouro em zonas de fraturas '
                                   'e falhas.'},
              'score': 0.869495034,
              'values': []},
             {'id': 'occurrence3',
              'metadata': {'text': 'Ouro aluvial encontrado em depósitos de '
                                   'cascalho próximo a rios e córregos. Indica '
        

## Vídeo 3.3 - Carregando um livro

In [None]:
!pip install pypdf

In [None]:
import pypdf

In [None]:
# Função para dividir o texto em chunks
def chunk_text(text, chunk_size=500):
    # Divide o texto em partes menores
    return [text[i:i+chunk_size] for i in range(0, len(text), chunk_size)]

In [None]:
# Abrir e ler o arquivo PDF
with open("livro.pdf", "rb") as file:
    reader = pypdf.PdfReader(file)
    text = ""

    # Itera por todas as páginas do PDF
    for page_num in range(len(reader.pages)):
        page = reader.pages[page_num]
        text += page.extract_text()  # Extrai o texto de cada página

In [None]:
# Dividir o texto em chunks de 500 caracteres
chunks = chunk_text(text)

In [None]:
chunks[1412]

In [None]:
# Formatar os chunks no formato desejado
data = []
for i, chunk in enumerate(chunks[:90], start=1):
    data.append({
        "id": f"chunk{i}",
        "text": chunk.strip()  # Remove espaços em branco desnecessários
    })

# Exibindo os primeiros 5 chunks como exemplo
for chunk in data[:5]:
    print(chunk)

In [None]:
embeddings = pc.inference.embed(
    "multilingual-e5-large",
    inputs=[d['text'] for d in data],
    parameters={
        "input_type": "passage"
    }
)

In [None]:
vectors = []
for d, e in zip(data, embeddings):
    vectors.append({
        "id": d['id'],
        "values": e['values'],
        "metadata": {'text': d['text']}
    })

index.upsert(
    vectors=vectors,
    namespace="ns1"
)