# NLP: explorando LLM para aplicações de chatbot

## 01. Utilizando modelos de LLM

### Obtendo uma resposta da LLM

In [1]:
from dotenv import load_dotenv
from litellm import completion
from os import getenv

load_dotenv()

GROQ_API_KEY = getenv('GROQ_API_KEY')

In [2]:
messages = [
    {
        'role': 'system',
        'content': """
        Você é o Chat da Terra e do Universo e responde em português brasileiro
        perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
        além de informações sobre terremotos.
        """,
    },
    {
        'role': 'user',
        'content': 'Qual a frequência dos máximos solares?',
    },
]

In [3]:
response = completion(
    model='groq/gemma2-9b-it',
    messages=messages,
    api_key=GROQ_API_KEY,
)

In [4]:
print(response.choices[0].message.content)

Olá! 🪐 🌏 💨 🌎 

Sou o Chat da Terra e do Universo! 😄  

A frequência dos máximos solares é de aproximadamente **11 anos**. Cada ciclo solar começa com um mínimo solar, onde as manchas solares são escassas, e aumenta até um máximo solar, com alta atividade solar, como erupções e flares. ☀️💥 

Entretanto, cada ciclo solar tem duração e intensidade diferentes. Um ciclo pode durar de 9 a 14 anos, e a atividade solar durante o máximo solar também varia. 

Gostaria de saber mais sobre o ciclo solar atual ou sobre alguma outra atividade solar? 🌌





In [5]:
response = completion(
    model='groq/llama-3.3-70b-versatile',
    messages=messages,
    api_key=GROQ_API_KEY,
)

In [6]:
print(response.choices[0].message.content)

Uma pergunta interessante sobre o nosso Sol!

A frequência dos máximos solares é um tema importante na astronomia e na previsão do tempo espacial. Os máximos solares ocorrem aproximadamente a cada 11 anos, em um ciclo conhecido como Ciclo de Schwabe ou Ciclo Solar.

Durante esse ciclo, a atividade solar, incluindo a quantidade de manchas solares, erupções solares e radiação ultravioleta, aumenta e diminui em uma curva sinusoidal. O pico da atividade solar é chamado de máximo solar, enquanto o mínimo é chamado de mínimo solar.

No máximo solar, o Sol é mais ativo, com mais manchas solares, erupções solares e tempestades geomagnéticas. Isso pode afetar a Terra de várias maneiras, incluindo:

* Interrupções nas comunicações por rádio e em satélites
* Aumento no risco de tempestades geomagnéticas que podem afetar a rede elétrica
* Aumento na radiação cósmica que pode afetar a segurança dos astronautas e dos passageiros em voos de longa distância

Já no mínimo solar, a atividade solar é mai

### Para saber mais: conhecendo a LiteLLM

LiteLLM é uma biblioteca open-source projetada para facilitar a integração e o uso de grandes modelos de linguagem (LLMs) em diversas aplicações de software. Aproveitando a arquitetura avançada de transformers, LiteLLM aprimora as capacidades de processamento de linguagem natural (NLP), permitindo que desenvolvedores construam aplicações que utilizem mútiplos provedores de LLMs, realizem reconhecimento de imagens e automatizem interações com sistemas externos. A biblioteca destaca-se por sua API unificada, que simplifica o gerenciamento de mais de 100 provedores de LLMs, otimizando assim custos e desempenho para organizações que buscam soluções eficazes de IA.

Nesta página você pode consultar as diferentes LLMs que a [LiteLLM permite o uso](https://docs.litellm.ai/docs/providers). Além disso, você também pode verificar o uso de ferramentas como modelos de geração de imagens, texto para voz e voz para texto em [Embedding Models](https://docs.litellm.ai/docs/embedding/supported_embedding). Observe que diversos desses serviços dependem de uma API paga, porém também temos a possibilidade de usar modelos abertos como o Llama e Gemma que mostramos no curso.

As funcionalidades do LiteLLM incluem tratamento robusto de erros, capacidades de registro (logging) e um design modular que facilita prototipagem rápida e personalização. Essas características a tornam particularmente adequada para aplicações em atendimento ao cliente, análise de dados e saúde, onde repostas eficientes e precisas são essenciais. A biblioteca também oferece recursos de gestão em nível empresarial, permitindo que as organizações controlem o acesso, autenticação e monitoramento do uso de LLMs, o que é vital para implementações em grande escala.

A comunidade ativa ao redor do LiteLLM contribui para sua melhoria contínua e adaptabilidade no cenário dinâmico da IA, garantindo que atenda às diversas necessidades de desenvolvedores e pesquisadores. Com o avanço das tecnologias de LLM, o LiteLLM está posicionado para continuar sendo um recurso valioso na criação de aplicações sofisticadas impulsionadas por IA em diversos domínios.

### Construindo um chatbot

In [7]:
def call_groq_api(
    messages: list[dict[str, str]],
    model: str = 'groq/llama-3.3-70b-versatile'
) -> str:
    response = completion(
        model=model,
        messages=messages,
        api_key=GROQ_API_KEY,
    )
    return response.choices[0].message.content

In [8]:
def chat():
    print('Iniciando chat com o modelo. Digite `sair` para encerrar')
    messages = [
        {
            'role': 'system',
            'content': """
            Você é o Chat da Terra e do Universo e responde em português brasileiro
            perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
            além de informações sobre terremotos.
            """,
        }
    ]

    while True:
        user_message = input('Você: ')
        if user_message.lower() == 'sair':
            break

        messages.append({'role': 'user', 'content': user_message})
        model_response = call_groq_api(messages)
        messages.append({'role': 'assistant', 'content': model_response})
        print(f"Assistente: {model_response}")

In [9]:
# chat()

### Pegando dados de uma API

In [10]:
import requests
import json

In [11]:
def previsao_do_tempo(city: str, country: str):
    OPEN_WEATHER_API_KEY = getenv('OPEN_WEATHER_API_KEY')
    url = f"http://api.openweathermap.org/data/2.5/weather?q={city},{country}&APPID={OPEN_WEATHER_API_KEY}&lang=pt_br&units=metric"
    response = requests.get(url)
    data = response.json()
    return json.dumps(data, indent=2, ensure_ascii=False)

In [12]:
previsao_do_tempo('Curitiba', 'BR')

'{\n  "coord": {\n    "lon": -49.2908,\n    "lat": -25.504\n  },\n  "weather": [\n    {\n      "id": 500,\n      "main": "Rain",\n      "description": "chuva leve",\n      "icon": "10d"\n    }\n  ],\n  "base": "stations",\n  "main": {\n    "temp": 21.47,\n    "feels_like": 21.5,\n    "temp_min": 19.61,\n    "temp_max": 21.47,\n    "pressure": 1018,\n    "humidity": 70,\n    "sea_level": 1018,\n    "grnd_level": 916\n  },\n  "visibility": 10000,\n  "wind": {\n    "speed": 1.34,\n    "deg": 93,\n    "gust": 2.24\n  },\n  "rain": {\n    "1h": 0.86\n  },\n  "clouds": {\n    "all": 29\n  },\n  "dt": 1747684284,\n  "sys": {\n    "type": 2,\n    "id": 2094306,\n    "country": "BR",\n    "sunrise": 1747648167,\n    "sunset": 1747687087\n  },\n  "timezone": -10800,\n  "id": 6322752,\n  "name": "Curitiba",\n  "cod": 200\n}'

## 02. Usando ferramentas

### Criando um dicionário

In [13]:
tools = [
    {
        'type': 'function',
        'function': {
            'name': 'previsao_do_tempo',
            'description': 'Retorna a previsão do tempo em uma cidade e país',
            'parameters': {
                'type': 'object',
                'properties': {
                    'city': {
                        'type': 'string',
                        'description':  'Nome da cidade',
                    },
                    'country': {
                        'type': 'string',
                        'description': 'Sigla do país',
                    }
                },
                'required': ['city', 'country'],
            }
        }
    }
]

In [14]:
def call_groq_api(
    messages: list[dict[str, str]],
    model: str = 'groq/llama-3.3-70b-versatile'
) -> str:
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice='auto',
        api_key=GROQ_API_KEY,
    )
    text_response = response.choices[0].message
    tool_calls = text_response.tool_calls

    if tool_calls:
        available_functions = {
            'previsao_do_tempo': previsao_do_tempo
        }
        for tool_call in tool_calls:
            function_name = tool_call.function.name
            function_to_call = available_functions[function_name]
            function_args = json.loads(tool_call.function.arguments)

            function_response = function_to_call(
                city=function_args.get('city'),
                country=function_args.get('country')
            )
            return function_response
    else:
        return text_response.content

In [15]:
# chat()

### Adicionando uma segunda API

In [16]:
def verificar_tempestade_solar():
    url = 'https://services.swpc.noaa.gov/products/noaa-planetary-k-index.json'
    response = requests.get(url)
    if response.status_code == 200:
        data = response.json()
        latest_kp = float(data[-1][1])
        if latest_kp >= 5:
            return f"Alerta de tempestade soler! Índice Kp atual: {latest_kp}"
        else:
            return f"Sem alertas de tempestade solar. Índice Kp atual: {latest_kp}"
    else:
        return "Erro ao buscar dados do NOAA"

In [17]:
tools = [
    {
        'type': 'function',
        'function': {
            'name': 'previsao_do_tempo',
            'description': 'Retorna a previsão do tempo em uma cidade e país',
            'parameters': {
                'type': 'object',
                'properties': {
                    'city': {
                        'type': 'string',
                        'description':  'Nome da cidade',
                    },
                    'country': {
                        'type': 'string',
                        'description': 'Sigla do país',
                    }
                },
                'required': ['city', 'country'],
            }
        }
    },
    {
        'type': 'function',
        'function': {
            'name': 'verificar_tempestade_solar',
            'description': 'Verifica se há alertas de tempestade solar',
        },
        'parameters': {
            'type': 'object',
            'properties': {},
            'required': [],
        }
    }
]

In [18]:
def call_groq_api(
    messages: list[dict[str, str]],
    model: str = 'groq/llama-3.3-70b-versatile'
) -> str:
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice='auto',
        api_key=GROQ_API_KEY,
    )
    text_response = response.choices[0].message
    tool_calls = text_response.tool_calls

    if tool_calls:
        available_functions = {
            'previsao_do_tempo': previsao_do_tempo,
            'verificar_tempestade_solar': verificar_tempestade_solar,
        }
        for tool_call in tool_calls:
            function_name = tool_call.function.name
            function_to_call = available_functions[function_name]
            function_args = json.loads(tool_call.function.arguments)

            match function_name:
                case 'previsao_do_tempo':
                    function_response = function_to_call(
                        city=function_args.get('city'),
                        country=function_args.get('country')
                    )
                case 'verificar_tempestade_solar':
                    function_response = function_to_call()

            return function_response
    else:
        return text_response.content

In [19]:
# chat()

### Para saber mais: chamada de ferramentas e chamada de múltiplas LLMs

A chamada de ferramentas permite que LLMs interajam com sistemas e funções externas parar elaborar respostas mais completas e precisas. Isso significa que o modelo escolhido não se limita à sua base de conhecimento: ele pode executar ações práticas para aprimorar suas respostas. Por exemplo, se uma LLM tiver dificuldade em resolver um problema matemático complexo, ela pode "chamar" uma função específica para realizar o cálculo, retornando o resultado correto. Esse processo aumenta a versatilidade do modelo, que pode executar tarefas diversas usando recursos externos.

Com a biblioteca litellm, é fácil verificar se um modelo permite o uso de chamadas de função. Basta executar o comando:
```python
assert litellm.supports_function_calling(model="gpt-3.5-turbo")
```

Esse comando confirma se o modelo em questão oferece suporte para chamadas de função, o que abre a possibilidade de criar fluxos de trabalho interativos. A litellm também permite o uso de uma função única ou de múltiplas funções em paralelo, tornando a integração ainda mais flexível. Isso é especialmente útil em aplicações complexas, onde o modelo precisa coordenar várias operações ao mesmo tempo para oferecer uma resposta completa.

Outra funcionalidade bastante útil é o `Batching Completion()`. A litellm oferece uma funcionalidade poderosa para comparar respostas de diferentes modelos de LLM ao mesmo tempo, o que é extremamente útil para avaliar a qualidade e a precisão das respostas em diversas situações. Ao usar a função `batch_completion_models`, podemos enviar a mesma mensagem a vários modelos simultaneamente e receber as respostas lado a lado. Isso permite que se avalie rapidamente qual modelo oferece a resposta mais adequada para cada caso específico.

Por exemplo, ao configurar as chaves de API dos provedores desejados (Anthropic, OpenAI e Cohere, neste caso), conseguimos fazer uma chamada que compara as respostas dos modelos `gtp-3.5-turbo`, `claude-instant-1.2` e `command-nightly`:
```python
import litellm
import os
from litellm import batch_completion_models

GROQ_API_KEY = os.getenv('GROQ_API_KEY')

response = batch_completion_models(
    models=['groq/gemma2-9b-it', 'groq/llama3-groq-70b-8192-tool-use-preview'],
    messages=[{'role': 'user', 'content': 'Hey, how is it going?'}]
)

print(response)
```

A função `batch_completion_models` envia o mesmo prompt para todos os modelos listados e retorna uma resposta para cada um deles. Isso facilita a comparação de respostas, permitindo identificar rapidamente qual modelo entende melhor a tarefa, se comunica de maneira mais clara ou oferece informações mais precisas. Essa abordagem é ideal para equipes de desenvolvimento que precisam decidir qual modelo é mais adequedo para uma aplicação específica ou para usuários que desejam obter respostas diversificadas sobre o mesmo tema.

### Carregando dados com a Pandas

In [20]:
import pandas as pd

In [21]:
def extrair_sismos():
    url = 'https://earthquake.usgs.gov/earthquakes/feed/v1.0/summary/4.5_day.csv'
    df = pd.read_csv(url)
    return df

In [22]:
extrair_sismos()

Unnamed: 0,time,latitude,longitude,depth,mag,magType,nst,gap,dmin,rms,...,updated,place,type,horizontalError,depthError,magError,magNst,status,locationSource,magSource
0,2025-05-19T18:03:13.392Z,41.8231,88.1839,10.0,4.8,mb,60,107,6.114,0.48,...,2025-05-19T18:19:50.040Z,"142 km E of Sishilichengzi, China",earthquake,9.19,1.891,0.067,68,reviewed,us,us
1,2025-05-19T16:20:16.828Z,8.8077,126.6228,57.336,4.5,mb,52,83,2.013,0.57,...,2025-05-19T19:08:15.040Z,"35 km ESE of Aras-asan, Philippines",earthquake,6.08,6.378,0.086,40,reviewed,us,us
2,2025-05-19T15:24:11.695Z,-24.6147,-174.9693,10.0,5.1,mb,31,139,9.437,1.02,...,2025-05-19T17:17:58.574Z,south of Tonga,earthquake,13.9,1.874,0.075,58,reviewed,us,us
3,2025-05-19T14:01:20.769Z,-7.1508,-13.0616,10.0,5.0,mb,51,60,1.503,0.76,...,2025-05-19T14:27:19.040Z,"172 km ENE of Georgetown, Saint Helena",earthquake,10.25,1.84,0.074,58,reviewed,us,us
4,2025-05-19T11:17:08.077Z,-18.0225,-69.9229,116.579,4.6,mb,51,82,0.528,0.58,...,2025-05-19T12:55:24.040Z,"27 km S of Palca, Peru",earthquake,7.39,4.907,0.084,42,reviewed,us,us
5,2025-05-19T11:17:01.917Z,-35.7303,-102.9849,10.0,5.4,mww,102,68,24.498,0.83,...,2025-05-19T13:51:42.178Z,southeast of Easter Island,earthquake,13.39,1.8,0.083,14,reviewed,us,us
6,2025-05-19T08:04:21.704Z,1.1557,97.1522,20.703,4.7,mb,41,199,2.338,0.89,...,2025-05-19T08:32:40.040Z,"53 km WSW of Gunungsitoli, Indonesia",earthquake,9.35,6.788,0.09,37,reviewed,us,us
7,2025-05-19T05:59:30.546Z,1.0269,97.1362,16.942,4.7,mb,33,192,2.436,0.58,...,2025-05-19T06:53:30.040Z,"60 km WSW of Gunungsitoli, Indonesia",earthquake,11.0,6.476,0.104,28,reviewed,us,us
8,2025-05-19T05:48:31.702Z,-30.1691,-177.2789,10.0,5.3,mww,62,61,1.081,1.35,...,2025-05-19T12:31:03.040Z,"Kermadec Islands, New Zealand",earthquake,8.55,1.791,0.073,18,reviewed,us,us
9,2025-05-19T03:41:29.227Z,7.467,125.7568,62.974,4.9,mb,56,93,0.432,0.73,...,2025-05-19T09:33:49.801Z,"1 km SSE of Pagsabangan, Philippines",earthquake,8.61,6.207,0.079,50,reviewed,us,us


In [23]:
tools = [
    {
        'type': 'function',
        'function': {
            'name': 'previsao_do_tempo',
            'description': """
            Utilize esta ferramenta apenas quando
            o usuário pedir explícitamente
            que quer a previsão do tempo para
            uma cidade específica
            """,
            'parameters': {
                'type': 'object',
                'properties': {
                    'city': {
                        'type': 'string',
                        'description':  'Nome da cidade',
                    },
                    'country': {
                        'type': 'string',
                        'description': 'Sigla do país',
                    },
                },
                'required': ['city', 'country'],
            },
        }
    },
    {
        'type': 'function',
        'function': {
            'name': 'verificar_tempestade_solar',
            'description': """
            Utilize esta ferramenta apenas quando
            o usuário pedir explícitamente que
            deseja saber sobre tempestades solares
            """,
            'parameters': {
                'type': 'object',
                'properties': {},
                'required': [],
            },
        }
    },
    {
        'type': 'function',
        'function': {
            'name': 'extrair_sismos',
            'description': """
            Utilize esta ferramenta apenas quando
            o usuário pedir explícitamente que
            deseja saber sobre sismos
            """,
            'parameters': {
                'type': 'object',
                'properties': {},
                'required': [],
            },
        }
    }
]

In [24]:
def call_groq_api(
    messages: list[dict[str, str]],
    model: str = 'groq/llama-3.3-70b-versatile'
) -> str:
    global tools
    response = completion(
        model=model,
        messages=messages,
        tools=tools,
        tool_choice='auto',
        api_key=GROQ_API_KEY,
    )
    text_response = response.choices[0].message
    tool_calls = text_response.tool_calls
    if tool_calls:
        available_functions = {
            'previsao_do_tempo': previsao_do_tempo,
            'verificar_tempestade_solar': verificar_tempestade_solar,
            'extrair_sismos': extrair_sismos,
        }
        for tool_call in tool_calls:
            function_name = tool_call.function.name
            function_to_call = available_functions[function_name]
            function_args = json.loads(tool_call.function.arguments)

            match function_name:
                case 'previsao_do_tempo':
                    function_response = function_to_call(
                        city=function_args.get('city'),
                        country=function_args.get('country')
                    )
                case 'verificar_tempestade_solar':
                    function_response = function_to_call()
                case 'extrair_sismos':
                    function_response = function_to_call()
            return function_response
    else:
        return text_response.content

In [25]:
def chat():
    print('Iniciando chat com o modelo. Digite `sair` para encerrar')
    messages = [
        {
            'role': 'system',
            'content': """
            Você é o Chat da Terra e do Universo e responde em português brasileiro
            perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
            além de informações sobre terremotos.
            """,
        }
    ]

    while True:
        user_message = input('Você: ')
        if user_message.lower() == 'sair':
            print('Encerrando o chat. Até a próxima!')
            break

        messages.append({'role': 'user', 'content': user_message})
        model_response = call_groq_api(messages)

        display(model_response)
        if isinstance(model_response, pd.DataFrame):
            print('O model_response é um DataFrame.')
            texto_corrido = ''
            for idx, row in model_response.iterrows():
                texto_corrido += f"Evento {idx + 1}: Magnitude: {row['mag']}, Local: {row['place']}, Tempo: {row['time']}\n"

            model_response = texto_corrido

        messages.append({'role': 'assistant', 'content': model_response})

In [26]:
# chat()

## 03. Adicionando uma base de conhecimento

### Criando um index com o Pinecone

In [27]:
PINECONE_API_KEY = getenv('PINECONE_API_KEY')

In [28]:
from pinecone import Pinecone

pc = Pinecone(api_key=PINECONE_API_KEY)

  from tqdm.autonotebook import tqdm


In [29]:
data = [
    {
        "id": "occurrence1",
        "text": "Ouro presente em veios de quartzo em uma formação hidrotermal. Observa-se alta concentração de ouro em zonas de fraturas e falhas."
    },
    {
        "id": "occurrence2",
        "text": "Associação do ouro com sulfetos, especialmente pirita e arsenopirita, em ambiente de rochas metavulcânicas. Indica potencial para depósito orogênico de ouro."
    },
    {
        "id": "occurrence3",
        "text": "Ouro aluvial encontrado em depósitos de cascalho próximo a rios e córregos. Indica transporte e concentração secundária de ouro."
    },
    {
        "id": "occurrence4",
        "text": "Presença de ouro em formações de skarn associadas a intrusões ígneas graníticas. Indica formação relacionada a processos de metamorfismo de contato."
    },
    {
        "id": "occurrence5",
        "text": "Ouro disseminado em formações sedimentares de origem marinha, em conglomerados ricos em minerais pesados. Potencial para depósito do tipo placer ou paleoplacer."
    },
]

In [30]:
index = pc.Index('geologia')

In [31]:
embeddings = pc.inference.embed(
    'multilingual-e5-large',
    inputs=[d['text'] for d in data],
    parameters={'input_type': 'passage'}
)

In [32]:
vectors = []
for d, e in zip(data, embeddings):
    vectors.append({
        'id': d['id'],
        'values': e['values'],
        'metadata': {'text': d['text']}
    })

In [33]:
vectors[0]

{'id': 'occurrence1',
 'values': [0.01340484619140625,
  0.007171630859375,
  -0.03558349609375,
  -0.060943603515625,
  0.017730712890625,
  -0.040283203125,
  -0.03375244140625,
  0.11639404296875,
  0.04986572265625,
  -0.0144805908203125,
  0.055389404296875,
  0.018341064453125,
  -0.02496337890625,
  0.0059661865234375,
  -0.0005908012390136719,
  -0.00984954833984375,
  -0.0242462158203125,
  0.03631591796875,
  0.00708770751953125,
  0.0012540817260742188,
  0.034912109375,
  0.007495880126953125,
  -0.042144775390625,
  -0.04339599609375,
  -0.039794921875,
  -0.01369476318359375,
  -0.05267333984375,
  -0.0181427001953125,
  -0.0277862548828125,
  -0.02227783203125,
  -0.00814056396484375,
  0.023651123046875,
  -0.04278564453125,
  -0.037506103515625,
  -0.032470703125,
  0.04693603515625,
  0.07269287109375,
  0.046844482421875,
  -0.035614013671875,
  0.05657958984375,
  -0.0325927734375,
  0.051727294921875,
  -0.0167694091796875,
  0.0012359619140625,
  0.011306762695312

In [34]:
index.upsert(vectors=vectors, namespace='ns1')

{'upserted_count': 5}

### Perguntando sobre os dados

In [35]:
query = 'O ouro ocorre em sedimentos de origem marinha?'

In [36]:
x = pc.inference.embed(
    model='multilingual-e5-large',
    inputs=[query],
    parameters={'input_type': 'query'}
)

In [37]:
results = index.query(
    namespace='ns1',
    top_k=3,
    include_values=False,
    include_metadata=True,
    vector=x[0].values
)

In [38]:
results

{'matches': [{'id': 'occurrence5',
              'metadata': {'text': 'Ouro disseminado em formações sedimentares '
                                   'de origem marinha, em conglomerados ricos '
                                   'em minerais pesados. Potencial para '
                                   'depósito do tipo placer ou paleoplacer.'},
              'score': 0.890062749,
              'values': []},
             {'id': 'occurrence1',
              'metadata': {'text': 'Ouro presente em veios de quartzo em uma '
                                   'formação hidrotermal. Observa-se alta '
                                   'concentração de ouro em zonas de fraturas '
                                   'e falhas.'},
              'score': 0.85518384,
              'values': []},
             {'id': 'occurrence3',
              'metadata': {'text': 'Ouro aluvial encontrado em depósitos de '
                                   'cascalho próximo a rios e córregos. Indica '
         

### Para saber mais: o que é um Embedding?

Na ciência de dados e no processamento de linguagem natural (NLP), um embedding é uma técnica usada para converter textos em representações numéricas que podem ser processadas por algoritmos de machine learning e deep learning. Essas representações numéricas são vetores em espaços de alta dimensão que capturam características semânticas do texto. Em outras palavras, embeddings permitem que modelos compreendam similaridades e diferenças entre palavras ou sentenças, ajudando a identificar o contexto e o significado subjacentes em textos.

Esses embeddings são amplamente utilizados em tarefas de classificação de texto, análise de sentimentos, tradução automática, entre outras aplicações em NLP. No contexto do curso, os embeddings foram o que tornaram possível a busca por textos semelhantes na base de dados.

Como criar embeddings parar uma lista de textos usando a SpaCy?

Considerando a lista de informações sobre ouro apresentada nos vídeos, vamos ver como criar os embeddings dela. Cada texto será convertido em um vetor de características usando a biblioteca SpaCy, que é particularmente eficiente para essa tarefa por já conter modelos pré-treinados para gerar embeddings de alta qualidade.

```python
import spacy

# Carregar o modelo em português
nlp = spacy.load("pt_core_news_md")

# Lista de textos
data = [
    {
        "id": "occurrence1",
        "text": "Ouro presente em veios de quartzo em uma formação hidrotermal. Observa-se alta concentração de ouro em zonas de fraturas e falhas."
    },
    {
        "id": "occurrence2",
        "text": "Associação do ouro com sulfetos, especialmente pirita e arsenopirita, em ambiente de rochas metavulcânicas. Indica potencial para depósito orogênico de ouro."
    },
    {
        "id": "occurrence3",
        "text": "Ouro aluvial encontrado em depósitos de cascalho próximo a rios e córregos. Indica transporte e concentração secundária de ouro."
    },
    {
        "id": "occurrence4",
        "text": "Presença de ouro em formações de skarn associadas a intrusões ígneas graníticas. Indica formação relacionada a processos de metamorfismo de contato."
    },
    {
        "id": "occurrence5",
        "text": "Ouro disseminado em formações sedimentares de origem marinha, em conglomerados ricos em minerais pesados. Potencial para depósito do tipo placer ou paleoplacer."
    },
]

# Criar embeddings para cada ocorrência
embeddings = []
for occurrence in data:
    doc = nlp(occurrence["text"])
    embeddings.append({"id": occurrence["id"], "embedding": doc.vector})

# Resultados
for emb in embeddings:
    print(f"ID: {emb['id']}, Embedding: {emb['embedding'][:5]}...")  # Mostrando uma parte do embedding para simplificação
```

Neste código, cada texto é passado pelo modelo pt_core_news_md do spaCy, que gera o vetor embedding (doc.vector). Esse vetor representa o conteúdo semântico do texto e pode ser usado para diversas análises. como encontrar similaridades entre os textos.

### Carregando um livro

In [39]:
import pypdf

In [40]:
def chunk_text(text, chunk_size=500):
    return [text[i:i + chunk_size] for i in range(0, len(text), chunk_size)]

In [41]:
with open('livro.pdf', 'rb') as file:
    reader = pypdf.PdfReader(file)
    text = ''

    for page_num in range(len(reader.pages)):
        page = reader.pages[page_num]
        text += page.extract_text()

In [42]:
chunks = chunk_text(text)

In [43]:
chunks[1401]

'athered rocks for en-\ngineering purposes. Quart. J. Engin. Geology, v. 28, p. 207-242. \nYardley B.W.D. 2004. Introdução à Petrologia Metamórfica. 2ª ed. Brasí lia: UnB. 434 p.  \nYardley B.W.D., Mackenzie W.S., Guilford C. 1990. Atlas of metamorphic rocks and their textures. London: Longman \nScient. and Technical. 120 p. \nZirkel F. 1866. Lehrbuch der Petrographie. Marcus, Bonn, vol. 1, 607 p.; vol. 2, 675 p.   \nRetornar ao Sumário '

In [44]:
data = []
for idx, chunk in enumerate(chunks[:90], start=1):
    data.append({
        'id': f"{chunk[idx]}",
        'text': chunk.strip()
    })


print(data[0])

{'id': 'n', 'text': 'Universidade de São Paulo \nInstituto de Geociências \nGeologia básica para engenheiros \nHorstpeter H. G. J. Ulbrich \nJose  B. de Madureira Filho \nEliane A. Del Lama \nLauro K. Dehira \nISBN:  978-65-86403-05-3 \nDOI:10.11606/9786586403053 \nSa o Paulo \n2023 Esta obra é de acesso aberto.  É permitida a reprodução parcial ou total desta obra, desde que citada a fonte e autoria, proibin do qualquer uso para fins \ncomerciais e respeitando a Licença Creative Commons indicada: Licença Creative Commons (CC'}


In [45]:
embeddings = pc.inference.embed(
    'multilingual-e5-large',
    inputs=[d['text'] for d in data],
    parameters={
        'input_type': 'passage'
    }
)

In [46]:
vectors = []
for d, e in zip(data, embeddings):
    vectors.append({
        'id': d['id'],
        'values': e['values'],
        'metadata': {'text': d['text']}
    })

index.upsert(
    vectors=vectors,
    namespace='ns1'
)

{'upserted_count': 90}

## 04. Utilizando o conhecimento no chat

### Chamando a base de dados

In [47]:
def info_geologia(query: str):
    x = pc.inference.embed(
        model='multilingual-e5-large',
        inputs=[query],
        parameters={
            'input_type': 'passage'
        }
    )
    results = index.query(
        namespace='ns1',
        vector=x[0].values,
        top_k=3,
        include_values=False,
        include_metadata=True
    )
    return results

In [48]:
query = 'O ouro ocorre em sedimentos de origem marinha?'
resposta = info_geologia(query)

In [49]:
resposta.matches[0].metadata['text']

'Ouro disseminado em formações sedimentares de origem marinha, em conglomerados ricos em minerais pesados. Potencial para depósito do tipo placer ou paleoplacer.'

In [50]:
def chat():
    print('Iniciando chat com o modelo. Digite `sair` para encerrar')
    messages = [
        {
            'role': 'system',
            'content': """
            Você é o Chat da Terra e do Universo e responde em português brasileiro
            perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
            além de informações sobre terremotos.
            """,
        }
    ]

    while True:
        user_message = input('Você: ')
        if user_message.lower() == 'sair':
            print('Encerrando o chat. Até a próxima!')
            break

        messages.append({'role': 'user', 'content': user_message})

        if 'geologia' in user_message.lower():
            response = info_geologia(user_message)
            geology_info = f"Informações adicionais sobre geologia: {response.matches[0].metadata['text']}"
            messages.append({'role': 'system', 'content': geology_info})

        model_response = call_groq_api(messages)

        display(model_response)
        if isinstance(model_response, pd.DataFrame):
            print('O model_response é um DataFrame.')
            texto_corrido = ''
            for idx, row in model_response.iterrows():
                texto_corrido += f"Evento {idx + 1}: Magnitude: {row['mag']}, Local: {row['place']}, Tempo: {row['time']}\n"

            model_response = texto_corrido

        messages.append({'role': 'assistant', 'content': model_response})

In [51]:
# chat()

### Para saber mais: onde adicionar o conhecimento

Para desenvolver um chatbot eficaz, é essencial definir onde e como adicionar o conhecimento que ele precisa para interagir adequadamente com os usuários. Existem diferentes formas de introduzir conhecimento extra em um chatbot, como nos prompts de system e de user. Cada uma dessas abordagens têm vantagens e desvantagens que afetam o desempenho e a precisão das respostas.

#### Conhecimento direto no prompt do System

Adicionar o conhecimento diretamente ao prompt de system cria uma base inicial e fixa de informações que o chatbot usará ao longo de toda a conversa. O prompt de system define as diretrizes gerais de comportamento do chatbot, sua personalidade, e o conhecimento fundamental que ele deve manter em todas as interações.

#### Vantagens:

- **Consistência**: O conhecimento inserido no prompt de system é consistente em todas as interações, garantindo uma base de respostas estável.
- **Economia de esforço**: Esse conhecimento é aplicado automaticamente a cada conversa, sem necessidade de reespecificação.
- **Controle de personalidade e estilo**: Manter o tom e o comportamento do chatbot é mais simples, pois o prompt de system é responsável por definir a "personalidade" geral do chatbot.

#### Desvantagens:

- **Rigidez**: O conhecimento presente no prompt de system não é facilmente ajustável ao contexto específico de cada interação. Isso pode ser limitante para casos em que o chatbot precisa adaptar o tom ou o nível de profundidade.
- **Uso de recursos**: Um prompt de system extenso pode consumir muitos tokens, reduzindo o espaço disponível para respostas mais longas e complexas em interações intensas.

#### Conhecimento adicionado no prompt de User

Incluir informações diretamente nos prompts de user é ideal quando se precisa personalizar uma resposta ou adaptar o nível de conhecimento ao contexto específico. Essas informações podem guiar o chatbot para entender a intenção do usuário com mais precisão.

#### Vantagens:

- **Flexibilidade contextual**: Permite que o chatbot responda com base em informações específicas de cada interação, adaptando-se ao usuário.
- **Personalização**: Conhecimentos específicos do prompt de user podem ajudar a refinar a resposta para atender a uma necessidade mais pontual do usuário, aumentando a satisfação com o atendimento.

#### Desvantagens:

- **Risco de repetição**: Adicionar conhecimento repetidamente em prompts de user pode gerar redundância.
- **Gastos adicionais de recursos**: Incluir conhecimento detalhado em prompts de user consome mais tokens e pode afetar o desempenho do chatbot em conversas longas.

#### Conclusão

Escolher onde adicionar o conhecimento extra de um chatbot depende da necessidade de consistência, flexibilidade e eficiência no uso de recursos. O prompt de system fornece uma base sólida e consistente; o prompt de user permite flexibilidade e personalização de contexto; e o conhecimento nas funções melhora o desempenho em tarefas específicas. Por exemplo, a forma como fizemos duranto o curso torna mais interessante que toda a conversa seja relacionada a um único tema. A escolha estratégica de onde posicionar o conhecimento pode ajudar a construir um chatbot mais robusto e eficiente, adaptado tanto a interações gerais quanto a demandas pontuais dos usuários.

### Adaptando o chat para o Gradio

In [52]:
def response(message, history):
    messages = [
        {
            'role': 'system',
            'content': """
            Você é o Chat da Terra e do Universo e responde em português brasileiro
            perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
            além de informações sobre terremotos.
            """,
        }
    ]
    for user_msg, bot_msg in history:
        messages.append({'role': 'user', 'content': user_msg})
        messages.append({'role': 'assistant', 'content': bot_msg})

    messages.append({'role': 'user', 'content': message})

    if 'geologia' in message.lower():
        response = info_geologia(message)
        geology_info = f"Informações adicionais sobre geologia: {response.matches[0].metadata['text']}"
        messages.append({'role': 'system', 'content': geology_info})

    model_response = call_groq_api(messages)

    if isinstance(model_response, pd.DataFrame):
        texto_corrido = ''
        for idx, row in model_response.iterrows():
            texto_corrido += f"Evento {idx + 1}: Magnitude: {row['mag']}, Local: {row['place']}, Tempo: {row['time']}"
            model_response = texto_corrido

    return model_response

In [53]:
import gradio as gr

In [54]:
# gr.ChatInterface(
#     response,
#     title='🌎☀️🌧 Chat da Terra e do Universo',
#     textbox=gr.Textbox(placeholder='Digite sua mensagem aqui...'),
#     type='messages'
# ).launch(debug=True)

### 05. Entregando a aplicação

### Adicionando uma segunda aba

In [55]:
from transformers import pipeline
import numpy as np


transcritor = pipeline(
    'automatic-speech-recognition',
    model='openai/whisper-base',
    generate_kwargs={'task': 'transcribe', 'language': '<|pt|>'}
)


def transcricao(audio):
    sr, y = audio
    if y.ndim > 1:
        y = y.mean(axis=1)

    y = y.astype(np.float32)
    y /= np.max(np.abs(y))

    return transcritor({'sampling_rate': sr, 'raw': y})['text']

In [59]:
# with gr.Blocks() as demo:
#     with gr.Tab('Chat da Terra e do Universo'):
#         gr.ChatInterface(
#             response,
#             title='🌎☀️🌧 Chat da Terra e do Universo',
#             textbox=gr.Textbox(placeholder='Digite sua mensagem aqui...'),
#             # submit_btn=gr.Button('Enviar')
#         )
#     with gr.Tab('Assistente de áudio'):
#         gr.Interface(
#             transcricao,
#             gr.Audio(sources='microphone'),
#             'text'
#         )
# demo.launch(debug=True)

### Passando a transcrição para o modelo

In [58]:
def responde_audio(audio):
    messages = [
        {
            'role': 'system',
            'content': """
            Você é o Chat da Terra e do Universo e responde em português brasileiro
            perguntas sobre a previsão do tempo na Terra e do espaço próximo à Terra,
            além de informações sobre terremotos.
            """,
        }
    ]
    message = transcricao(audio)

    if 'geologia' in message.lower():
        response = info_geologia(message)
        geology_info = f"Informações adicionais sobre geologia: {response.matches[0].metadata['text']}"
        messages.append({'role': 'system', 'content': geology_info})

    model_response = call_groq_api(messages)

    if isinstance(model_response, pd.DataFrame):
        texto_corrido = ''
        for idx, row in model_response.iterrows():
            texto_corrido += f"Evento {idx + 1}: Magnitude: {row['mag']}, Local: {row['place']}, Tempo: {row['time']}"

        model_response = texto_corrido

    return model_response

In [None]:
with gr.Blocks() as demo:
    with gr.Tab('Chat da Terra e do Universo'):
        gr.ChatInterface(
            response,
            title='🌎☀️🌧 Chat da Terra e do Universo',
            textbox=gr.Textbox(placeholder='Digite sua mensagem aqui...'),
            # submit_btn=gr.Button('Enviar')
        )
    with gr.Tab('Assistente de áudio'):
        gr.Interface(
            fn=responde_audio,
            inputs=gr.Audio(sources='microphone'),
            outputs='text',
            title='Assistente de áudio'
        )
demo.launch(debug=True)

### Para saber mais: texto para voz

Nesta aula estamos permitindo que a LLM seja capaz de responder mensagens de voz através da transcrição da voz para texto. Porém, também é possível fazer a LLM "falar" passando o texto por voz. A linguagem Python oferece várias bibliotecas para isso, permitindo que desenvolvedores integrem TTS de forma rápida e eficiente. Nesta atividade, vamos explorar as principais bibliotecas TTS disponíveis para Python e ver um exemplo prático usando a biblioteca gTTS.

#### gTTS (Google Text-to-Speech)

A [gTTS](https://pypi.org/project/gTTS/) é uma das bibliotecas mais populares para transformar texto em voz, usando a API do Google Translate. Ela é leve, fácil de instalar e oferece suporte a uma variedade de idiomas. A grande vantagem da gTTS é que é possível criar arquivos de áudio com apenas algumas linhas de código.

Instalação da gTTS

Primeiro, você precisa instalar a biblioteca gTTS. Isso pode ser feito diretamente pelo pip:
```bash
pip install gtts
```

Neste exemplo, vamos criar um arquivo de áudio a partir de uma string de texto e salvá-lo no formato MP3:
```python
from gtts import gTTS
import os

# Texto que queremos converter em áudio
texto = "Olá! Este é um exemplo de conversão de texto para voz usando a biblioteca gTTS."

# Configuração da gTTS (idioma: português)
tts = gTTS(text=texto, lang='pt', slow=False)

# Salvando o arquivo de áudio
tts.save("exemplo_audio.mp3")

# Reproduzindo o áudio (opcional)
os.system("start exemplo_audio.mp3")  # No Windows, use "start"; no Mac, "afplay"; no Linux, "mpg321"

```

#### pyttsx3

A biblioteca [pyttsx3](https://pypi.org/project/pyttsx3/) permite a conversão de texto em voz offline, sem necessidade de conexão com a internet. Ela é uma ótima alternativa para quem precisa de uma solução local. Além disso, o pyttsx3 permite o controle da velocidade da fala e do volume. Com o pyttsx3, você tem um controle maior sobre a voz, e ele é ideal para ambientes que exigem TTS offline.

#### Amazon Polly

A [Amazon Polly](https://ai-service-demos.go-aws.com/polly) é um serviço de texto para voz da AWS, capaz de gerar vozes naturais com excelente qualidade. Essa solução é paga, mas oferece vozes realistas e configurações avançadas, como controle de tom e pausas. Ela é amplamente utilizada em aplicações que demandam vozes mais naturais e com uma variedade maior de idiomas e sotaques. Para usar o Polly, é necessário ter uma conta AWS com permissões apropriadas para acessar o serviço.

#### Fala de IA do Azure

A [Fala de IA do Azure](https://azure.microsoft.com/pt-br/products/ai-services/ai-speech/) oferece um serviço robusto de TTS, suportando uma vasta gama de idiomas e permitindo configurações avançadas para gerar vozes naturais. É uma alternativa poderosa para empresas que já utilizam a infraestrutura da Microsoft. Para utilizar o Azure, você precisa configurar a conta e chave de acesso no portal da Azure. A integração com Python é feita usando a biblioteca azure-cognitiveservices-speech.