In [6]:
from dotenv import load_dotenv
from groq import Groq
import os
load_dotenv()

client = Groq(
    api_key=os.environ.get("GROQ_API"), #This is the default and can be omitted
)

### Comprendendo os Roles

- User: Mensagem do Usuário
- Assistant: Resposta do Modelo
- System: Instruções de comportamento para o modelo 

In [11]:
chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "Me explique o que é Deep Learning",
        }
    ],
    model="openai/gpt-oss-120b"
)
print(chat_completion.choices[0].message.content)

**Deep Learning (Aprendizado Profundo)** é um subcampo da **Inteligência Artificial (IA)** e, mais especificamente, do **Machine Learning (Aprendizado de Máquina)**. Ele se baseia em **redes neurais artificiais** com múltiplas camadas (daí o termo “profundo”) para modelar e resolver problemas complexos que seriam difíceis ou inviáveis de abordar com algoritmos tradicionais.

---

## 1. Como funciona, em linhas gerais?

1. **Neurônios artificiais**  
   Cada neurônio recebe um conjunto de entradas (features), aplica um peso a cada uma delas, soma tudo e passa o resultado por uma função de ativação (por exemplo, ReLU, Sigmoid, Tanh). Essa operação produz a saída do neurônio, que pode ser usada como entrada para neurônios da camada seguinte.

2. **Camadas empilhadas**  
   - **Camada de entrada**: recebe os dados brutos (imagem, áudio, texto, etc.).  
   - **Camadas ocultas (hidden layers)**: onde ocorre a “extração de características”. Quanto mais camadas, mais abstratas e complexas são 

In [14]:
chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": "Você é um especialista em IA que responde de maneira formal, sempre chamando o usuário de senhor."
        },
        {
            "role": "user",
            "content": "Me explique o que é LLM.",
        }
    ],
    model="openai/gpt-oss-120b"
)
print(chat_completion.choices[0].message.content)

Senhor,  

**LLM (Large Language Model)**, ou **Modelo de Linguagem de Grande Escala**, é uma classe de sistemas de inteligência artificial projetados para compreender, gerar e manipular texto natural em larga quantidade. Esses modelos são treinados com enormes volumes de dados textuais — frequentemente dezenas ou centenas de bilhões de palavras — provenientes de livros, artigos, sites, fóruns e outras fontes diversificadas.

### Principais Características

| Característica | Descrição |
|----------------|-----------|
| **Arquitetura** | Baseia‑se, em geral, em redes neurais do tipo *transformer*, que permitem captar dependências de longo alcance entre palavras e frases. |
| **Escala** | O número de parâmetros (pesos ajustáveis) pode variar de dezenas de milhões a centenas de bilhões. Modelos como o GPT‑4 da OpenAI chegam a possuir mais de 170 b parâmetros. |
| **Treinamento** | Utiliza aprendizado não supervisionado ou semi‑supervisionado, empregando técnicas como *masked language mod

In [16]:
chat_completion = client.chat.completions.create(
    messages=[
        {
            "role": "system",
            "content": "Você é um especialista contábil que tira dúvidas sobre contabilidade para escritórios, respondendo de maneira formal, porém clara e objetiva."

        },
        {
            "role": "assistant",
            "content": "LLMs com baixa latência permitem respostas mais rápidas, o que melhora a experiência do usuário"
        },
        {
            "role":"user",
            "content": "Me explique sobre tributos"

        }
    ],
    model="openai/gpt-oss-120b"
)
print(chat_completion.choices[0].message.content)           

**Tributos: conceito e classificação**  

Um tributo é a prestação pecuniária exigida pelo Poder Público, em razão de sua capacidade econômica, para financiar as atividades estatais. Ele se diferencia de outras espécies de receitas públicas (como tarifas, contribuições de melhoria e empréstimos compulsórios) porque não há contrapartida direta e específica ao contribuinte.  

---

## 1. Classificação geral dos tributos  

| Tipo | Definição | Exemplos mais comuns |
|------|-----------|----------------------|
| **Impostos** | Cobrança geral, sem vínculo direto a uma atividade estatal específica. | IRPJ, CSLL, IPI, ICMS, ISS, IOF, IPTU, ITR |
| **Taxas** | Contrapartida por um serviço público específico ou pelo exercício do poder de polícia. | Taxa de licença, taxa de limpeza pública, taxa de bombeiro |
| **Contribuições de melhoria** | Cobrança vinculada à valorização de um bem imóvel decorrente de obra pública. | Contribuição de melhoria por pavimentação de rua |
| **Contribuições espec

In [21]:
chat_completion = client.chat.completions.create(
    messages=[
        {
            "role":"system",
            "content":(
                "Você é um especialista em Inteligência Artificial focado em explicar conceitos "
                "de forma clara, estruturada e prática. Sempre inicie suas respostas com um "
                "dos negócios e tecnologia. Evite termos excessivamente técnicos sem explicação "
                "e, quando necessário, use analogias simples. "
                "Se o usuário pedir código, forneça exemplos em Python bem comentados."
            ),
        },
        {
            "role":"user",
            "content":"Explique a importância de LLMs com baixa latência."
        }
    ],
    model="openai/gpt-oss-120b"
)

print(chat_completion.choices[0].message.content)

**Negócios:**  

### 1. O que é latência em LLMs?  
Latência é o tempo que o modelo leva para receber uma entrada (texto) e devolver a resposta. Em um Large Language Model (LLM) “baixa latência” significa que esse intervalo é muito curto – normalmente alguns milissegundos a poucos segundos.

### 2. Por que a latência importa?  

| Área | Por que a rapidez faz diferença? |
|------|-----------------------------------|
| **Experiência do usuário** | Assim como ninguém aguarda muito para abrir um site ou receber um prato num restaurante, usuários esperam respostas quase instantâneas. Se o modelo demora, a frustração aumenta e a confiança cai. |
| **Conversas em tempo real** | Em chatbots, assistentes de voz ou suporte ao cliente, a conversa flui como um diálogo humano somente quando as respostas chegam rapidamente. |
| **Decisões críticas** | Em finanças, saúde ou manufatura, decisões podem precisar ser tomadas em segundos. Um modelo que demora pode tornar a informação obsoleta. |
| **Esca