# Preparando o ambiente

1. Instalando os pacotes
2. Realizando os imports
3. Definindo as configura√ß√µes (Vari√°veis de ambiente ou Secrets)
4. Baixando os arquivos de suporte.

## Instalando os **pacotes**

In [None]:
# Instalando todos os pacotes que vamos utilizar no curso.
!pip install python-dotenv openai ipykernel numexpr \
             langchain langchain_groq langchain_google_genai \
             langchain_openai langchain_experimental langchain-community langchain_groq\
             langgraph pypdf chromadb langchain_chroma fastmcp langchain_mcp_adapters==0.0.9 \
             pydantic graphviz grandalf pydot requests matplotlib google-generativeai pandas tabulate -q

In [None]:
# Linux
# Instalando o graphviz, para gerarmos nossos fluxos em PNG
!apt install graphviz graphviz-dev -y

In [None]:
# Windows
# Download: https://gitlab.com/api/v4/projects/4207231/packages/generic/graphviz-releases/11.0.0/windows_10_cmake_Release_graphviz-install-11.0.0-win64.exe
# Instalar o .exe
# Adicionar no PATH ==> "C:\Program Files\Graphviz\bin"

# link oficial de download do instalador
# https://graphviz.org/download/

In [None]:
# Linux
# Instalando o pacote do graphviz no python
!pip install --config-settings="--global-option=build_ext" --config-settings="--global-option=-I/usr/include/graphviz" pygraphviz -q

In [None]:
# Windows
#!pip install --config-settings="--global-option=build_ext" --config-settings="--global-option=-IC:\Program Files\Graphviz\include" --config-settings="--global-option=-LC:\Program Files\Graphviz\lib" pygraphviz

## Importando os pacotes

In [None]:
# =======================
# Bibliotecas da standard library (Python)
# =======================

# Sistema operacional: cria√ß√£o de diret√≥rios, configura√ß√£o e leitura de vari√°veis de ambiente
import os

# Informa√ß√µes e manipula√ß√£o da execu√ß√£o do interpretador Python
import sys

# Express√µes regulares
import re

# Manipula√ß√£o de datas e hor√°rios
import datetime

# Execu√ß√£o de fun√ß√µes ass√≠ncronas
import asyncio

# Conex√µes seguras e cliente HTTP ass√≠ncrono
import ssl
import httpx

# Manipula√ß√£o de arquivos e diret√≥rios de forma independente do sistema operacional
from pathlib import Path

# Identificadores √∫nicos universais (UUID)
from uuid import uuid4

# Manipula√ß√£o de CSV
import pandas as pd

# Tipagem est√°tica (anota√ß√µes e tipos auxiliares)
from typing import Any, List, Union, TypedDict

# Manipula√ß√£o de XML
from xml.etree import ElementTree as ET

# Envio de e-mails (SMTP e MIME)
from smtplib import SMTP, SMTP_SSL
from email.mime.base import MIMEBase
from email.mime.multipart import MIMEMultipart
from email.mime.text import MIMEText
from email.utils import formataddr
try:
    from email import encoders
except ImportError:
    from email import Encoders as encoders

# Leitura de vari√°veis de ambiente a partir de arquivos `.env`
from dotenv import load_dotenv

# Requisi√ß√µes HTTP (s√≠ncronas)
import requests

# Exibi√ß√£o de gr√°ficos e imagens
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

# =======================
# OpenAI
# =======================

from openai import OpenAI
from openai.types.chat.chat_completion import ChatCompletion

# =======================
# Gemini
# =======================

import google.generativeai as gemini

# =======================
# LangChain
# =======================

# Configura√ß√£o de debug do LangChain
from langchain.globals import set_debug

# Modelos LLM (Large Language Models)
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.language_models.chat_models import BaseChatModel

# Constru√ß√£o de prompts
from langchain.schema import HumanMessage
from langchain.prompts import (
    PromptTemplate,
    ChatPromptTemplate,
    MessagesPlaceholder,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate
)

# Parsers de sa√≠da
from langchain.schema.output_parser import StrOutputParser

# Execu√ß√£o de fluxos (Runnables)
from langchain_core.runnables import RunnableLambda

# Cria√ß√£o e execu√ß√£o de agentes
from langchain.agents import (
    Tool,
    AgentExecutor,
    create_tool_calling_agent,
    create_react_agent
)

# Ferramentas customizadas para agentes
from langchain.tools import tool
from langchain_community.agent_toolkits.load_tools import load_tools
from langchain_experimental.tools.python.tool import PythonAstREPLTool

# Tipos de mem√≥ria utilizados em agentes
from langchain.memory import ConversationBufferMemory

# Componentes de RAG (Retrieval-Augmented Generation)
from langchain_chroma import Chroma  # Armazenamento vetorial
from langchain_openai.embeddings import OpenAIEmbeddings  # Embeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter  # Separador de texto
from langchain_community.document_loaders import PyPDFDirectoryLoader  # Leitura de documentos PDF

# Acesso ao hub LangChain de prompts prontos (https://smith.langchain.com/hub)
from langchain import hub

# =======================
# MCP (Model Context Protocol)
# =======================

# Servidor MCP
from mcp.server.fastmcp import FastMCP

# Cliente MCP multi-servidor
from langchain_mcp_adapters.client import MultiServerMCPClient

# =======================
# LangGraph
# =======================

# Cria√ß√£o de agentes com LangGraph
from langgraph.prebuilt import create_react_agent as create_react_agent_graph

# Sistema de checkpoint em mem√≥ria
from langgraph.checkpoint.memory import InMemorySaver

# Defini√ß√£o e execu√ß√£o de grafos
from langgraph.graph import StateGraph, END

# =======================
# Outros
# =======================

# Ignora avisos durante a execu√ß√£o
from IPython import get_ipython

import warnings
warnings.filterwarnings('ignore')

In [None]:
# Verifica onde o notebook est√° rodando
RUNNING_IN_COLAB = 'google.colab' in str(get_ipython())
try:
  from google.colab import userdata
except:
  pass

OUTPUT_DOCUMENTS_DIR:str = './documentos/' if not RUNNING_IN_COLAB else '/content/documentos/'

if not RUNNING_IN_COLAB and sys.platform.lower() == "win32" and "Graphviz" not in os.environ["PATH"]: # Somente no Windows
    os.environ["PATH"] = os.getenv("PATH", "") + ";C:\\Program Files\\Graphviz\\bin"

## Configura√ß√µes

In [None]:
# Arquivo de environment (se estiver local)
# Exemplo de um arquivo .env
# ==============================================
# GROQ_API_KEY=
# OPENAI_API_KEY=
# ANTHROPIC_API_KEY=
# GOOGLE_API_KEY=
#
# SMTP_USERNAME=
# SMTP_PASSWORD=
# ==============================================

# Caminho de onde foi criado o .env
ENV_PATH:str = '.env'

# No colab utilizamos o <Secrets> Menu esquerda (chave)

def carrega_variaveis_ambiente() -> None:

    # Modo local
    if os.path.exists(ENV_PATH) and not RUNNING_IN_COLAB:
        load_dotenv(ENV_PATH, override=True)

    # Modo Colab
    if RUNNING_IN_COLAB:
      os.environ['GROQ_API_KEY'] = userdata.get('GROQ_API_KEY')
      os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')
      os.environ['ANTHROPIC_API_KEY'] = userdata.get('ANTHROPIC_API_KEY')
      os.environ['GOOGLE_API_KEY'] = userdata.get('GOOGLE_API_KEY')

      os.environ['SMTP_USERNAME'] = userdata.get('SMTP_USERNAME')
      os.environ['SMTP_PASSWORD'] = userdata.get('SMTP_PASSWORD')

carrega_variaveis_ambiente()

## Baixando os arquivo para utilizarmos na Aula.

In [None]:
def download(url:str, output_dir:str=OUTPUT_DOCUMENTS_DIR) -> None:
    if not os.path.exists(output_dir):
        os.makedirs(output_dir, exist_ok=True)

    filename = url.split('/')[-1]
    filepath = os.path.join(output_dir, filename)

    if not os.path.exists(filepath):
        response = requests.get(url)
        if response.status_code == 200:
            with open(filepath, 'wb') as file:
                file.write(response.content)
            print(f"Arquivo baixado com sucesso: {filepath}")
        else:
            print(f"Erro ao baixar o arquivo. C√≥digo de status: {response.status_code}")


In [None]:
download('https://middleware.datah.ai/RAG-DATA H.pdf')
download('https://middleware.datah.ai/noticias_publicadas_ultimos_30d.csv')
download('https://middleware.datah.ai/leitura_ultimos_5d_amostra.csv')

# Agentes

## Objetivo

1. Entender o que √© um agente
2. Conhecer o ciclo de percep√ß√£o-decis√£o-a√ß√£o
3. Distinguir agentes de LLMs simples
4. Criar agentes com Langchain (LCEL / AgentExecutor)
5. Conceitos sobre LLM (Temperatura, Top_p e Min_p)
6. Trabalhar com Ferramentas
7. Trabalhar com Mem√≥ria
8. Trabalhar com Contexto
9. Prompt
10. Trabalhar com RAG
11. Tipos de Agentes (AgentExcutor / React)
12. Trabalhar com MCP
13. Trabalhar com LangGraph






## O que √© um Agente?

Um agente √© qualquer **entidade** que pode:
* **Perceber** seu ambiente (ex: atrav√©s de sensores)
* **Processar** essa percep√ß√£o
* **Agir** sobre o ambiente (atrav√©s de atuadores).

![agente](https://middleware.datah.ai/agent_figura_11.png)

## Principais Conceitos

* **Percep√ß√£o** (Percept): √â a informa√ß√£o que o agente coleta do seu ambiente. Para um carro aut√¥nomo, por exemplo, a percep√ß√£o s√£o os dados das c√¢meras, radares e GPS.

* **A√ß√£o** (Action): √â o que o agente faz para interagir com o ambiente. No carro aut√¥nomo, as a√ß√µes seriam acelerar, frear ou virar o volante.

* **Fun√ß√£o do Agente** (Agent Function): √â o "**c√©rebro**" do agente. √â a fun√ß√£o que mapeia a sequ√™ncia de percep√ß√µes para uma a√ß√£o. Teoricamente, **como um agente deveria agir** em resposta a uma sequ√™ncia completa de percep√ß√µes. Na pr√°tica, essa fun√ß√£o √© implementada por um **programa de agente**.

$$f:P^* \rightarrow A$$

* **Programa do Agente** (Agent Program): √â a implementa√ß√£o concreta da fun√ß√£o do agente. Existem diferentes tipos de programas de agente, cada um com um n√≠vel de complexidade e "intelig√™ncia.

$$ f $$

* **Atuadores** (actuators): Executam essa a√ß√£o no mundo f√≠sico. Eles s√£o a parte do agente que interage fisicamente com o ambiente.

## Estrutura para criar um Agente

![agente](https://middleware.datah.ai/agent_figura_01.png)


## Criando um agente utilizando a API da OpenAI

LLM + Prompt


***IMPORTANTE: Este exemplo precisa de uma chave da OpenAI.***


In [None]:
# exemplo_01.py

# Criando o client para trabalharmos com os agentes.
api_key = os.getenv('OPENAI_API_KEY')
client = OpenAI(api_key=api_key)

# ou

client = OpenAI()

# Criando o agente
def agente_manual(pergunta:str) -> str:
    model:str = "gpt-4o-mini"
    prompt:str = f"""
Voc√™ √© um assistente inteligente com acesso a duas ferramentas:
1. Calculadora
2. Wikipedia

Dado a pergunta abaixo, diga o que pretende fazer.

Pergunta: {pergunta}

Responda no formato:
A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]
Motivo: ...
    """

    resposta:ChatCompletion = client.chat.completions.create(
        model=model,
        messages=[
            {
                "role": "user",
                "content": prompt
            }
        ]
    )

    return resposta.choices[0].message.content

In [None]:
# Utilizando nosso primeiro agente
resposta = agente_manual("Qual a raiz quadrada de 256?")
print("Resposta OpenAI:",resposta)

In [None]:
resposta = agente_manual("Qual a popula√ß√£o de Ribeir√£o Preto.")
print("Resposta OpenAI:", resposta)

## Criando um agente utilizando a API do Gemini

LLM + Prompt


***IMPORTANTE: Este exemplo precisa de uma chave do Gemini.***

In [None]:
# exemplo_01_1.py

# Criando o client para trabalharmos com os agentes.
gemini.configure(api_key=os.environ["GOOGLE_API_KEY"])


# Criando o agente
def agente_manual_gemini(pergunta: str) -> str:
    model_name: str = "gemini-1.5-flash"
    prompt: str = f"""
Voc√™ √© um assistente inteligente com acesso a duas ferramentas:
1. Calculadora
2. Wikipedia

Dado a pergunta abaixo, diga o que pretende fazer.

Pergunta: {pergunta}

Responda no formato:
A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]
Motivo: ...
    """

    # Inicializa o modelo
    model = gemini.GenerativeModel(model_name)
    response = model.generate_content(
        contents=[
            {
                "role": "user",
                "parts": [prompt]
            }
        ]
    )

    return response.text

In [None]:
resposta = agente_manual_gemini("Qual a raiz quadrada de 256?")
print("Resposta Gemini:", resposta)

In [None]:
resposta = agente_manual_gemini("Qual a popula√ß√£o de Ribeir√£o Preto.")
print("Resposta Gemini:", resposta)

## LangChain

O LangChain √© um framework em **Python (e JS)** criado para constru√ß√£o de aplica√ß√µes que usam LLMs (Large Language Models) como ChatGPT, Claude, Mistral, Llama, etc.


**Porque utilizar um Framework?**

* Ele facilita a cria√ß√£o de pipelines, chatbots, assistentes, agentes, RAGs (Retrieval-Augmented Generation), entre outros.

* Facilita a portabilidade entre as LLMs. (Cada LLM tem a sua API com as sua particularidade).

* Ele tem componentes prontos e bem separados (LLMs, Memory, Tools, Chains, Agents).

* Facilita a constru√ß√£o de pipelines complexas.

* J√° vem com recursos de tracking, observability, serialization, etc.

* Voc√™ pode usar s√≥ as partes que quiser (n√£o √© obrigat√≥rio usar tudo).

Para mais detalhes acesse: https://www.langchain.com/

## Iniciando com o Framework LangChain (LCEL)

### O que √© o LangChain Expression Language (LCEL)?

 **LCEL (LangChain Expression Language)** √© uma ferramenta poderosa do LangChain projetada para facilitar a constru√ß√£o de cadeias de chamadas (chains) de forma fluida e eficiente. Pense nele como a "cola" que une diferentes componentes de um aplicativo de IA, como modelos de linguagem (LLMs), prompts e ferramentas, em um fluxo de trabalho coerente.

A grande **vantagem do LCEL** √© sua capacidade de permitir que os desenvolvedores criem pipelines complexos de maneira simples e declarativa, usando o operador | (pipe), semelhante ao que se usa em shells como Bash. Isso torna a leitura e a escrita das cadeias muito mais intuitiva.

O LCEL n√£o √© apenas uma sintaxe elegante; ele traz consigo uma s√©rie de benef√≠cios importantes:

* **Streaming**: Ele suporta o streaming de tokens, ou seja, as respostas s√£o geradas em tempo real, em vez de esperar a conclus√£o total da cadeia. Isso melhora a experi√™ncia do usu√°rio, pois a resposta come√ßa a aparecer imediatamente.

* **Paralelismo**: O LCEL executa opera√ß√µes que n√£o dependem umas das outras em paralelo automaticamente, o que melhora o desempenho da sua aplica√ß√£o.

* **Fallback**: Ele permite a defini√ß√£o de mecanismos de "fallback", onde voc√™ pode configurar um plano B caso um modelo ou ferramenta falhe, aumentando a robustez da sua aplica√ß√£o.

* **Composi√ß√£o**: A facilidade de combinar e reutilizar diferentes partes da sua cadeia, tornando o c√≥digo mais modular e f√°cil de manter.

* **Acessibilidade**: Suporte para chamadas s√≠ncronas e ass√≠ncronas, permitindo que voc√™ adapte o c√≥digo ao seu ambiente.

### Como o LCEL funciona?
O funcionamento do LCEL √© baseado no encadeamento de objetos que implementam a interface Runnable. Cada componente do LangChain que pode ser parte de uma cadeia ‚Äì como PromptTemplate, ChatModel, OutputParser ‚Äì √© um Runnable.

A sintaxe principal √© o operador |. Quando voc√™ escreve, por exemplo, `prompt | model`, o que est√° acontecendo por baixo dos panos √© o seguinte:

* **Entrada**: A cadeia recebe uma entrada (um dicion√°rio, uma string, etc.).

* **prompt**: A entrada √© processada pelo prompt. Por exemplo, uma string √© formatada em um PromptValue.

* **model**: O resultado do prompt √© passado como entrada para o model (o LLM). O modelo, por sua vez, gera uma ChatMessage.

* **Sa√≠da**: O resultado do model √© a sa√≠da da cadeia.

### Quando usar o LCEL?

* **Constru√ß√£o de Cadeias Simples e Complexas**: Se voc√™ precisa conectar prompts, modelos, parsers, ferramentas ou outros componentes do LangChain em uma sequ√™ncia, o LCEL √© a melhor escolha. A sintaxe | √© muito mais leg√≠vel do que aninhar chamadas de fun√ß√µes.

* **Aplica√ß√µes que Exigem Desempenho**: Gra√ßas ao paralelismo e ao suporte a streaming, o LCEL √© ideal para aplica√ß√µes em produ√ß√£o onde o tempo de resposta √© crucial, como chatbots e assistentes virtuais.

* **Prototipagem R√°pida**: Para testar rapidamente diferentes combina√ß√µes de prompts e modelos, o LCEL permite montar e desmontar cadeias de forma √°gil.

* **C√≥digo Limpo e Modular**: Se voc√™ valoriza a legibilidade e a manuten√ß√£o do c√≥digo, o LCEL for√ßa uma estrutura mais organizada, onde cada parte da cadeia √© um componente claramente definido.

Vamos a um exemplo pr√°tico:

### LLM's que vamos utilizar durante todo o curso

Imports
```python
# Modelos LLM (Large Language Models)
from langchain_openai import ChatOpenAI
from langchain_groq import ChatGroq
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.language_models.chat_models import BaseChatModel
```

In [None]:
# llms.py

# Cria os modelos do Curs
llm_padrao = ChatGroq(temperature=0, groq_api_key=os.getenv('GROQ_API_KEY'), model_name='llama-3.3-70b-versatile')        # .env/Secret = GROQ_API_KEY
llm_openai = ChatOpenAI(temperature=0, model="gpt-4o-mini")                                                               # .env/Secret = OPENAI_API_KEY
llm_gemini = ChatGoogleGenerativeAI(temperature=0, model='gemini-1.5-flash-latest')                                       # .env/Secret = GOOGLE_API_KEY
llm_groq_p = ChatGroq(temperature=0, groq_api_key=os.getenv('GROQ_API_KEY'), model_name='deepseek-r1-distill-llama-70b')  # .env/Secret = GROQ_API_KEY

In [None]:
# exemplo_02.py

set_debug(False)

# Criando o agente
def agente_lcel(pergunta:str) -> str:
    modelo:str = llm_padrao # Groq
    prompt:str = ChatPromptTemplate.from_messages(
        [
            ("system", "Voc√™ √© um assistente inteligente com acesso a duas ferramentas:"),
            ("system", "1. Calculadora"),
            ("system", "2. Wikipedia"),
            ("system", "Dado a pergunta abaixo, diga o que pretende fazer."),
            ("human", "{pergunta}"),
            ("system", "Responda no formato:"),
            ("system", "A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]"),
            ("system", "Motivo: ..."),
        ])

    # LCEL (LangChain Expression Language)
    cadeia = prompt | modelo | StrOutputParser()
    return cadeia.invoke({"pergunta": pergunta})

In [None]:
# Utilizando nosso primeiro agente
resposta = agente_manual("Qual a raiz quadrada de 256?")
print(resposta)

## AgentExecutor


O **AgentExecutor** √© o motor de execu√ß√£o de um agente. Ele √© a l√≥gica de alto n√≠vel que orquestra o processo de tomada de decis√£o. As principais responsabilidades do AgentExecutor s√£o:

* **Observar o Hist√≥rico de Conversas**: Ele recebe o prompt do usu√°rio e o hist√≥rico da conversa.

* **Chamar o Agent**: Ele envia essa informa√ß√£o para o Agent (que √© um Runnable, ou seja, pode ser constru√≠do com LCEL). O Agent √© a "**mente**" que decide a pr√≥xima a√ß√£o.

* **Processar a Resposta do Agente**: A resposta do Agent pode ser uma de duas coisas:
> * **Uma AgentAction**: O agente decidiu usar uma ferramenta. O AgentExecutor ent√£o chama a ferramenta especificada com a entrada correta.
> * **Uma AgentFinish**: O agente decidiu que a tarefa est√° completa e tem a resposta final para o usu√°rio.

* **Loop**: Se for uma **AgentAction**, o `AgentExecutor` executa a ferramenta, obt√©m o resultado e repete o processo (volta para o **passo 1**), enviando o resultado da ferramenta de volta para o agente. Ele faz isso em um loop at√© que o agente decida que a tarefa est√° finalizada (**AgentFinish**).

Resumindo o `AgentExecutor` √© a camada que gerencia o ciclo de vida do agente, o "ciclo de racioc√≠nio".


### **Qual √© melhor utilizar o `LCEL` ou o `AgentExecutor`?**

Voc√™ n√£o precisa escolher entre LCEL e AgentExecutor. O AgentExecutor √©, na verdade, uma implementa√ß√£o de uma cadeia constru√≠da com LCEL, por√©m com uma l√≥gica de alto n√≠vel para gerenciar o ciclo de vida do agente.

#### Exemplo do AgentExecutor

In [None]:
# exemplo_02.1.py

# Visualizar os detalhes da execu√ß√£o
set_debug(True)

def agente_langchain(pergunta:str) -> dict:
    modelo = llm_padrao # Groq
    prompt = ChatPromptTemplate.from_messages(
        [
            ("system", "Voc√™ √© um assistente inteligente com acesso a duas ferramentas:"),
            ("system", "1. Calculadora"),
            ("system", "2. Wikipedia"),
            ("system", "Dado a pergunta abaixo, diga o que pretende fazer."),
            ("human", "{pergunta}"),
            ("system", "Responda no formato:"),
            ("system", "A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]"),
            ("system", "Motivo: ... "),
            MessagesPlaceholder(variable_name="agent_scratchpad"), # Onde o agente ir√° escrever suas anota√ß√µes (Pensamento)
        ]
    )
    agente = create_tool_calling_agent(modelo, tools=[], prompt=prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=[])
    resposta = executor_do_agente.invoke({"pergunta": pergunta})
    return resposta['output']

In [None]:
resposta = agente_langchain("Qual a raiz quadrada de 256?")
print(resposta)


## Algumas vantagens do LangChain (Portabilidade)

LLM + Tool + Prompt

***IMPORTANTE: Este exemplo precisa de uma chave da OpenAI e Gemini.***

In [None]:
# exemplo_03.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)

def agente_langchain(llm:BaseChatModel, pergunta:str) -> dict:
    # https://python.langchain.com/docs/integrations/tools/
    # https://python.langchain.com/docs/versions/migrating_chains/llm_math_chain/
    ferramentas = load_tools(["llm-math"], llm=llm)

    prompt = ChatPromptTemplate.from_messages(
        [
            ("system", "Voc√™ √© um agente respons√°vel por resolver problemas matem√°ticos."),
            ("system", "Utilize todas as suas ferramentas dispon√≠veis e responda a pergunta do usu√°rio."),
            ("human", "{input}"),
            MessagesPlaceholder(variable_name="agent_scratchpad"), # Onde o agente ir√° escrever suas anota√ß√µes (Pensamento)
        ]
    )
    agente = create_tool_calling_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas)
    resposta = executor_do_agente.invoke({"input": pergunta})
    return resposta

In [None]:
# Utilizando a LLM da OpenAI para responder
resposta = agente_langchain(llm_openai, "Qual √© a raiz quadrada de 169 vezes 2?")
print(f'\n\nResposta OpenAi: {resposta.get("output", "N√£o encontrei a resposta")}\n')

In [None]:
# Utilizando a LLM do Gemini para responder
resposta = agente_langchain(llm_gemini, "Qual √© a raiz quadrada de 169 vezes 2?")
print(f'\nResposta Gemini: {resposta.get("output", "N√£o encontrei a resposta")}\n')

## Conceitos Importantes

### LLM - Temperature

```python
llm_padrao = ChatGroq(temperature=0, groq_api_key=os.getenv('GROQ_API_KEY'), model_name='llama3-70b-8192')
llm_openai = ChatOpenAI(temperature=0, model="gpt-4o-mini")                                   
llm_gemini = ChatGoogleGenerativeAI(temperature=0, model='gemini-1.5-flash-latest')   
```

Vamos entender o que acontece quando alteramos a temperatura da LLM. Sabemos que a **LLM** prev√™ sempre a pr√≥xima palavra. Exemplo:

```sh
Pergunta: Como est√° o dia hoje?
LLM: Hoje <>
LLM: Hoje o <>
LLM: Hoje o dia <>
LLM: Hoje o dia est√° <>
LLM: Hoje o dia est√° lindo.
Resposta: Hoje o dia est√° lindo.
```


![temperatura](https://middleware.datah.ai/agent_figura_02.png?12)






![grafico](https://middleware.datah.ai/agent_figura_03.png?12)


### Top_p (Amonstragem de n√∫cleo)

* Dada a lista de **palavras ordenadas** da **maior para menor** probabilidade.
* Seleciona um **subconjunto** onde a soma das probabilidades √© **maior ou igual ao top_p**
* O modelo escolhe aleatoriamente uma dessas palavras.

\

#### Exemplo = Top_p = 95%

Hoje o dia est√°
* **Lindo** 50%
* **Bonito** 30%
* **Claro** 15%


---


* Escuro 4%
* Banana 1%



### Min_p (Controlar a diversidade)

* Recupera a **palavra com maior probabilidade**.
* Define um limite de corte $$ \ {p_{max} * min_p}$$
* Seleciona um **subconjunto** onde a probabilidade √© **maior que o limite de corte**.
* O modelo escolhe aleatoriamente uma dessas palavras.

#### Exemplo = Min_p = 5%

Hoje o dia est√°
* **Lindo** 50%    (Limite de corte 2.5%)
* **Bonito** 30%
* **Claro** 15%
* **Escuro** 4%

---


* Banana 1%


## Ferramentas

No contexto do LangChain, as **ferramentas** (ou tools) s√£o fun√ß√µes que um modelo de linguagem (LLM) pode chamar para interagir com o mundo exterior. Pense nelas como os "**sentidos**" e "**m√£os**" do seu agente de IA.

Alguns exemplos de ferramentas comuns incluem:

* **Busca na internet**: Uma ferramenta que usa um buscador como o Google ou o DuckDuckGo para encontrar informa√ß√µes atualizadas.
* **Calculadora**: Uma ferramenta que executa opera√ß√µes matem√°ticas precisas.
* **API de clima**: Uma ferramenta que faz uma chamada a uma API para obter a previs√£o do tempo para uma cidade.
* **Leitor de arquivos**: Uma ferramenta que permite ao agente ler o conte√∫do de um documento.
* **Ferramenta de SQL**: Uma ferramenta que executa consultas em um banco de dados.


### Criando nossa primeira ferramenta

In [None]:
# exemplo_04.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)

@tool
def get_current_time(*args, **kwargs) -> str:
    """O objetivo dessa ferramenta √© retornar a data e hora atual."""
    now = datetime.datetime.now()
    return f"A data e hora atual √© {now.strftime('%Y-%m-%d %H:%M:%S')}"


def agente_langchain(llm:BaseChatModel, usar_ferramentas:bool=True) -> dict:
    ferramentas = [get_current_time] if usar_ferramentas else []
    prompt = ChatPromptTemplate.from_messages(
        [
            ("human", "{input}"),
            MessagesPlaceholder(variable_name="agent_scratchpad"), # Onde o agente ir√° escrever suas anota√ß√µes (Pensamento)
        ]
    )
    agente = create_tool_calling_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas)
    return executor_do_agente

In [None]:
executor_do_agente = agente_langchain(llm_padrao, usar_ferramentas=False)
resposta = executor_do_agente.invoke({"input": "Qual √© a data inicial e final dessa semana?"})
print(f'\n\nResposta sem Ferramenta: {resposta.get("output", "N√£o encontrei a resposta")}\n')

In [None]:
set_debug(False)

executor_do_agente = agente_langchain(llm_padrao, usar_ferramentas=True)
resposta = executor_do_agente.invoke({"input": "Qual √© a data inicial e final dessa semana?"})
print(f'\n\nResposta com Ferramenta: {resposta.get("output", "N√£o encontrei a resposta")}\n')

In [None]:
resposta = executor_do_agente.invoke({"input": "Qual foi minha ultima pergunta?"})
print(f'\n\nResposta sem Mem√≥ria: {resposta.get("output", "N√£o encontrei a resposta")}\n')

## Mem√≥ria

A **mem√≥ria** (ou memory) no LangChain √© o componente que permite que os agentes e as cadeias de conversa retenham informa√ß√µes de intera√ß√µes anteriores. Sem a mem√≥ria, cada intera√ß√£o seria tratada como uma nova e isolada, fazendo com que o LLM "**esquecesse**" o que foi dito nos turnos anteriores.

A mem√≥ria √© crucial para construir chatbots e assistentes que podem ter conversas fluidas e contextuais. Ela injeta o hist√≥rico da conversa no prompt de cada nova chamada ao LLM, permitindo que o modelo use esse contexto para gerar respostas mais relevantes.

Existem v√°rios tipos de mem√≥ria no LangChain, cada um com uma estrat√©gia diferente para armazenar e recuperar o hist√≥rico:

* **ConversationBufferMemory**: A forma mais simples de mem√≥ria. Ela armazena todas as mensagens da conversa em uma vari√°vel e as injeta no prompt. √â f√°cil de usar, mas pode se tornar ineficiente para conversas muito longas, pois o tamanho do prompt cresce.

* **ConversationBufferWindowMemory**: Similar √† anterior, mas armazena apenas as √∫ltimas N intera√ß√µes (uma "janela" de conversa). Isso evita que o prompt fique grande demais, mantendo apenas o contexto mais recente.

* **ConversationSummaryMemory**: Em vez de armazenar a conversa inteira, ela cria um resumo cont√≠nuo das intera√ß√µes anteriores. Isso √© √≥timo para conversas longas, pois mant√©m o contexto sem sobrecarregar o prompt.

* **ConversationSummaryBufferMemory**: Uma combina√ß√£o das duas √∫ltimas, que armazena as intera√ß√µes recentes na √≠ntegra e resume as intera√ß√µes mais antigas.



## Contexto

O termo "**contexto**" no mundo de modelos de linguagem e intelig√™ncia artificial refere-se a toda a informa√ß√£o relevante que um modelo precisa para entender e gerar uma resposta adequada para uma determinada solicita√ß√£o. √â o conjunto de dados que fornece o pano de fundo para a intera√ß√£o atual.

Em LangChain, o **contexto √© tudo aquilo que voc√™ alimenta o modelo de linguagem (LLM) junto com a pergunta** do usu√°rio para que ele possa dar uma resposta precisa. Ele pode vir de diversas fontes e √© fundamental para que o LLM n√£o responda com base apenas em seu conhecimento pr√©-treinado, mas sim com base nas informa√ß√µes que voc√™ forneceu.


![grafico](https://middleware.datah.ai/agent_figura_04.png?12)

In [None]:
# exemplo_05.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)

@tool
def get_current_time(*args, **kwargs) -> str:
    """O objetivo dessa ferramenta √© retornar a data e hora atual."""
    now = datetime.datetime.now()
    return f"A data e hora atual √©: {now.strftime('%Y-%m-%d %H:%M:%S')}"


def agente_langchain(llm:BaseChatModel, usar_ferramentas:bool=True) -> dict:
    ferramentas = [get_current_time] if usar_ferramentas else []

    # Retorna o hist√≥rico como uma lista de objetos de mensagem
    memoria = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

    prompt = ChatPromptTemplate.from_messages(
        [
            MessagesPlaceholder(variable_name="chat_history"), # O placeholder para o hist√≥rico
            ("human", "{input}"),
            MessagesPlaceholder(variable_name="agent_scratchpad"), # Onde o agente ir√° escrever suas anota√ß√µes (Pensamento)
        ]
    )
    agente = create_tool_calling_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas, memory=memoria)
    return executor_do_agente

In [None]:
executor_do_agente = agente_langchain(llm_padrao, usar_ferramentas=True)

In [None]:
resposta = executor_do_agente.invoke({"input": "Qual √© a data inicial e final dessa semana?"})
print(f'\n\nResposta: {resposta.get("output", "N√£o encontrei a resposta")}\n')

In [None]:
resposta = executor_do_agente.invoke({"input": "Qual foi minha ultima pergunta?"})
print(f'\n\nResposta com Mem√≥ria: {resposta.get("output", "N√£o encontrei a resposta")}\n')

## Prompt

O "**prompt**" √© a instru√ß√£o, pergunta ou texto inicial que voc√™ fornece a um modelo de linguagem (LLM) para que ele gere uma resposta. √â o ponto de partida de qualquer intera√ß√£o com uma IA generativa.

Ele √© o principal meio de comunica√ß√£o com a LLM, e a qualidade da sua resposta depende, em grande parte, da clareza e da precis√£o do prompt. Um prompt bem elaborado pode guiar o modelo a entregar exatamente o que voc√™ precisa, enquanto um prompt vago pode levar a uma resposta gen√©rica ou irrelevante.

### Tipos de Prompts

Os prompts podem ser categorizados de diferentes formas, dependendo do seu formato e da informa√ß√£o que cont√™m. No contexto do LangChain e do desenvolvimento com LLMs, as duas categorias mais importantes s√£o:

* **Prompts Simples (Strings)**: Este √© o tipo mais b√°sico de prompt. √â uma string de texto simples que voc√™ envia diretamente para o modelo. N√£o h√° formata√ß√£o complexa ou vari√°veis.
* **Prompts Estruturados (Templates)**: Este tipo de prompt √© uma estrutura reutiliz√°vel, ou um template, que cont√©m espa√ßos reservados para vari√°veis. Em vez de escrever o prompt completo a cada vez, voc√™ preenche essas vari√°veis com dados din√¢micos. Essa abordagem √© a mais utilizada em aplica√ß√µes reais, pois permite criar prompts robustos e flex√≠veis.


#### Prompt Simples (String)

In [None]:
# exemplo_06.py

# Criando o agente
def agente(pergunta:str) -> str:

    # [HumanMessage(content=pergunta)] == [("human", f"{pergunta}")]
    resposta = llm_padrao.invoke([HumanMessage(content=pergunta)])
    return resposta

In [None]:
resposta = agente("Qual a raiz quadrada de 256?")
print(resposta.content)

#### Prompt Template

In [None]:
# exemplo_07.py


# Criando o agente
def agente(pergunta:str) -> str:
    prompt = PromptTemplate(
        input_variables=["pergunta", "agent_scratchpad"],
        template="""Voc√™ √© um assistente inteligente com acesso a duas ferramentas:
                        1. Calculadora
                        2. Wikipedia
                    Dado a pergunta abaixo, diga o que pretende fazer.
                    Pergunta: {pergunta}
                    {agent_scratchpad}
                    Responda no formato:
                    A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]
                    Motivo: ...
        """
    )
    agente = create_tool_calling_agent(llm_padrao, tools=[], prompt=prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=[])
    resposta = executor_do_agente.invoke({"pergunta": pergunta})
    return resposta

In [None]:
resposta = agente("Qual a raiz quadrada de 256?")
print(resposta.get("output", "N√£o encontrei a resposta"))

#### ChatPromptTemplate

In [None]:
# exemplo_08.py

# Criando o agente
def agente(pergunta:str) -> str:
    prompt:str = ChatPromptTemplate.from_messages(
        [
            SystemMessagePromptTemplate.from_template("Voc√™ √© um assistente inteligente com acesso a duas ferramentas:"),
            SystemMessagePromptTemplate.from_template("1. Calculadora"),
            SystemMessagePromptTemplate.from_template("2. Wikipedia"),
            SystemMessagePromptTemplate.from_template("Dado a pergunta abaixo, diga o que pretende fazer."),
            HumanMessagePromptTemplate.from_template("{pergunta}"),
            SystemMessagePromptTemplate.from_template("Responda no formato:"),
            SystemMessagePromptTemplate.from_template("A√ß√£o: [Calculadora|Wikipedia|Responder diretamente]"),
            SystemMessagePromptTemplate.from_template("Motivo: ..."),
            MessagesPlaceholder(variable_name="agent_scratchpad")
        ])

    agente = create_tool_calling_agent(llm_padrao, [], prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=[])
    resposta = executor_do_agente.invoke({"pergunta": pergunta})
    return resposta

In [None]:
resposta = agente("Qual a raiz quadrada de 256?")
print(resposta.get("output", "N√£o encontrei a resposta"))

## RAG (Retrieval-Augmented Generation)

**RAG**, ou **Gera√ß√£o Aumentada por Recupera√ß√£o**, √© uma t√©cnica que combina o poder de um modelo de linguagem (LLM) com sistemas de recupera√ß√£o de informa√ß√µes. Em termos simples, o RAG permite que o LLM acesse dados externos, como seus pr√≥prios documentos, bases de conhecimento ou a internet, antes de gerar uma resposta.

O RAG **resolve tr√™s grandes problemas** dos LLMs tradicionais:

1. **Conhecimento Desatualizado**: LLMs s√£o treinados em grandes volumes de dados, mas esse conhecimento √© est√°tico e limitado √† data do treinamento. O RAG permite que o modelo acesse informa√ß√µes em tempo real e dados que s√£o constantemente atualizados.

2. **Alucina√ß√µes**: Como os LLMs √†s vezes inventam informa√ß√µes para preencher lacunas, eles podem gerar respostas incorretas ou sem fundamento. O RAG "aterra" a resposta em fatos concretos, usando as informa√ß√µes recuperadas de uma fonte externa confi√°vel, o que reduz drasticamente a chance de alucina√ß√µes.

3. **Falta de Transpar√™ncia**: Com o RAG, o modelo n√£o apenas responde, mas tamb√©m pode citar as fontes de onde a informa√ß√£o foi extra√≠da. Isso aumenta a confian√ßa do usu√°rio, pois ele pode verificar a veracidade da resposta.

Como o RAG funciona?

![rag](https://media.geeksforgeeks.org/wp-content/uploads/20250210190608027719/How-Rag-works.webp)

Mais informa√ß√µes https://www.geeksforgeeks.org/nlp/what-is-retrieval-augmented-generation-rag/

### Criando o Banco de dados vetorial (Chroma DB)

In [None]:
# exemplo_09.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)


def cria_banco_de_dados_vetorial(path_documentos:str) -> None:
    try:
        # Carrega os documentos do diret√≥rio especificado
        documents = PyPDFDirectoryLoader(path_documentos).load()

        # Usando embeddings do OpenAI
        embeddings = OpenAIEmbeddings()

        # Cria um banco de dados vetorial usando Chroma
        split_documents = RecursiveCharacterTextSplitter(chunk_size=600, chunk_overlap=100).split_documents(documents)

        # Cria o banco de dados vetorial
        vectorstore = Chroma.from_documents(split_documents, embeddings, persist_directory=f'{OUTPUT_DOCUMENTS_DIR}vectorstore')

        print("Banco de dados vetorial criado com sucesso.")
    except Exception as e:
        print(f"Erro ao carregar documentos: {e}")

In [None]:
cria_banco_de_dados_vetorial(path_documentos=OUTPUT_DOCUMENTS_DIR)

### Carregando o banco vetorial criado

In [None]:
# exemplo_10.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)


def carrega_banco_de_dados_vetorial(path_documentos:str) -> Chroma:
    try:
        # Carrega o banco de dados vetorial existente
        embeddings = OpenAIEmbeddings()
        vectorstore = Chroma(persist_directory=path_documentos, embedding_function=embeddings)
        return vectorstore
    except Exception as e:
        print(f"Erro ao carregar o banco de dados vetorial: {e}")
        return None

In [None]:
vectorstore = carrega_banco_de_dados_vetorial(f'{OUTPUT_DOCUMENTS_DIR}vectorstore')
docs = None

if vectorstore:
    retriever = vectorstore.as_retriever()
    docs = retriever.invoke("Data H")
    print(docs)
else:
    print("N√£o foi poss√≠vel carregar o banco de dados vetorial.")

### Criando o Agente com o RAG

![rag](https://media.geeksforgeeks.org/wp-content/uploads/20250210190608027719/How-Rag-works.webp)

#### Carregando as bibliotecas

In [None]:
# exemplo_11.py


# Visualizar os detalhes da execu√ß√£o
set_debug(False)

#### Carregando o banco vetorial

In [None]:
def carrega_banco_de_dados_vetorial(path_documentos:str) -> Chroma:
    try:
        # Carrega o banco de dados vetorial existente
        embeddings = OpenAIEmbeddings()
        vectorstore = Chroma(persist_directory=path_documentos, embedding_function=embeddings)
        return vectorstore
    except Exception as e:
        print(f"Erro ao carregar o banco de dados vetorial: {e}")
        return None


### Busca os dados e Cria o Contexto

In [None]:
def busca_na_base_de_documentos(pergunta:str) -> str:
    """Use esta ferramenta para responder perguntas sobre a Data H, seus produtos como NIC, Consultoria, Cyber Seguran√ßa,
       ou qualquer informa√ß√£o contida na base de conhecimento. A entrada deve ser a pergunta do usu√°rio."""
    vectorstore = carrega_banco_de_dados_vetorial(f'{OUTPUT_DOCUMENTS_DIR}vectorstore')
    contexto = None
    if vectorstore:
        retriever = vectorstore.as_retriever()
        docs = retriever.invoke(pergunta)
        contexto = "\n\n".join([doc.page_content for doc in docs])
    return contexto


#### Cria o agente

In [None]:
def agente_langchain(llm:BaseChatModel) -> dict:
    ferramentas = []
    memoria = ConversationBufferMemory(memory_key="chat_history", return_messages=True, input_key="input") # Retorna o hist√≥rico como uma lista de objetos de mensagem
    prompt = PromptTemplate(
        input_variables=["input", "context", "chat_history", "agent_scratchpad"], # Vari√°veis de entrada
        template="""{chat_history}
            Voc√™ √© um agente de IA especializado em responder perguntas.
            Contexto: {context}
            Pergunta: {input}
            {agent_scratchpad}
        """
    )
    agente = create_tool_calling_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas, memory=memoria)
    return executor_do_agente

### Testando o RAG

In [None]:
executor_do_agente = agente_langchain(llm_padrao)

pergunta = "O que √© o NIC?"

#### Sem contexto

In [None]:
contexto = ''
resposta = executor_do_agente.invoke({"input": pergunta, "context": contexto})
print(f'\n\nResposta sem Contexto: {resposta.get("output", "N√£o encontrei a resposta")}\n')

#### Com contexto RAG

In [None]:
contexto = busca_na_base_de_documentos(pergunta) or ''
resposta = executor_do_agente.invoke({"input": pergunta, "context": contexto})
print(f'\n\nResposta com Contexto: {resposta.get("output", "N√£o encontrei a resposta")}\n')

In [None]:
pergunta = "De qual empresa √© esse produto e onde ela fica?"
contexto = busca_na_base_de_documentos(pergunta) or ''
resposta = executor_do_agente.invoke({"input": pergunta, "context": contexto})
print(f'\n\nResposta com Contexto e Mem√≥ria: {resposta.get("output", "N√£o encontrei a resposta")}\n')

## Tipos de Agentes

### AgentExecutor

* `AgentExecutor` (orquestrador): √© a classe principal no LangChain respons√°vel por orquestrar todo o ciclo de vida de um agente. Ele √© o "**motor**" que gerencia o fluxo de trabalho. Sua fun√ß√£o √©:

\

![grafico](https://middleware.datah.ai/agent_figura_05.png?12)

### ReAct

* **ReAct** (O Padr√£o de Racioc√≠nio) √© um acr√¥nimo para Reasoning and Acting (Racioc√≠nio e A√ß√£o). Ele √© um padr√£o de pensamento que um agente segue para tomar decis√µes. No padr√£o ReAct, o agente n√£o apenas responde, ele ‚Äú**pensa em voz alta**‚Äù:

\

![grafico](https://middleware.datah.ai/agent_figura_06.png?12)

\


* **Pensamento**: O agente descreve o seu racioc√≠nio. Ele analisa a pergunta e decide qual seria o pr√≥ximo passo.
* **A√ß√£o**: O agente decide qual ferramenta usar e com quais argumentos.
* **Observa√ß√£o**: A sa√≠da da ferramenta. √â o resultado real da a√ß√£o.
* **Resposta Final**: Quando o agente determina que a tarefa est√° conclu√≠da, ele para de raciocinar e fornece a resposta ao usu√°rio.





### Outros Tipos

O **ReAct** √© o padr√£o de racioc√≠nio mais popular, mas o `AgentExecutor` no LangChain pode ser configurado com **outros tipos de l√≥gica de agente**. Os mais comuns s√£o:

* **ReAct Zero-shot**: A vers√£o mais b√°sica do ReAct, onde o agente decide a a√ß√£o com base apenas na sua capacidade de racioc√≠nio.
* **Conversational ReAct**: Uma extens√£o do ReAct que usa mem√≥ria e hist√≥rico de conversa, tornando-o ideal para chatbots.
* **OpenAI Functions / OpenAI Tools**: Este √© um tipo de agente que se baseia na funcionalidade de "**chamada de fun√ß√£o**" dos modelos da OpenAI. Em vez de o agente gerar um texto no formato **Thought/Action**, o pr√≥prio modelo gera uma chamada de fun√ß√£o estruturada (**uma AgentAction**) que o `AgentExecutor` ent√£o executa. √â uma abordagem mais direta.

In [None]:
# exemplo_12.py

# Visualizar os detalhes da execu√ß√£o
set_debug(True)


def agente_langchain(llm:BaseChatModel) -> dict:
    ferramentas = [PythonAstREPLTool()]

    prompt = hub.pull("hwchase17/react")
    print('\n','-'*40,'\n',prompt.template, '\n','-'*40, '\n')

    agente = create_react_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas, handle_parsing_errors=True)
    return executor_do_agente


In [None]:
executor_do_agente = agente_langchain(llm_groq_p)  # DeepSeek R1

pergunta = "Qual √© a √°rea do tri√¢ngulo com base 10 e altura 5?"

resposta = executor_do_agente.invoke({"input": pergunta})
print(f'\n\nResposta DeepSeek R1: {resposta.get("output", "N√£o encontrei a resposta")}\n')

## MCP - Model Context Protocol

O MCP (**Model Context Protocol**) √© um protocolo aberto que visa padronizar a forma como aplica√ß√µes de IA, como agentes, interagem com ferramentas externas e fontes de dados.

Pense no MCP como um "**adaptador universal**" para a IA. Em vez de cada aplica√ß√£o de IA ter que ser codificada para se comunicar com centenas de APIs de ferramentas diferentes, o MCP oferece uma interface comum. Isso permite que qualquer modelo de linguagem que entenda o protocolo possa usar qualquer ferramenta compat√≠vel com o MCP, independentemente de quem as criou.


### Integra√ß√£o sem MCP


\

![mcp](https://middleware.datah.ai/agent_figura_07.png?12)

### Integra√ß√£o com MCP

\

![mcp2](https://middleware.datah.ai/agent_figura_08.png?12)

### Protocolos MCP

* **SSE (Server-Sent Events)**
√â um protocolo de comunica√ß√£o que funciona sobre HTTP. Sua principal caracter√≠stica √© a comunica√ß√£o unidirecional, onde o servidor envia dados para o cliente em tempo real, atrav√©s de uma conex√£o HTTP persistente.

* **STDIO (Standard Input/Output)**
√â um conceito de comunica√ß√£o fundamental em sistemas operacionais, n√£o um protocolo de rede. Ele se refere aos canais de comunica√ß√£o padr√£o de um programa: **stdin** (entrada padr√£o), **stdout** (sa√≠da padr√£o) e **stderr** (sa√≠da de erro padr√£o).

### Diferen√ßas entre os protocolos

| Caracter√≠stica | SSE                                    | STDIO                               |
|----------------|----------------------------------------|-------------------------------------|
| Ambiente       | Comunica√ß√£o de rede (cliente-servidor) | Comunica√ß√£o local (inter-processos) |
| Fluxo          | Unidirecional (servidor -> cliente)    | Bidirecional (leitura e escrita)    |
| Protocolo      | HTTP                                   | Canais de sistema operacional       |
| Uso em IA      | Streaming de respostas de LLMs         | Comunica√ß√£o com ferramentas locais  |

### Exemplo de utiliza√ß√£o no Cursor AI.

```python
{
¬† "mcpServers": {
¬† ¬† ¬† "local-server-tools": {
¬† ¬† ¬† ¬† "command": "c:/Dados/Cursos/ia/.venv/Scripts/python.exe",
¬† ¬† ¬† ¬† "args": ["c:/Dados/Cursos/ia/mcp/local_server.py"]
¬† ¬† ¬† },
¬† ¬† ¬† "datah": {
¬† ¬† ¬† ¬† ¬† ¬† "url": "http://127.0.0.1:5008/sse",
¬† ¬† ¬† ¬† ¬† ¬† "transport": "sse"
¬† ¬† ¬† }
¬† }
}

```

### Vamos para o c√≥digo

***IMPORTANTE: Esse c√≥digo deve ser rodado localmente e n√£o no colab.***

#### Rotinas de apoio.

N√£o deixa na ferramenta toda a responsabilidade, transforma em componentes para serem reutilizados.

In [None]:
# mcp_helpers.py

class ArxivHelper:

    @property
    def base_url(self):
        return 'https://export.arxiv.org/api/query'

    async def make_arxiv_request(self, url:str) -> str | None:
        async with httpx.AsyncClient() as client:
            try:
                response = await client.get(url, headers={"User-Agent": 'arxiv-search-app/1.0'}, timeout=30)
                response.raise_for_status()
                return response.text
            except Exception as e:
                print(e)
                return None

    def parse_arxiv_response(self, xml_data:str) -> list[dict[str, Any]]:
        if not xml_data:
            return []

        root = ET.fromstring(xml_data)

        namespaces = {
            "atom": 'http://www.w3.org/2005/Atom',
            "arxiv": 'http://arxiv.org/schemas/atom'
        }

        entries = []
        for entry in root.findall('.//atom:entry', namespaces):
            e_title = entry.find('atom:title', namespaces)
            e_summary = entry.find('atom:summary', namespaces)
            e_link =  entry.find('atom:id', namespaces)
            e_published = entry.find('atom:published', namespaces)

            title = e_title.text.strip() if e_title is not None else ""
            summary = e_summary.text.strip() if e_summary is not None else ""

            authors = []
            for author in entry.findall('.//atom:author/atom:name', namespaces):
                authors.append(author.text.strip())

            link = e_link.text.strip() if e_link is not None else ""
            published = e_published.text.strip() if e_published is not None else ""

            entries.append(dict(
                title=title,
                summary=summary,
                authors=authors,
                link=link,
                published=published
            ))

        return entries

    def format_paper(self, paper:dict) -> str:
        authors_str = " ".join(paper.get('authors', ['Unknown author']))
        return f"""
            title: {paper.get('title', '')}
            authors: {authors_str}
            published: {paper.get('published', '')[:10]}
            link: {paper.get('link', '')}
            summary: {paper.get('summary', '')}
        """


class MailRecipient(object):

    def __init__(self):
        self.__recipients: List = []

    def add(self, email: str, name: str = None):
        if not name:
            self.__recipients.append(email)
        else:
            self.__recipients.append(formataddr((name, email)))

    def clear(self):
        self.__recipients = []

    def get(self) -> str:
        return ', '.join(self.__recipients)

    def has_item(self) -> bool:
        if not self.__recipients:
            return False
        return len(self.__recipients) > 0


class MailMessage(object):

    def __init__(self, sender_email: str, sender_name: str = None):
        self.__message: MIMEMultipart = MIMEMultipart()
        self.__from: str = sender_email
        self.__from_name: str = sender_name
        self.__body: Union[str, None] = None
        self.__subject: Union[str, None] = None
        self.to: MailRecipient = MailRecipient()
        self.cc: MailRecipient = MailRecipient()
        self.bcc: MailRecipient = MailRecipient()

    def get_message(self) -> MIMEMultipart:
        self.__message['From'] = formataddr((self.__from_name, self.__from)) if self.__from_name else self.__from
        self.__message['Subject'] = self.__subject
        self.__message['To'] = self.to.get()
        if self.cc.has_item():
            self.__message['Cc'] = self.cc.get()
        if self.bcc.has_item():
            self.__message['Bcc'] = self.bcc.get()
        self.__message.attach(self.__body)
        self.__validate_mail_message()
        return self.__message

    def set_subject(self, subject: str):
        self.__subject = subject

    def set_text_body(self, text):
        self.__body = MIMEText(text, "plain")

    def set_html_body(self, html):
        self.__body = MIMEText(html, "html")

    def attach_file(self, filename: str, mime_type: str = "application/octet-stream"):
        with open(filename, 'rb') as attachment:
            mime_type_parts: List[str] = mime_type.split('/')
            part: MIMEBase = MIMEBase(mime_type_parts[0], mime_type_parts[1])
            part.set_payload(attachment.read())
        encoders.encode_base64(part)
        part.add_header("Content-Disposition", f"attachment; filename= {Path(filename).name}")
        self.__message.attach(part)

    def __validate_mail_message(self):
        if not self.__subject:
            raise ValueError("The email subject is required.")
        if not self.__body:
            raise ValueError("The email body is required.")
        if not self.__message['From']:
            raise ValueError('From is required.')
        if len(self.__message['From']) == 0:
            raise ValueError("The sender (from) is required.")
        if not self.to.has_item() and not self.cc.has_item() and not self.bcc.has_item():
            raise ValueError("Add at least a email to send this message.")


class SMTPServer(object):

    def __init__(self, host: str, port: int = 587,
                 username: str = None, password: str = None,
                 has_ssl: bool = False, has_tls: bool = True,
                 has_authentication: bool = True):

        self.__host: str = host
        self.__port: int = port
        self.__username: str = username
        self.__password: str = password
        self.__tls: bool = has_tls
        self.__ssl: bool = has_ssl
        self.__authentication: bool = has_authentication
        self.__context = ssl.create_default_context()

    def connect(self) -> Union[SMTP, SMTP_SSL]:
        try:
            if self.__tls:
                self.__server = SMTP(host=self.__host, port=self.__port)
                self.__server.ehlo()
                self.__server.starttls(context=self.__context)
                self.__server.ehlo()
            elif self.__ssl:
                self.__server = SMTP_SSL(host=self.__host, port=self.__port, context=self.__context)
            else:
                self.__server = SMTP(host=self.__host, port=self.__port)

            if self.__authentication:
                self.__server.login(user=self.__username, password=self.__password)

        except Exception as e:
            if self.__server:
                self.disconnect()
            raise e
        return self.__server

    def disconnect(self):
        self.__check_connection()
        self.__server.quit()

    def send(self, mail_message: MailMessage) -> bool:
        self.__check_connection()
        self.__server.send_message(msg=mail_message.get_message())
        return True

    def get_sender(self) -> str:
        return self.__username

    def __check_connection(self):
        if not self.__server:
            raise ConnectionError("The server is not connected. Connect first.")



#### Criando o Servidor MCP

***IMPORTANTE: N√£o d√° para rodar no colab, apenas local.***

In [None]:
# mcp_server.py

async def search_arxiv_tool(query:str, max_results:int = 5) -> str:
    """
    Esta ferramenta busca por artigos cient√≠ficos no site arxiv.org

    Args:
        query (str): O assunto que deseja buscar no site.
        max_results (int, optional): Quantidade m√°xima de artigos retornados pelo site. O padr√£o √© 5.
    """
    try:
        arxiv_mcp_tool = ArxivHelper()
        formatted_query = query.replace(" ", '+')

        url = f"{arxiv_mcp_tool.base_url}?search_query=all:{formatted_query}&start=0&max_results={max_results}"
        xml_data = await arxiv_mcp_tool.make_arxiv_request(url)
        if not xml_data:
            raise ValueError("N√£o foi capaz de recuperar os dados do arxiv.")

        papers = arxiv_mcp_tool.parse_arxiv_response(xml_data)
        if not papers:
            return FileNotFoundError("Artigos n√£o encontrados.")

        paper_texts = [arxiv_mcp_tool.format_paper(paper) for paper in papers]
        return "\n---\n".join(paper_texts)
    except Exception as e:
        return f"ERRO: {str(e)}"


async def send_mail(subject:str, email_to:str, email_content:str, email_attach_file:str=None) -> str:
    """
    Esta ferramenta envia um e-mail para uma pessoa.

    Args:
        subject (str): √â o assunto do email, e deve ser um t√≠tulo curto.
        email_to (str): √â o e-mail para quem ser√° enviado o email. Este argumento pode receber mais de um email, em uma string separados por "," or ";". Ex: usuario1@domain.com, usuario2@domain.com
        email_content (str): √â o conte√∫do do email
        email_attach_file (str, optional): √â o caminho absoluto de um arquivo para anexar ao email. Se n√£o existir anexo, o valor deve ser None. O valor padr√£o √© None.
    """
    username=os.getenv('SMTP_USERNAME')
    password=os.getenv('SMTP_PASSWORD')
    smtp = SMTPServer(host='smtp.gmail.com', port=587, username=username, password=password, has_ssl=True, has_tls=True, has_authentication=True)

    sender_email = 'marcelopiovan@gmail.com'
    sender_name = 'Marcelo Piovan'

    message = MailMessage(sender_email=sender_email, sender_name=sender_name)
    message.set_subject(subject=subject)
    for email in re.split(r'[,;]', email_to):
        email = email.strip()
        if email:
            message.to.add(email=email)

    message.set_html_body(email_content)

    if email_attach_file is not None and email_attach_file != '' and len(email_attach_file) > 0:
        if not os.path.isfile(email_attach_file):
            raise FileNotFoundError(f"Arquivo n√£o encontrado: {email_attach_file}")
        message.attach_file(filename=email_attach_file)

    try:
        smtp.connect()
        smtp.send(message)
        smtp.disconnect()
        return 'Email enviado com sucesso!'
    except Exception as e:
        return f"ERRO: {str(e)}"


#### Rodando o servidor

In [None]:
if RUNNING_IN_COLAB:
    raise NotImplementedError('Esse servidor deve rodar localmente.')


if __name__ == "__main__":
    print("üöÄ Iniciando o servidor ... ")
    mcp = FastMCP(name="DataH_MCP", port=5008)
    print(f'URL para verifica√ß√£o "http://localhost:5008/sse"')
    mcp.add_tool(search_arxiv_tool)
    mcp.add_tool(send_mail)
    mcp.run(transport='sse')

### Usando um Servidor MCP - Cliente

***IMPORTANTE: N√£o d√° para rodar no colab, apenas local.***

In [None]:
# mcp_client.py

set_debug(False)

server_params = {
    # "local-server-tools": {
    #     "command": "C:\\Dados\\Projetos\\aulas\\agent\\.venv\\Scripts\\python.exe",
    #     "args": ["C:/Dados/Projetos/aulas/agent/src/mcp_server.py"],
    #     "transport": "stdio",
    # },
    "server-tools": {
        "url": "http://127.0.0.1:5008/sse",
        "transport": "sse",
    }
}

async def run_agent():
    model:str = "gpt-4o-mini"
    checkpointer = InMemorySaver()

    async with MultiServerMCPClient(server_params) as client:

        all_tools = client.get_tools()
        if not all_tools:
            print("\033[31mNenhuma ferramenta dispon√≠vel no servidor MCP.\033[0m")

        for server, tools in client.server_name_to_tools.items():
            print(f'\033[31m\n==== MCP Server UP! - {server} ====\033[0m')
            for tool in tools:
                print(f'\033[35m* {tool.name} *\033[0m\n{tool.description}\n')


        prompt = f"""
            Sua tarefa √© solucionar as perguntas do usu√°rio, usando as ferramentas dispon√≠veis e seu pr√≥prio conhecimento.
            Responda sempre em portugu√™s.
        """
        agent = create_react_agent_graph(model, all_tools, checkpointer=checkpointer, prompt=prompt)

        session_id = str(uuid4())
        config = {"configurable": {"thread_id": session_id}}

        while True:
            user_input = input("\033[33mFa√ßa a sua pergunta: \033[0m")

            if user_input == "sair":
                break

            if user_input == "limpar":
                print("\033c")
                continue

            print(f"\033[34mUsu√°rio: {user_input}\033[0m")

            agent_response = await agent.ainvoke({"messages": user_input}, config=config)
            print(f"\033[32mAgente: {agent_response['messages'][-1].content}\033[0m")

            checkpoint = await checkpointer.aget(config)



#### Rodando o Cliente

In [None]:
if RUNNING_IN_COLAB:
    raise NotImplementedError('Esse cliente deve rodar localmente.')


if __name__ == "__main__":
    result = asyncio.run(run_agent())

## LangGraph

O **LangGraph** √© uma biblioteca constru√≠da sobre o LangChain que serve para criar agentes e **fluxos de trabalho multi-etapa** de forma mais robusta e controlada. Em vez de modelar um agente como uma simples cadeia linear, o LangGraph o representa como um grafo de estados, permitindo criar l√≥gicas complexas com n√≥s e arestas.

\

![graph](https://middleware.datah.ai/graph.png?12)



Pense no `AgentExecutor` como um motor de carro que s√≥ sabe seguir um caminho em **linha reta** (o loop de racioc√≠nio ReAct).

O `LangGraph` √© como um **sistema de navega√ß√£o completo** que permite ao motorista escolher caminhos diferentes, fazer retornos, parar em pontos de interesse e at√© mesmo mudar de plano no meio da jornada.

O `LangGraph` √© ideal para construir agentes que precisam de l√≥gica de controle complexa. Ele √© a ferramenta para situa√ß√µes onde um simples AgentExecutor se torna limitado, como:

* **L√≥gica Condicional**: Criar agentes que podem tomar decis√µes de "se/ent√£o" em cada passo.

>> *Ex: Se a busca na ferramenta A falhar, tente a ferramenta B.*

* **M√∫ltiplos Fluxos de Trabalho**: Modelar um agente que pode executar diferentes tarefas com base no input inicial.

>> *Ex: Se a pergunta for sobre finan√ßas, siga um fluxo. Se for sobre atendimento ao cliente, siga outro.*

* **Ciclos de Conversa Complexos**: Gerenciar conversas que precisam de aprova√ß√£o do usu√°rio, feedback ou valida√ß√£o antes de continuar para o pr√≥ximo passo.

* **Agentes de Longo Prazo**: Modelar sistemas que precisam manter um estado persistente e complexo ao longo de v√°rias intera√ß√µes, como agentes que acompanham o progresso de um projeto.




O `LangGraph` usa o conceito de **n√≥s** (as fun√ß√µes ou a√ß√µes a serem executadas) e **arestas** (as transi√ß√µes entre os n√≥s), com a habilidade de definir **condicional_edges** para ramifica√ß√µes din√¢micas no fluxo.

\

![grafico](https://middleware.datah.ai/agent_figura_09.png?12)

| Vantagens                                                                                                                                                                             | Desvantagens                                                                                                                                                     |
|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Controle Total do Fluxo: Voc√™ define cada etapa e transi√ß√£o do agente, eliminando o "efeito caixa preta" do AgentExecutor.                                                            | Complexidade Inicial: O aprendizado e a configura√ß√£o inicial s√£o mais complexos.                                                                                 |
| Robustez: √â mais f√°cil de criar mecanismos de recupera√ß√£o e tratamento de erros, direcionando o fluxo para um n√≥ de tratamento de erros em caso de falha.                             | N√£o √© para Todos os Casos: Para agentes ReAct simples ou cadeias lineares, o AgentExecutor com LCEL √© mais do que suficiente e muito mais r√°pido de implementar. |
| Estado Gerenciado: Ele gerencia o estado completo do agente (incluindo o hist√≥rico de conversa e sa√≠das de ferramentas) em um √∫nico objeto de State, tornando a depura√ß√£o mais f√°cil. | Curva de Aprendizagem: Requer uma compreens√£o de conceitos de grafos e m√°quinas de estado, o que pode ser um obst√°culo para iniciantes.                          |

In [None]:
# exemplo_13.py

# Visualizar os detalhes da execu√ß√£o
set_debug(False)


# Formata√ß√£o das respostas
def formatar_classificacao_para_estado(classificacao: str):
    palavra_chave = classificacao.lower().strip().split()[0]
    return {"classificacao": palavra_chave}

def formatar_resposta_caes(resposta: str):
    return {"resposta": resposta}

def formatar_resposta_gatos(resposta: str):
    return {"resposta": resposta}



# Cadeias para cada especialidade
def cadeia_cachorro(llm):
    prompt_caes = ChatPromptTemplate.from_template(
        "Voc√™ √© um especialista em c√£es. Responda a pergunta a seguir de forma concisa: {pergunta}"
    )
    return prompt_caes | llm | StrOutputParser() | RunnableLambda(formatar_resposta_caes)


def cadeia_gato(llm):
    prompt_gatos = ChatPromptTemplate.from_template(
        "Voc√™ √© um especialista em gatos. Responda a pergunta a seguir de forma concisa: {pergunta}"
    )
    return prompt_gatos | llm | StrOutputParser() | RunnableLambda(formatar_resposta_gatos)


def cadeia_classificador(llm):
    classificador_prompt = PromptTemplate.from_template(
        """Classifique a seguinte pergunta como 'caes' ou 'gatos'.
            Responda apenas com a palavra 'caes' ou 'gatos'.
        Pergunta: {pergunta}

        T√≥pico:"""
    )
    return classificador_prompt | llm | StrOutputParser() | RunnableLambda(formatar_classificacao_para_estado)


# Define o estado do nosso grafo
class GrafoState(TypedDict):
    pergunta: str
    classificacao: str
    resposta: str


# Condicional para rotear a pergunta
def rotear_pergunta(state):
    if "caes" in state["classificacao"].lower():
        return "cadeia_caes"
    elif "gatos" in state["classificacao"].lower():
        return "cadeia_gatos"
    else:
        # Padr√£o para c√£es se n√£o conseguir classificar
        return "cadeia_caes"


def fluxo(llm):
    workflow = StateGraph(GrafoState)

    # Adiciona os n√≥s (etapas)
    workflow.add_node("classificador", cadeia_classificador(llm))
    workflow.add_node("cadeia_caes", cadeia_cachorro(llm))
    workflow.add_node("cadeia_gatos", cadeia_gato(llm))

    # O in√≠cio do grafo
    workflow.set_entry_point("classificador")

    workflow.add_conditional_edges(
        "classificador",
        rotear_pergunta,
        {
            "cadeia_caes": "cadeia_caes",
            "cadeia_gatos": "cadeia_gatos",
        },
    )

    # E os pontos de sa√≠da
    workflow.add_edge("cadeia_caes", END)
    workflow.add_edge("cadeia_gatos", END)

    # Compila o grafo para uso
    return workflow.compile()


In [None]:
workflow = fluxo(llm_padrao)

# Mostra o fluxo
workflow.get_graph().draw_png("graph.png")
workflow.get_graph().print_ascii()

img = mpimg.imread('graph.png')
imgplot = plt.imshow(img)
plt.axis('off')
plt.title('Graph')
plt.show()

In [None]:
# Executando o grafo com uma pergunta sobre c√£es
pergunta_caes = "Por que os cachorros gostam tanto de brincar de buscar?"
resultado_caes = workflow.invoke({"pergunta": pergunta_caes})
print(f"Pergunta: {pergunta_caes}")
print(f"Resposta: {resultado_caes['resposta']}\n")

In [None]:
# Executando o grafo com uma pergunta sobre gatos
pergunta_gatos = "Qual √© o som mais comum que os gatos fazem?"
resultado_gatos = workflow.invoke({"pergunta": pergunta_gatos})
print(f"Pergunta: {pergunta_gatos}")
print(f"Resposta: {resultado_gatos['resposta']}")

## Agente analisador de CSV


In [None]:
set_debug(False)


@tool
def get_current_time(*args, **kwargs) -> str:
    """O objetivo dessa ferramenta √© retornar a data e hora atual."""
    now = datetime.datetime.now()
    return f"A data e hora atual √©: {now.strftime('%Y-%m-%d %H:%M:%S')}"


def dataframe_python_code(df) -> str:
    return Tool(
                name="C√≥digos Python",
                func=PythonAstREPLTool(locals={"df": df}),
                description="""Utilize esta ferramenta sempre que o usu√°rio solicitar c√°lculos, consultas, an√°lises ou transforma√ß√µes
                espec√≠ficas usando Python diretamente sobre o DataFrame `df`.
                Exemplos de uso incluem: "Quais seriam as principais not√≠cias da semana?", "Quais s√£o os valores √∫nicos da coluna Y?",
                "Qual a correla√ß√£o entre A e B?". Evite utilizar esta ferramenta para solicita√ß√µes mais amplas ou descritivas,
                como informa√ß√µes gerais sobre o DataFrame, resumos estat√≠sticos completos ou gera√ß√£o de gr√°ficos ‚Äî nesses casos,
                use as ferramentas apropriadas."""
            )


In [None]:
def agente_langchain(llm:BaseChatModel, df:pd.DataFrame) -> dict:
    ferramentas = [dataframe_python_code(df), get_current_time]

    df_head:str = df.head().to_markdown()

    prompt = PromptTemplate(
                    input_variables=["input", "agent_scratchpad", "tools", "tool_names"],
                    partial_variables={"df_head": df_head},
                    template = """
                        Voc√™ √© um assistente que sempre responde em portugu√™s.

                        Voc√™ tem acesso a um dataframe pandas chamado `df`.
                        Aqui est√£o as primeiras linhas do DataFrame, obtidas com `df.head().to_markdown()`:

                        {df_head}

                        Responda √†s seguintes perguntas da melhor forma poss√≠vel.

                        Para isso, voc√™ tem acesso √†s seguintes ferramentas:

                        {tools}

                        Use o seguinte formato:

                        Question: a pergunta de entrada que voc√™ deve responder
                        Thought: voc√™ deve sempre pensar no que fazer
                        Action: a a√ß√£o a ser tomada, deve ser uma das [{tool_names}]
                        Action Input: a entrada para a a√ß√£o
                        Observation: o resultado da a√ß√£o
                        ... (este Thought/Action/Action Input/Observation pode se repetir N vezes)
                        Thought: Agora eu sei a resposta final
                        Final Answer: a resposta final para a pergunta de entrada original.

                        Comece!

                        Question: {input}
                        Thought: {agent_scratchpad}"""
                )

    agente = create_react_agent(llm, ferramentas, prompt)
    executor_do_agente = AgentExecutor(agent=agente, tools=ferramentas, handle_parsing_errors=True)
    return executor_do_agente

In [None]:
df = pd.read_csv(f'{OUTPUT_DOCUMENTS_DIR}noticias_publicadas_ultimos_30d.csv')
agente = agente_langchain(llm_openai, df)
resposta = agente.invoke({"input": "Quais foram as top 5 editorias com mais not√≠cias na segunda semana de julho?"})
print(resposta.get("output", "N√£o encontrei a resposta"))

In [None]:
df = pd.read_csv(f'{OUTPUT_DOCUMENTS_DIR}leitura_ultimos_5d_amostra.csv')
agente = agente_langchain(llm_openai, df)
resposta = agente.invoke({"input": "Qual √© o percentual de assinantes e n√£o assinantes?"})
print(resposta.get("output", "N√£o encontrei a resposta"))

In [None]:
resposta = agente.invoke({"input": "Gere um gr√°fico de pizza demonstrando cada tipo de usu√°rio."})
print(resposta.get("output", "N√£o encontrei a resposta"))

![grafico](https://middleware.datah.ai/agent_figura_10.png?12)

# Anexo I - Groq

## Criando uma conta no Groq para conseguirmos uma **Free API Key** üòé

groq\
Fonte: https://groq.com/

**Groq** (https://groq.com) √© uma empresa americana de intelig√™ncia artificial fundada em 2016 por ex-engenheiros do Google. Seu principal diferencial e inova√ß√£o reside no desenvolvimento de um circuito integrado espec√≠fico para aplica√ß√µes de IA que eles chamam de **LPU** (**Language Processing Unit**), e hardware relacionado.

A miss√£o da Groq √© acelerar o desempenho da infer√™ncia de cargas de trabalho de IA, ou seja, o processo de usar um modelo de IA j√° treinado para gerar previs√µes ou respostas. Eles se destacam por oferecer velocidade de processamento e efici√™ncia incompar√°veis, superando as GPUs (Graphics Processing Units) nesse aspecto, que foram originalmente projetadas para processamento gr√°fico e adaptadas para IA.

**Pontos Chave sobre o Groq:**

1. **LPU (Language Processing Unit)**: √â o chip especializado da Groq. Diferente das GPUs, que s√£o mais vers√°teis, as LPUs foram projetadas especificamente para a infer√™ncia de modelos de IA, especialmente Large Language Models (LLMs - Grandes Modelos de Linguagem). Essa especializa√ß√£o permite que as LPUs atinjam lat√™ncias ultrabaixas e alto throughput (taxa de gera√ß√£o de tokens por segundo).
2. **Velocidade Instant√¢nea**: A Groq tem ganhado destaque no mercado por sua capacidade de gerar respostas de LLMs quase instantaneamente. Eles frequentemente demonstram que seus sistemas podem gerar centenas ou at√© milhares de tokens por segundo, um desempenho significativamente mais r√°pido do que muitas outras solu√ß√µes dispon√≠veis.
3. **Efici√™ncia Energ√©tica e Custo**: Al√©m da velocidade, a arquitetura da LPU tamb√©m √© otimizada para maior efici√™ncia energ√©tica e menor custo por infer√™ncia em compara√ß√£o com as GPUs tradicionais.

\
Em resumo, a **Groq** se posiciona como uma alternativa poderosa √† **NVIDIA** no espa√ßo de hardware de IA, focando especificamente em oferecer a infer√™ncia de LLMs mais r√°pida e eficiente do mercado por meio de sua inovadora tecnologia LPU.

At√© a gera√ß√£o desse material o Groq oferece API Key gratuitas para desenvolvedores testarem diversos tipos de modelos. Para conseguir uma API, voc√™ deve se registrar no Groq e criar uma Free API Key.

\

![groq](https://middleware.datah.ai/groq.gif)

# Anexo II - Secrets

Agora vamos configurar nossa API nos **Secrets** Google Colaboratory.

\
![secrets](https://middleware.datah.ai/secrets.gif)

# Anexo III - Reposit√≥rio

Baixe o projeto utilizando o link: https://knowledgebase.datah.com.br/cmpiovan/aula-agentes-2025.git