<a href="https://colab.research.google.com/github/diegohugo570/backup-python/blob/main/01_Aula_Pr%C3%A1tica_LangGraph_do_Zero.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install -qU langchain-openai langgraph
!pip install --upgrade google-search-results



In [None]:
# Bibliotecas
from pydantic import BaseModel, Field
from typing_extensions import TypedDict, Annotated
from typing import List

from langchain_core.messages import AnyMessage, HumanMessage, AIMessage
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from bs4 import BeautifulSoup
import requests

from langgraph.graph import StateGraph, START, END
from langgraph.checkpoint.memory import MemorySaver

import os
from google.colab import userdata

os.environ["OPENAI_API_KEY"] = userdata.get('OPENAI_API_KEY')

## Fun√ß√µes Auxiliares

In [None]:
def get_google_results_links(query: str, num_results: int = 1):
  url = "https://serpapi.com/search"
  params = {
      "engine": "google",
      "q": query,
      "api_key": userdata.get("SERP_API_KEY")
  }

  response = requests.get(url, params=params)
  return list(map(lambda x: x.get("link", ""), response.json()["related_questions"]))[:num_results]

In [None]:
def extract_text_from_site(url):
  soup = BeautifulSoup(requests.get(url).text)
  texto = ""
  for tag in soup.find_all(["p", "h1", "h2", "h3", "h4", "h5", "h6"]):
    texto += tag.get_text() + "\n"
  return texto

In [None]:
def format_history(history, n: int = -1):
    if not history:
        return ""

    response = ""
    total_messages = len(history)
    total_pairs = total_messages // 2

    if n == -1 or n > total_pairs:
        n = total_pairs
    elif n <= 0:
        n = 0

    start_idx = total_messages - (n * 2)
    if start_idx < 0:
        start_idx = 0

    for k in range(start_idx, total_messages, 2):
        human = history[k]
        response += f"- Usu√°rio: {human.content}\n"
        if k + 1 < total_messages:
            ai = history[k + 1]
            response += f"- Voc√™: {ai.content}\n"
    return response

## Defini√ß√£o do Estado

In [None]:
class State(TypedDict):
  mensagem: Annotated[str, "Mensagem do usu√°rio"]
  score: Annotated[int, "Nota do avaliador"]
  query: Annotated[str, "Query reescrita pelo agente"]
  resultado_pesquisa: Annotated[str, "Resultados da pesquisa"]
  fitness: Annotated[bool, "A pergunta √© sobre fitness ou n√£o?"]
  historico: Annotated[List[AnyMessage], "Hist√≥rico de perguntas"]
  resposta: Annotated[str, "Resposta do agente"]

# Defini√ß√£o das Sa√≠das Estruturadas

In [None]:
class RouterResponse(BaseModel):
  cot: List[str] = Field(description="Cadeia de pensamento do agente")
  fitness: bool = Field(description="Pergunta relacionada a fitness ou n√£o")

In [None]:
class QueryRewriterResponse(BaseModel):
  cot: List[str] = Field(description="Cadeia de pensamento do agente")
  query: str = Field(description="Query reescrita otimizada")

In [None]:
class VerificadorResponse(BaseModel):
  cot: List[str] = Field(description="Cadeia de pensamento do agente do agente")
  score: int = Field(description="N√∫mero entre 0 e 10")

## Criar os n√≥s

In [None]:
def router_node(state: State) -> State:
  mensagem = state["mensagem"]
  historico = state["historico"]

  prompt = """
  <Especialista>
  Voc√™ √© um agente especialista em classifica√ß√£o de inten√ß√£o de mensagens. Sua tarefa √© analisar conversas entre usu√°rios e o assistente e identificar se a inten√ß√£o do usu√°rio √© tirar d√∫vidas sobre conte√∫dos **fitness** (sa√∫de, bem-estar, nutri√ß√£o, emagrecimento, treino, academia, corpo etc.) ou **n√£o**.

  Seu papel √© exclusivamente classificar, sem responder perguntas ou dar opini√µes fora da an√°lise.
  </Especialista>

  <Contexto>
  Voc√™ receber√° duas entradas:
  1. Hist√≥rico da conversa em formato de lista de mensagens anteriores (pode estar vazio).
  2. √öltima mensagem enviada pelo usu√°rio (a que deve ser avaliada com mais peso).

  Com base no conte√∫do sem√¢ntico e lexical dessas mensagens, voc√™ dever√°:
  - Avaliar se o usu√°rio tem a inten√ß√£o de tirar d√∫vidas sobre conte√∫dos fitness.
  - Gerar uma **cadeia de pensamento l√≥gica** (em linguagem natural) justificando sua decis√£o.
  - Retornar um JSON contendo a cadeia de pensamento e um booleano indicando o resultado da classifica√ß√£o.
  </Contexto>

  <Instru√ß√£o>
  Leia o hist√≥rico e a √∫ltima mensagem. Analise o conte√∫do considerando palavras-chave, contexto sem√¢ntico e inten√ß√£o impl√≠cita. Considere sin√¥nimos e termos relacionados ao universo fitness.

  Se houver qualquer sinal que indique que a inten√ß√£o √© relacionada a fitness, classifique como `true`. Caso contr√°rio, `false`.

  Retorne apenas o JSON com os seguintes campos:
  - `cadeia_de_pensamento`: explica√ß√£o l√≥gica do racioc√≠nio seguido.
  - `fitness`: booleano indicando se √© sobre fitness ou n√£o.
  </Instru√ß√£o>

  <Tom de Comunica√ß√£o>
  T√©cnico, direto e objetivo. Nada al√©m do necess√°rio.
  </Tom de Comunica√ß√£o>

  <Hist√≥rico de mensagens>
  {historico}
  </Hist√≥rico de mensagens>

  <√öltima mensagem enviada pelo usu√°rio>
  {mensagem}
  </√öltima mensagem enviada pelo usu√°rio>
  """

  prompt_template = PromptTemplate.from_template(prompt)

  llm = ChatOpenAI(model = "gpt-4o-mini", temperature = 0.2)
  llm_strucutured = llm.with_structured_output(RouterResponse)

  chain = prompt_template | llm_strucutured

  resposta = chain.invoke({"historico": format_history(historico), "mensagem": mensagem})

  return {"fitness": resposta.fitness}

In [None]:
def verificador_coerencia_node(state: State) -> State:
  mensagem = state["mensagem"]
  historico = state["historico"]
  resultado_pesquisa = state["resultado_pesquisa"]

  prompt = """
 <Verificador>
  Voc√™ √© um agente especialista em verifica√ß√£o de coer√™ncia entre a d√∫vida do usu√°rio e os resultados encontrados em uma pesquisa do Google.

  Sua fun√ß√£o √© analisar se os resultados retornados pela pesquisa s√£o suficientes e coerentes para responder √† d√∫vida ou necessidade expressa pelo usu√°rio. Voc√™ n√£o deve responder √† d√∫vida, apenas avaliar se √© poss√≠vel respond√™-la com o material dispon√≠vel.
  </Verificador>

  <Contexto>
  Voc√™ receber√° tr√™s entradas:
  1. `historico`: uma lista contendo as mensagens anteriores trocadas entre o usu√°rio e o assistente.
  2. `mensagem_atual`: a √∫ltima mensagem enviada pelo usu√°rio, que deve ser analisada com mais peso.
  3. `resultado_pesquisa`: uma lista de trechos retornados da busca no Google, que podem conter partes de artigos, t√≠tulos, descri√ß√µes e links.

  Seu trabalho √© verificar se esses resultados s√£o suficientes para responder, com qualidade, a solicita√ß√£o feita pelo usu√°rio. N√£o considere apenas palavras-chave, mas a **qualidade, relev√¢ncia, atualidade e coer√™ncia contextual** dos conte√∫dos apresentados.
  </Contexto>

  <Instru√ß√£o>
  Analise o conte√∫do da √∫ltima mensagem do usu√°rio, complementando com o hist√≥rico se necess√°rio. Em seguida, avalie os `resultado_pesquisa` para verificar se:
  - Existe **rela√ß√£o direta** entre os conte√∫dos encontrados e o que foi perguntado.
  - Os resultados s√£o **suficientemente informativos** para permitir uma resposta clara, √∫til e bem embasada.

  Atribua um `score` de 0 a 10:
  - 0 = nenhum resultado √© √∫til
  - 10 = todos os elementos da d√∫vida podem ser plenamente respondidos com os resultados

  Retorne um JSON com os campos:
  - `cot`: cadeia de pensamento que justifica a nota atribu√≠da
  - `score`: valor inteiro entre 0 e 10
  </Instru√ß√£o>

  <Tom de Comunica√ß√£o>
  Preciso, t√©cnico e l√≥gico.
  </Tom de Comunica√ß√£o>

  <Hist√≥rico de mensagens>
  {historico}
  </Hist√≥rico de mensagens>

  <√öltima mensagem enviada pelo usu√°rio>
  {mensagem}
  </√öltima mensagem enviada pelo usu√°rio>

  <Resultados Pesquisa>
  {resultado_pesquisa}
  </Resultados Pesquisa>
  """

  prompt_template = PromptTemplate.from_template(prompt)

  llm = ChatOpenAI(model = "gpt-4o-mini", temperature = 0.2)
  llm_strucutured = llm.with_structured_output(VerificadorResponse)

  chain = prompt_template | llm_strucutured

  resposta = chain.invoke({"historico": format_history(historico), "mensagem": mensagem, "resultado_pesquisa": resultado_pesquisa})

  return {"score": resposta.score}

In [None]:
def query_rewriter_node(state: State) -> State:
  mensagem = state["mensagem"]
  historico = state["historico"]
  resultado_pesquisa = state["resultado_pesquisa"]
  query = state["query"]


  invoke_chain_dict = {"historico": format_history(historico), "mensagem": mensagem, "resultado_pesquisa": resultado_pesquisa}

  prompt = """
  <Especialista>
  Voc√™ √© um agente especialista em reescrita de queries para buscas no Google. Sua fun√ß√£o √© otimizar a query do usu√°rio para que os resultados da pesquisa sejam mais relevantes, precisos e √∫teis.
  </Especialista>

  <Contexto>
  Voc√™ receber√° tr√™s entradas:
  1. `historico`: uma lista com as mensagens anteriores trocadas entre o usu√°rio e o assistente.
  2. `mensagem_atual`: a √∫ltima mensagem enviada pelo usu√°rio, com maior peso na an√°lise.
  3. `resultado_pesquisa`: lista com os resultados da √∫ltima busca, considerados ruins ou pouco relevantes.

  Sua tarefa √© identificar por que os resultados anteriores foram insatisfat√≥rios e reescrever a query com mais clareza, especificidade e inten√ß√£o expl√≠cita, considerando o que o usu√°rio realmente quer saber.
  </Contexto>

  <Instru√ß√£o>
  Analise a inten√ß√£o do usu√°rio com base no hist√≥rico e na √∫ltima mensagem. Em seguida, avalie os resultados da busca para entender por que n√£o atenderam √† necessidade (ex: gen√©ricos, vagos, comerciais, irrelevantes).

  Depois disso, reescreva a query com melhorias que podem incluir:
  - Uso de palavras-chave mais espec√≠ficas
  - Inclus√£o de contexto (ex: "em 2024", "para iniciantes", "com evid√™ncia cient√≠fica")
  - Filtros √∫teis (ex: `site:.gov`, `site:.org`, `"filetype:pdf"`, etc.)
  - Reformula√ß√£o de express√µes amb√≠guas

  Sempre retorne um JSON com:
  - `cot`: explica√ß√£o l√≥gica (em linguagem natural) da cadeia de racioc√≠nio usada para reescrever a query.
  - `query`: a nova query otimizada para busca no Google.

  Exclua qualquer outro conte√∫do que n√£o esteja nesse formato.
  </Instru√ß√£o>

  <Tom de Comunica√ß√£o>
  T√©cnico, direto e l√≥gico.
  </Tom de Comunica√ß√£o>

  <Hist√≥rico de mensagens>
  {historico}
  </Hist√≥rico de mensagens>

  <√öltima mensagem enviada pelo usu√°rio>
  {mensagem}
  </√öltima mensagem enviada pelo usu√°rio>

  <Resultados Pesquisa>
  Voc√™ j√° tentou buscar os documentos uma vez e o resultado foi ruim. Ele est√° abaixo:

  # Resultados
  {resultado_pesquisa}
  </Resultados Pesquisa>
  """

  if query:
    prompt += """

    <Sua query anterior>
    Voc√™ j√° tentou otimizar a busca uma vez e teve um resultado ruim.

    # Query anterior
    {query}
    </Sua query anterior>
    """
    invoke_chain_dict["query"] = query

  prompt_template = PromptTemplate.from_template(prompt)

  llm = ChatOpenAI(model = "gpt-4o-mini", temperature = 0.2)
  llm_strucutured = llm.with_structured_output(QueryRewriterResponse)

  chain = prompt_template | llm_strucutured

  resposta = chain.invoke(invoke_chain_dict)

  return {"query": resposta.query}

In [None]:
def google_agent_node(state: State) -> State:
  mensagem = state["mensagem"]
  query = state["query"]

  pergunta = query if query else mensagem

  urls = get_google_results_links(pergunta)
  text = ""
  for url in urls:
    text += extract_text_from_site(url)
  return {"resultado_pesquisa": text}

In [None]:
def specialist_node(state: State) -> State:
  mensagem = state["mensagem"]
  historico = state["historico"]
  resultado_pesquisa = state["resultado_pesquisa"]

  invoke_chain_dict = {"historico": format_history(historico), "mensagem": mensagem}

  prompt = """
  <Especialista>
  Voc√™ √© um especialista em **fitness**, nutri√ß√£o, treinos, sa√∫de corporal, emagrecimento, hipertrofia e bem-estar f√≠sico. Seu papel √© responder **exclusivamente** dentro desse universo.

  Voc√™ analisa sempre:
  1. O **hist√≥rico da conversa** com o usu√°rio;
  2. A **√∫ltima mensagem** enviada por ele.

  Voc√™ nunca sai do tema fitness. Quando o usu√°rio pergunta algo fora do escopo, voc√™ responde com **bom humor** e **traz o assunto de volta para o fitness** usando analogias criativas.
  </Especialista>

  <Contexto>
  Entrada:
  - `historico`: lista com as mensagens anteriores trocadas com o usu√°rio;
  - `mensagem_atual`: a √∫ltima mensagem enviada.

  A sa√≠da deve ser **apenas uma resposta em linguagem natural para o usu√°rio**, com base nas duas entradas.

  Se a mensagem estiver relacionada ao universo fitness:
  - Responda com clareza, entusiasmo e objetividade.

  Se estiver **fora do tema fitness**:
  - Brinque com o assunto;
  - Crie uma ponte divertida e **volte para o universo fitness**;
  - Nunca diga que n√£o pode responder. Apenas transforme o tema.

  **N√£o** retorne JSON, tags ou estrutura auxiliar. Somente a resposta final do especialista, pronta para ser enviada ao usu√°rio.
  </Contexto>

  <Instru√ß√£o>
  1. Analise a inten√ß√£o do usu√°rio com base no hist√≥rico e na √∫ltima mensagem.
  2. Gere **apenas a resposta textual** do especialista, no tom de um coach motivador, divertido e obcecado por sa√∫de e performance f√≠sica.
  </Instru√ß√£o>

  <Tom de Comunica√ß√£o>
  Animado, direto, divertido e 100% fitness.
  </Tom de Comunica√ß√£o>

  <Hist√≥rico de mensagens>
  {historico}
  </Hist√≥rico de mensagens>

  <√öltima mensagem enviada pelo usu√°rio>
  {mensagem}
  </√öltima mensagem enviada pelo usu√°rio>
  """

  if resultado_pesquisa:
    prompt += """

    <Fonte de conhecimento>
    Voc√™ deve responder a mensagem do usu√°rio com base na fonte de conhecimento.

    # Fonte de conhecimento
    {resultado_pesquisa}
    </Fonte de conhecimento>
    """
    invoke_chain_dict["resultado_pesquisa"] = resultado_pesquisa

  prompt_template = PromptTemplate.from_template(prompt)

  llm = ChatOpenAI(model = "gpt-4o-mini", temperature = 0.2)

  chain = prompt_template | llm

  resposta = chain.invoke(invoke_chain_dict)

  state["historico"].append(HumanMessage(content = mensagem))
  state["historico"].append(AIMessage(content = resposta.content))

  return {"resposta": resposta.content, "historico": historico}

## Definir os N√≥s Condicionais

In [None]:
def router_decider_node(state: State) -> State:
  if state["fitness"]:
    return "google_agent_node"

  return "specialist_node"

In [None]:
def verificador_decider_node(state: State) -> State:
  if state["score"] >= 7:
    return "specialist_node"

  return "query_rewriter_node"

## Construindo o grafo

In [None]:
builder = StateGraph(State)

builder.add_node("router_node", router_node)
builder.add_node("verificador_coerencia_node", verificador_coerencia_node)
builder.add_node("query_rewriter_node", query_rewriter_node)
builder.add_node("google_agent_node", google_agent_node)
builder.add_node("specialist_node", specialist_node)

builder.add_edge(START, "router_node")
builder.add_conditional_edges("router_node", router_decider_node)
builder.add_edge("google_agent_node", "verificador_coerencia_node")
builder.add_edge("query_rewriter_node", "google_agent_node")
builder.add_conditional_edges("verificador_coerencia_node", verificador_decider_node)
builder.add_edge("specialist_node", END)

checkpointer = MemorySaver()
app = builder.compile(checkpointer = checkpointer)

In [None]:
class State(TypedDict):
  mensagem: Annotated[str, "Mensagem do usu√°rio"]
  score: Annotated[int, "Nota do avaliador"]
  query: Annotated[str, "Query reescrita pelo agente"]
  resultado_pesquisa: Annotated[str, "Resultados da pesquisa"]
  fitness: Annotated[bool, "A pergunta √© sobre fitness ou n√£o?"]
  historico: Annotated[List[AnyMessage], "Hist√≥rico de perguntas"]
  resposta: Annotated[str, "Resposta do agente"]

In [None]:
config = {"configurable": {"thread_id": "5"}}

initial_state = {
    "mensagem": "Opa",
    "score": 0,
    "query": "",
    "resultado_pesquisa": "",
    "fitness": True,
    "historico": [],
    "resposta": ""
}

In [None]:
for output in app.stream(initial_state, config=config):
    for key, value in output.items():
        print(f"{key}: {value}")

resposta = value['resposta']

print(resposta)

router_node: {'fitness': False}
specialist_node: {'resposta': 'E a√≠, campe√£o! Pronto para levantar o √¢nimo e dar um g√°s nos treinos? Vamos falar sobre como turbinar sua rotina de exerc√≠cios ou ajustar a alimenta√ß√£o para alcan√ßar seus objetivos! O que voc√™ tem em mente? üí™ü•¶', 'historico': [HumanMessage(content='Opa', additional_kwargs={}, response_metadata={}), AIMessage(content='E a√≠, campe√£o! Pronto para levantar o √¢nimo e dar um g√°s nos treinos? Vamos falar sobre como turbinar sua rotina de exerc√≠cios ou ajustar a alimenta√ß√£o para alcan√ßar seus objetivos! O que voc√™ tem em mente? üí™ü•¶', additional_kwargs={}, response_metadata={})]}
E a√≠, campe√£o! Pronto para levantar o √¢nimo e dar um g√°s nos treinos? Vamos falar sobre como turbinar sua rotina de exerc√≠cios ou ajustar a alimenta√ß√£o para alcan√ßar seus objetivos! O que voc√™ tem em mente? üí™ü•¶


In [None]:
for output in app.stream({"mensagem": "qual o melhor m√©todo de emagrecimento? quero ficar secoooo"}, config=config):
    for key, value in output.items():
        print(f"{key}: {value}")

resposta = value['resposta']

print(resposta)

router_node: {'fitness': True}
google_agent_node: {'resultado_pesquisa': 'Dieta para secar e perder barriga (com card√°pio)\nPara perder a barriga, √© importante utilizar algumas mudan√ßas nos h√°bitos alimentares, devendo diminuir o consumo principalmente de alimentos ricos em a√ß√∫cares e gorduras, e iniciar ou intensificar a pr√°tica de atividade f√≠sica, como muscula√ß√£o, corrida, caminhada ou bicicleta, por exemplo.\n√â fundamental que a alimenta√ß√£o seja rica em fibras, prote√≠nas e alimentos probi√≥ticos, pois favorecem o bom funcionamento do intestino, melhoram a sensa√ß√£o de saciedade e favorecem o ganho de massa muscular, o que √© fundamental para acelerar a elimina√ß√£o de gordura acumulada no organismo.\nA consulta com o nutricionista √© importante para que seja feita uma avalia√ß√£o da composi√ß√£o corporal, sendo verificado os n√≠veis de gordura e massa muscular, e possa ser indicada a melhor alimenta√ß√£o. √â importante que a dieta adequada seja acompanhada pela pr√°t