In [1]:
# Lista de comentários fictícios do Reddit com e sem expressões de dor/problemas
comentarios_reddit = [
    # Comentários que expressam dores/problemas
    "Estou tendo dores de cabeça terríveis há semanas e nenhum remédio parece ajudar. Alguém tem alguma sugestão?",
    "Meu notebook está superaquecendo constantemente e não consigo trabalhar por mais de 30 minutos. Já perdi vários prazos por causa disso.",
    "A empresa de internet na minha região é horrível. Pago por 100Mbps e recebo menos de 10Mbps nos horários de pico.",
    "Não consigo dormir há meses. Tenho tentado de tudo, mas a insônia está afetando meu trabalho e minha vida pessoal.",
    "Estou frustrado com o preço dos aluguéis na minha cidade. É impossível encontrar algo decente que caiba no orçamento.",
    "Meu celular novo veio com defeito na bateria e a loja se recusa a trocar. Estou indignado com o atendimento ao cliente.",
    "Tenho procurado emprego há 6 meses e ainda não consegui nada. As contas estão se acumulando e não sei mais o que fazer.",
    "O aplicativo de delivery que uso constantemente aumentou as taxas e agora é quase inviável pedir comida.",
    "A qualidade dos produtos de supermercado caiu muito e os preços só aumentam. Estou pagando mais por menos.",
    "Me sinto sozinho trabalhando em home office, a falta de interação social está me deixando deprimido.",
    
    # Comentários neutros ou positivos (sem expressão de dor/problema)
    "Acabei de terminar essa série e adorei o final. Alguém mais assistiu?",
    "Recomendo esse livro para quem gosta de ficção científica, a narrativa é incrível.",
    "Visitei aquele novo restaurante no centro ontem. A comida é realmente muito boa.",
    "O último episódio do podcast foi muito informativo, aprendi várias coisas novas.",
    "Finalmente consegui montar meu setup para home office, ficou exatamente como eu queria.",
    "Completei minha coleção de mangá hoje, me sinto realizado!",
    "Ontem fui ao parque com meu cachorro e encontramos vários outros pets. Foi um dia divertido.",
    "Adoro quando o Reddit me recomenda subreddits interessantes que eu não conhecia.",
    "Alguém aqui joga esse novo jogo? Estou procurando pessoas para jogar online.",
    "Compartilhando uma foto do bolo que fiz seguindo aquela receita que postaram aqui semana passada."
]

In [12]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

sys.path.insert(0, os.path.abspath('..'))
from schemas.classify_schema import ClassifySchema

from dotenv import load_dotenv
import os

# Carregar variáveis de ambiente do arquivo .env
load_dotenv()

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

# <Prompt>
summary_prompt = ChatPromptTemplate.from_messages(
        [
            (
                "system",
                """Você é um analista profissional de comentários e posts do Reddit. 
                   Sua tarefa é analisar os comentários e posts de alguns usuários e identificar se eles expressam algum tipo de dor ou problema.
                   Quando um comentário/post expressa dor ou problema, a saída deve ser 'yes'.
                   Quando um comentário/post não expressa dor ou problema, a saída deve ser 'no'.
        """,
            ),
            (
                "human",
                """
                Aqui estão alguns comentários do Reddit.

                comentários: {comentarios_reddit}

                Me ajude a classificar se cada comentário revela algum problema do usuário/dor ou não.
        """,
            ),
        ]
    )

# <LLM>
llm = ChatOpenAI(
    model="gpt-4o-2024-08-06"
)

# <Chain>
chain = summary_prompt | llm.bind_tools([ClassifySchema])
    

In [None]:
# Executa a cadeia de prompts
result = chain.invoke({"comentarios_reddit": comentarios_reddit})
result

AIMessage(content='', additional_kwargs={'tool_calls': [{'id': 'call_sRjfKvSOwLr8JyzSQi7ediWb', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_65mgsJZtDzxmlB4rFnNrvxZY', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_6ieD4Wwz6fs23RlwFSkHYgdT', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_iiujWTJTROi7q82QkApxMdpO', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_3FnU6dg3Aoc72ivd2Rt80Oj2', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_WBWtQtOFmNpcpFtSTu3BbtoP', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'ClassifySchema'}, 'type': 'function'}, {'id': 'call_nbWfZsD6yaYvIreB6nSbr6aT', 'function': {'arguments': '{"has_problem": "yes"}', 'name': 'Cla

In [18]:
# Exibe o resultado
result.additional_kwargs["tool_calls"]

[{'id': 'call_sRjfKvSOwLr8JyzSQi7ediWb',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_65mgsJZtDzxmlB4rFnNrvxZY',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_6ieD4Wwz6fs23RlwFSkHYgdT',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_iiujWTJTROi7q82QkApxMdpO',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_3FnU6dg3Aoc72ivd2Rt80Oj2',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_WBWtQtOFmNpcpFtSTu3BbtoP',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_nbWfZsD6yaYvIreB6nSbr6aT',
  'function': {'arguments': '{"has_problem": "yes"}',
   'name': 'Class

In [28]:
import json

new_results = []
for call in result.additional_kwargs["tool_calls"]:
    call["function"]["arguments"] = json.loads(call["function"]["arguments"])
    new_results.append(call)

new_results

[{'id': 'call_sRjfKvSOwLr8JyzSQi7ediWb',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_65mgsJZtDzxmlB4rFnNrvxZY',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_6ieD4Wwz6fs23RlwFSkHYgdT',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_iiujWTJTROi7q82QkApxMdpO',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_3FnU6dg3Aoc72ivd2Rt80Oj2',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_WBWtQtOFmNpcpFtSTu3BbtoP',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},
 {'id': 'call_nbWfZsD6yaYvIreB6nSbr6aT',
  'function': {'arguments': {'has_problem': 'yes'}, 'name': 'ClassifySchema'},
  'type': 'function'},

In [29]:
only_problems = [comentarios_reddit[i] for i in range(len(comentarios_reddit)) if new_results[i]["function"]["arguments"]["has_problem"] == "yes"]
only_problems

['Estou tendo dores de cabeça terríveis há semanas e nenhum remédio parece ajudar. Alguém tem alguma sugestão?',
 'Meu notebook está superaquecendo constantemente e não consigo trabalhar por mais de 30 minutos. Já perdi vários prazos por causa disso.',
 'A empresa de internet na minha região é horrível. Pago por 100Mbps e recebo menos de 10Mbps nos horários de pico.',
 'Não consigo dormir há meses. Tenho tentado de tudo, mas a insônia está afetando meu trabalho e minha vida pessoal.',
 'Estou frustrado com o preço dos aluguéis na minha cidade. É impossível encontrar algo decente que caiba no orçamento.',
 'Meu celular novo veio com defeito na bateria e a loja se recusa a trocar. Estou indignado com o atendimento ao cliente.',
 'Tenho procurado emprego há 6 meses e ainda não consegui nada. As contas estão se acumulando e não sei mais o que fazer.',
 'O aplicativo de delivery que uso constantemente aumentou as taxas e agora é quase inviável pedir comida.',
 'A qualidade dos produtos de s