In [1]:
import os
import requests
import PyPDF2
from bs4 import BeautifulSoup
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, Tool, create_react_agent
from langchain import hub
from langchain_core.prompts import PromptTemplate
import json # Adicione esta importação se ainda não a tiver para a ferramenta de YouTube/PDF
import asyncio

# --- 1. Configuração da Chave da API OpenAI ---
# Certifique-se de que sua chave da API da OpenAI esteja configurada como uma variável de ambiente
# ou substitua "YOUR_OPENAI_API_KEY" pela sua chave real.
# É altamente recomendável usar variáveis de ambiente por segurança:
os.environ["OPENAI_API_KEY"] = "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"
# Se você não definir a variável de ambiente, pode descomentar a linha abaixo e colocar sua chave diretamente:
# openai_api_key = "YOUR_OPENAI_API_KEY"

if "OPENAI_API_KEY" not in os.environ:
    print("AVISO: A variável de ambiente OPENAI_API_KEY não está definida.")
    print("Por favor, defina-a ou insira sua chave diretamente no código.")
    # Exemplo (NÃO RECOMENDADO PARA PRODUÇÃO):
    # os.environ["OPENAI_API_KEY"] = "sk-..." 



In [2]:
# --- Definição das Ferramentas Existentes (Mantenha as suas) ---
def get_text_from_url(url: str) -> str:
    """
    Extrai todo o texto visível de uma URL fornecida.
    Útil para ler o conteúdo de páginas web.
    """
    try:
        response = requests.get(url, timeout=10) # Adiciona um timeout para evitar esperas infinitas
        response.raise_for_status()  # Lança um erro para códigos de status HTTP ruins (4xx ou 5xx)
        soup = BeautifulSoup(response.text, 'html.parser')

        for script in soup(["script", "style"]):
            script.extract()

        text = soup.get_text()
        lines = (line.strip() for line in text.splitlines())
        chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
        text = ' '.join(chunk for chunk in chunks if chunk)
        
        max_length = 4000
        if len(text) > max_length:
            print(f"ATENÇÃO: Texto da URL truncado de {len(text)} para {max_length} caracteres.")
            text = text[:max_length] + "..."
        return text
    except requests.exceptions.RequestException as e:
        return f"Erro ao acessar a URL: {e}"
    except Exception as e:
        return f"Erro ao processar o conteúdo da URL: {e}"

url_text_extractor_tool = Tool(
    name="get_text_from_url",
    func=get_text_from_url,
    description="Útil para extrair o conteúdo de texto de uma página web a partir de uma URL. Forneça uma URL completa como entrada."
)

async def get_youtube_info(url_and_query: str) -> str:
    """
    Simula a extração de informações de um vídeo do YouTube usando um LLM.
    Recebe uma string no formato 'URL_DO_VIDEO|SUA_PERGUNTA'.
    """
    try:
        parts = url_and_query.split('|', 1)
        if len(parts) != 2:
            return "Erro: Formato de entrada inválido. Use 'URL_DO_VIDEO|SUA_PERGUNTA'."

        youtube_url = parts[0].strip()
        user_query = parts[1].strip()

        if not youtube_url or not user_query:
            return "Erro: URL do vídeo ou pergunta não fornecida."

        prompt_text = f"Dado o seguinte URL de vídeo do YouTube: {youtube_url}\n\nResponda à seguinte pergunta, imaginando o conteúdo do vídeo ou resumindo-o se você tiver informações contextuais sobre ele: \"{user_query}\"\n\nSe você não souber, diga que não sabe com base no contexto fornecido."

        chat_history = [{ "role": "user", "parts": [{ "text": prompt_text }] }]
        payload = { "contents": chat_history }
        apiKey = ""
        apiUrl = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key={apiKey}"

        response = requests.post(apiUrl, headers={'Content-Type': 'application/json'}, data=json.dumps(payload))
        response.raise_for_status()

        result = response.json()

        if result.get("candidates") and len(result["candidates"]) > 0 and \
           result["candidates"][0].get("content") and \
           result["candidates"][0]["content"].get("parts") and \
           len(result["candidates"][0]["content"]["parts"]) > 0:
            return result["candidates"][0]["content"]["parts"][0]["text"]
        else:
            return "Não foi possível obter uma resposta do LLM para esta pergunta."

    except requests.exceptions.RequestException as e:
        return f"Erro ao acessar a API da OpenAI/Google Gemini: {e}. Verifique sua conexão ou quota."
    except Exception as e:
        return f"Ocorreu um erro inesperado ao processar a requisição: {e}"

youtube_info_extractor_tool = Tool(
    name="get_youtube_info",
    func=get_youtube_info,
    description="Útil para obter informações sobre um vídeo do YouTube. A entrada deve ser no formato 'URL_DO_VIDEO|SUA_PERGUNTA', por exemplo, 'https://www.youtube.com/watch?v=dQw4w9WgXcQ|Qual é o tema principal deste vídeo?'"
)

# --- NOVA FERRAMENTA: Monitor de Eletromagnetismo (Consulta de Capítulo por TXT) ---
async def lookup_electromagnetism_chapter_from_txt(chapter_identifier_and_query: str) -> str:
    """
    Atua como um monitor de Eletromagnetismo, buscando informações em um capítulo específico
    lendo o conteúdo de um arquivo TXT local e respondendo a uma pergunta com base nesse conteúdo.

    A entrada deve ser uma string no formato 'IDENTIFICADOR_DO_CAPITULO|SUA_PERGUNTA'.
    O IDENTIFICADOR_DO_CAPITULO será usado para formar o nome do arquivo (ex: 'Capitulo 2' -> 'Capitulo 2.txt').
    Ex: 'Capitulo 2|O que é a Lei de Coulomb?'

    Args:
        chapter_identifier_and_query (str): Uma string contendo o identificador do capítulo
                                            e a pergunta do aluno, separados por '|'.

    Returns:
        str: A resposta do LLM baseada no conteúdo do capítulo ou uma mensagem de erro.
    """
    try:
        parts = chapter_identifier_and_query.split('|', 1)
        if len(parts) != 2:
            return "Erro: Formato de entrada inválido. Use 'IDENTIFICADOR_DO_CAPITULO|SUA_PERGUNTA'."

        chapter_identifier = parts[0].strip()
        student_question = parts[1].strip()

        if not chapter_identifier or not student_question:
            return "Erro: Identificador do capítulo ou pergunta não fornecida."

        # Constrói o nome do arquivo esperado (ex: "Capitulo 2.txt")
        file_name = f"{chapter_identifier}.txt"
        # Caminho completo para o arquivo (assumindo que está na mesma pasta do script)
        # os.getcwd() retorna o diretório de trabalho atual.
        file_path = os.path.join(os.getcwd(), file_name)

        if not os.path.exists(file_path):
            return f"Erro: Arquivo '{file_name}' não encontrado na pasta atual. Certifique-se de que o arquivo está na mesma pasta que o script."

        chapter_content = ""
        try:
            with open(file_path, 'r', encoding='utf-8') as file:
                chapter_content = file.read()
        except UnicodeDecodeError:
            try:
                with open(file_path, 'r', encoding='latin-1') as file:
                    chapter_content = file.read()
            except Exception as e:
                return f"Erro de decodificação ao ler o arquivo '{file_name}': {e}"
        except Exception as e:
            return f"Erro ao ler o arquivo '{file_name}': {e}"

        if not chapter_content.strip():
            return f"Erro: O arquivo '{file_name}' está vazio ou não contém texto legível."

        max_content_length = 25000 # Limite de tokens para o gpt-4o-mini
        if len(chapter_content) > max_content_length:
            chapter_content = chapter_content[:max_content_length] + "\n[CONTEÚDO TRUNCADO]"
            print(f"Aviso: Conteúdo do capítulo '{chapter_identifier}' truncado para {max_content_length} caracteres.")

        prompt_text = (
            f"Você é um monitor de Eletromagnetismo. Um aluno perguntou sobre o capítulo '{chapter_identifier}'. "
            f"Aqui está o conteúdo do capítulo para referência:\n\n"
            f"```chapter_content\n{chapter_content}\n```\n\n"
            f"Com base APENAS neste conteúdo do capítulo, responda à seguinte pergunta do aluno: \"{student_question}\"\n"
            f"Se a resposta não estiver explicitamente no texto fornecido, diga que a informação não está disponível no capítulo ou que você não pode responder com base nele."
        )

        llm_openai = ChatOpenAI(model="gpt-4o-mini", temperature=0.2)

        chat_history = [{ "role": "user", "parts": [{ "text": prompt_text }] }]
        payload = { "messages": chat_history } # OpenAI API expects 'messages' not 'contents'

        apiKey = os.getenv("OPENAI_API_KEY")
        if not apiKey:
            return "Erro: Chave da API da OpenAI não configurada. Por favor, defina a variável de ambiente OPENAI_API_KEY."

        apiUrl = "https://api.openai.com/v1/chat/completions"

        headers = {
            'Content-Type': 'application/json',
            'Authorization': f'Bearer {apiKey}'
        }

        response = requests.post(apiUrl, headers=headers, data=json.dumps(payload))
        response.raise_for_status()

        result = response.json()

        if result.get("choices") and len(result["choices"]) > 0 and \
           result["choices"][0].get("message") and \
           result["choices"][0]["message"].get("content"):
            return result["choices"][0]["message"]["content"]
        else:
            return "Não foi possível obter uma resposta do monitor para esta pergunta."

    except requests.exceptions.RequestException as e:
        return f"Erro ao acessar a API da OpenAI: {e}. Verifique sua conexão, quota ou chave da API."
    except Exception as e:
        return f"Ocorreu um erro inesperado ao consultar o capítulo: {e}"

electromagnetism_monitor_tool = Tool(
    name="lookup_electromagnetism_chapter",
    func=lookup_electromagnetism_chapter_from_txt,
    description=(
        "Útil para consultar informações em um capítulo específico do material de Eletromagnetismo. "
        "A entrada deve ser o IDENTIFICADOR EXATO DO CAPÍTULO (ex: 'Capitulo 2') seguido de '|' e, em seguida, a PERGUNTA do aluno. "
        "O agente tentará ler o arquivo TXT correspondente (ex: 'Capitulo 2.txt') na mesma pasta do script."
    )
)
# --- NOVA FERRAMENTA: Ler TXT Local e Criar Título ---
async def read_txt_and_create_title(file_path: str) -> str:
    """
    Lê o conteúdo de um arquivo TXT localmente e cria um título curto e descritivo para ele
    usando o modelo gpt-4o-mini.

    Args:
        file_path (str): O caminho completo para o arquivo TXT local.

    Returns:
        str: O título gerado pelo modelo de linguagem ou uma mensagem de erro.
    """
    if not file_path.strip():
        return "Erro: O caminho do arquivo TXT não foi fornecido."

    # Verifica se o arquivo existe no sistema de arquivos local
    if not os.path.exists(file_path):
        return f"Erro: Arquivo não encontrado no caminho: {file_path}"

    text_content = ""
    try:
        # Tenta ler com UTF-8, depois com latin-1 se houver erro de decodificação
        with open(file_path, 'r', encoding='utf-8') as file:
            text_content = file.read()
    except UnicodeDecodeError:
        try:
            with open(file_path, 'r', encoding='latin-1') as file:
                text_content = file.read()
        except Exception as e:
            return f"Erro de decodificação ao ler o arquivo TXT: {e}"
    except Exception as e:
        return f"Erro ao ler o arquivo TXT: {e}"

    if not text_content.strip():
        return "Erro: O arquivo TXT está vazio ou não contém texto legível."

    # Limita o tamanho do texto para evitar exceder o limite de tokens do LLM
    max_text_length = 15000  # Ajuste conforme necessário e o limite do seu LLM
    if len(text_content) > max_text_length:
        text_content = text_content[:max_text_length] + "\n[CONTEÚDO TRUNCADO PARA CABER NO LIMITE DO MODELO]"
        print(f"Aviso: Conteúdo do TXT truncado para {max_text_length} caracteres para caber no prompt do LLM.")

    # Constrói o prompt para o modelo de linguagem
    prompt_template = PromptTemplate(
        input_variables=["text"],
        template="Crie um título curto e descritivo para o seguinte conteúdo de texto:\n\n{text}\n\nTítulo:"
    )

    try:
        # Inicializa o modelo de linguagem. Usa gpt-4o-mini como solicitado.
        llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.7)

        # Invoca o LLM com o prompt formatado e o conteúdo do arquivo
        response_llm = llm.invoke(prompt_template.format(text=text_content))
        return response_llm.content

    except Exception as e:
        return f"Ocorreu um erro ao gerar o título com o LLM: {e}"

# Criação da Ferramenta LangChain para ler TXT local
create_title_from_local_txt_tool = Tool(
    name="create_title_from_local_txt",
    func=read_txt_and_create_title,
    description=(
        "Útil para ler um arquivo TXT localmente e criar um título curto e descritivo para o seu conteúdo. "
        "A entrada deve ser o CAMINHO COMPLETO para o arquivo TXT no sistema de arquivos local. "
        "Ex: 'C:/Users/SeuUsuario/Documentos/meu_texto.txt' ou '/home/usuario/documentos/meu_texto.txt'"
    )
)


def extract_text_from_pdf_sync(pdf_path: str) -> str:
    """
    Extrai todo o texto de um arquivo PDF localmente (função síncrona).
    """
    if not os.path.exists(pdf_path):
        return f"Erro: Arquivo PDF não encontrado no caminho: {pdf_path}"

    text = ""
    try:
        with open(pdf_path, 'rb') as file:
            reader = PyPDF2.PdfReader(file)
            for page_num in range(len(reader.pages)):
                page = reader.pages[page_num]
                text += page.extract_text() + "\n"
        return text
    except Exception as e:
        return f"Erro ao ler o PDF: {e}"

extract_text_from_pdf_tool = Tool(
    name="extract_text_from_pdf",
    func=extract_text_from_pdf_sync, # Agora chama a função síncrona
    description="Útil para extrair todo o texto de um arquivo PDF local. A entrada deve ser o CAMINHO COMPLETO para o arquivo PDF."
)


In [3]:
# --- 3. Inicialização do Modelo de Linguagem (LLM) ---
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.7) # Modelo gpt-4o-mini como solicitado

# --- 4. Preparação do Agente ---
tools = [
    url_text_extractor_tool,
    youtube_info_extractor_tool,
    extract_text_from_pdf_tool,
    create_title_from_local_txt_tool,
    electromagnetism_monitor_tool
]

custom_prompt_template = """
Você é um assistente de IA útil e inteligente.
Seu nome é James Moriarty.
Sua principal função é responder às perguntas do usuário.
PRIMEIRO, tente responder diretamente usando seu próprio conhecimento.
SEGUNDO, se você não souber a resposta, ou se a pergunta exigir informações muito específicas, atualizadas, ou a análise de um documento/URL, então use as ferramentas disponíveis.
Use as ferramentas APENAS quando for estritamente necessário para obter informações que você não possui.

Aqui estão as ferramentas que você pode usar:
{tools}

Use o seguinte formato:

Question: a pergunta de entrada que você deve responder
Thought: você deve sempre pensar sobre o que fazer.
Action: a ação a ser tomada, deve ser uma das [{tool_names}]
Action Input: a entrada para a ação (NÃO use aspas duplas aqui)
Observation: o resultado da ação
... (este Thought/Action/Action Input/Observation pode se repetir N vezes)
Thought: Eu sei a resposta final
Final Answer: a resposta final à pergunta original

Begin!

Question: {input}
Thought:{agent_scratchpad}
"""

prompt = PromptTemplate.from_template(custom_prompt_template)
prompt = prompt.partial(
    tools=str(tools),
    tool_names=", ".join([tool.name for tool in tools])
)

agent = create_react_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True, handle_parsing_errors=True)


In [4]:
# --- 5. Execução do Agente (Loop de Chat Assíncrono para Jupyter) ---

async def main_chat_loop():
    print("\n--- Agente Moriarty - Monitor de Eletromagnetismo ---")
    print("Para sair, digite 'sair'.")
    print("Exemplos de perguntas:")
    print(" - 'O que é a Lei de Coulomb no Capitulo 2?'")
    print(" - 'Resuma o Capitulo 1.'")
    print(" - 'Qual é a definição de potencial elétrico no Capitulo 3?'")
    print(" - 'Obrigado.'") # Para testar resposta direta

    while True:
        try:
            user_input = await asyncio.to_thread(input, "\nSua pergunta (ou 'sair' para terminar): ")
            if user_input.lower() == 'sair':
                break

            print(f"\nVocê: {user_input}")
            print("Moriarty pensando...")
            response = await agent_executor.ainvoke({"input": user_input})
            print("\n--- Resposta do Agente ---")
            print('Moriarty:', response["output"])
        except Exception as e:
            print(f"\nOcorreu um erro: {e}")
            print("Tente novamente ou verifique se sua chave da OpenAI está configurada corretamente.")

    print("\nAgente encerrado.")

# Para executar em Jupyter Notebooks, é melhor agendar a tarefa
# em vez de usar asyncio.run() diretamente na célula principal,
# pois asyncio.run() pode bloquear o kernel.
# Apenas execute esta linha UMA VEZ. Se você reexecutar a célula,
# pode precisar reiniciar o kernel do Jupyter.
if __name__ == "__main__":
    # Verifica se já existe um loop de eventos rodando
    try:
        loop = asyncio.get_running_loop()
    except RuntimeError:
        loop = None

    if loop and loop.is_running():
        # Se um loop já estiver rodando (ex: em um notebook Jupyter),
        # agende a tarefa para ser executada no loop existente.
        print("Loop de eventos já rodando. Agendando tarefa...")
        loop.create_task(main_chat_loop())
    else:
        # Se nenhum loop estiver rodando (ex: script python normal),
        # inicie um novo loop e execute a função.
        print("Iniciando novo loop de eventos...")
        asyncio.run(main_chat_loop())


Loop de eventos já rodando. Agendando tarefa...



--- Agente Moriarty - Monitor de Eletromagnetismo ---
Para sair, digite 'sair'.
Exemplos de perguntas:
 - 'O que é a Lei de Coulomb no Capitulo 2?'
 - 'Resuma o Capitulo 1.'
 - 'Qual é a definição de potencial elétrico no Capitulo 3?'
 - 'Obrigado.'

Sua pergunta (ou 'sair' para terminar): 