In [27]:
import os
import requests
import PyPDF2
from bs4 import BeautifulSoup
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, Tool, create_react_agent
from langchain import hub
from langchain_core.prompts import PromptTemplate


os.environ["OPENAI_API_KEY"] = "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"
# Se você não definir a variável de ambiente, pode descomentar a linha abaixo e colocar sua chave diretamente:

if "OPENAI_API_KEY" not in os.environ:
    print("AVISO: A variável de ambiente OPENAI_API_KEY não está definida.")
    print("Por favor, defina-a ou insira sua chave diretamente no código.")
    # Exemplo (NÃO RECOMENDADO PARA PRODUÇÃO):
    # os.environ["OPENAI_API_KEY"] = "sk-..." 


In [28]:
# --- 1. Função que o agente usará para 'extrair' informações de um link ---
def get_text_from_url(url: str) -> str:
    """
    Extrai todo o texto visível de uma URL fornecida.
    Útil para ler o conteúdo de páginas web.
    """
    try:
        response = requests.get(url, timeout=10) # Adiciona um timeout para evitar esperas infinitas
        response.raise_for_status()  # Lança um erro para códigos de status HTTP ruins (4xx ou 5xx)
        soup = BeautifulSoup(response.text, 'html.parser')

        # Remove elementos de script e estilo
        for script in soup(["script", "style"]):
            script.extract()

        # Obtém o texto
        text = soup.get_text()

        # Quebra linhas em espaços e remove espaços em branco extras
        lines = (line.strip() for line in text.splitlines())
        chunks = (phrase.strip() for line in lines for phrase in line.split("  "))
        text = ' '.join(chunk for chunk in chunks if chunk)
        
        # Limita o tamanho do texto para evitar sobrecarga do LLM
        max_length = 4000 # Limite de caracteres para o texto extraído
        if len(text) > max_length:
            print(f"ATENÇÃO: Texto da URL truncado de {len(text)} para {max_length} caracteres.")
            text = text[:max_length] + "..." # Adiciona reticências para indicar truncamento

        return text
    except requests.exceptions.RequestException as e:
        return f"Erro ao acessar a URL: {e}"
    except Exception as e:
        return f"Erro ao processar o conteúdo da URL: {e}"

# Cria a ferramenta para extrair texto de URL
url_text_extractor_tool = Tool(
    name="get_text_from_url",
    func=get_text_from_url,
    description="Útil para extrair o conteúdo de texto de uma página web a partir de uma URL. Forneça uma URL completa como entrada."
)

In [29]:
# --- 1. Função que o agente usará para 'extrair' informações de vídeo ---
async def get_youtube_info(url_and_query: str) -> str:
    """
    Simula a extração de informações de um vídeo do YouTube usando um LLM.
    Recebe uma string no formato 'URL_DO_VIDEO|SUA_PERGUNTA'.
    Ex: 'https://www.youtube.com/watch?v=dQw4w9WgXcQ| Qual é o tema principal?'

    Esta função não assiste ao vídeo. Ela usa a inteligência do LLM
    para inferir ou resumir informações com base no seu conhecimento pré-existente
    e no contexto fornecido (URL e pergunta).
    """
    try:
        # Divide a string de entrada em URL e pergunta
        parts = url_and_query.split('|', 1)
        if len(parts) != 2:
            return "Erro: Formato de entrada inválido. Use 'URL_DO_VIDEO|SUA_PERGUNTA'."

        youtube_url = parts[0].strip()
        user_query = parts[1].strip()

        if not youtube_url or not user_query:
            return "Erro: URL do vídeo ou pergunta não fornecida."

        # Constrói o prompt para o modelo de linguagem
        prompt_text = f"Dado o seguinte URL de vídeo do YouTube: {youtube_url}\n\nResponda à seguinte pergunta, imaginando o conteúdo do vídeo ou resumindo-o se você tiver informações contextuais sobre ele: \"{user_query}\"\n\nSe você não souber, diga que não sabe com base no contexto fornecido."

        # Prepara o histórico de chat para a requisição da API
        chat_history = [{ "role": "user", "parts": [{ "text": prompt_text }] }]

        # Payload da requisição para a API do Gemini
        payload = { "contents": chat_history }

        # A chave da API será fornecida automaticamente pelo ambiente Canvas se deixada vazia
        apiKey = ""
        apiUrl = f"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key={apiKey}"

        # Realiza a requisição fetch para a API do Google Gemini
        # Nota: requests.post é usado aqui para compatibilidade em ambientes Python síncronos
        # No ambiente Canvas, `fetch` é um método global disponível no escopo do navegador para React/HTML
        # Para Python puro rodando em um servidor ou ambiente de script, você usaria `requests`
        # Aqui, estamos simulando a chamada fetch com requests, que é o que você usaria em um ambiente de servidor Python
        response = requests.post(apiUrl, headers={'Content-Type': 'application/json'}, data=json.dumps(payload))
        response.raise_for_status() # Lança exceções para status de erro HTTP (4xx ou 5xx)

        result = response.json()

        # Verifica se a resposta contém o texto esperado
        if result.get("candidates") and len(result["candidates"]) > 0 and \
           result["candidates"][0].get("content") and \
           result["candidates"][0]["content"].get("parts") and \
           len(result["candidates"][0]["content"]["parts"]) > 0:
            return result["candidates"][0]["content"]["parts"][0]["text"]
        else:
            return "Não foi possível obter uma resposta do LLM para esta pergunta."

    except requests.exceptions.RequestException as e:
        return f"Erro ao acessar a API da OpenAI/Google Gemini: {e}. Verifique sua conexão ou quota."
    except Exception as e:
        return f"Ocorreu um erro inesperado ao processar a requisição: {e}"

# --- 2. Criação da Ferramenta LangChain ---
# Esta é a ferramenta que você adicionará à lista de ferramentas do seu agente.
youtube_info_extractor_tool = Tool(
    name="get_youtube_info",
    func=get_youtube_info, # Assumindo que o agente pode chamar funções assíncronas
    description="Útil para obter informações sobre um vídeo do YouTube. A entrada deve ser no formato 'URL_DO_VIDEO|SUA_PERGUNTA', por exemplo, 'https://www.youtube.com/watch?v=dQw4w9WgXcQ|Qual é o tema principal deste vídeo?'"
)

In [30]:

async def extract_text_from_pdf(pdf_path):

    """
    Extrai todo o texto de um arquivo PDF.
    """
    if not os.path.exists(pdf_path):
        print(f"Erro: Arquivo não encontrado em {pdf_path}")
        return None

    text = ""
    try:
        with open(pdf_path, 'rb') as file:
            reader = PyPDF2.PdfReader(file)
            for page_num in range(len(reader.pages)):
                page = reader.pages[page_num]
                text += page.extract_text() + "\n"
        return text
    except Exception as e:
        print(f"Erro ao ler o PDF: {e}")
        return None
extract_text_from_pdf_tool = Tool(
    name="extract_text_from_pdf",
    func=extract_text_from_pdf, # Assumindo que o agente pode chamar funções assíncronas
    description="Útil para obter informações sobre um vídeo do YouTube. A entrada deve ser no formato 'URL_DO_VIDEO|SUA_PERGUNTA', por exemplo, 'https://www.youtube.com/watch?v=dQw4w9WgXcQ|Qual é o tema principal deste vídeo?'"
)

In [None]:
# --- 3. Inicialização do Modelo de Linguagem (LLM) ---
llm = ChatOpenAI(model="gpt-4.1-mini", temperature=0.7)

# --- 4. Preparação do Agente ---
# Define as ferramentas que o agente pode usar
tools = [
    url_text_extractor_tool,
    youtube_info_extractor_tool,
    extract_text_from_pdf_tool
    ]


# Criar um novo PromptTemplate ou modificar o template do base_prompt
# Exemplo de um template mais explícito:
custom_prompt_template = """
Você é um assistente de IA útil e inteligente.
Seu nome é James Moriarty.
Sua principal função é responder às perguntas do usuário.
PRIMEIRO, tente responder diretamente usando seu próprio conhecimento.
SEGUNDO, se você não souber a resposta, ou se a pergunta exigir informações muito específicas, atualizadas, ou a análise de um documento/URL, então use as ferramentas disponíveis.
Use as ferramentas APENAS quando for estritamente necessário para obter informações que você não possui.

Aqui estão as ferramentas que você pode usar:
{tools}

Use o seguinte formato:

Question: a pergunta de entrada que você deve responder
Thought: você deve sempre pensar sobre o que fazer.
Action: a ação a ser tomada, deve ser uma das [{tool_names}]
Action Input: a entrada para a ação (NÃO use aspas duplas aqui)
Observation: o resultado da ação
... (este Thought/Action/Action Input/Observation pode se repetir N vezes)
Thought: Eu sei a resposta final
Final Answer: a resposta final à pergunta original

Begin!

Question: {input}
Thought:{agent_scratchpad}
"""

# Crie um novo PromptTemplate com suas instruções personalizadas
# Certifique-se de que as variáveis de entrada (input_variables) correspondem ao que o create_react_agent espera.
prompt = PromptTemplate.from_template(custom_prompt_template)
prompt = prompt.partial(
    tools=str(tools), # Ferramentas precisam ser passadas como string para o template
    tool_names=", ".join([tool.name for tool in tools])
)

# Cria o agente
agent = create_react_agent(llm, tools, prompt)

# Cria o executor do agente
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True, handle_parsing_errors=True)

# --- 5. Execução do Agente ---

while True:
    try:
        user_input = input("\nSua pergunta (ou 'sair' para terminar): ")
        if user_input.lower() == 'sair':
            break

        print(f"\nVocê: {user_input}")
        response = agent_executor.invoke({"input": user_input})
        print("\n--- Resposta do Agente ---")
        print('Moriarty:', response["output"])
    except Exception as e:
        print(f"\nOcorreu um erro: {e}")
        print("Tente novamente ou verifique se sua chave da OpenAI está configurada corretamente.")

print("\nAgente encerrado.")


Você: Qual seu nome


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: A pergunta é direta e simples, e já está respondida no próprio enunciado inicial, onde foi informado que meu nome é James Moriarty.
Final Answer: Meu nome é James Moriarty.[0m

[1m> Finished chain.[0m

--- Resposta do Agente ---
Professor M.: Meu nome é James Moriarty.

Agente encerrado.
