In [42]:

from langchain.chat_models import ChatOpenAI
from langchain.agents import Tool , initialize_agent, AgentType
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from tavily import TavilyClient
import os
from dotenv import load_dotenv
load_dotenv()
tavily_key = os.getenv("TAVILY_API_KEY")
##print("Chave Groq:", os.environ.get("GROQ_API_KEY"))


In [43]:

gpt35 = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    temperature=0.7,
    api_key=os.environ.get("OPENAI_API_KEY"),
)

In [44]:
FORMATO_CURSOS = """
1. Curso: Nome do Curso
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
"""

In [45]:

tavily = TavilyClient(api_key=tavily_key)

PUBLICAS_KEYWORDS = [
    "uf", "usp", "unicamp", "ufmg", "ufrj", "ufpe", "ufsc", "ufabc", "unb", "if"
]

def func_buscar_cursos(query: str) -> list:
    resultados = tavily.search(query, search_depth="advanced", max_results=30)
    cursos = []
    query_slug = query.lower().replace(" ", "-")

    for item in resultados["results"]:
        url_lower = item["url"].lower()
        titulo_lower = item["title"].lower()
        
        # Filtra só universidades públicas
        if any(pub in url_lower or pub in titulo_lower for pub in PUBLICAS_KEYWORDS):
            cursos.append({
                "titulo": item["title"],
                "url": item["url"],
                "conteudo": item["content"][:600]
            })
        if len(cursos) >= 5:  # limite por curso
            break
    return cursos




buscar_cursos = Tool(
    name="BuscadorCursos",
    func=func_buscar_cursos,
    description="Busca cursos superior na internet ou base de dados publica"
)

In [46]:
# template para estruturar perfil com palavras-chave + cursos


prompt_educacao = ChatPromptTemplate.from_messages([
    ("system", 
        "Você é especialista em educação brasileira. "
        "Sua resposta deve estar estritamente neste formato:"
        f"{FORMATO_CURSOS}\n"
        "- Gere sempre 3 cursos.\n"
        "- **Não inclua nenhuma universidade ou centro privado ou site de conteúdo educacional.**"
        "- Use dados reais, não invente URLs.\n"
        "- Não use JSON nem outro formato de código."
    ),
    ("user", "Perfil: {perfil_usuario}")
])





In [47]:


chain_educacao = LLMChain(
    llm=gpt35,
    prompt=prompt_educacao,
    verbose=True,
    
)

agente_pesquisador = initialize_agent(
    tools=[buscar_cursos],
    llm=gpt35,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,   ##STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION   ZERO_SHOT_REACT_DESCRIPTION  
    verbose=True,
    handle_parsing_errors=True,
    max_iterations=10,             # evita loop infinito
    early_stopping_method="generate" ,

)


def orquestrador(perfil_usuario: str):
    sugestoes = chain_educacao.run({"perfil_usuario": perfil_usuario})

    promptpesquisador = (
        f"Com base nestas sugestões: {sugestoes}, "
        "encontre os cursos mais relevantes em instituições e universidades públicas, "
        f"e escreva tudo exatamente assim:\n{FORMATO_CURSOS}, - **Não inclua nenhuma universidade ou centro privado ou site de conteúdo educacional.**"
    )

    return agente_pesquisador.run(promptpesquisador)


perfil = "gosto de computador, sistemas e matematica"
resposta = orquestrador(perfil)
print(resposta)










[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: Você é especialista em educação brasileira. Sua resposta deve estar estritamente neste formato:
1. Curso: Nome do Curso
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)
   - Universidade : Nome da Universidade (link: https://exemplo.com)

- Gere sempre 3 cursos.
- **Não inclua nenhuma universidade ou centro privado ou site de conteúdo educacional.**- Use dados reais, não invente URLs.
- Não use JSON nem outro formato de código.
Human: Perfil: gosto de computador, sistemas e matematica[0m

[1m> Finished chain.[0m


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mI need to search for courses in public universities related to Computer Science, Computer Engineering,