In [None]:
#@title Instalação

#%pip uninstall crewai pdfminer.six pdfplumber -y
%pip install crewai pdfminer.six pdfplumber

Collecting crewai
  Downloading crewai-0.134.0-py3-none-any.whl.metadata (35 kB)
Collecting pdfminer.six
  Downloading pdfminer_six-20250506-py3-none-any.whl.metadata (4.2 kB)
Collecting pdfplumber
  Downloading pdfplumber-0.11.7-py3-none-any.whl.metadata (42 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m42.8/42.8 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting appdirs>=1.4.4 (from crewai)
  Downloading appdirs-1.4.4-py2.py3-none-any.whl.metadata (9.0 kB)
Collecting auth0-python>=4.7.1 (from crewai)
  Downloading auth0_python-4.10.0-py3-none-any.whl.metadata (9.2 kB)
Collecting chromadb>=0.5.23 (from crewai)
  Downloading chromadb-1.0.13-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (7.0 kB)
Collecting instructor>=1.3.3 (from crewai)
  Downloading instructor-1.9.0-py3-none-any.whl.metadata (11 kB)
Collecting json-repair>=0.25.2 (from crewai)
  Downloading json_repair-0.47.6-py3-none-any.whl.metadata (12 kB)
Collecting json5>=0.10

In [None]:
#@title Configuração inicial
from crewai import Agent, Task, Crew, LLM
from pydantic import BaseModel
import os

api_key = os.gentenv("API_KEY")
model_name = os.getenv("MODEL_NAME")

llm = LLM(model='gemini/gemini-1.5-flash', api_key=api_key)

In [None]:
#@title Criação de agentes e tasks

analista = Agent(
    name='Analista de artigos cientificos',
    goal="""
        Você é um especialista em análise de artigos científicos.

        Sua tarefa é analisar uma parte especifica de um artigo, somente ela.

        Você deve fornecer dados e/ou uma analise sobre a parte do artigo que foi solicitada.

        Além da parte do artigo, você pode também receber instruções adicionais relacionadas ao artigo, que devem ser seguidas.

        Como resposta, retorne um nome simples para o que foi analisado, e o conteudo da análise. (exemplo: "Introdução" : "A introdução do artigo apresenta...")

        A solicitação de analise é a seguinte (analise o artigo baseado na parte solicitada):
        {solicitacao}

        O artigo que você deve analisar é o seguinte:
        {conteudo_artigo}
    """,
    backstory="""
        Você é um analista de artigos científicos, especializado em analisar partes específicas de artigos.
        Você deve fornecer uma análise detalhada e precisa com base na parte do artigo que foi solicitada.

        Você deve analisar somente o que foi solicitado.
        Se houver instruções adicionais, você deve segui-las.
    """,
    llm=llm,
    role='analista',
)

class AnaliseOutput(BaseModel):
    nome: str
    conteudo: str

analistaTask = Task(
    name='Analise de artigo',
    description='Analisa uma parte específica de um artigo científico.',
    agent=analista,
    output_json=AnaliseOutput,
    expected_output="A análise deve conter um nome simples e o conteúdo da análise. o conteúdo deve ser um texto simples, em markdown se possível",
    inputs=['conteudo_artigo', 'solicitacao']
)

crewAnalise = Crew(
    name='Analise de artigo',
    agents=[analista],
    tasks=[analistaTask],
    llm=llm,
)

In [None]:
#@title Extração de texto de PDF

from pdfminer.high_level import extract_text
import os

def extrair_texto(caminho_pdf : str):
    return extract_text(caminho_pdf)

def listar_pdfs(pasta="./"):
    return [f for f in os.listdir(pasta) if f.lower().endswith(".pdf")]

# Boas vindas ao analisador de artigos!

Escolha sua opção:

  1. Analise simples (tema central, objetivos, metodologia, resultados, conclusao, resumo, palavras chaves).

  2. Analise customizada (escolha as seções que deseja analisar).

  3. Analise simples + customizada (seções padrão + seções customizadas).

  0. Sair

In [None]:
#@title Código principal

secoes_para_analisar = []

print("""
Boas vindas ao analisador de artigos.

Escolha sua opção:
      1. Analise simples (tema central, objetivos, metodologia, resultados, conclusao, resumo, palavras chaves).
      2. Analise customizada (escolha as seções que deseja analisar).
      3. Analise simples + customizada (seções padrão + seções customizadas).

      0. Sair
""")

escolha = input("Digite o número da opção desejada: ")

secoes_padrao = [
    "Tema central: Assunto e problema abordado",
    "Objetivos: O que o autor pretende investigar, demonstrar ou dicutir",
    "Metodologia: Quais metodos foram usados e como os dados foram coletados",
    "Resultados: Principais descobertas e conclusões",
    "Conclusões: Quais são as implicações do resultado, o autor responde a pergunta da pesquisa?",
    "Resumo: Resumo geral sobre o artigo",
    "Palavras chave: Principais termos e conceitos abordados no artigo, divida em estrutura de palavras chave",
]

if escolha == '1':
    secoes_para_analisar = secoes_padrao.copy()
elif escolha == '2' or escolha == '3':
    if(escolha == '3'):
        secoes_para_analisar = secoes_padrao.copy()
    print("""
        Para uma analise customizada, é necessário que seja informado o que você deseja analisar.
        Escreva textos diretos sobre o que você deseja analisar, por exemplo:
        - Tema central: Assunto e problema abordado
        - Objetivos: O que o autor pretende investigar, demonstrar ou discutir
          ...

        Você pode também pedir analises mais específicas, como:
            - Quais são os vieses cognitivos abordados no artigo?
            - Quais são os principais argumentos apresentados?
            - Quais áreas de computação são discutidas no artigo?

        Escreva quantas seções você quiser analisar.
        Quando ja tiver terminado, digite 'FIM' para finalizar a entrada.

        Instruções:
            - Cada seção deve ser escrita em uma linha separada.
            - Após escrever uma seção, pressione Enter para adicionar a próxima.
            - Quando terminar, digite 'FIM' e pressione Enter.
    """)
    while True:
        secao = input("Digite a seção que deseja analisar (ou 'FIM' para finalizar): ")
        if secao.strip().upper() == 'FIM':
            break
        secoes_para_analisar.append(secao.strip())


analises = []
for pdf in listar_pdfs():
    print(f"Analisando: {pdf}")
    conteudo_artigo = extrair_texto(pdf)
    analises_artigo = []
    for secao in secoes_para_analisar:
        print(f"Analisando seção: {secao}")
        analise = crewAnalise.kickoff({'conteudo_artigo': conteudo_artigo, 'solicitacao': secao})
        analises_artigo.append(analise)

    print(f"Análise concluída para: {pdf}")
    with open(f'analise_{pdf}.md', 'w') as f:
        for analise in analises_artigo:
            f.write(f"# {analise['nome']}:\n{analise['conteudo']}\n---\n\n")
    print('\n\n')


Boas vindas ao analisador de artigos.

Escolha sua opção:
      1. Analise simples (tema central, objetivos, metodologia, resultados, conclusao, resumo, palavras chaves).
      2. Analise customizada (escolha as seções que deseja analisar).
      3. Analise simples + customizada (seções padrão + seções customizadas).

      0. Sair



In [None]:




if not api_key:
    raise ValueError("GOOGLE_API_KEY not found in .env file")

if not model_name:
    # Set a default model if not specified
    model_name = 'gemini/gemini-1.5-flash'
    print(f"MODEL_NAME not found in .env file, using default: {model_name}")

print(f"Using model: {model_name}")