Skip to content

Ferramenta para realizar download de teses e dissertações da CAPES

License

Notifications You must be signed in to change notification settings

ApoenaX/teses-download

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Packaged with Poetry Python 3.11

teses-download

Script para fazer download das teses e dissertações da CAPES.

Início Rápido

  1. Instalar dependências do projeto
git clone https://github.com/AcademicAI/teses-download.git
cd teses-catalogo && pip install .
  1. Passar lista de urls da plataforma e diretório para salvar pdfs.
python -m teses_download "urls.txt" "./Trabalhos/"

Usando a bilioteca

  1. Download de várias urls
from teses_download import download
from teses_download import cache

with open("/content/urls.txt", "r") as f:
     urls = f.read().splitlines()

my_cache = cache.create_cache()
download.download_multiple_pdfs(urls,"/content/pdfs", my_cache)
  1. Download de uma url específica
from teses_download import download

url = "https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.xhtml?popup=true&id_trabalho=13398016"
id = int(url.split("=")[-1])
download.download_pdf(url, id, "./diretorio-teste")