Academic Data Scraper

Este repositório contém ferramentas de automação para coleta de dados acadêmicos das plataformas OpenAlex e arXiv. O objetivo é extrair metadados e resumos (abstracts) de publicações científicas para análises bibliométricas e processamento de linguagem natural (NLP).

📂 Estrutura do Projeto

O projeto segue uma organização modular para garantir a integridade dos dados e a persistência de logs:

.
├── data/           # Datasets gerados em formato .jsonl
├── log/            # Arquivos de log e monitoramento
├── scielo/         # Scripts de extração (ponto de execução)
│   ├── openalex_scraper.py
│   └── arxiv_scraper.py
└── requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
arxiv		arxiv
functions		functions
logs		logs
scholar		scholar
scielo		scielo
.gitignore		.gitignore
LICENSE.md		LICENSE.md
README.MD		README.MD
dataset_computacao_pt.csv		dataset_computacao_pt.csv
requirements.txt		requirements.txt
sensitive.txt		sensitive.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Academic Data Scraper

📂 Estrutura do Projeto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Academic Data Scraper

📂 Estrutura do Projeto

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages