Este é um exemplo de como fazer web scraping com Puppeteer para coletar dados de uma página da web.
- Clone o repositório:
git clone https://github.com/ZOMBOTRON/reegex.git
- Instale as dependências:
npm install
- Execute o script:
node index.js
Este script lê os IDs dos distritos de um arquivo JSON chamado IDs.json
e coleta dados de cada distrito usando Puppeteer. Os dados coletados incluem o nome da cidade, população, gentílico e território. Os dados são salvos em um arquivo CSV chamado dados.csv
.
Cidade,População,Gentílico,Território
São Salvador do Tocantins,2.385,são salvadorense,2.385km²
São Sebastião do Tocantins,4.100,sansebastianense,4.100km²
São Valério,4.422,são valeriano,4.422km²
- Este script é apenas um exemplo e pode ser modificado para atender às suas necessidades específicas.
- Certifique-se de respeitar os termos de serviço do site ao fazer web scraping.
- Consulte a documentação do Puppeteer para obter mais informações sobre como usá-lo.
- Este script foi testado com o Puppeteer versão 22.8.0.
- Este script foi escrito em JavaScript ES6 e requer Node.js para ser executado.