Skip to content

lucianomcsilva/robo_aj

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Robô (aranha) Arnaldo Jabor

Projeto criado para o curso de recueração de informação na web e em redes sociais do Mackenzie. Para todar esse codigo, é preciso ter o scrapy instalado na sua maquina.

Para instalar o scrapy:

Execute a instalação diretamente pelo PIP pelo comando abaixo

pip install scrapy

Executando a aranha

Uma vez instalada, acenda ao diretório robo_aj e execute o comando:

scrapy crawl spider_aj 

O scrapy permite que você salve o resultado em outros formados, diretamente no comando de linha. para isso, basta incluir -O seguido do nome do arquivo e extensão. São aceitos .csv, .json e .jl (JSONLine). Exemplo:

scrapy crawl spider_aj -O artigos.jl 

Consulte a documentação do scrapy para outros comandos.

Alteração do código

Para alterar a aranha, vocÊ deve mexer no arquivo spider_aj.py. Não é necessário mexer nos demais arquivos. Os links com os textos do Arnaldo Jabor no jornal o tempo estão ja pre carregados neste html

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published