Skip to content

merunga/ejemplo-scraping-datosperu

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Ejemplo de como scrapear datosperu.org

Para ejecutar este ejemplo, necesitarás una instalación de ruby con harvestman instalado y una conexión a internet.

Para ejecutar el crawler sólo tienes que ejecutar

ruby  crawl.rb

Este script visitará las primeras 3 páginas del rubro Otras Asociaciones en datosperu.org y extraerá el nombre de la organización y su RUC.

Para entender mejor cómo se hace el scrapero, chequea el script crawl.rb, que tiene varios comentarios Algunos resultados podrás encontrarlos en el archivo resultados_crawler.txt

Y por último para poder adaptar este script a tus necesidades, es recomendado que le eches un vistazo a la tecnología XPATH

About

Codigo de ejemplo para el scrapeo de datosperu.org usando harvestman

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages