Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Investigar Spiders Contracts para testar las Spiders. #24

Open
matiskay opened this issue Aug 14, 2015 · 4 comments
Open

Investigar Spiders Contracts para testar las Spiders. #24

matiskay opened this issue Aug 14, 2015 · 4 comments

Comments

@matiskay
Copy link
Contributor

Ahora que se esta en proceso de refactorizar las spiders y agregar items loaders para la recoleccion de datos. Nos vemos con la necesidad de testar las spider de una manera programatica.

Actualmente mi forma de testar una spider es:

  • Comparar el total de elementos de una fecha.

  • Escoger un item de la primera pagina y buscar este elemento en la base de datos.

  • Escoger un item de una pagina intermedia y buscar este elemento en la base de datos.

  • Escoger un item de la pagina final y buscar este elemento en la base de datos.

    Cosas interesantes sobre los registros de visitas.

  • Hay "invarianza" en el total de visitas de una determinada fecha.

  • Hay "invarianza" en los items de una determinada fecha.

Si es que spider contracts no funciona para nuestro caso la idea seria usar pytest conectado a la base de datos y verificar que los registros estan en la base de datos.

Creo que se va necesitar agregar una comando para hacer crawling de una fecha especifica.

Link: Spider Contracts: http://doc.scrapy.org/en/latest/topics/contracts.html

@aniversarioperu
Copy link
Member

antes he usado un fake response from spider para testear los spiders de Scrapy.

también estuve testeando el pipeline https://github.com/proyectosdeley/proyectos_de_ley_scraper/tree/master/pdl_scraper

tener tests para manolo_scaper sería un golazo.

@aniversarioperu aniversarioperu self-assigned this Aug 17, 2015
@matiskay
Copy link
Contributor Author

@aniversarioperu, genial. Voy a revisar el fake response y proponer un metodo para testear las spider de manolo.

@aniversarioperu
Copy link
Member

ok, si te encargas entonces me des-auto-asignaré 😄

@aniversarioperu aniversarioperu removed their assignment Aug 17, 2015
@matiskay
Copy link
Contributor Author

@aniversarioperu, por ahora los unicos tests que tenemos son tests para los metodos parse de varias spiders. Hacer test para los otros metodos es mas complicado porque no solo lidiamos con paginas obtenidas por GET sino que la logica involucra parametros que se envian por POST.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants