El proyecto consiste en la recopilación de información de documentos descalificados de páginas web como la CIA, Mossad y la NSA, el spider utilizado para la realización del scraping se encuentra dentro de IAgency, el cual generá un archivo cia.json que contiene el url, el titulo y el cuerpo del documento extraído de las páginas web. El archivo cia.json paso a ser utilizado para crear tarjetas dentro de una página web como ejemplo de lo que se puede hacer con web scraping.
- Scrapy que es un framework de alto nivel el cual facilita el proceso de Web Scraping y Web Crawiling (Realización de Scrapy a lo largo del sitio web).
- Python y el concepto de generadores
- Hmtl
- Css
- JavaScript