El arte arcano del scraping y todo lo que se necesita para él. Un libro que algún día escribiré y/o terminaré.
- Cómo se construye una página web.
- Cómo se descarga una página web: el protocolo HTTP y todo lo que él conlleva.
- Cómo se llega a una página web.
- Explorando la página web: busca y (casi siempre) encontrarás.
- Extrayendo datos de una página web bien: usando su estructura.
- Extrayendo datos de una página web regular: expresiones regulares.
- Extrayendo datos de una págian web mal: a veces veo JavaScript.
- Buenas prácticas en extracción de datos.
- Almacenamiento y procesamiento de los datos: little big data.