Skip to content

El arte arcano del scraping y todo lo que se necesita para él.

License

Notifications You must be signed in to change notification settings

JJ/grimorio-datos-web

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 

Repository files navigation

grimorio-datos-web

El arte arcano del scraping y todo lo que se necesita para él. Un libro que algún día escribiré y/o terminaré.

Secciones

  1. Cómo se construye una página web.
  2. Cómo se descarga una página web: el protocolo HTTP y todo lo que él conlleva.
  3. Cómo se llega a una página web.
  4. Explorando la página web: busca y (casi siempre) encontrarás.
  5. Extrayendo datos de una página web bien: usando su estructura.
  6. Extrayendo datos de una página web regular: expresiones regulares.
  7. Extrayendo datos de una págian web mal: a veces veo JavaScript.
  8. Buenas prácticas en extracción de datos.
  9. Almacenamiento y procesamiento de los datos: little big data.

About

El arte arcano del scraping y todo lo que se necesita para él.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published