ChileAyuda.com - Web Scraper

Este scraper tiene como objetivo centralizar noticias de varias fuentes en un solo origen para luego poder procesar y difundir a distintos sistemas.

Stack de tecnologías

NodeJs

Como instalar / ejecutar

# Instalar dependencias
npm install

# Correr tests
npm run test

# Ejecutar (prod)
node scraper.js -s <source-name> -o </path/to/file.json>

Uso

# Una ejecución por fuente de datos

node scraper.js -s <source-name> -o </path/to/file.json>

# El resultado es que genera un archivo en disco con el contenido
# parseado en JSON

Cómo funciona

Este scraper consta de un controller, un fetcher, un writer y un conjunto de parsers.

El controller se encarga de delegar entre los componentes y realizar el control de errores.

El fetcher se encarga de realizar el request http y generar un DOM mediante cheerio.

Los parsers declaran que fuentes soporta este scraper. Cada parser soporta a una fuente en particular, declarando su nombre, url y lo más importante, una función que convierte el DOM en un JSON según lo que interese de cada sitio en particular

El writer se encarga de escribir los resultados a un JSON probando que no haya duplicados y que se mantengan/eliminen registros históricos deacuerdo a los parametros configurados.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

ChileAyuda.com - Web Scraper

Stack de tecnologías

Como instalar / ejecutar

Uso

Cómo funciona

Files

README.md

Latest commit

History

README.md

File metadata and controls

ChileAyuda.com - Web Scraper

Stack de tecnologías

Como instalar / ejecutar

Uso

Cómo funciona