Skip to content

Guía de 101Crawlers

Iñigo Alonso Ruiz edited this page Apr 12, 2016 · 5 revisions

Guía y Wiki de 101Crawlers

Este proyecto tiene dos partes. La [parte web] (https://github.com/Shathe/101CrawlersWeb/tree/master/site) que encapsula todo el funcionamiento y la parte de más bajo nivel que implementa toda la [lógica sobre Nutch y Docker] (https://github.com/Shathe/101CrawlersWeb/tree/master/butler)

La parte de web actualmente está bajo desarrollo que se implementará cuando se tenga una base útil de la lógica para poder dar un mínimo servicio.

  1. Tener instalado docker en el sistema (y en funcionamiento). Para más información [instalación completa y configurando] (https://docs.docker.com/engine/installation/) o instalación rápida en [linux] (https://docs.docker.com/linux/) [Mac] (https://docs.docker.com/mac/) [Windows] (https://docs.docker.com/windows/). Se recomienda la instalación completa, puesto que indica como configurar, por ejemplo en linux docker para no tener que dar permisos de root (Si no, estos scripts, seguramente no funcionarán). Puede que aparezca este mensaje:

    WARNING: Error loading config file:/home/user/.docker/config.json - stat /home/user/.docker/config.json: permission denied
    

    Pero no da problemas pues no es necesario (se puede crear un fchero con un Json vacío {} para que no e aparezca). El mensaje que no te tiene que aparecer es 'Cannot connect to the Docker daemon. Is 'docker daemon' running on this host?' lo cual significará que se ha configurado mal docker.

  2. Ir al [tutorial] (https://github.com/Shathe/101CrawlersWeb/wiki/Tutorial-%5BEN%5D)

Clone this wiki locally