-
Notifications
You must be signed in to change notification settings - Fork 0
/
README
17 lines (13 loc) · 801 Bytes
/
README
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Programa para descargar *todas* las imagenes de las actas escaneadas en el PREP del IFE.
El programa usa Web Scraping (http://en.wikipedia.org/wiki/Web_scraping ) para obtener las URLs de las imágenes.
Requerimientos:
Java 1.6+
Apache Commons Lang 3 (http://commons.apache.org/lang/ )
Wget, ya sea para Linux o para Windows (http://gnuwin32.sourceforge.net/packages/wget.htm )
Setup:
Modificar las constantes:
'STOPCRAWLERFILENAME' archivo en el sistema de archivos local que se buscará un archivo para detener el proceso.
'WGETPATH' el path al ejecutable de Wget
'PREPURL' URL del Servlet 'DetalleCasillas' del PREP (Hay varios espejos del PREP)
Ejemplo de uso desde la consola:
java -Xmx2048m -jar "/Users/xxx/NetBeansProjects/ObtenerActasPREP/dist/ObtenerActasPREP.jar" > /Users/xxx/urls.txt