Este script automatiza el proceso de consulta de EPS en el sitio web de ADRES usando Selenium WebDriver y Puppeteer. Utiliza ScraperAPI para obtener el HTML de la página dinámica y AntiCaptcha para resolver los desafíos CAPTCHA.
- Node.js instalado
- NPM (Node Package Manager) instalado
- Microsoft Edge instalado (el WebDriver de Edge debe estar disponible)
Antes de ejecutar el script, asegúrate de instalar las dependencias necesarias ejecutando:
npm installO en su defecto:
npm install -r requirements.txt- Asegúrate también de configurar tu clave API de ScrapperAPI y tu clave API de AntiCaptcha en el archivo index.js antes de ejecutar el script.
// Configuración de AntiCaptcha
ac.setAPIKey("YOUR_ANTICAPTCHA_KEY");//Configuración de ScrapperAPI
const API_KEY = "YOUR_SCRAPPERAPI_KEY";Para ejecutar el script, utiliza el siguiente comando en la línea de comandos:
node index.js tipoDoc numDocDonde:
tipoDoc es el tipo de documento (por ejemplo, "CC" para cédula de ciudadanía).
numDoc es el número de documento asociado al tipo.
Por ejemplo:
node index.js CC 123456789Esto iniciará el proceso de scraping y generará un archivo PDF con la consulta realizada.
El script realiza las siguientes acciones:
- Obtiene la página usando ScraperAPI para manejar la renderización de JavaScript.
- Navega al formulario de consulta y completa los campos requeridos (tipo de documento y número de documento).
- Descarga y resuelve el CAPTCHA utilizando AntiCaptcha.
- Realiza la consulta haciendo clic en el botón correspondiente.
- Espera a que se abra una nueva pestaña con los resultados y guarda la página como HTML.
- Utiliza Puppeteer para guardar la página como un archivo PDF.
- El script está diseñado para funcionar con la configuración predeterminada de Selenium y Puppeteer. Asegúrate de que el WebDriver de Edge esté correctamente instalado y configurado para su uso.
- El uso de ScraperAPI y AntiCaptcha puede implicar costos adicionales dependiendo del volumen de uso y las tarifas de servicio.