Automatiza lo que el SRI nunca pensó automatizar.
SRI PRO AUTOMATIZADO es un motor en Python que permite:
- 📥 Descargar comprobantes desde el portal del SRI\
- 📄 Extraer XML y RIDE\
- 📊 Procesar datos contables automáticamente\
- 📦 Generar datasets listos para análisis
El SRI: - ❌ No tiene API pública\
- ❌ Obliga procesos manuales\
- ❌ Usa CAPTCHA\
- ❌ No permite descarga masiva real
👉 Este proyecto resuelve eso sin romper las reglas.
sri_pro_automatizado.py
portal → descarga desde SRI
parse → procesamiento XML
consolidar → unión de datos
- Python 3.x\
- Playwright\
- Pandas\
- XML Parsing
- ✔ Automatización del portal SRI\
- ✔ Soporte CAPTCHA manual\
- ✔ Descarga inteligente (XML / RIDE / PDF)\
- ✔ Corrección de archivos corruptos (UUID)\
- ✔ Procesamiento masivo de XML\
- ✔ Exportación JSON estructurado\
- ✔ Logs y control de errores
pip install playwright pandas openpyxl
playwright installpython sri_pro_automatizado.py portal \
--start-year 2024 \
--end-year 2025 \
--outdir ./sri_data \
--browser edge \
--download-mode bothpython sri_pro_automatizado.py parse \
--input-dir ./xml_recibidos \
--output-json ./salida/compras_struct.json \
--output-flat-json ./salida/compras_items.json \
--workers 4python sri_pro_automatizado.py consolidar \
--input-dir ./sri_data/downloads \
--output-file ./salida/consolidado.json- No evade seguridad del SRI\
- CAPTCHA es manual\
- Algunos XML dependen del flujo interno del portal
Ing. Jenny Julizza Álava Bolaños
El SRI no fue hecho para automatizarse.
Pero eso nunca ha detenido a los ingenieros.