Skip to content

Colección de herramientas y scripts (Python, SQL) para potenciar el Data Engineering con Inteligencia Artificial. Incluye optimizadores SQL, documentación automática de SSIS, resumidores técnicos y prompts especializados

License

Notifications You must be signed in to change notification settings

ChenchoDev/ia-data-engineering-tools

Repository files navigation

🤖 IA Tools for Data Engineering

Colección de herramientas y scripts que usan Inteligencia Artificial para mejorar la productividad de Data Engineers.

License: MIT Python 3.9+ PRs Welcome

🎯 Objetivo

Demostrar cómo la IA puede complementar (no reemplazar) el trabajo de un Data Engineer, automatizando tareas repetitivas y acelerando el aprendizaje.

Este proyecto nace de la experiencia real trabajando con Azure Data Factory, SSIS, Power BI y SQL Server, identificando tareas donde la IA puede aportar valor inmediato.

🛠️ Herramientas

🤖 Automatización

📚 Aprendizaje

⚡ Productividad

💡 Ejemplos Prácticos

🚀 Quick Start

🌟 Opción A: Web App (Visual)

La forma más fácil de usar las herramientas es a través de la interfaz gráfica unificada.

# 1. Instalar dependencias
pip install -r requirements.txt

# 2. Configurar tu API Key en el archivo .env

# 3. Lanzar la aplicación
streamlit run app.py

# Si el comando anterior falla en Windows, prueba:
python -m streamlit run app.py

⌨️ Opción B: Línea de Comandos (CLI)

Si prefieres usar scripts individuales o automatizar tareas:

# Clonar repositorio
git clone https://github.com/ChenchoDev/ia-data-engineering-tools.git
cd ia-data-engineering-tools

# Crear entorno virtual (recomendado)
python -m venv venv
# Windows: venv\Scripts\activate
# Mac/Linux: source venv/bin/activate

# Instalar dependencias
pip install -r requirements.txt

# Configurar API Key
cp .env.example .env
# Edita .env con tu clave

Uso rápido (CLI)

# Ejemplo: Generar código Biml para SSIS
cd 01-automation/ssis-generator
python ssis_generator.py --prompt "Cargar tabla Clientes desde CSV a SQL"

📚 Documentación

🎯 Casos de Uso

Para Data Engineers

  • ✅ Documentar pipelines ETL automáticamente
  • ✅ Optimizar queries lentas
  • ✅ Aprender nuevas tecnologías más rápido
  • ✅ Generar código boilerplate
  • ✅ Debugging asistido por IA

Para Equipos

  • ✅ Estandarizar documentación
  • ✅ Onboarding más rápido
  • ✅ Knowledge sharing
  • ✅ Reducir deuda técnica

🗺️ Roadmap

✅ Fase 1: MVP (Completada)

  • Estructura del repositorio
  • README principal
  • Colección de prompts
  • Documentación básica

🚧 Fase 2: Herramientas Core (En progreso)

  • SQL Optimizer funcional
  • SSIS Documenter
  • Article Summarizer
  • Tests unitarios

📋 Fase 3: Expansión (Planificado)

  • ADF Pipeline Generator
  • Power BI DAX Optimizer
  • Integración con Azure DevOps
  • CLI unificada

🤝 Contribuciones

¡Las contribuciones son bienvenidas! Si tienes ideas para nuevas herramientas o mejoras:

  1. Fork el proyecto
  2. Crea una rama para tu feature (git checkout -b feature/AmazingFeature)
  3. Commit tus cambios (git commit -m 'Add some AmazingFeature')
  4. Push a la rama (git push origin feature/AmazingFeature)
  5. Abre un Pull Request

Ver CONTRIBUTING.md para más detalles.

📄 Licencia

Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para más detalles.

👤 Autor

Chencho Marín

⚠️ Disclaimer

Este es un proyecto personal creado con fines educativos y de demostración. No incluye código propietario ni datos reales de clientes. Todos los ejemplos son genéricos y ficticios.

🙏 Agradecimientos

  • A la comunidad de Data Engineering por compartir conocimiento
  • A los creadores de las librerías open source utilizadas
  • A todos los que contribuyen con feedback y mejoras

Si este proyecto te resulta útil, dale una estrella!

💡 ¿Tienes ideas para nuevas herramientas? Abre un issue y hablemos.

About

Colección de herramientas y scripts (Python, SQL) para potenciar el Data Engineering con Inteligencia Artificial. Incluye optimizadores SQL, documentación automática de SSIS, resumidores técnicos y prompts especializados

Resources

License

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages