🤖 IA Tools for Data Engineering

Colección de herramientas y scripts que usan Inteligencia Artificial para mejorar la productividad de Data Engineers.

🎯 Objetivo

Demostrar cómo la IA puede complementar (no reemplazar) el trabajo de un Data Engineer, automatizando tareas repetitivas y acelerando el aprendizaje.

Este proyecto nace de la experiencia real trabajando con Azure Data Factory, SSIS, Power BI y SQL Server, identificando tareas donde la IA puede aportar valor inmediato.

🛠️ Herramientas

🤖 Automatización

SSIS Documenter - Genera documentación automática de paquetes SSIS
SQL Optimizer - Analiza y optimiza queries SQL

📚 Aprendizaje

Article Summarizer - Resume artículos técnicos de Azure, Power BI, etc.
Code Explainer - Explica código complejo en lenguaje simple

⚡ Productividad

Prompt Templates - Biblioteca de prompts útiles para Data Engineers
Workflow Automation - Automatización de tareas comunes

💡 Ejemplos Prácticos

ADF Pipeline Generator - Genera pipelines de Azure Data Factory desde lenguaje natural
Power BI DAX Optimizer - Optimiza medidas DAX y mejora rendimiento

🚀 Quick Start

🌟 Opción A: Web App (Visual)

La forma más fácil de usar las herramientas es a través de la interfaz gráfica unificada.

# 1. Instalar dependencias
pip install -r requirements.txt

# 2. Configurar tu API Key en el archivo .env

# 3. Lanzar la aplicación
streamlit run app.py

# Si el comando anterior falla en Windows, prueba:
python -m streamlit run app.py

⌨️ Opción B: Línea de Comandos (CLI)

Si prefieres usar scripts individuales o automatizar tareas:

# Clonar repositorio
git clone https://github.com/ChenchoDev/ia-data-engineering-tools.git
cd ia-data-engineering-tools

# Crear entorno virtual (recomendado)
python -m venv venv
# Windows: venv\Scripts\activate
# Mac/Linux: source venv/bin/activate

# Instalar dependencias
pip install -r requirements.txt

# Configurar API Key
cp .env.example .env
# Edita .env con tu clave

Uso rápido (CLI)

# Ejemplo: Generar código Biml para SSIS
cd 01-automation/ssis-generator
python ssis_generator.py --prompt "Cargar tabla Clientes desde CSV a SQL"

📚 Documentación

Getting Started - Guía de inicio rápido
Use Cases - Casos de uso reales
Best Practices - Mejores prácticas al usar IA en Data Engineering

🎯 Casos de Uso

Para Data Engineers

✅ Documentar pipelines ETL automáticamente
✅ Optimizar queries lentas
✅ Aprender nuevas tecnologías más rápido
✅ Generar código boilerplate
✅ Debugging asistido por IA

Para Equipos

✅ Estandarizar documentación
✅ Onboarding más rápido
✅ Knowledge sharing
✅ Reducir deuda técnica

🗺️ Roadmap

✅ Fase 1: MVP (Completada)

Estructura del repositorio
README principal
Colección de prompts
Documentación básica

🚧 Fase 2: Herramientas Core (En progreso)

SQL Optimizer funcional
SSIS Documenter
Article Summarizer
Tests unitarios

📋 Fase 3: Expansión (Planificado)

ADF Pipeline Generator
Power BI DAX Optimizer
Integración con Azure DevOps
CLI unificada

🤝 Contribuciones

¡Las contribuciones son bienvenidas! Si tienes ideas para nuevas herramientas o mejoras:

Fork el proyecto
Crea una rama para tu feature (git checkout -b feature/AmazingFeature)
Commit tus cambios (git commit -m 'Add some AmazingFeature')
Push a la rama (git push origin feature/AmazingFeature)
Abre un Pull Request

Ver CONTRIBUTING.md para más detalles.

📄 Licencia

Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE para más detalles.

👤 Autor

Chencho Marín

💼 LinkedIn: chencho-marin
🌐 Web: chenchomarin.com
📧 Email: contacto@chenchomarin.com

⚠️ Disclaimer

Este es un proyecto personal creado con fines educativos y de demostración. No incluye código propietario ni datos reales de clientes. Todos los ejemplos son genéricos y ficticios.

🙏 Agradecimientos

A la comunidad de Data Engineering por compartir conocimiento
A los creadores de las librerías open source utilizadas
A todos los que contribuyen con feedback y mejoras

⭐ Si este proyecto te resulta útil, dale una estrella! ⭐

💡 ¿Tienes ideas para nuevas herramientas? Abre un issue y hablemos.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
01-automation		01-automation
02-learning-tools		02-learning-tools
03-productivity		03-productivity
04-examples		04-examples
docs		docs
.env.example		.env.example
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
PROYECTO_IA_DATA_ENGINEERING.md		PROYECTO_IA_DATA_ENGINEERING.md
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🤖 IA Tools for Data Engineering

🎯 Objetivo

🛠️ Herramientas

🤖 Automatización

📚 Aprendizaje

⚡ Productividad

💡 Ejemplos Prácticos

🚀 Quick Start

🌟 Opción A: Web App (Visual)

⌨️ Opción B: Línea de Comandos (CLI)

Uso rápido (CLI)

📚 Documentación

🎯 Casos de Uso

Para Data Engineers

Para Equipos

🗺️ Roadmap

✅ Fase 1: MVP (Completada)

🚧 Fase 2: Herramientas Core (En progreso)

📋 Fase 3: Expansión (Planificado)

🤝 Contribuciones

📄 Licencia

👤 Autor

⚠️ Disclaimer

🙏 Agradecimientos

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

License

ChenchoDev/ia-data-engineering-tools

Folders and files

Latest commit

History

Repository files navigation

🤖 IA Tools for Data Engineering

🎯 Objetivo

🛠️ Herramientas

🤖 Automatización

📚 Aprendizaje

⚡ Productividad

💡 Ejemplos Prácticos

🚀 Quick Start

🌟 Opción A: Web App (Visual)

⌨️ Opción B: Línea de Comandos (CLI)

Uso rápido (CLI)

📚 Documentación

🎯 Casos de Uso

Para Data Engineers

Para Equipos

🗺️ Roadmap

✅ Fase 1: MVP (Completada)

🚧 Fase 2: Herramientas Core (En progreso)

📋 Fase 3: Expansión (Planificado)

🤝 Contribuciones

📄 Licencia

👤 Autor

⚠️ Disclaimer

🙏 Agradecimientos

About

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages