<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_2_3_4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 2.3.4: Cuándo usar BI vs Python

## 1. El dilema que todo analista enfrenta

Es lunes por la mañana. Tu jefa entra y te pide:  
_"Necesito saber cuántas ventas tuvimos este fin de semana por región, y quiero verlo cada lunes automáticamente."_

Abres tu ordenador. Tienes dos opciones:  

- **Opción A:** Power BI → conectar, arrastrar campos, dashboard en 20 minutos.  
- **Opción B:** Python → importar Pandas, escribir código, generar gráficos... 2 horas.

**¿Cuál eliges?** Obviamente la A.

Pero ahora imagina que te pide:  
_"Quiero predecir qué clientes van a cancelar su suscripción el próximo mes y por qué."_

Ahora Power BI se queda corto. Necesitas **Python**.

> **Clave:** BI y Python no compiten, **colaboran**. Saber cuándo usar cada uno es lo que separa a un analista junior de uno senior.

---

## 2. Business Intelligence: La navaja suiza visual

**¿Qué es BI?**  
Herramientas como **Power BI, Tableau y Looker Studio** que permiten crear dashboards interactivos sin escribir código.

**Superpoderes de BI:**  
- **Velocidad extrema:** Dashboards en horas, no días.  
- **Democratización:** Cualquiera puede filtrar, explorar y entender.  
- **Actualización automática:** Conecta a tu base de datos y se actualiza solo.  
- **Profesionalidad visual:** Gráficos elegantes listos para presentar.  

**Ejemplo real:**  
El equipo de operaciones en **Inditex** usa **Power BI** conectado a su sistema de inventario. Cada mañana, los gerentes de tienda ven automáticamente:  
- Stock disponible por producto  
- Ventas vs objetivos  
- Alertas de productos con rotación baja  

**Resultado:** Decisiones de reposición 60% más rápidas, -12% en costes de almacén.

> **Analogía:** BI es como un **coche automático**: rápido, cómodo, perfecto para el día a día.

---

## 3. Python: El bisturí del análisis avanzado

**¿Qué es Python para datos?**  
Un lenguaje de programación con librerías como **Pandas, NumPy, Scikit-learn** que da control total sobre los datos.

**Superpoderes de Python:**  
- **Flexibilidad infinita:** Cualquier análisis imaginable.  
- **Automatización total:** Scripts que se ejecutan solos.  
- **Análisis avanzado:** Machine learning, estadística, procesamiento de texto.  
- **Limpieza industrial:** Maneja datos caóticos que BI no puede tocar.  

**Ejemplo real:**  
El equipo de **Cabify** necesitaba predecir la demanda de viajes por zona y hora para optimizar la distribución de conductores. Usaron **Python** para:  
- Limpiar millones de registros de viajes  
- Crear features (día de la semana, clima, eventos)  
- Entrenar un modelo de regresión  
- Generar predicciones cada hora  

**Resultado:** +18% en eficiencia operativa, -22% en tiempos de espera.

> **Analogía:** Python es como un **coche manual**: más lento al principio, pero te lleva donde otros no pueden.

---

## 4. Comparación directa: ¿Cuál es mejor para qué?

| Criterio | Business Intelligence | Python |
|----------|----------------------|--------|
| **Velocidad inicial** | ⚡ Muy rápida (horas) | 🐢 Lenta (días) |
| **Curva de aprendizaje** | 📈 Suave (drag-and-drop) | 📈 Empinada (programación) |
| **Flexibilidad** | 🔒 Limitada a la herramienta | 🔓 Ilimitada |
| **Limpieza de datos** | ❌ Requiere datos limpios | ✅ Diseñado para datos sucios |
| **Análisis avanzado** | 📊 Básico (KPIs, agregaciones) | 🧠 Avanzado (ML, estadística) |
| **Automatización** | 🔄 Programada (refrescos) | 🤖 Total (scripts, APIs) |
| **Accesibilidad** | 👥 Todos (interactivo) | 👨‍💻 Solo técnicos |
| **Reproducibilidad** | 🔀 Media | ✅ Alta (código versionado) |
| **Coste** | 💰 Licencias | 🆓 Open source |
| **Ideal para** | Monitoreo continuo | Investigación profunda |

---

## 5. Cuándo usar BI: Los 5 escenarios clave

### ✅ 1. Necesitas velocidad y no programar
- Reportes para reuniones de mañana.  
- Exploración rápida de datos.  
**Ejemplo:** Dashboard de ventas diarias para el equipo comercial.

### ✅ 2. La audiencia es no técnica
- Directivos, gerentes, equipos de marketing.  
- Dashboards interactivos donde ellos filtran.  
**Ejemplo:** CFO que quiere ver márgenes por producto con un clic.

### ✅ 3. Los datos ya están limpios y estructurados
- Conexión directa a SQL, Snowflake, BigQuery.  
**Ejemplo:** Conectar Power BI a tu data warehouse corporativo.

### ✅ 4. Análisis estándar y recurrente
- KPIs que se miden siempre igual.  
- Métricas de negocio conocidas.  
**Ejemplo:** Tasa de conversión, CAC, LTV, NPS.

### ✅ 5. Actualización automática es crítica
- Dashboards "vivos" que refrescan solos.  
**Ejemplo:** Monitor de incidencias en tiempo real para IT.

> **Regla práctica:** Si tu análisis se puede hacer en Excel con tablas dinámicas, probablemente se puede hacer en BI.

---

## 6. Cuándo usar Python: Los 5 escenarios clave

### ✅ 1. Datos desordenados o no estructurados
- CSV con formatos inconsistentes.  
- Múltiples fuentes que hay que unir.  
- Textos, logs, JSON anidados.  
**Ejemplo:** Limpiar 50 archivos Excel de diferentes sucursales con estructuras distintas.

### ✅ 2. Análisis estadístico o machine learning
- Regresiones, pruebas de hipótesis, A/B testing.  
- Predicciones, clasificaciones, clustering.  
**Ejemplo:** Modelo de churn prediction con 40 variables.

### ✅ 3. Transformaciones complejas y personalizadas
- Cálculos imposibles en BI.  
- Lógica de negocio muy específica.  
**Ejemplo:** Calcular Customer Lifetime Value con fórmulas personalizadas y cohortes dinámicas.

### ✅ 4. Automatización de procesos repetitivos
- Scripts que corren diariamente sin supervisión.  
- Procesar cientos de archivos.  
**Ejemplo:** Pipeline que lee datos de APIs, limpia, transforma y carga en base de datos cada noche.

### ✅ 5. Análisis exploratorio profundo (EDA)
- Investigación de un dataset nuevo.  
- Probar 20 hipótesis diferentes.  
**Ejemplo:** Entender por qué las ventas cayeron 15% en marzo analizando 30 variables.

> **Regla práctica:** Si necesitas escribir "si esto, entonces aquello" más de 5 veces, usa Python.

---

## 7. Casos prácticos: Decisiones reales

### Caso 1: Dashboard de ventas para el CEO
**Contexto:** El CEO quiere ver ventas, margen y top productos cada lunes.  
**Decisión:** **Power BI** ⚡  
**Por qué:** Análisis estándar, audiencia no técnica, actualización automática.  
**Tiempo de desarrollo:** 30 minutos.  
**Mantenimiento:** Cero (se actualiza solo).

---

### Caso 2: Predecir cancelaciones de clientes
**Contexto:** Marketing quiere identificar clientes en riesgo de churn.  
**Decisión:** **Python (Pandas + Scikit-learn)** 🐍  
**Por qué:** Machine learning, análisis de 30+ variables, scoring personalizado.  
**Tiempo de desarrollo:** 8 horas (modelo inicial).  
**Mantenimiento:** Mensual (reentrenamiento).

---

### Caso 3: Limpiar datos de 100 sucursales
**Contexto:** Cada sucursal envía Excel con formato diferente. Hay que unificar.  
**Decisión:** **Python (Pandas + os)** 🐍  
**Por qué:** Automatización, transformaciones complejas, procesamiento en lote.  
**Tiempo de desarrollo:** 2 horas de código.  
**Resultado:** Tarea repetible en 10 segundos vs 2 días manuales.

---

### Caso 4: Análisis exploratorio de dataset desconocido
**Contexto:** Te llega un CSV de 800K filas que nunca has visto.  
**Decisión:** **Python (Pandas + Seaborn)** 🐍  
**Por qué:** Exploración profunda, detección de outliers, distribuciones, correlaciones.  
**Tiempo:** 1-2 horas.  
**Output:** Notebook con hallazgos que luego se convierten en dashboard BI.

---

### Caso 5: Monitor de KPIs de e-commerce
**Contexto:** Tracking de pedidos, conversión, AOV en tiempo real.  
**Decisión:** **Looker Studio** ⚡  
**Por qué:** Actualización continua, acceso para todo el equipo, métricas estándar.  
**Tiempo de desarrollo:** 1 hora.  
**Usuarios:** 20 personas del equipo pueden verlo y filtrarlo.

---

## 8. El enfoque ganador: BI + Python trabajando juntos

La magia ocurre cuando **combinas ambas herramientas** en un flujo integrado.

### 🔄 Flujo de trabajo ideal:

1. **Python:** Limpia, transforma, enriquece datos crudos.  
2. **Python:** Calcula métricas complejas o genera predicciones.  
3. **Python/Airflow:** Automatiza el proceso y guarda resultados en base de datos.  
4. **BI:** Se conecta a los datos ya procesados.  
5. **BI:** Crea dashboards interactivos para stakeholders.  
6. **BI:** Usuarios finales toman decisiones sin pedir a un analista.

**Ejemplo real en Glovo:**  
1. **Ingeniero de datos:** Pipeline en Python que procesa logs de pedidos (millones de filas).  
2. **Científico de datos:** Modelo en Python que calcula "tiempo estimado de entrega" por zona.  
3. **Analytics Engineer:** Transforma los datos y crea tablas limpias en BigQuery.  
4. **Analista:** Dashboard en Looker Studio que muestra tiempos de entrega vs objetivos.  
5. **Gerentes de operaciones:** Usan el dashboard para optimizar rutas y asignar repartidores.  

**Resultado:** -15% en tiempos de entrega, +8% en satisfacción de clientes.

> **Clave:** Python para **preparar** y **descubrir**. BI para **comunicar** y **monitorizar**.

---

## 9. Tabla de decisión rápida

| Tu situación | Herramienta | Razón |
|--------------|-------------|-------|
| Dashboard para directivos | **BI** | Visualización rápida, interactiva, sin código |
| Limpieza de datos caóticos | **Python** | Flexibilidad para transformaciones complejas |
| Reporte semanal automático | **BI** | Actualización programada, fácil compartir |
| Predicción con ML | **Python** | Requiere algoritmos y librerías especializadas |
| Análisis estadístico avanzado | **Python** | Control total, reproducibilidad |
| Monitoreo de KPIs en tiempo real | **BI** | Conexión directa a fuentes de datos vivas |
| Unir 50 archivos Excel | **Python** | Automatización de procesamiento en lote |
| Análisis exploratorio de dataset nuevo | **Python** | Flexibilidad para probar hipótesis |
| Presentación a stakeholders | **BI** | Visualizaciones profesionales e interactivas |
| Web scraping o consumo de APIs | **Python** | BI no puede extraer datos externos |
| KPIs básicos (suma, promedio, %) | **BI** | Más rápido y no requiere programación |
| Calcular métricas personalizadas | **Python** | Lógica de negocio compleja |

---

## 10. Errores comunes (y cómo evitarlos)

| ❌ Error | ✅ Solución |
|---------|-----------|
| Usar solo BI y quedarse en análisis superficial | Dedica tiempo semanal a exploración en Python |
| Hacer todo en Python y no comunicar insights | Convierte hallazgos clave en dashboards accesibles |
| Forzar datos sucios en BI → gráficos incorrectos | Limpia primero en Python o con ETL adecuado |
| Ignorar el mantenimiento de dashboards | Documenta métricas y revisa dashboards trimestralmente |
| Reinventar la rueda en Python cuando BI es suficiente | Pregúntate: "¿Realmente necesito flexibilidad total?" |
| Usar BI para análisis que requieren ML | Reconoce las limitaciones y cambia a Python |

---

## 11. ¿Y si solo domino una herramienta?

### Si solo sabes BI:
**Aprende Python básico:** Pandas para leer CSVs, hacer groupby, limpiar nulos.  
**Por qué:** Te hará más autónomo cuando los datos están sucios.  
**Tiempo de inversión:** 2-4 semanas de práctica.  
**ROI:** Podrás hacer el doble de análisis sin depender de ingenieros.

### Si solo sabes Python:
**Aprende Power BI o Looker Studio:** Conectar datos, crear visualizaciones básicas.  
**Por qué:** Tus insights tendrán 10x más impacto si son visibles y accesibles.  
**Tiempo de inversión:** 1-2 semanas.  
**ROI:** Tus análisis llegarán a toda la organización, no solo a técnicos.

> **Verdad incómoda:** Los mejores analistas dominan **ambas herramientas** y saben exactamente cuándo usar cada una.

---

## 12. Tendencias actuales: Integración nativa

Las herramientas ya no están separadas:

- **Power BI + Python:** Ejecuta scripts de Python dentro de Power BI para visualizaciones personalizadas.  
- **Tableau + TabPy:** Usa Python para cálculos complejos en Tableau.  
- **Looker + BigQuery ML:** Ejecuta modelos de ML directamente desde Looker.  
- **Streamlit/Plotly Dash:** Crea dashboards interactivos con Python puro.

**El futuro:** La línea entre BI y Python se difumina. Lo importante es el **resultado**, no la herramienta.

---

## 13. Resumen ejecutivo

- **BI:** Velocidad, accesibilidad, monitoreo continuo. Ideal para **reportes recurrentes**.  
- **Python:** Profundidad, flexibilidad, análisis avanzado. Ideal para **investigación y automatización**.  
- **Lo mejor:** Usarlas juntas en un **flujo integrado** (Python prepara, BI comunica).  
- **Decisión clave:** Pregúntate siempre: _"¿Necesito velocidad o control? ¿Audiencia técnica o no técnica?"_  

**Regla de oro final:** Usa BI para **comunicar** lo conocido. Usa Python para **descubrir** lo desconocido.

---

## 14. Referencias

### Vídeos
- [Power BI vs Python: Which One Should You Learn?](https://youtu.be/7sFacrcJYXk)
- [When to Use Python vs SQL vs Power BI](https://youtu.be/LY5Y0qTfD3c)
- [Modern Data Stack Explained](https://youtu.be/tyJ476aNCYU)
- [Data Analysis: Python vs BI Tools](https://youtu.be/q5n4Bj6XqUc)

### Lecturas
- [Data Analyst Roadmap](https://roadmap.sh/data-analyst)
- [The Modern Data Stack: BI Tools in the Age of Python](https://www.getcensus.com/blog/bi-tools-vs-python)
- [When to Use Python for Data Analysis](https://realpython.com/python-data-analysis/)

### Herramientas
- **BI:** Power BI Desktop (gratis), Looker Studio (gratis), Tableau Public  
- **Python:** Jupyter Notebook, Google Colab  
- **Integración:** TabPy, Power BI Python visuals, Streamlit

---

## 15. Ejercicio práctico para alumnos

**Reto:** Descarga un dataset de ventas (ej. de Kaggle).  

**Parte 1 - BI:**  
- Crea un dashboard en Looker Studio o Power BI.  
- Muestra ventas por mes, top 10 productos, margen por categoría.  
- **Tiempo objetivo:** 30 minutos.

**Parte 2 - Python:**  
- Responde: _"¿Hay diferencias estadísticamente significativas en ventas entre productos con descuento vs sin descuento?"_  
- Usa Pandas para calcular, SciPy para t-test, Seaborn para visualizar.  
- **Tiempo objetivo:** 90 minutos.

**Reflexión:** Compara cuándo fue más útil cada herramienta y por qué.
