# Sprint 2 - Webinar 5 (Parte 1 de 2): PivotTables y Visualización (Excel/Google Sheets)
**Fecha:** 2025-09-16  
**Dataset:** `sp2_w5_almacen_ventas.xlsx` (adjunto)  
**Herramientas:** Excel o Google Sheets (sin Python/pandas)  
**Nivel:** Intermedio  
**Duración total:** 120 minutos

<div style="text-align: center">
    <img src="https://raw.githubusercontent.com/ljpiere/tpdata_python/main/images/w1s1_2.png" width="400">
</div>

## Objetivos de aprendizaje
- Construir y personalizar PivotTables para agrupar y resumir datos.  
- Filtrar, ordenar y aplicar diferentes cálculos (SUM, COUNT, AVERAGE, MAX, MIN).  
- Interpretar resultados y convertirlos en hallazgos para negocio.  
- Crear gráficos apropiados y usar formato condicional para resaltar valores clave.  
- Diseñar una pestaña-resumen tipo mini dashboard.  
- Usar LLMs (ChatGPT/Claude) como apoyo para agregaciones **con criterio y cautela**.

## Agenda (120 min)
1) **PivotTables – fundamentos y primera tabla dinámica** (25 min)  
2) **Filtrado y orden dentro de la PivotTable** (15 min)  
3) **Cálculos y múltiples métricas** (20 min)  
4) **Refinar el layout e interpretar resultados** (10 min)  
5) **AI 🤖 LLMs para filtrar/agregar (con riesgos)** (10 min)  
6) **Gráficos correctos y narrativa** (15 min)  
7) **Formato condicional para resaltar** (10 min)  
8) **Mini dashboard de resumen** (10 min)  
9) **Comunicar hallazgos en una diapositiva** (5 min)


## Preparación (antes de la clase)
- Descarga/abre `sp2_w5_almacen_ventas.xlsx` en Excel o súbelo a Google Drive y ábrelo en Sheets.  
- Verifica que las columnas tengan tipos coherentes: fechas, categorías (región, producto), números (unidades, ventas).  
- Crea una pestaña nueva llamada **`Pivot_Trabajo`** y otra **`Resumen`** para el dashboard final.

# 4. Analyzing Data with PivotTables (Dataset: `sp2_w5_almacen_ventas.xlsx`)

Usaremos la hoja **`Raw Data`** con columnas:
- **Date**, **Region**, **Product**, **Units_Sold**, **Unit_Price**, **Salesperson**, **Total_Sales**.

**Por qué importa (teoría):** una tabla dinámica estima **estadísticos** (SUM, AVG, COUNT, %) por **dimensiones** (Date/Region/Product/Salesperson) para condensar transacciones en **KPIs**. Esto reduce dimensionalidad, facilita comparar grupos y detectar patrones/outliers—paso clave del **análisis descriptivo**.


## 4.1 Building Your First PivotTable (25 min)

**Pregunta guía:** *¿Qué **Regiones** y **Productos** explican más **Total_Sales**?*

**Paso a paso en Google Sheets:**
1) Importa el XLSX a Google Drive y abre en **Sheets**.  
2) Ve a la hoja **`Raw Data`**. Selecciona todo el rango con encabezados (A:G).  
3) **Insertar → Tabla dinámica** → *Nueva hoja*.  
4) En el panel de la tabla dinámica:  
   - **Filas** → **Region**.  
   - **Columnas** → **Product** (opcional si deseas matriz Region×Product).  
   - **Valores** → **Total_Sales** como **SUMA**.  
5) Activa **Mostrar totales**.  
6) QA rápido: el **Total general** debe coincidir con `=SUM('Raw Data'!G:G)` (columna **Total_Sales**).

**Notas teóricas:** esta agregación estima el **tamaño total** por grupo (suficiente para priorizar top performers).

## 4.2 Filtering and Sorting Inside PivotTables (15 min)

**Objetivo:** Enfocarnos en lo relevante (tiempo/segmentos) y ordenar por contribución.

**Paso a paso en Google Sheets:**
1) **Filtro por fecha:** agrega **Date** a **Filtros** → *Entre* → selecciona un rango (p.ej., 2024-01-01 a 2024-03-31).  
2) **Filtro por vendedor:** agrega **Salesperson** a **Filtros** si deseas excluir cuentas de prueba.  
3) **Ordenar:** en **Valores**, usa el menú de tres puntos → **Ordenar por SUM de Total_Sales (desc)** para ver **top regiones/productos**.

**Tip QA:** guarda los criterios aplicados (rango de fechas, exclusiones) en una hoja `change_log`.

## 4.3 Summarizing with Different Calculations (20 min)

**Preguntas guía:**  
- ¿Cuál es el **ticket promedio** (ingreso por unidad) por Region/Product?  
- ¿Qué % del total aporta cada Región?

**Paso a paso en Google Sheets:**
1) En la misma tabla dinámica (o crea otra):  
   - **Valores → Total_Sales** como **SUMA** (Ingresos).  
   - **Valores → Units_Sold** como **SUMA** (Volumen).  
2) **Ticket promedio** (dos alternativas):  
   - **Fácil (tabla dinámica):** agrega **Total_Sales** como **SUMA** y **Units_Sold** como **SUMA** y crea un **Campo calculado**:  
     - `TicketProm = Total_Sales / Units_Sold`  
   - **Fuera de la Pivot (hoja normal):** usa una tabla auxiliar con `=SUMIFS('Raw Data'!G:G,'Raw Data'!B:B,A2,'Raw Data'!C:C,B2) / SUMIFS('Raw Data'!D:D,'Raw Data'!B:B,A2,'Raw Data'!C:C,B2)`  
     (donde **B** es Region, **C** Product, **D** Units_Sold, **G** Total_Sales).  
3) **% del total** (participación): en la Pivot, si tu editor lo permite, usa **Mostrar como → % del total** sobre **Total_Sales**; si no, crea un **Campo calculado**:  
   - `PctTotal = Total_Sales / (Total de Total_Sales)`  
   - O fuera de la Pivot: `=Ingresos_grupo / SUM('Raw Data'!G:G)`.

**Interpretación:** identifica **segmentos con alto ticket pero bajo volumen** (nicho premium) vs **alto volumen y bajo ticket** (masivo).

## 4.4 Refining Layout & Interpreting Results (10 min)

**Layout sugerido:**
- **Filas:** Region → Product (jerarquía).  
- **Valores:** SUM(Total_Sales), SUM(Units_Sold), Campo calculado `TicketProm`.  
- **Totales y subtotales** activos.  
- **Formato numérico:** moneda para Total_Sales y TicketProm.

**Cuadro de hallazgos (añade un cuadro de texto al lado):**
1) Top 3 regiones por ingresos y su % del total.  
2) Producto con **mayor ticket** en cada región.  
3) Hipótesis: ¿pricing? ¿mix? ¿promociones? ¿disponibilidad?

## 4.5 AI 🤖 Using LLMs to Propose Cuts/QA (10 min)

**Prompts útiles:**
- “Sugiéreme 3 cortes adicionales (Date→mes, Salesperson, Region×Product) para explicar variaciones de `Total_Sales`.”  
- “¿Qué **sesgos** o **data quality issues** podrían afectar esta Pivot?”  
Verifica siempre con cálculos en Sheets (**nunca** aceptes números sin confirmarlos).

# 5. Visualizing and Highlighting Key Insights (Dataset específico)

Trabajaremos con **Total_Sales**, **Units_Sold**, **TicketProm** y las dimensiones **Date**, **Region**, **Product**, **Salesperson**.

**Teoría:** elige el gráfico según la **tarea** (comparar, seguir tendencia, ver composición). Evita saturación (top-10) y etiquetas innecesarias.


## 5.1 Right Chart for the Question (15 min)

**Configuraciones concretas en Sheets:**
- **Comparación por categoría (Top-10 productos por ingresos):**  
  1) Crea una tabla de apoyo con las 10 mayores ventas por `Product`:  
     - Ordena una Pivot por **SUM(Total_Sales)** y filtra **Top 10** (o usa `=SORT(N(LISTA); -1)` si prefieres fórmulas).  
  2) **Insertar → Gráfico → Barras**. Eje X: Total_Sales; Eje Y: Product.

- **Tendencia temporal (ingresos mensuales):**  
  1) Agrega columna auxiliar **Month** en `Raw Data`:  
     - En H2: `=EOMONTH(A2,0)` o `=DATE(YEAR(A2),MONTH(A2),1)` para inicio de mes.  
  2) Pivot: **Filas → Month**, **Valores → SUM(Total_Sales)**.  
  3) **Insertar → Gráfico → Líneas**.

- **Composición (Region dentro del total):**  
  1) Pivot: **Filas → Region**, **Valores → SUM(Total_Sales)**.  
  2) **Gráfico → Barras apiladas** (mejor que pastel si >5 categorías).

## 5.2 Conditional Formatting to Surface Outliers (10 min)

**Ejemplos prácticos en Sheets:**
1) En una tabla de `Total_Sales` por Region, aplica **Formato → Formato condicional → Escala de color** (del p10 al p90).  
2) Umbral KPI: resalta celdas > objetivo trimestral (por ejemplo, `> 120000`).  
3) Outliers de ticket: en la tabla con `TicketProm`, resalta valores > p90 o < p10 (usa **Percentiles** si tu Sheets lo permite).  
4) Añade nota: “Reglas aplicadas y fecha de cálculo”.

## 5.3 Simple Summary Dashboard (10 min)

**Estructura:**
- Hoja `dashboard` con:  
  - **KPI 1 — Ingresos (rango de fechas):**  
    `=SUMIFS('Raw Data'!G:G, 'Raw Data'!A:A, ">="&$B$1, 'Raw Data'!A:A, "<="&$B$2)`  
    (donde **B1** = fecha inicio, **B2** = fecha fin).  
  - **KPI 2 — Ticket promedio:**  
    `=SUM('Raw Data'!G:G)/SUM('Raw Data'!D:D)`  
  - **Barras Top-10 productos** por ingresos (gráfico vinculado a tabla auxiliar).  
  - **Línea** de ingresos mensuales (desde la Pivot por `Month`).  
  - **Tabla dinámica** por Region con SUM(Total_Sales), SUM(Units_Sold), `TicketProm`.

- **Segmentadores (Slicers):** **Datos → Segmentador** para `Region` y `Salesperson`.  
- **Tema visual:** títulos claros, sin rebasar 3–4 colores, formato moneda/fecha coherente.

## 5.4 Communicating Insights (5 min)

En `resumen`, escribe 3 bullets:
1) **Qué pasó:** p.ej., “West y North concentran 62% de ingresos; enero es el pico mensual”.  
2) **Por qué:** hipótesis (mix de productos, precios, promociones, vendedores).  
3) **Qué hacer:** acciones con **responsable y fecha** (reposición, bundles, objetivo de ticket).

## Evaluación rápida (auto-chequeo)
- [ ] ¿Tu PivotTable 4.1 muestra ventas por **región x categoría**?
- [ ] ¿Aplicaste filtros/orden para mostrar **Top 3** categorías por región (4.2)?
- [ ] ¿Incluiste **dos métricas** (unidades y promedio) en la misma tabla (4.3)?
- [ ] ¿Refinaste el layout y escribiste un **resumen ejecutivo** (4.4)?
- [ ] ¿Replicaste una agregación con un **LLM** y comparaste resultados (4.5)?
- [ ] ¿Creaste un **gráfico** claro con títulos/etiquetas (5.1)?
- [ ] ¿Aplicaste **formato condicional** para resaltar desempeño (5.2)?
- [ ] ¿Armastes un **mini dashboard** (5.3)?
- [ ] ¿Redactaste **2–3 insights** y una **slide** (5.4)?

## Rúbrica sugerida (10 pts)
- PivotTables correctas y filtrado/orden (4 pts).  
- Cálculos múltiples y layout claro (2 pts).  
- Gráfico + formato condicional (2 pts).  
- Dashboard + comunicación de insights (2 pts).

## Tips y buenas prácticas
- Nombra tus campos de forma clara; guarda versiones.  
- Prefiere **tablas** (Ctrl/Cmd+T) como origen de datos para rango dinámico.  
- Documenta filtros aplicados (fecha, región) al exportar.  
- En Sheets, usa **Slicers** para filtros visuales en dashboards.  
- Evita sobrecargar gráficos; menos es más.  
- Con LLMs: pega **muestras**, no toda la base; valida siempre contra Excel/Sheets.

## (Opcional) Guía de solución breve
<details>
<summary>Ver guía</summary>

**4.1**: Región→Filas, Categoría→Columnas, Ventas→Valores (SUM).  
**4.2**: Filtro por fecha, Ordenar por Ventas desc., Top 3 por valor.  
**4.3**: Añade Unidades (SUM) y Ventas (AVERAGE) en Valores; prueba % del total.  
**4.4**: Diseño tabular, renombrar y formato COP; 2–3 frases de hallazgos.  
**4.5**: Prompt LLM con condición (región=‘Norte’); compara con Excel.  
**5.1**: Gráfico columnas o líneas por mes–región; etiquetas claras.  
**5.2**: Reglas Top/Umbral + semáforos.  
**5.3**: KPIs (SUM Ventas, Promedio Ticket, Top Región) + 1 gráfico.  
**5.4**: Redacción con contexto→hallazgo→implicación; 1 slide.

</details>