# Sesi√≥n 2: Walmart Project ‚Äî Limpieza, Enriquecimiento y Resumen con KPIs

## Objetivos de la sesi√≥n
- **LIMPIAR**: normalizar nombres, estandarizar fechas por semana (`semana_limpia`).
- **ENRIQUECER**: unir `raw_ventas` con `stores` y `departments` v√≠a `XLOOKUP/VLOOKUP`.
- **RESUMIR**: construir pivots para **KPI de eficiencia (ventas/m¬≤)**, **participaci√≥n** y **volatilidad (CV)**.
- Documentar supuestos y validaciones b√°sicas del merge.


## üìÖ Agenda 

* **Parte 1** ‚Äî Limpieza de datos

* **Parte 2** ‚Äî Enriquecimiento

* **Parte 3** ‚Äî Resumen con KPIs v√≠a tablas din√°micas



## Setup
- [walmart_project_data.xlsx]([/mnt/data/walmart_project_data.xlsx](https://docs.google.com/spreadsheets/d/1niRmx3GerZx5U8ZTBk1300oxfkjZW9i1/edit?usp=sharing&ouid=107698041790639854307&rtpof=true&sd=true)) ‚Äî hojas: `raw_ventas`, `stores`, `departments`.


# Parte 1 ‚Äî Limpieza de datos 

**Hoja de trabajo:** duplica `raw_ventas` ‚Üí n√≥mbrala `clean_ventas` (marca pesta√±a en **verde**).

### 0. Break rooms:

Identifica qu√© cambios har√≠as a la hoja de c√°culo.
-  Cambiarias nombres de columnas?
- Agregar√≠as m√°s columnas?
- Cambiarias alg√∫n valor de las columnas? Quiz√°s los 0/1

### 1.1 Normaliza columnas
- Renombra a **snake_case** o nombres declarativos: `tienda | dept | fecha | ventas_semanales | es_feriado`
- Aplica:
  - `=TRIM()` para eliminar espacios sobrantes
  - `=LOWER()/UPPER()/PROPER()` para estandarizar texto
  - Validaci√≥n de datos si corresponde (`es_feriado` ‚àà {0,1})

### 1.2 Estandariza semana (clave temporal)
Crea columna **`semana_limpia`** (a√±o-semana ISO; lunes como primer d√≠a):

- **Google Sheets**  
  `=YEAR(C2) & "-" & TEXT(WEEKNUM(C2, 2), "00")`

> Comprueba que todas las filas sean 2012. Si encuentras otras fechas, documenta el criterio (filtrar/ajustar).

**Salida esperada**: hoja `clean_ventas` lista para an√°lisis:
`tienda | dept | fecha | ventas_semanales | es_feriado | semana_limpia`

---
# Parte 2 ‚Äî Enriquecimiento (20‚Äì30 min)
**Objetivo**: a√±adir `tipo`, `tama√±o`, `nombre_dept` a `clean_ventas` desde `stores` y `departments`.

### 2.1 Join por `Store` ‚Üí `Type` y `Size`
En `clean_ventas`, inserta columnas:
- `tipo` (desde `stores[Type]`)
- `tama√±o` (desde `stores[Size]`)

**Google Sheets ‚Äî con `XLOOKUP`**  
`=XLOOKUP(A2, Stores!A:A, Stores!B:B, "NoMatch", 0))`

*(Sheets usa la misma sintaxis de XLOOKUP; con VLOOKUP, recuerda el √≠ndice de columna y `FALSE`)*

### 2.2 Join por `Dept` ‚Üí `dept_name`
`=XLOOKUP(B2, Departments!A:A, Departments!B:B, "NoMatch", 0)` ‚Üí `nombre_dept`

### 2.3 Verificaci√≥n y troubleshooting
- Cuenta no coincidencias: `=COUNTIF(RangoResultados,"NoMatch")`
- Revisa duplicados en claves (`Store`, `Dept`) seg√∫n tu dise√±o de uni√≥n.
- Documento ‚ÄúJOIN_DOC‚Äù:
  - Claves y cardinalidad asumidas
  - % de `NoMatch`
  - Decisiones tomadas ante errores (correcci√≥n, exclusi√≥n, imputaci√≥n)

**Salida esperada**: `tienda | dept | fecha | ventas_semanales | es_feriado | semana_limpia | tipo | tama√±o | nombre_dept`

---
# Parte 3 ‚Äî Resumen con KPIs v√≠a Tablas Din√°micas (20‚Äì30 min)

> Construye **una pivot por KPI** y deja los c√°lculos como **campos calculados** cuando aplique.

## KPI 1 ‚Äî Eficiencia (Ventas por m¬≤)
1) Pivot (por `tienda` o `nombre_dept`):  
   - Valores: **SUM(ventas_semanales)** y **AVERAGE(tama√±o)**
2) Campo calculado **`ventasxmetro2`**:  
   `=SUM(ventas_semanales) / AVERAGE(tama√±o)`
3) Ordena de mayor a menor.

**Salida**: columnas ‚Üí `nombre_dept` | `SUM ventas` | `AVG tama√±o` | `ventasxmetro2`

---

## KPI 2 ‚Äî Participaci√≥n del departamento (% sobre total)
1) Pivot por `nombre_dept` con **SUM(ventas_semanales)**  
2) Mostrar valor como **% del total**.

**Salida**: `nombre_dept` | `% del total de ventas`

---

## KPI 3 ‚Äî Volatilidad (Coeficiente de Variaci√≥n, CV)
1) Pivot por `nombre_dept` con:
   - `SUM(ventas_semanales)`
   - `STDEV(ventas_semanales)`
   - `AVERAGE(ventas_semanales)`
2) Campo calculado **`cv`**:  
   `=STDEV(ventas_semanales) / AVERAGE(ventas_semanales)`

**Interpretaci√≥n**:  
- CV ~ 0 ‚Üí estable; CV ‚â• 0.5 ‚Üí vol√°til; CV ‚â• 1 ‚Üí muy vol√°til.


---
## Entregables al cierre de la sesi√≥n (Parte 1 de 2)
- Hoja **`clean_ventas`** lista.
- Hoja **`JOIN_DOC`** con supuestos y verificaciones (conteo de `NoMatch`, duplicados).
- Tres pivots, uno por KPI (**eficiencia, participaci√≥n, volatilidad**) con campos calculados.
- 2‚Äì3 bullets de hallazgos r√°pidos (sin dashboard todav√≠a).

---
## Criterios de evaluaci√≥n r√°pidos
- **Limpieza**: nomenclatura consistente y `semana_limpia` correcta.  
- **Enriquecimiento**: `XLOOKUP/VLOOKUP` correctos, verificaci√≥n documentada.  
- **KPIs**: campos calculados y pivots claros, ordenados y legibles.  
- **Razonamiento**: Justificaci√≥n de decisiones ante errores y outliers.


---
## Ap√©ndice: f√≥rmulas √∫tiles y tips
- `=TRIM()`, `=CLEAN()`, `=PROPER()`, validaci√≥n de datos (listas).  
- `=XLOOKUP(valor, rango_busqueda, rango_resultado, "NoMatch", 0)` (coincidencia exacta).  
- `=VLOOKUP(valor, tabla, √≠ndice, FALSE)` (evita coincidencia aproximada salvo que la necesites).  
- **Pivots**: usa ‚ÄúMostrar valores como % del total‚Äù para participaci√≥n.  
- **Documenta**: todo supuesto de join y tratamiento de `NoMatch` en `JOIN_DOC`.


## Cierre

- Kahoot
- Repaso de aprendizajes y pr√≥ximos pasos

## Siguientes Pasos

- **Participaci√≥n continua:** asistir a Co-Learning y a Sprint Focus, y usar los canales de Discord para hacer preguntas.
- **Recordatorios:** la grabaci√≥n y recursos utilizados, se comparten al finalizar la sesi√≥n; en caso de necesitar apoyo adicional, agenda un 1:1.
