<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/leccion_2_2_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Lección 2.2.2: Visualizaciones estadísticas con Seaborn

## 1. ¿Por qué Seaborn?

Si Matplotlib es el **martillo básico**, Seaborn es la **caja de herramientas profesional**. Construida sobre Matplotlib, Seaborn está diseñada específicamente para **visualización estadística** con un enfoque: hacer lo complejo simple y lo simple hermoso.

**¿Qué hace especial a Seaborn?**
- **Menos código, más resultado:** 5 líneas en lugar de 20.
- **Estadística integrada:** Intervalos de confianza, regresiones, distribuciones automáticas.
- **Diseño profesional:** Paletas modernas y gráficos listos para presentar.
- **Integración perfecta con Pandas:** Trabaja directo con DataFrames.
- **Gráficos especializados:** Box, violin, heatmap, pairplot... imposibles en Matplotlib básico.

> **Analogía:** Matplotlib es cocinar desde cero. Seaborn es tener un chef que prepara platos gourmet en minutos.

**Comparación rápida:**

| Aspecto | Matplotlib | Seaborn |
|---------|-----------|---------|
| **Código necesario** | Mucho | Poco |
| **Gráficos estadísticos** | Manual | Automático |
| **Diseño por defecto** | Básico | Profesional |
| **Curva aprendizaje** | Media-Alta | Baja |
| **Control fino** | Total | Limitado |
| **Mejor para...** | Personalización extrema | Análisis exploratorio |

---

## 2. Setup y estilos

```python
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# Configuración inicial recomendada
sns.set_theme(style="whitegrid")  # Estilo limpio con grid
print(f"Versión de Seaborn: {sns.__version__}")  # Recomendado: 0.12+
```

**Estilos disponibles:**

| Estilo | Cuándo usarlo | Apariencia |
|--------|---------------|------------|
| `whitegrid` | Análisis general, presentaciones | Fondo blanco con cuadrícula sutil |
| `darkgrid` | Datos densos, gráficos complejos | Fondo gris claro con cuadrícula |
| `white` | Minimalista, publicaciones | Blanco puro sin grid |
| `dark` | Presentaciones oscuras, web | Fondo oscuro |
| `ticks` | Control preciso de ejes | Con marcas en los ejes |

```python
# Cambiar estilo
sns.set_theme(style="whitegrid")  # El más versátil
sns.set_theme(style="dark")       # Para fondos oscuros
```

---

## 3. Dataset de práctica: Retail Analytics

Vamos a crear un dataset realista de ventas para usar **en toda la lección**:

```python
np.random.seed(42)
n = 500

# Simular datos de una cadena retail
datos_ventas = pd.DataFrame({
    'mes': np.random.choice(['Ene', 'Feb', 'Mar', 'Abr', 'May', 'Jun'], n),
    'categoria': np.random.choice(['Electrónica', 'Ropa', 'Hogar', 'Deportes'], n),
    'ventas': np.random.normal(1000, 300, n),
    'clientes': np.random.poisson(50, n),
    'rating': np.random.uniform(1, 5, n),
    'promocion': np.random.choice(['Sí', 'No'], n, p=[0.3, 0.7])
})

# Añadir outliers realistas (ventas excepcionales)
datos_ventas.loc[::50, 'ventas'] *= 2.5

print(datos_ventas.head())
print(f"\nDataset: {len(datos_ventas)} registros")
```

**Output esperado:**
```
     mes     categoria    ventas  clientes  rating promocion
0    Feb   Electrónica   1148.84        52    3.74        No
1    Abr          Ropa    863.27        50    2.98        No
2    Mar         Hogar   2476.90        46    4.55        Sí
3    Jun      Deportes    905.33        48    1.87        No
4    May   Electrónica   1237.42        51    3.12        Sí

Dataset: 500 registros
```

> **Ventaja didáctica:** Usaremos este mismo dataset en todos los ejemplos. Aprenderás viendo el mismo dato desde diferentes ángulos.

---

## 4. Gráficos de distribución: Entender los datos

### 4.1 Histograma con KDE

**Pregunta:** ¿Cómo se distribuyen nuestras ventas?

```python
plt.figure(figsize=(10, 6))
sns.histplot(data=datos_ventas, x='ventas', kde=True, bins=25, color='#2E86AB')
plt.title('Distribución de Ventas - Histograma con Curva de Densidad', fontsize=16, fontweight='bold')
plt.xlabel('Ventas (€)', fontsize=12)
plt.ylabel('Frecuencia', fontsize=12)
plt.axvline(datos_ventas['ventas'].mean(), color='red', linestyle='--', linewidth=2,
            label=f"Media: {datos_ventas['ventas'].mean():.0f}€")
plt.legend()
plt.tight_layout()
plt.show()
```

**¿Qué nos dice?**
- **Forma:** ¿Normal, sesgada, bimodal?
- **Centro:** Media y mediana
- **Dispersión:** ¿Muy concentrados o dispersos?
- **Outliers:** Valores extremos visibles en la cola

**Ventaja vs Matplotlib:** El parámetro `kde=True` añade la curva de densidad automáticamente. En Matplotlib necesitarías scipy y 10 líneas extra.

### 4.2 KDE Plot: Comparar distribuciones

**Pregunta:** ¿Las ventas con promoción son diferentes?

```python
plt.figure(figsize=(10, 6))
sns.kdeplot(data=datos_ventas, x='ventas', hue='promocion', fill=True, alpha=0.5, linewidth=2)
plt.title('Comparación de Ventas: Con vs Sin Promoción', fontsize=16, fontweight='bold')
plt.xlabel('Ventas (€)', fontsize=12)
plt.ylabel('Densidad', fontsize=12)
plt.tight_layout()
plt.show()
```

**Insight:** Si la curva "Sí" está desplazada a la derecha, las promociones funcionan.

---

## 5. Boxplot: Detectar outliers y comparar

**Pregunta:** ¿Qué categoría tiene más variabilidad?

```python
plt.figure(figsize=(10, 6))
sns.boxplot(data=datos_ventas, x='categoria', y='ventas', palette='Set2', linewidth=2)
plt.title('Distribución de Ventas por Categoría', fontsize=16, fontweight='bold')
plt.ylabel('Ventas (€)', fontsize=12)
plt.xlabel('Categoría', fontsize=12)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
```

**Interpretación del boxplot:**
```
         ╭─ Máximo (dentro de 1.5×IQR)
    ─────┤
    │    │
Q3  ├────┤  ← 75% de los datos están aquí o abajo
    │    │
Q2  ├────┤  ← Mediana (50%)
    │    │
Q1  ├────┤  ← 25% de los datos
    │    │
    ─────┤
         ╰─ Mínimo
    
    ●    ← Outliers (fuera de 1.5×IQR)
```

**Elementos:**
- **Línea central:** Mediana (Q2)
- **Caja:** Rango intercuartílico IQR (Q1-Q3) - donde está el 50% de los datos
- **Bigotes:** Valores dentro de 1.5×IQR desde Q1/Q3
- **Puntos aislados:** Outliers potenciales

**Insight:** Si Electrónica tiene más outliers superiores, hay productos premium que explotar.

---

## 6. Violin Plot: Box + Distribución

**Pregunta:** ¿Cómo varía la distribución entre categorías y promociones?

```python
plt.figure(figsize=(12, 6))
sns.violinplot(data=datos_ventas, x='categoria', y='ventas', hue='promocion',
               split=True, palette='muted', inner='box')
plt.title('Distribución de Ventas: Categoría vs Promoción', fontsize=16, fontweight='bold')
plt.ylabel('Ventas (€)', fontsize=12)
plt.xlabel('Categoría', fontsize=12)
plt.xticks(rotation=45)
plt.legend(title='Promoción', loc='upper right')
plt.tight_layout()
plt.show()
```

**Ventaja del violin:** Muestra la **forma completa** de la distribución. Ves si es simétrica, sesgada, bimodal (dos picos).

**Insight:** Si el violin de "Ropa con promoción" es más ancho arriba, las promociones atraen compras grandes.

---

## 7. Gráficos de relación: Descubrir patrones

### 7.1 Scatter Plot con regresión

**Pregunta:** ¿Más clientes significan más ventas?

```python
plt.figure(figsize=(10, 6))
sns.regplot(data=datos_ventas, x='clientes', y='ventas',
            scatter_kws={'alpha':0.4, 's':50, 'color':'#2E86AB'},
            line_kws={'color':'red', 'linewidth':2.5})
plt.title('Relación: Clientes vs Ventas (con regresión)', fontsize=16, fontweight='bold')
plt.xlabel('Número de Clientes', fontsize=12)
plt.ylabel('Ventas (€)', fontsize=12)
plt.grid(alpha=0.3)
plt.tight_layout()
plt.show()
```

**Ventaja mágica:** `regplot` calcula y dibuja la **línea de regresión** con intervalo de confianza automáticamente. En Matplotlib necesitarías `np.polyfit` y código adicional.

**Insight:** Si la pendiente es pronunciada, cada cliente adicional impacta mucho en ventas.

### 7.2 Scatter multidimensional

**Pregunta:** ¿Cómo se relacionan ventas, clientes y rating por categoría?

```python
plt.figure(figsize=(12, 6))
sns.scatterplot(data=datos_ventas, x='clientes', y='ventas',
                hue='categoria', size='rating', sizes=(50, 300),
                alpha=0.6, palette='deep')
plt.title('Análisis Multidimensional: Ventas, Clientes, Rating y Categoría', fontsize=16, fontweight='bold')
plt.xlabel('Número de Clientes', fontsize=12)
plt.ylabel('Ventas (€)', fontsize=12)
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left', frameon=True)
plt.tight_layout()
plt.show()
```

**Insight:** 4 variables en un gráfico (X, Y, color, tamaño). Imposible en Excel.

---

## 8. Pairplot: EDA explosivo

**Pregunta:** ¿Cómo se relacionan TODAS las variables entre sí?

```python
# Seleccionar variables numéricas
variables_numericas = datos_ventas[['ventas', 'clientes', 'rating']]

# MAGIA: Matriz completa de relaciones
sns.pairplot(variables_numericas, diag_kind='kde', corner=False, height=3)
plt.suptitle('Pairplot - Relaciones Múltiples', y=1.02, fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()
```

**¿Qué hace `pairplot`?**
- Crea una **matriz de gráficos**: cada variable vs cada variable.
- **Diagonal:** Distribución de cada variable (histograma o KDE).
- **Fuera de diagonal:** Scatter plots entre pares.
- **Todo automático:** 9 gráficos en 1 línea de código.

**Con categorías:**
```python
# Versión avanzada: añadir color por categoría
sns.pairplot(datos_ventas[['ventas', 'clientes', 'rating', 'promocion']],
             hue='promocion', palette='Set1', diag_kind='kde', height=3)
plt.suptitle('Pairplot por Promoción', y=1.02, fontsize=16, fontweight='bold')
plt.show()
```

**Resultado:** En 10 segundos ves todas las relaciones posibles. En Matplotlib necesitarías 100+ líneas.

**Insight:** Si ventas y clientes se correlacionan fuerte, pero rating no, el rating no predice ventas (revisar sistema de reviews).

---

## 9. Heatmap: Matriz de correlación

**Pregunta:** ¿Qué variables están correlacionadas?

```python
# Calcular correlaciones
correlacion = datos_ventas[['ventas', 'clientes', 'rating']].corr()

plt.figure(figsize=(8, 6))
sns.heatmap(correlacion,
            annot=True,           # Mostrar valores
            fmt='.2f',            # 2 decimales
            cmap='coolwarm',      # Azul (negativo) a Rojo (positivo)
            center=0,             # Centrar en 0
            square=True,          # Celdas cuadradas
            linewidths=1.5,       # Líneas entre celdas
            cbar_kws={'label': 'Correlación'})
plt.title('Matriz de Correlación - Variables Clave', fontsize=16, fontweight='bold', pad=20)
plt.tight_layout()
plt.show()
```

**Interpretación:**
- **+1.0:** Correlación perfecta positiva
- **0.0:** Sin correlación
- **-1.0:** Correlación perfecta negativa

**Insight típico:**
- Ventas ↔ Clientes: 0.65 (correlación moderada-alta) ✅
- Ventas ↔ Rating: 0.12 (correlación débil) ⚠️
- **Acción:** El rating no predice ventas. Investigar sistema de valoración.

---

## 10. Barplot con intervalos de confianza

**Pregunta:** ¿Qué categoría vende más en promedio?

```python
plt.figure(figsize=(10, 6))
sns.barplot(data=datos_ventas, x='categoria', y='ventas',
            hue='promocion', palette='viridis',
            errorbar='ci', errwidth=2, capsize=0.1)  # IC 95% automático
plt.title('Ventas Promedio por Categoría (con IC 95%)', fontsize=16, fontweight='bold')
plt.ylabel('Ventas Promedio (€)', fontsize=12)
plt.xlabel('Categoría', fontsize=12)
plt.xticks(rotation=45)
plt.legend(title='Promoción')
plt.tight_layout()
plt.show()
```

**Magia de Seaborn:** Las barras de error (intervalos de confianza al 95%) se calculan **automáticamente**. En Matplotlib tendrías que calcularlas con `scipy.stats`.

**Insight:** Si las barras de error de "Con promoción" no se solapan con "Sin promoción", el efecto es estadísticamente significativo.

---

## 11. FacetGrid: Múltiples gráficos condicionales

**Pregunta:** ¿Cómo varía la relación clientes-ventas por mes?

```python
g = sns.FacetGrid(datos_ventas, col='mes', col_wrap=3, height=4, palette='Set2')
g.map(sns.scatterplot, 'clientes', 'ventas', alpha=0.6)
g.add_legend()
g.set_titles("Mes: {col_name}")
g.set_axis_labels("Clientes", "Ventas (€)")
plt.suptitle('Relación Clientes-Ventas por Mes', y=1.02, fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()
```

**Ventaja:** 6 gráficos (uno por mes) generados automáticamente. Ideal para explorar patrones temporales.

**Insight:** Si en Diciembre la pendiente es más pronunciada, cada cliente gasta más (temporada navideña).

---

## 12. Paletas de colores profesionales

### 12.1 Tipos de paletas

```python
# Paletas categóricas (para tipos distintos)
paletas_categoricas = ['Set1', 'Set2', 'Paired', 'husl', 'deep']

# Paletas secuenciales (para valores ordenados: bajo → alto)
paletas_secuenciales = ['Blues', 'Reds', 'YlOrRd', 'viridis', 'rocket']

# Paletas divergentes (para valores positivos/negativos)
paletas_divergentes = ['coolwarm', 'RdBu', 'vlag', 'icefire']

# Visualizar paleta
sns.palplot(sns.color_palette('husl', 8))
plt.show()
```

### 12.2 Configuración global

```python
# Configurar todo de una vez
sns.set_theme(
    style='whitegrid',
    palette='husl',
    font='sans-serif',
    font_scale=1.2,
    rc={
        'figure.figsize': (10, 6),
        'axes.labelsize': 12,
        'axes.titlesize': 14
    }
)
```

---

## 13. Caso práctico integrado: Análisis completo

```python
def analisis_rapido_retail(df):
    """Dashboard completo de análisis retail en una función"""
    sns.set_theme(style="whitegrid", palette="husl")
    
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    fig.suptitle('Dashboard Completo - Retail Analytics', fontsize=18, fontweight='bold')
    
    # 1. Variabilidad por categoría (Violin)
    sns.violinplot(data=df, x='categoria', y='ventas', ax=axes[0,0], palette='Set2')
    axes[0,0].set_title('Variabilidad de Ventas por Categoría', fontweight='bold')
    axes[0,0].tick_params(axis='x', rotation=45)
    
    # 2. Efecto promociones (Barplot con IC)
    sns.barplot(data=df, x='categoria', y='ventas', hue='promocion',
                ax=axes[0,1], estimator=np.median, errorbar='ci', palette='viridis')
    axes[0,1].set_title('Mediana de Ventas: Con/Sin Promoción', fontweight='bold')
    axes[0,1].tick_params(axis='x', rotation=45)
    axes[0,1].legend(title='Promoción')
    
    # 3. Relación clientes-ventas por categoría (Scatter)
    sns.scatterplot(data=df, x='clientes', y='ventas', hue='categoria',
                    alpha=0.6, s=80, ax=axes[1,0], palette='deep')
    axes[1,0].set_title('Relación Clientes-Ventas por Categoría', fontweight='bold')
    
    # 4. Resumen estadístico (Heatmap)
    resumen = df.groupby('categoria')['ventas'].agg(['mean', 'std', 'count'])
    sns.heatmap(resumen, annot=True, fmt='.1f', cmap='YlGnBu', ax=axes[1,1])
    axes[1,1].set_title('Resumen Estadístico por Categoría', fontweight='bold')
    
    plt.tight_layout()
    return fig

# Ejecutar análisis
analisis_rapido_retail(datos_ventas)
plt.show()
```

**Resultado:** Dashboard ejecutivo con 4 perspectivas en una función. Reutilizable para cualquier dataset retail.

**Insights típicos:**
1. **Variabilidad:** Electrónica tiene ventas más dispersas (productos caros y baratos).
2. **Promociones:** Funcionan mejor en Ropa y Hogar.
3. **Clientes:** Relación lineal débil, sugiere que el ticket promedio varía mucho.
4. **Estadístico:** Deportes tiene menor desviación estándar (ventas más predecibles).

---

## 14. Mejores prácticas y errores comunes

### ✅ **HACER**

| Práctica | Por qué | Ejemplo |
|----------|---------|---------|
| Usar `sns.set_theme()` | Consistencia visual | `sns.set_theme(style='whitegrid')` |
| Incluir `hue` para categorías | Añade dimensión visual | `hue='categoria'` |
| Usar paletas apropiadas | Claridad y accesibilidad | Categórica: 'Set1', Secuencial: 'Blues' |
| Añadir títulos descriptivos | Comunicación clara | "Ventas por Región Q2 2024" |
| Usar `alpha` en scatter | Evitar solapamiento | `alpha=0.6` |

### ❌ **NO HACER**

| Error | Problema | Consecuencia |
|-------|----------|--------------|
| Sobrecargar información | Demasiadas variables en un gráfico | Confusión |
| Ignorar outliers | No investigarlos | Perder insights o errores |
| Colores sin contraste | Difícil de leer | Accesibilidad pobre |
| Olvidar etiquetas | Nadie entiende qué es qué | Gráfico inútil |
| No usar `tight_layout()` | Elementos cortados | Aspecto poco profesional |

---

## 15. Comparación: ¿Cuándo usar qué?

| Situación | Usa Seaborn | Usa Matplotlib | Por qué |
|-----------|-------------|----------------|---------|
| Análisis exploratorio rápido | ✅ | ❌ | Menos código, diseño automático |
| Gráficos estadísticos | ✅ | ❌ | Funciones especializadas built-in |
| Trabajar con DataFrames | ✅ | ❌ | Integración nativa con Pandas |
| Control pixel a pixel | ❌ | ✅ | Matplotlib da control total |
| Animaciones | ❌ | ✅ | Seaborn no soporta animaciones |
| Dashboards científicos | ✅ | ❌ | Diseño profesional por defecto |
| Gráficos muy personalizados | ✅+✅ | ✅ | Combina ambos con `ax=` |

**Regla de oro:** Empieza con Seaborn. Si necesitas personalización extrema, añade Matplotlib encima usando `ax=ax`.

---

## 16. Integración Seaborn + Matplotlib

Lo mejor de ambos mundos:

```python
# Estructura con Matplotlib, visualización con Seaborn
fig, ax = plt.subplots(figsize=(10, 6))

# Gráfico con Seaborn
sns.boxplot(data=datos_ventas, x='categoria', y='ventas', palette='Set2', ax=ax)

# Personalización con Matplotlib
ax.set_title('Análisis de Categorías', fontsize=16, fontweight='bold', pad=20)
ax.set_ylabel('Ventas (€)', fontsize=12)
ax.set_xlabel('Categoría', fontsize=12)
ax.axhline(y=1000, color='red', linestyle='--', linewidth=2, label='Objetivo')
ax.legend()
ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)
plt.tight_layout()
plt.show()
```

> **Tip:** Usa `ax=ax` en funciones de Seaborn para combinar con Matplotlib.

---

## 17. Datasets de práctica incluidos

Seaborn incluye datasets para practicar:

```python
# Cargar datasets de ejemplo
titanic = sns.load_dataset('titanic')
tips = sns.load_dataset('tips')
iris = sns.load_dataset('iris')
diamonds = sns.load_dataset('diamonds')
penguins = sns.load_dataset('penguins')

# Ver datasets disponibles
print(sns.get_dataset_names())

# Ejemplo: Análisis rápido de propinas
plt.figure(figsize=(10, 6))
sns.scatterplot(data=tips, x='total_bill', y='tip', hue='time', size='size')
plt.title('Propinas vs Cuenta Total')
plt.show()
```

**Datasets recomendados para practicar:**
- **titanic:** Supervivencia (clasificación)
- **tips:** Propinas en restaurante (regresión)
- **iris:** Especies de flores (clasificación multiclase)
- **penguins:** Pingüinos de Antártica (alternativa moderna a iris)

---

## 18. Tabla resumen de funciones clave

| Función | Propósito | Cuándo usar | Ejemplo típico |
|---------|-----------|-------------|----------------|
| `histplot()` | Distribución con histograma | Ver forma de datos | Distribución de salarios |
| `kdeplot()` | Densidad suavizada | Comparar distribuciones | Tiempo de carga A vs B |
| `boxplot()` | Detectar outliers | Comparar grupos | Ventas por región |
| `violinplot()` | Box + forma distribución | Ver distribución detallada | Engagement por contenido |
| `barplot()` | Barras con IC | Comparar medias/medianas | Satisfacción por canal |
| `scatterplot()` | Relaciones con categorías | Explorar correlaciones | Precio vs tamaño |
| `regplot()` | Scatter + regresión | Modelar relación lineal | Publicidad vs ventas |
| `heatmap()` | Matriz de valores | Correlaciones, tablas pivot | Matriz de correlación |
| `pairplot()` | Todas vs todas | EDA multivariable | Explorar dataset completo |
| `countplot()` | Contar frecuencias | Distribución categórica | Usuarios por país |

---

## 19. Ejercicio práctico final

**Tu turno:** Usa el dataset `tips` de Seaborn y crea:

1. **Histplot:** Distribución de propinas con KDE
2. **Boxplot:** Propinas por día de la semana
3. **Scatterplot:** Cuenta total vs propina (con regresión)
4. **Heatmap:** Correlación entre variables numéricas
5. **Dashboard:** Combina los 4 anteriores en un subplot 2×2

```python
# Solución sugerida
tips = sns.load_dataset('tips')

fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle('Análisis de Propinas - Restaurante', fontsize=18, fontweight='bold')

# 1. Distribución
sns.histplot(data=tips, x='tip', kde=True, ax=axes[0,0], color='#2E86AB')
axes[0,0].set_title('Distribución de Propinas')

# 2. Por día
sns.boxplot(data=tips, x='day', y='tip', ax=axes[0,1], palette='Set2')
axes[0,1].set_title('Propinas por Día')

# 3. Relación
sns.regplot(data=tips, x='total_bill', y='tip', ax=axes[1,0],
            scatter_kws={'alpha':0.5}, line_kws={'color':'red'})
axes[1,0].set_title('Cuenta vs Propina')

# 4. Correlación
corr = tips[['total_bill', 'tip', 'size']].corr()
sns.heatmap(corr, annot=True, fmt='.2f', cmap='coolwarm', ax=axes[1,1])
axes[1,1].set_title('Correlaciones')

plt.tight_layout()
plt.show()
```

---

## 20. Resumen

- **Seaborn = Matplotlib con superpoderes estadísticos** y diseño profesional.
- **Menos código, más resultado:** Gráficos complejos en 2-3 líneas.
- **Tipos esenciales:**
  - Distribución: `histplot`, `kdeplot`, `boxplot`, `violinplot`
  - Relación: `scatterplot`, `regplot`, `pairplot`
  - Categórico: `barplot`, `boxplot`, `countplot`
  - Matrices: `heatmap`
- **Integración con Pandas:** Trabaja directo con DataFrames usando `data=df`.
- **Estadística automática:** IC, regresiones, distribuciones sin código adicional.
- **Workflow EDA:** histplot → boxplot → scatterplot → pairplot → heatmap.
- **Combinable con Matplotlib:** Usa `ax=ax` para personalización avanzada.

> **Siguiente paso:** Con Matplotlib y Seaborn dominados, pasarás a dashboards interactivos con Plotly/Dash. Seaborn te preparó para pensar en visualizaciones estadísticas de calidad.

---

## 21. Referencias

### Documentación Oficial
- [Seaborn Documentation](https://seaborn.pydata.org/)
- [Seaborn Tutorial Oficial](https://seaborn.pydata.org/tutorial.html)
- [Seaborn Gallery - Galería de Ejemplos](https://seaborn.pydata.org/examples/index.html)

### Vídeos Recomendados
- [Seaborn Tutorial for Beginners](https://youtu.be/6GUZXDef2U0)
- [Complete Seaborn Python Tutorial](https://youtu.be/TLdXM0A7SR8)
- [Seaborn Crash Course](https://youtu.be/vaf4ir8eT38)
- [From Matplotlib to Seaborn](https://youtu.be/ooqXQ37XHMM)

### Recursos Prácticos
- [Seaborn Cheat Sheet (DataCamp)](https://www.datacamp.com/cheat-sheet/python-seaborn-cheat-sheet)
- [Seaborn + Pandas Tutorial (Real Python)](https://realpython.com/python-seaborn/)
- [Python Graph Gallery - Seaborn](https://python-graph-gallery.com/seaborn/)
- [From Matplotlib to Seaborn (Towards Data Science)](https://towardsdatascience.com/from-matplotlib-to-seaborn-a-declarative-guide-for-data-visualization-5dfff4f6d44b)

### Datasets para Practicar
- [Seaborn Built-in Datasets](https://github.com/mwaskom/seaborn-data)
    - titanic.csv
    - iris.csv
    - tips.csv
- [Kaggle Datasets](https://www.kaggle.com/datasets)
- [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php)

---

**¡Ahora a explorar datos con estilo estadístico! 📊🎨✨**