# Introducción a Seaborn: Visualización Estadística

## 1. Carga de Datos y Configuración
Seaborn incluye datasets de práctica integrados. Usaremos `tips` (propinas), que contiene datos sobre cuentas en un restaurante.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# Cargar dataset integrado de Seaborn
df = sns.load_dataset('tips')

print("--- Primeras filas del dataset 'Tips' ---")
display(df.head())

## 2. Histplot: Distribución de la Cuenta Total
**Objetivo:** Ver cómo se distribuye el monto de las cuentas. ¿La mayoría son cuentas bajas o altas?
* **Estilo:** Usaremos `whitegrid` para facilitar la lectura de la cuadrícula.
* **Personalización:** Añadimos una curva de densidad (`kde=True`) para ver la forma suave de la distribución.

In [None]:
# Configurar estilo visual
sns.set_style("whitegrid")

plt.figure(figsize=(10, 6))

# Crear Histograma con curva de densidad (KDE)
sns.histplot(data=df, x='total_bill', kde=True, color='teal', bins=20)

# Personalización
plt.title('Distribución del Total de la Cuenta ($)', fontsize=15)
plt.xlabel('Total de la Cuenta')
plt.ylabel('Frecuencia')

plt.show()

## 3. Countplot: Clientes por Día
**Objetivo:** ¿Qué día de la semana tiene más afluencia de clientes?
* **Estilo:** Cambiamos a `darkgrid` para contraste.
* **Análisis:** Separaremos (hue) por `sex` (género del pagador) para ver quién paga más frecuentemente cada día.

In [None]:
# Cambiar estilo
sns.set_style("darkgrid")

plt.figure(figsize=(10, 6))

# Crear Countplot
# order: ordenamos los días cronológicamente
order_dias = ['Thur', 'Fri', 'Sat', 'Sun']
sns.countplot(data=df, x='day', hue='sex', order=order_dias, palette='pastel')

# Personalización
plt.title('Frecuencia de Clientes por Día y Género', fontsize=15)
plt.xlabel('Día de la Semana')
plt.ylabel('Cantidad de Mesas')
plt.legend(title='Género')

plt.show()

## 4. Barplot: Promedio de Propinas
**Objetivo:** ¿En qué momento del día (Almuerzo vs Cena) se dejan mejores propinas en promedio?
* **Nota:** El `barplot` por defecto calcula el **promedio** (mean). La línea negra encima de la barra es el intervalo de confianza (error bar).
* **Estilo:** Usaremos `ticks` para un look más limpio en los ejes.

In [None]:
# Cambiar estilo
sns.set_style("ticks")

plt.figure(figsize=(10, 6))

# Crear Barplot
# x = Momento del día (Lunch/Dinner)
# y = Propina (Tip) -> Seaborn calculará el promedio automáticamente
sns.barplot(data=df, x='time', y='tip', hue='smoker', palette='husl')

# Personalización
plt.title('Promedio de Propinas: Almuerzo vs Cena', fontsize=15)
plt.xlabel('Momento del Día')
plt.ylabel('Propina Promedio ($)')
plt.legend(title='¿Fumador?')

# Quitar bordes innecesarios (típico del estilo 'ticks')
sns.despine()

plt.show()