# Seaborn
Es una biblioteca de visualización de datos en Python basada en Matplotlib, diseñada para hacer gráficos estadísticos atractivos y fáciles de interpretar. Se integra muy bien con pandas y permite crear gráficos complejos con pocas líneas de código.

**Características principales:**
- Facilita la creación de gráficos estadísticos como: gráficos de dispersión, de barras, de cajas (boxplot), violin plots, mapas de calor, etc.
- Permite personalizar fácilmente los estilos y paletas de colores.
- Trabaja directamente con DataFrames de pandas.

**Ventajas:**
- Código más simple y legible que Matplotlib puro.
- Gráficos con mejor estética por defecto.
- Funciones para análisis exploratorio de datos.

**Tipos de graficos:**
- **Scatter plots** (`scatterplot`)
- **Line plots** (`lineplot`)
- **Bar plots** (`barplot`, `countplot`)
- **Box plots** (`boxplot`)
- **Violin plots** (`violinplot`)
- **Strip plots** (`stripplot`)
- **Swarm plots** (`swarmplot`)
- **Histograms** (`histplot`)
- **KDE plots** (Kernel Density Estimate, `kdeplot`)
- **Heatmaps** (`heatmap`)
- **Pair plots** (`pairplot`)
- **Joint plots** (`jointplot`)
- **Cat plots** (categorical plots, `catplot`)

In [None]:
import seaborn as sns
import pandas as pd

# Crear un DataFrame de ejemplo
df = pd.DataFrame({
    'x': [1, 2, 3, 4, 5],
    'y': [5, 4, 3, 2, 1]
})

# Crear un gráfico de dispersión
sns.scatterplot(data=df, x='x', y='y')

El argumento hue en Seaborn se utiliza para diferenciar los datos en un gráfico según una variable categórica, asignando diferentes colores a cada categoría. Esto permite visualizar cómo se distribuyen los datos según esa variable.

Ejemplo: Si tienes una columna "sexo" con valores "hombre" y "mujer", al usar hue='sexo', Seaborn coloreará los puntos o barras según el sexo.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Ejemplo de DataFrame
import pandas as pd
df = pd.DataFrame({
    'altura': [160, 170, 175, 165, 180, 155],
    'peso': [60, 70, 80, 55, 90, 50],
    'sexo': ['mujer', 'hombre', 'hombre', 'mujer', 'hombre', 'mujer']
})

# Gráfico de dispersión con hue
sns.scatterplot(
    data=df,
    x='altura',
    y='peso',
    hue='sexo',
    hue_order=['hombre', 'mujer'],
    palette={'hombre': 'blue', 'mujer': 'pink'})
plt.show()

## .relplot()
Es una función de alto nivel para crear gráficos relacionales, como gráficos de dispersión (`scatter`) y de líneas (`line`). Es muy flexible y permite crear gráficos complejos fácilmente.

**¿Cómo funciona?**
- Por defecto, crea un gráfico de dispersión (`kind='scatter'`), pero puedes cambiarlo a línea con `kind='line'`.
- Permite usar argumentos como `hue`, `col`, `row`, `size`, y `style` para diferenciar y organizar los datos por categorías, creando incluso múltiples subgráficos (facetas).
- `data`: DataFrame con los datos.
- `x`, `y`: Variables para los ejes.
- `hue`: Variable para agrupar por color.
- `size`: Variable para el tamaño de los puntos.
- `style`: Variable para el estilo de los marcadores.
- `col`, `row`: Variables para crear subgráficos (facetas).
- `kind`: Tipo de gráfico (`'scatter'` o `'line'`).
- `palette`: Paleta de colores.
- `height`: Altura de cada faceta.
- `aspect`: Relación de aspecto de cada faceta.
- `markers`: Marcadores personalizados.
- `sizes`: Rango o diccionario para los tamaños de los puntos.
- `col_wrap`: Número de columnas antes de hacer un salto de línea en las facetas.
- `facet_kws`: Diccionario de opciones para el `FacetGrid`.

**Ventajas:**
- Permite crear fácilmente gráficos con múltiples variables categóricas.
- Facilita la comparación entre grupos y la visualización de relaciones.

**Resumen:**
`.relplot()` es ideal para explorar relaciones entre variables y comparar grupos, con opciones para personalizar colores, estilos y organizar subgráficos.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# DataFrame de ejemplo
import pandas as pd
df = pd.DataFrame({
    'x': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5],
    'y': [5, 4, 3, 2, 1, 2, 3, 4, 5, 6],
    'grupo': ['A']*5 + ['B']*5
})

# Gráfico de dispersión con hue
sns.relplot(data=df, x='x', y='y', hue='grupo', kind='scatter', row='grupo', style='grupo')
plt.show()

## .catplot()
Es una función de alto nivel para crear gráficos categóricos fácilmente. Permite visualizar la relación entre una variable categórica y una numérica usando diferentes tipos de gráficos.

- Las gráficas de puntos muestran variables categóricas.
- Muestra el promedio de variables cuantitativas.
- Pueden mostrar el intervalo de confianza (95%).
- Por defecto, crea un gráfico de puntos (kind='strip'), pero puedes cambiarlo a otros tipos como 'box', 'violin', 'bar', 'swarm', 'point', etc.
- Permite usar argumentos como hue, col, row para diferenciar y organizar los datos por categorías, creando subgráficos (facetas).
- El parámetro estimator en Seaborn (usado en funciones como catplot, barplot, pointplot, etc.) permite definir la función estadística que se aplica a los datos de cada categoría para calcular el valor central que se muestra en el gráfico. Por defecto, estimator es np.mean (media), pero se puede cambiar por otras funciones como np.median (mediana), np.sum, etc.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

df = pd.DataFrame({
    'grupo': ['A', 'A', 'B', 'B'],
    'valor': [10, 12, 8, 15]
})

sns.catplot(data=df, x='grupo', y='valor', kind='point', estimator=np.median)
plt.show()

## Cambiando Estilo y Color
Seaborn permite personalizar el estilo y los colores de los gráficos fácilmente. Se pueden cambiar el estilo globalmente o para gráficos individuales. Ambas funciones afectan todos los gráficos creados después de llamarlas.

### .set_style()
Cambia el estilo visual global de los gráficos de Seaborn (fondos, cuadrículas, bordes). Ejemplos de estilos: 'white', 'dark', 'whitegrid', 'darkgrid', 'ticks'.

```python
import seaborn as sns

sns.set_style('whitegrid')  # Fondo blanco con cuadrícula
```
### set_palette()
Cambia la paleta de colores global para los gráficos. Se pueden usar nombres de paletas predefinidas ('deep', 'muted', 'bright', etc.) o definir una lista de colores.

```python
import seaborn as sns

sns.set_palette('pastel')  # Usa colores pastel en los gráficos
```

###  .set_context()
Ajusta el tamaño de los elementos del gráfico (fuentes, líneas, marcadores, etc.) para adaptarse a diferentes contextos de presentación.

Principales contextos:

- `paper`: Para gráficos en artículos o reportes (más pequeño).
- `notebook`: Para trabajar en notebooks (tamaño intermedio, es el valor por defecto).
- `talk`: Para presentaciones orales (elementos más grandes).
- `poster`: Para pósters o presentaciones grandes (elementos aún más grandes).

```python
import seaborn as sns

sns.set_context('talk')  # Hace que los textos y líneas sean más grandes, ideal para presentaciones
```

## Títulos de las Gráficas

### .fig.suptitle()
Permite agregar un título a la gráfica. En caso de tener sub-graficas este es un titulo que engloba todas las sub-graficas.

```python
g.fig.suptitle('Título de la gráfica')
```
### .set_titles()
Permite agregar títulos a cada sub-gráfica. Se puede usar un formato de cadena para personalizar los títulos.

``` python
g.set_title('Título de la sub-gráfica')
```

### .set()
Permite establecer etiquetas para los ejes x e y, así como el título de la gráfica.
``` python
g.set(xlabel='Car Model Year', ylabel='Average MPG')
```

### .xticks()
Permite rotar las etiquetas del eje x para mejorar la legibilidad. Por ejemplo, si las etiquetas son largas o se superponen, se puede usar:
``` python
plt.xticks(rotation=90)
```