
# Laboratorio de Visualización: Matplotlib → Seaborn (dataset `titanic`)

**Obxectivo:** práctica gradual e organizada. Comezamos con **Matplotlib** (gráficos básicos e subplots) e continuamos con **Seaborn** (visualización estatística).  
**Dataset:** `titanic` (integrado en Seaborn).

> Indícanse **parámetros concretos** nos enunciados para homoxeneizar os resultados na aula.



## 0) Preparación do contorno e carga de datos

- Importa `pandas`, `matplotlib.pyplot` como `plt` e `seaborn` como `sns`.
- Carga `titanic` con `sns.load_dataset("titanic")`.
- Amosar `head()` e `info()`.


In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Carga do dataset
titanic = sns.load_dataset("titanic")

# Exploración rápida
display(titanic.head())
titanic.info()



## 1) Matplotlib: gráficos básicos

> Nos seguintes exercicios usa **Matplotlib**. Para cada gráfico:
> - Crea unha figura con `plt.figure(figsize=(6,4))`.
> - Engade título con `plt.title(...)`.
> - Etiquetas de eixes con `plt.xlabel(...)`, `plt.ylabel(...)`.
> - Activa grella con `plt.grid(True, linestyle="--", linewidth=0.5)`.
> - Non establezas cores explícitas.



### 1.1 Liña: idade ordenada
- Filtra as filas con `age` non nula.
- Ordena por `age` ascendente.
- Debuxa un **gráfico de liña** da columna `age` (eixe Y) contra o un rango da lonxitude, `range(len(df))` (eixe X).
- Parámetros: `linewidth=1.5`, `alpha=0.9`. 


In [None]:
# 1.1



### 1.2 Dispersión: `age` vs `fare`
- Filtra filas con `age` e `fare` non nulas.
- **Scatter plot**: X=`age`, Y=`fare`.
- Parámetros: `s=20` (tamaño), `alpha=0.6`, `marker='o'`.
- Limita eixes: `xlim(0, 80)`; `ylim(0, 300)`.


In [None]:
# 1.2


### 1.3 Histograma: `age`
- Filtra `age` non nula.
- **Histograma** con `bins=20`, `edgecolor="black"`, `alpha=0.8`.
- Engade `plt.axvline(df["age"].mean(), linestyle="--", linewidth=1)` para a media.


In [None]:
# 1.3


### 1.4 Barras: media de `fare` por `class`
- Calcula a media de `fare` por `class` con `groupby`.
- **Bar plot** vertical con `plt.bar`.
- Ordena o índice de `class` como `['Third','Second','First']` antes de debuxar.

In [None]:
# 1.4


### 1.5 Barras horizontais: conteos por `embark_town`
- Conta rexistros por `embark_town` (exclúe nulos) (`dropna` -> `value_counts` -> `sort_values`).
- **Barra horizontal** con `plt.barh` e etiquetas nos eixes.
- Ordena de menor a maior.


In [None]:
# 1.5



### 1.6 Boxplot (Matplotlib): `age` por `sex`
- Filtra `age` non nula.
- Crea un boxplot con dúas caixas (home/muller) usando listas de valores.
- Parámetros: `showmeans=True`, `meanline=True`.
- Etiqueta eixes e engade título.


In [None]:
# 1.6


### 1.7 Gráfico circular: proporción `survived`
- Calcula proporcións de `survived` (0/1) excluíndo nulos.
```python
s = titanic["survived"].dropna().value_counts().reindex([0,1]).fillna(0)
```
- Debuxa un `plt.pie` con etiquetas `["Non","Si"]` e `autopct="%1.1f%%"`.
- `startangle=90` e `counterclock=False`.


In [None]:
# 1.7


## 2) Matplotlib: Subplots

Crea composicións de varias gráficas na mesma figura.

**Regras comúns:**
- Usa `fig, axes = plt.subplots(...)` co `figsize` indicado.
- Engade `plt.suptitle(...)` para o título xeral.
- `plt.tight_layout()` ao final.



### 2.1 Táboa 2x2
- `figsize=(9,7)`
- (1,1) Histograma de `age` con `bins=15`.
- (1,2) Dispersión `age` vs `fare`.
- (2,1) Barras horizontais de conteos por `class`.
- (2,2) Boxplot de `fare` por `sex` (usa Matplotlib).


In [None]:
# 2.1


### 2.2 Subplots compartindo eixo X
- Filtra `age` e `survived` non nulos.
- Crea 2 subplots **(2x1)** con `sharex=True`, `figsize=(7,6)`.
- No subplot superior:
  - Histograma de `age`.
  - parámetros: `bins=20`, `edgecolor=black`, `alpha=0.8`.
  - etiquetas: y -> "Frecuencia Total",  título -> "Distribución de idades"
- No subplot inferior.
  - Histograma aplilado de dúas series:
    - Idades de pasaxeiros que non sobreviviron (`survived = 0`)
    - Idades de pasaxeiros que nsobreviviron (`survived = 1`)
  - parámetros: `bins=20`, `edgecolor=black`, `alpha=0.8`, `label =['Non sobreviviu', 'Sobreviviu']`. 
  - Etiquetas: x -> 'Idade', y -> 'Frecuencia por estado', título -> 'Idades por supervivencia'
  - Engade `axes[1].legend() `


In [None]:
# 2.2
import numpy as np




## 3) Seaborn: visualización estatística

Emprega **Seaborn** co mesmo dataset `titanic`.



### 3.1 Conteos por `class` (countplot)
- `sns.countplot` con `x="class"`.
- Ordena categorías de `class` como `['Third','Second','First']`.
- Engade `plt.title("Pasaxeiros por clase")` e `plt.grid(axis="y", linestyle="--", linewidth=0.5)`.


In [None]:
# 3.1


### 3.2 Distribución de `age` por `sex` (histplot + kde)
- Usa `sns.histplot` con `x="age"`, `hue="sex"`, `bins=20`, `kde=True`, `element="step"`, `stat="density"`, `common_norm=False`.
- Exclúe nulos en `age`.


In [None]:
# 3.2



### 3.3 Boxplot: `fare` por `class`
- `sns.boxplot` con `x="class"`, `y="fare"`.
- Exclúe nulos en `fare`.
- Engade título e eixo Y ata 300 con `plt.ylim(0, 300)`.


In [None]:
# 3.3


### 3.4 Violinplot: `fare` por `survived`
- `sns.violinplot` con `x="survived"`, `y="fare"`.
- Exclúe nulos en `fare`.
- Título e `ylim(0, 300)`.


In [None]:
# 3.4




### 3.5 Dispersión: `age` vs `fare` con `hue="class"` e `style="sex"`
- `sns.scatterplot` con `x="age"`, `y="fare"`, `hue="class"`, `style="sex"`.
- Exclúe nulos en `age` e `fare`.
- Limita eixes como en 1.2.


In [None]:
# 3.5



### 3.6 Barras (media): `age` por `class` e `sex`
- `sns.barplot` con `x="class"`, `y="age"`, `hue="sex"`, `estimator=pd.Series.mean`, `errorbar="ci"`.
- Exclúe nulos en `age`.
- Ordena `class` como antes.


In [None]:
# 3.6


### 3.7 Mapa de calor: correlación numérica
- Selecciona columnas numéricas e calcula `corr()`.
```python
num = titanic.select_dtypes(include="number")
corr = num.corr(numeric_only=True)
```
- `sns.heatmap` con `annot=True`, `fmt=".2f"`, `linewidths=.5`.


In [None]:
# 3.7



### 3.8 Pairplot (numéricas principais)
- Selecciona `["age","fare","sibsp","parch"]`, elimina nulos e crea `sns.pairplot`.


In [None]:
# 3.8


### 3.9 Jointplot: `age` vs `fare`
- `sns.jointplot` con `x="age"`, `y="fare"`, `kind="scatter"`.
- Exclúe nulos.


In [None]:
# 3.9


### 3.10 Catplot: conteos por `sex` e `class`
- `sns.catplot(kind="count")` con `x="sex"`, `hue="class"`, `col="survived"`.
- Axuste: `height=4`, `aspect=1.2`.
- `g.set_titles("survived = {col_name}")`


In [None]:
# 3.10
