# Caso práctico
## Visualización con `pandas`

### Recordad: atajos de teclado
- `Ctrl + Enter`: ejecuta celda seleccionada
- `Mayúsculas + Enter`: ejecuta celda seleccionada y pasa a la siguiente
- `Alt + Enter`: ejecuta celda, inserta nueva y pasa a la siguiente

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

sns.set()
plt.rcParams['figure.figsize'] = [20.0, 10.0]
sns.set_context('talk')  # fuentes más grandes

In [None]:
csv_datos = 'http://www.ine.es/jaxi/files/_px/es/csv_sc/t20/e301/nacim/a2017/l0/03022.csv_sc?nocab=1'
# csv_datos = 'nacimientos.csv'

> Cambiar el origen de los datos a local (`nacimientos.csv`) en caso de problemas de conectividad

In [None]:
# Descarga los datos y limpia datos innecesarios
nacimientos = pd.read_csv(csv_datos,
                          sep=';',
                          encoding='utf-8',
                          skipfooter=2, engine='python',
                          na_values='..',
                          header=[4, 5],
                          index_col=0)

nacimientos.dropna(axis=1, inplace=True)
meses = nacimientos.columns.get_level_values(0)[0::3].values.repeat(3)
nacimientos.columns = pd.MultiIndex.from_tuples(
    zip(meses, nacimientos.columns.get_level_values(1)),
    names=['Mes', 'Sexo']
)

In [None]:
uniprovinciales = ['Cantabria', 'Rioja, La', 'Murcia', 'Asturias', 'Navarra', 'Balears, Illes', 'Madrid']
# provincias que empiezan por la letra 'G'
provincias_g = [prov for prov in nacimientos.index if prov.upper().startswith('G')]

dfu = nacimientos.Total.reindex(uniprovinciales)

#####
dfu.plot.bar();  # crea gráfico de barras
#####
dfu

## 1 - Crea una figura con 2 subplots (uno junto al otro) y dibuja los gráficos de barras para `uniprovinciales` y `provincias_g`

### 1.2 Repite el mismo gráfico con barras apiladas
- **BONUS**: Omite la columna 'Total'

## 2 -  Representa la evolución anual para cada provincia
- Eje 'x': tiempo
- Eje 'y': Total de nacimientos
- **`[BONUS #1]`**: Excluir datos de Madrid
- **`[BONUS #2]`** Estilo de línea: contínua con marcadores en 'v'

In [None]:
dfu = nacimientos.reindex(uniprovinciales)        # filtra por provincias
dfu.drop('Total', axis=1, level=0, inplace=True)  # tira columna de totales
dfu_totales = dfu.xs('Total', axis=1, level=1)    # extrae columna de totales

### 2.2 Repetir con un gráfico por provincia colocadas una junto a la otra (usar el atributo `layout`)

## 3 - Mismo gráfico que en `2.2`, pero compartiendo el eje 'y'

- **`[BONUS #1]`**: excluir datos de Madrid
- **`[BONUS #2]`**: dibujar una marca en el eje de abcisas cada 3 meses

## 4 - Nombrar cada gráfico de (3) con un título

- **`[BONUS]`**: Establecer una nota (título) global para toda la figura
  `plt.gca().get_figure()` obtiene la referencia a la figura

## 5 - Crear un gráfico de área con los datos de Cantabria

- Establecer un tamaño de 12 pulgadas de ancho por 8 de alto
- Excluir la columna de datos totales (mujeres+hombres)

## 6 - Repetir el gráfico anterior sin datos apilados

- Datos apilados por defecto

## 7 - Crear un diagrama de cajas (`boxplot`) sin cuadrícula

- Usar un tamaño de 8 por 6 pulgadas

## 8 - Repetir el diagrama anterior girando las etiquetas del eje 'x'

## 9 - Ajustar los ejes en el gráfico generado en `2`

- Eje 'x' entre 3 y  (3=Abril, 8=Septiembre)
- Eje 'y' entre 0 y 1500
- Sin cuadrícula
- **`[BONUS]`**: Leyenda en la parte superior izquierda
- **`[BONUS]`**: añadir marcas en el eje 'x' cada 2 meses


## 10 - Cambiar el mapa de colores del gráfico anterior

In [None]:
# Lista de mapas de colores disponibles
# colores invertidos: nombre_r (ejemplo: 'Blues_r')

print([cm for cm in plt.cm.datad if not cm.endswith("_r")])

## 11 - Añadir un segundo eje de ordenadas con los datos de Madrid

- Omitir el posicionamiento de la leyenda

## 12 - Incluir los datos en el segundo gráfico generado en [1]

- **`[BONUS]`**: Elimina los ticks del eje 'x' (`set_xticklabels()`)

# BONUS

## Generar un gráfico circular con estilo 'xkcd' con los datos de Cantabria