# Ejercicio 19

## Enunciado
Crea un programa que:

1. Lea los datos referentes a la contaminación de Madrid de Marzo 2020 en un DataFrame de pandas.
2. Genere una nueva columna indicando el número de mediciones de **NO2** del día no válidas.
3. Crea un mapa de calor donde poder observar el resultado del punto anterior en función del día y la estación.

## Datos

- Listado de las estaciones de control: [enlace](https://datos.madrid.es/egob/catalogo/212629-1-estaciones-control-aire.csv)
- Datos 2020: [enlace](https://datos.madrid.es/egob/catalogo/201200-10306316-calidad-aire-horario.zip)
- Datos 2019: [enlace](https://datos.madrid.es/egob/catalogo/201200-42-calidad-aire-horario.zip)
- Interpretación de los datos: [enlace](https://datos.madrid.es/FWProjects/egob/Catalogo/MedioAmbiente/Aire/Ficheros/Interprete_ficheros_%20calidad_%20del_%20aire_global.pdf)

### ¿Qué cosas nuevas necesitamos saber?
- Funciones lambda.
- Creación de nuevas columnas en un DataFrame.

### Funciones lambda.

Las funciones lambda o funciones anónimas son aquellas que no requieren de definición previa. Para crear una es tan sencillo como en los siguientes ejemplos:

In [None]:
dividir = lambda x, y: x / y # x e y indican que nuestra lambda necesita 2 parametros
print(dividir(10, 2)) # por ello llamamos a lambda con 2 argumentos

Podemos además hacer uso de otras funciones dentro de nuestras funciones lambda.

In [None]:
concatenar = lambda x: ''.join(x)
print(concatenar(['1','2','3','4','5']))

### Creación de nuevas columnas en un DataFrame.

Veamos como crear nuevas columnas en un DataFrame. Para ello, primero generemos unos datos a modos de ejemplo.

In [None]:
# una vez instalada, realizaremos el siguiente import
import pandas as pd
import random

In [None]:
data = {'numeros': [random.randint(75, 125) for _ in range(100)]} # generamos 100 números aleatorios ente 75 y 125

In [None]:
df = pd.DataFrame(data)
df

In [None]:
# veamos como crear una columna que nos indique si es par
df['es_par'] = (df['numeros'] % 2) == 0
df

In [None]:
# ahora hagamos una nueva columna multiplicando el número oginal por 5
df['por_5'] = df['numeros'] * 5
df

In [None]:
# o simplemente una columna con un valor constante
df['constante'] = 'Constante'
df

In [None]:
# supongamos que ahora quiero crear una columna con un número aleatorio...
# lo normal sería hacer esto, pero...
df['random'] = random.randint(1, 100)
df

In [None]:
# como podemos ver, todos tienen el mismo valor, por qué?
# porque el número aleatorio solo lo ha creado una vez y luego ha asignado ese valor a todas la columnas
# paa hacerlo correctamente, debemos hacerlo de esta manera para generar tantos numeros aleatorios como
# filas tenga el df
df['random'] = df.apply(lambda x: random.randint(1, 10), axis=1) # axis = 1 indica que la operación se realiza a nivel de fila
df

In [None]:
# tambien podemos generar un numero aletorio comprendendido entre los valores de dos columnas
# por ejemplo
df['random_numeros_por5'] = df[['numeros', 'por_5']].apply(lambda x: random.randint(x[0], x[1]), axis=1)
df

In [None]:
# por último, también podemos aplicar lambdas a nivel de columna
df['numeros_mas_10'] = df['numeros'].apply(lambda x: x+10)
df

Esto se debe a que cuando hacemos algo del tipo df[['', '']] estamos obteniendo otro DataFrame mientras que cuando hacemos df[''] obtenemos solo la columna en cuestión (serie) y por ello ejecutamos la lambda no a nivel de fila si no a nivel de columna (para cada elemento de la misma).

Eso es todo, a por el ejercicio!

**NOTA**: En la solución del Ejercicio 18 se explica como crear gráficos a partir de lo datos de un DataFrame en el apartado de Bonus del final.

Puedes hacerlo como prefieras, pero si lo vas a hacer directamente sobre el DataFrame, es probable que necesites [pivotar](https://www.geeksforgeeks.org/python-pandas-pivot/) alguna columna.

## Solución