# Ejercicio 

El objetivo de este trabajo es comprobar si las restricciones de tráfico establecidas en Madrid Central han servido para reducir significativamente las emisiones de gases contaminantes.

### Conjunto de datos

Datos abiertos del Ayuntamiento de Madrid: [Calidad del aire. Datos diarios años 2001 a 2019](http://aprendeconalf.es/python/trabajos/datos/emisiones-madrid.csv).

# Solución

## Preprocesamiento de datos

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import datetime as dt

# Códigos de las magnitudes contaminantes medidas
magnitudes = {
    '01':'Dióxido de Azufre',
    '06':'Monóxido de Carbono',
    '07':'Monóxido de Nitrógeno',
    '08':'Dióxido de Nitrógeno',
    '09':'Partículas < 2.5 μm',
    '10':'Partículas < 10 μm',
    '12':'Óxidos de Nitrógeno',
    '14':'Ozono',
    '20':'Tolueno',
    '30':'Benceno',
    '35':'Etilbenceno',
    '37':'Metaxileno',
    '38':'Paraxileno',
    '39':'Ortoxileno',
    '42':'Hidrocarburos totales(hexano)',
    '43':'Metano',
    '44':'Hidrocarburosno metánicos (hexano)'
}

# Códigos de las estaciones de medición.
estaciones = {
    '001':'Pº. Recoletos',
    '002':'Glta. de Carlos V',
    '035':'Pza. del Carmen',
    '004':'Pza. de España',
    '039':'Barrio del Pilar',
    '006':'Pza. Dr. Marañón',
    '007':'Pza. M. de Salamanca',
    '008':'Escuelas Aguirre',
    '009':'Pza. Luca de Tena',
    '038':'Cuatro Caminos',
    '011':'Av. Ramón y Cajal',
    '012':'Pza. Manuel Becerra',
    '040':'Vallecas',
    '014':'Pza. Fdez. Ladreda',
    '015':'Pza. Castilla',
    '016':'Arturo Soria', 
    '017':'Villaverde Alto',
    '018':'Calle Farolillo',
    '019':'Huerta Castañeda',
    '036':'Moratalaz',
    '021':'Pza. Cristo Rey',
    '022':'Pº. Pontones',
    '023':'Final C/ Alcalá',
    '024':'Casa de Campo',
    '025':'Santa Eugenia',
    '026':'Urb. Embajada (Barajas)',
    '027':'Barajas',
    '047':'Méndez Álvaro',
    '048':'Pº. Castellana',
    '049':'Retiro',
    '050':'Pza. Castilla',
    '054':'Ensanche Vallecas',
    '055':'Urb. Embajada (Barajas)',
    '056':'Plaza Elíptica',
    '057':'Sanchinarro',
    '058':'El Pardo',
    '059':'Parque Juan Carlos I',
    '060':'Tres Olivos'
}

# Carga de datos
ruta = 'datos/datos-emisiones.csv'
df = pd.read_csv('http://aprendeconalf.es/python/trabajos/datos/emisiones-madrid.csv')
# Preprocesamiento de datos
# Pasar los días de columnas a una nueva variable DIA
df = df.melt(id_vars=['ESTACION', 'MAGNITUD', 'ANO', 'MES'], var_name='DIA', value_name='VALOR')
# Eliminar la D del valor de los días
df['DIA'] = df['DIA'].apply(lambda x: x[1:])
# Convertir las columnas DIA, MES, ANO, ESTACION y MAGNITUD en cadenas
df['ESTACION'] = df['ESTACION'].astype(str)
df['MAGNITUD'] = df['MAGNITUD'].astype(str)
df['MES'] = df['MES'].astype(str)
df['ANO'] = df['ANO'].astype(str)
# Añadir 00 a la estación cuando la estación solo tiene un dígito y 0 cuando tiene dos
df['ESTACION'] = df['ESTACION'].apply(
    lambda x: '00' + x if len(x) < 2 else '0' + x)
# Añadir 0 a la magnitud cuando solo tiene un dígito
df['MAGNITUD'] = df['MAGNITUD'].apply(lambda x: '0' + x if len(x) < 2 else x)
# Añadir 0 al mes cuando el mes solo tiene un dígito
df['MES'] = df['MES'].apply(lambda x: '0' + x if len(x) < 2 else x)
# Crear una nueva columna concatenando las columnas DIA, MES y AÑO en formato dd/mm/aaaa
df['FECHA'] = df['DIA'] + '/' + df['MES'] + '/' + df['ANO']
# Convertir la columna fecha al tipo datetime
df['FECHA'] = pd.to_datetime(df['FECHA'], format='%d/%m/%Y', errors='coerce')
# Eliminar las filas con fechas no válidas
df = df.drop(df[np.isnat(df['FECHA'])].index)
# Ordenar el dataframe por fechas, magnitudes y estaciones
df = df.sort_values(['FECHA', 'MAGNITUD', 'ESTACION'])

print(df)

1. Crear una función que reciba una estación de medición y una magnitud y devuelva una lista con todas las mediciones de la magnitud en la estación.

In [7]:
def estacion_magnitud(df, estacion, magnitud):
    """
    Función que devuelve la lista de valores de una estación y magnitud.
    Parámetros: 
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - estacion: Es una cadena con el código de la estación de medición.
        - magnitud: Es una cadena el código de la magnitud medida.
    Devuelve:
        Una lista con los valores de la magnitud medidos en la estación indicada.
    """
    # Filtro de la estación y la magnitud
    df1 = df[(df['ESTACION'] == estacion) & (df['MAGNITUD'] == magnitud)]
    return list(df1['VALOR'])

# Ejemplo
print(estacion_magnitud(df, '050', '12'))


00'}, {'id': '1819060', 'anfitrion': '9525646', 'distrito': 'Arganzuela', 'plazas': '2', 'precio': '$50.00'}, {'id': '1825060', 'anfitrion': '9551147', 'distrito': 'Centro', 'plazas': '4', 'precio': '$49.00'}, {'id': '1826031', 'anfitrion': '3275902', 'distrito': 'Centro', 'plazas': '2', 'precio': '$85.00'}, {'id': '1829496', 'anfitrion': '9570589', 'distrito': 'Salamanca', 'plazas': '4', 'precio': '$90.00'}, {'id': '1830224', 'anfitrion': '5542111', 'distrito': 'Centro', 'plazas': '9', 'precio': '$135.00'}, {'id': '1835915', 'anfitrion': '9597850', 'distrito': 'Centro', 'plazas': '2', 'precio': '$45.00'}, {'id': '1845903', 'anfitrion': '9643400', 'distrito': 'Centro', 'plazas': '3', 'precio': '$80.00'}, {'id': '1846137', 'anfitrion': '9644407', 'distrito': 'Centro', 'plazas': '1', 'precio': '$20.00'}, {'id': '1846297', 'anfitrion': '2519411', 'distrito': 'Retiro', 'plazas': '2', 'precio': '$56.00'}, {'id': '1847117', 'anfitrion': '8108510', 'distrito': 'Retiro', 'plazas': '2', 'precio

2. Crear una función que reciba un mes y una estación de medición y devuelva un diccionario con las medias de las magnitudes medidas por la estación durante ese mes.

In [8]:
def medias_mes_estacion(df, mes, estacion):
    """
    Función que devuelve la media de las magnitudes medidas en una estación en un mes concreto.
    Parámetros:
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - mes: Es una cadena de dos caractares con el número de mes en formato mm.
        - estacion: Es una cadena con el código de la estación de medición.
    Devuelve:
        Un diccionario cuyos pares tienen como clave las magnitudes y como valores las medias del mes en la estación indicada.
    """ 
    # Filtro de la estación y el mes
    df1 = df[(df['ESTACION'] == estacion) & (df['MES'] == mes)]
    # Agrupación por magnitud y cálculo de la media
    return {magnitudes[k]:np.mean(v) for k, v in df1.groupby('MAGNITUD')['VALOR']}

# Ejemplo
print(medias_mes_estacion(df, '03', '050'))

{'Chamartín': 22, 'Latina': 19, 'Centro': 618, 'Arganzuela': 44, 'Salamanca': 51, 'Tetuán': 19, 'Fuencarral - El Pardo': 5, 'Ciudad Lineal': 23, 'Chamberí': 69, 'Villaverde': 5, 'Hortaleza': 12, 'Moncloa - Aravaca': 18, 'Carabanchel': 14, 'Retiro': 35, 'San Blas - Canillejas': 14, 'Villa de Vallecas': 5, 'Barajas': 6, 'Usera': 5, 'Puente de Vallecas': 11, 'Moratalaz': 4, 'Vicálvaro': 1}


In [None]:
3. Crear una función que reciba un mes y una magnitud y devuelva un diccionario con las medias de las estaciones de medición de la magnitud durante ese mes.

In [9]:
def medias_mes_magnitud(df, mes, magnitud):
    """
    Función que devuelve la media de una magnitud en mes concreto en cada estación de medición.
    Parámetros:
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - mes: Es una cadena de dos caractares con el número de mes en formato mm.
        - magnitud: Es una cadena con el código de la magnitud medida.
    Devuelve:
        Un diccionario cuyos pares tienen como clave las estaciones y como valores las medias del mes de la magnitud indicada.
    """ 
    # Filtro de la magnitud y el mes
    df1 = df[(df['MAGNITUD'] == magnitud) & (df['MES'] == mes)]
    # Agrupación por estación y cálculo de la media
    return {estaciones[k]:np.mean(v) for k, v in df1.groupby('ESTACION')['VALOR']}

# Ejemplo
print(medias_mes_magnitud(df, '12', '12'))


[{'id': '256004', 'anfitrion': '1732442', 'distrito': 'Centro', 'plazas': '12', 'precio': '$80.00'}, {'id': '264054', 'anfitrion': '1370007', 'distrito': 'Centro', 'plazas': '12', 'precio': '$480.00'}, {'id': '536574', 'anfitrion': '447969', 'distrito': 'Arganzuela', 'plazas': '10', 'precio': '$70.00'}, {'id': '685152', 'anfitrion': '3494012', 'distrito': 'Hortaleza', 'plazas': '12', 'precio': '$155.00'}, {'id': '688795', 'anfitrion': '1732442', 'distrito': 'Centro', 'plazas': '10', 'precio': '$75.00'}, {'id': '745728', 'anfitrion': '3797913', 'distrito': 'Centro', 'plazas': '12', 'precio': '$250.00'}, {'id': '773861', 'anfitrion': '1732442', 'distrito': 'Centro', 'plazas': '12', 'precio': '$75.00'}, {'id': '834562', 'anfitrion': '4365768', 'distrito': 'Barajas', 'plazas': '10', 'precio': '$110.00'}, {'id': '970485', 'anfitrion': '5302455', 'distrito': 'Retiro', 'plazas': '16', 'precio': '$350.00'}, {'id': '1044902', 'anfitrion': '5751753', 'distrito': 'Moncloa - Aravaca', 'plazas': '1

4. Crear una función que reciba un rango de fechas y una estación de medición y genere un gráfico con la evolución diaria de las magnitudes de esa estación en las fechas indicadas.

In [12]:
def evolucion_estacion(df, estacion, inicio, fin):
    """
    Función que crea un gráfico con la evolución de las magnitudes de una estación de medición en un rango de fechas.
    Parámetros:
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - estacion: Es una cadena con el código de la estacion de medición.
        - inicio: Es una cadena con la fecha inicial en formato dd-mm-aaaa.
        - fin: Es una cadena con la fecha final en formato dd-mm-aaaa.
    """
    # Añadir columna con el nombre de las magnitudes
    df['NOMBRE MAGNITUD'] = df['MAGNITUD'].apply(lambda x: magnitudes[x])
    # Filtro de la estación y rango de fechas
    df1 = df[(df['ESTACION'] == estacion) & (df['FECHA'] >= inicio) & (df['FECHA'] <= fin)]
    # Establecemos la columna fecha como índice del DataFrame
    df1.set_index('FECHA', inplace = True)
    # Inicializamos el gráfico
    fig, ax = plt.subplots()
    # Agrupamos los datos por magnitud y generamos el gráfico de líneas
    df1.groupby('NOMBRE MAGNITUD')['VALOR'].plot(legend = True)
    # Reducimos el eje x un 30% para que quepa la leyenda
    box = ax.get_position()
    ax.set_position([box.x0, box.y0, box.width * 0.7, box.height])
    # Dibujar la leyenda fuera del área del gráfico
    plt.legend(loc='center left', bbox_to_anchor=(1.0, 0.5))
    # Guardamos el gráfico.
    plt.show()
    return

# Ejemplo
evolucion_estacion(df, '017', '2018-03-01', '2018-06-30')


[{'id': '1890985', 'anfitrion': '5675916', 'distrito': 'Arganzuela', 'plazas': '2', 'precio': '$18.00'}, {'id': '896291', 'anfitrion': '4778528', 'distrito': 'Arganzuela', 'plazas': '2', 'precio': '$19.00'}, {'id': '537234', 'anfitrion': '2638528', 'distrito': 'Arganzuela', 'plazas': '1', 'precio': '$22.00'}, {'id': '691344', 'anfitrion': '655088', 'distrito': 'Arganzuela', 'plazas': '1', 'precio': '$23.00'}, {'id': '375472', 'anfitrion': '1888816', 'distrito': 'Arganzuela', 'plazas': '2', 'precio': '$24.00'}, {'id': '748854', 'anfitrion': '1888816', 'distrito': 'Arganzuela', 'plazas': '1', 'precio': '$24.00'}, {'id': '883037', 'anfitrion': '4674072', 'distrito': 'Arganzuela', 'plazas': '1', 'precio': '$24.00'}, {'id': '26825', 'anfitrion': '114340', 'distrito': 'Arganzuela', 'plazas': '1', 'precio': '$25.00'}, {'id': '605697', 'anfitrion': '2999728', 'distrito': 'Arganzuela', 'plazas': '2', 'precio': '$25.00'}, {'id': '1592439', 'anfitrion': '4043145', 'distrito': 'Arganzuela', 'plaza

In [None]:
5. Crear una función que reciba un rango de fechas y una magnitud y genere un gráfico con la evolución diaria de la magnitud para cada estación de medición en las fechas indicadas.

In [13]:
def evolucion_magnitud(df, magnitud, inicio, fin):
    """
    Función que crea un gráfico con la evolución de las mediciones de una magnitud en cada estación en un rango de fechas.
    Parámetros:
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - magnitud: Es una cadena con el código de la magnitud medida.
        - inicio: Es una cadena con la fecha inicial en formato dd-mm-aaaa.
        - fin: Es una cadena con la fecha final en formato dd-mm-aaaa.
    """
    # Añadir columna con el nombre de las estaciones
    df['NOMBRE ESTACION'] = df['ESTACION'].apply(lambda x: estaciones[x])
    # Filtro de la magnitud y el rango de fechas
    df1 = df[(df['MAGNITUD'] == magnitud) & (df['FECHA'] >= inicio) & (df['FECHA'] <= fin)]
    # Establecemos la columna fecha como índice del DataFrame
    df1.set_index('FECHA', inplace = True)
    # Inicializamos el gráfico
    fig, ax = plt.subplots()
    # Agrupamos los datos por estación y generamos el gráfico de líneas.
    df1.groupby('NOMBRE ESTACION')['VALOR'].plot(legend = True)
    # Reducimos el eje x un 30% para que quepa la leyenda
    box = ax.get_position()
    ax.set_position([box.x0, box.y0, box.width * 0.7, box.height])
    # Dibujar la leyenda fuera del área del gráfico
    plt.legend(loc='center left', bbox_to_anchor=(1.0, 0.5))
    # Guardamos el gráfico
    plt.show()
    return

# Ejemplo
evolucion_magnitud(df, '12', '2018-03-01', '2018-06-30')


{'13660': 1, '83531': 2, '101471': 1, '101653': 1, '114340': 1, '130907': 3, '132883': 1, '288380': 1, '303845': 1, '353616': 1, '353738': 5, '364585': 2, '378073': 5, '391014': 1, '401552': 1, '368907': 2, '448981': 1, '259229': 1, '487095': 1, '495849': 1, '499977': 2, '510570': 1, '527760': 1, '5795235': 3, '533936': 1, '534128': 12, '534515': 1, '361930': 2, '564773': 1, '574498': 1, '557423': 1, '605612': 3, '606925': 2, '632589': 1, '650803': 1, '666482': 1, '723539': 1, '739627': 1, '740087': 5, '780107': 1, '796746': 1, '805726': 4, '814490': 3, '816497': 1, '845399': 4, '596469': 8, '850654': 2, '877571': 4, '927343': 3, '852616': 2, '967721': 1, '749212': 1, '75944': 1, '1004721': 1, '1008659': 1, '124972': 2, '1031664': 1, '669927': 1, '1090760': 1, '1732442': 5, '1168897': 1, '1174648': 1, '1172225': 2, '1130651': 2, '1212528': 1, '630482': 2, '1351231': 1, '1367452': 1, '1351865': 2, '1373873': 1, '1374415': 1, '1370007': 1, '1406073': 1, '1466005': 1, '1473247': 1, '14783

6. Crear una función que reciba una magnitud y genere un gráfico con las medias mensuales para cada estación de medición.

In [19]:
def evolucion_medias_magnitud(df, magnitud):
    """
    Función que crea un gráfico con la evolución de las medias de una magnitud en cada estación.
    Parámetros:
        - df: Es un DataFrame con la información de la base de datos de emisiones.
        - magnitud: Es una cadena con el código de la magnitud medida.
    """
    # Añadir columna con el nombre de las estaciones
    df['NOMBRE ESTACION'] = df['ESTACION'].apply(lambda x: estaciones[x])
    # Filtro de la magnitud
    df1 = df[df['MAGNITUD'] == magnitud]
    # Establecemos la columna fecha como índice del DataFrame
    df1.set_index('FECHA', inplace = True)
    # Inicializamos el gráfico
    fig, ax = plt.subplots()
    # Agrupamos los datos por estación y generamos el gráfico de líneas.
    df1.groupby(['ANO','MES','NOMBRE ESTACION']).mean().unstack()['VALOR'].plot(ax = ax, legend = True)
    # Reducimos el eje x un 30% para que quepa la leyenda
    box = ax.get_position()
    ax.set_position([box.x0, box.y0, box.width * 0.7, box.height])
    # Dibujar la leyenda fuera del área del gráfico
    plt.legend(loc='center left', bbox_to_anchor=(1.0, 0.5))
    # Guardamos el gráfico
    plt.show()
    return

# Ejemplo
evolucion_medias_magnitud(df, '12')


Unnamed: 0,id,anfitrion,url,tipo_alojamiento,distrito,precio,gastos_limpieza,plazas,noches_minimas,puntuacion,precio_persona
0,6369,13660,https://www.airbnb.com/rooms/6369,Private room,Chamartín,70.0,5.0,2,1,98.0,25.000000
2,24805,101471,https://www.airbnb.com/rooms/24805,Entire home/apt,Centro,80.0,30.0,3,5,100.0,53.750000
3,24836,101653,https://www.airbnb.com/rooms/24836,Entire home/apt,Centro,115.0,0.0,4,3,98.0,49.285714
4,26825,114340,https://www.airbnb.com/rooms/26825,Private room,Arganzuela,25.0,15.0,1,2,94.0,21.666667
9,62423,303845,https://www.airbnb.com/rooms/62423,Private room,Centro,45.0,22.0,3,1,90.0,16.750000
...,...,...,...,...,...,...,...,...,...,...,...
995,2686592,13751801,https://www.airbnb.com/rooms/2686592,Private room,Centro,21.0,10.0,1,20,83.0,20.476190
996,2701211,1650712,https://www.airbnb.com/rooms/2701211,Entire home/apt,Salamanca,165.0,70.0,4,3,84.0,80.714286
997,2704499,13841663,https://www.airbnb.com/rooms/2704499,Entire home/apt,Centro,85.0,20.0,3,2,100.0,38.000000
998,2706194,1843216,https://www.airbnb.com/rooms/2706194,Entire home/apt,Centro,69.0,30.0,4,4,94.0,38.250000
