### Práctica de Formatos de datos: CSV y JSON

#### Ejercicio 1[5 puntos]
Considerar el archivo __Contaminación.csv__. El archivo contiene la información recogida por las estaciones de control de calidad del aire durante el año 2019.

Una descripción detallada de la estructura de los datos se puede encontrar en el siguiente enlace: https://datos.madrid.es/FWProjects/egob/Catalogo/MedioAmbiente/Aire/Ficheros/Interprete_ficheros_%20calidad_%20del_%20aire_global.pdf

La información contenida por columnas es la siguiente:
* __PROVINCIA__: Código numérico que representa la provincia. 
* __MUNICIPIO__: Código numérico que representa el municipio. 
* __ESTACIÓN__: Código numérico de hasta dos dígitos que representa la estación. Consultar ANEXO I de la documentación
* __MAGNITUD__: Código numérico de hasta dos dígitos que representa la magnitud.Consultar ANEXO II de la documentación
* __PUNTO MUESTREO__: Código numérico formado por 3 subcódigos. El primer código representa la estación, el segundo código representa la magnitud, y el tercer código representa la técnica de medida.
* __MES__: Mes de la toma de datos. Valor entre 1 y 12.
* __D01-D31__: Medidas tomadas desde el día D01 hasta el día D31 del mes correspondiente.
* __V01-V31__: Validez de las medidas tomadas desde el día D01 hasta el día D31 del mes correspondiente. Puede valer V(Válido), N(No válido), no se conoce(vacío) o bien otra cadena(se considera incorrecto).


Se pide crear un programa que realice las siguientes operaciones:
* Leer los datos del archivo __Contaminación.csv__
* Transformar los datos leidos de manera que aquellos valores que no sean válidos ("N") su valor sea sustituido por 0.
* Obtener y  mostrar por pantalla para cada tipo de contaminante (columna Magnitud) y para cada estación (columna ESTACIÓN), la suma total de la contaminación que se ha producido durante el año 2019, es decir:

|Estación|Contaminante1| Contaminante2| Contaminante3| ....Contaminanten|
|----|-------------|-------------|-------------|-------------|
|Estación1|Subtotal11 |--- |--- |Subtotal1n|  
|Estación2|--- |--- |--- |--- | 
|   ...|--- |--- |--- |--- |     
|Estaciónn|Subtotal1n |--- |--- |Subtotalnn| 
     
* Generar un documento __Salida.csv__ donde cada línea del documento contiene la siguiente información:
    Estación1, Contaminante1,Subtotal1, Contaminante2,Subtotal2,......................,Contaminanten,Subtotaln
    
    Estaciónm, Contaminante1,Subtotal1, Contaminante2,Subtotal2,......................,Contaminanten,Subtotaln
    
Tanto en lo que mostréis por pantalla como lo que escribáis en el archivo usad los nombres de los contaminantes y de las estaciones que aparecen en los anexos de la documentación indicada más arriba.
    

Para leer los archivos usa un código como el siguiente:

In [1]:
import csv

medidas = {1: 'Dióxido de Azufre', 6: 'Monóxido de Carbono', 7: 'Monóxido de Nitrógeno', 8: 'Dióxido de Nitrógeno', 9: 'Partículas < 2.5 µm', 10: 'Partículas < 10 µm', 12: 'Óxidos de Nitrógeno', 14: 'Ozono',
           20: 'Tolueno', 30: 'Benceno', 35: 'Etilbenceno', 37: 'Metaxileno', 38: 'Paraxileno', 39: 'Ortoxileno', 42: 'Hidrocarburos totales (Hexano)', 43: 'Metano', 44: 'Hidrocarburos no metánicos (hexano)'}


def leer_estaciones():
    resultado = dict()

    with open('Estaciones.csv', encoding="utf8", errors='ignore') as csvestaciones:
        entrada = csv.reader(csvestaciones, delimiter=";")

        for linea in entrada:
            if entrada.line_num == 1:
                continue
            resultado[int(linea[1])] = linea[2]

    return resultado


def procesar_datos():
    datos = dict()
    with open('Contaminación.csv', encoding="utf8", errors='ignore') as csvarchivo:
        entrada = csv.reader(csvarchivo, delimiter=";")

        for i in entrada:
            if entrada.line_num == 1:
                continue

            estacion = int(i[2])
            magnitud = int(i[3])

            if estacion not in datos:
                datos[estacion] = dict()

            valor = 0.0
            if magnitud in datos[estacion]:
                valor = datos[estacion][magnitud]

            # Columnas de valores de contaminación [7-68]
            for celda in range(8, 69, 2):
                if i[celda].upper() == "V":
                    valor = valor+float(i[celda-1])

            datos[estacion][magnitud] = valor
    return datos


def presentar_datos(datos):

    with open('Salida.csv', 'w', encoding='utf8') as destino:
        salida = csv.writer(destino,delimiter=';')

        # Cabecera
        cabecera=['Estación']
        for contaminanteM in medidas.values():
            cabecera.append(contaminanteM)
        salida.writerow(cabecera)

        for estacion in datos:
            datosSalida = [estaciones[estacion]]

            for valor in medidas.keys():
                if valor in datos[estacion]:
                    datosSalida.append(datos[estacion][valor])
                else:
                    datosSalida.append('---')
            salida.writerow(datosSalida)

In [4]:
estaciones = leer_estaciones()
datos = procesar_datos()
presentar_datos(datos)

with open('Salida.csv', encoding='utf8',errors='ignore') as documento:
    entrada = csv.reader(documento, delimiter=";")
    for texto in entrada:
        print(texto)


['Estación', 'Dióxido de Azufre', 'Monóxido de Carbono', 'Monóxido de Nitrógeno', 'Dióxido de Nitrógeno', 'Partículas < 2.5 µm', 'Partículas < 10 µm', 'Óxidos de Nitrógeno', 'Ozono', 'Tolueno', 'Benceno', 'Etilbenceno', 'Metaxileno', 'Paraxileno', 'Ortoxileno', 'Hidrocarburos totales (Hexano)', 'Metano', 'Hidrocarburos no metánicos (hexano)']
[]
['Pza. de España', '2016.0', '104.99999999999984', '6373.0', '10392.0', '---', '---', '20147.0', '---', '---', '---', '---', '---', '---', '---', '---', '---', '---']
[]
['Escuelas Aguirre', '2098.0', '46.700000000000145', '4819.0', '12109.0', '2595.0', '5230.0', '19486.0', '12049.0', '632.9000000000001', '146.8000000000002', '113.50000000000009', '---', '---', '---', '375.07000000000016', '352.2100000000001', '23.12']
[]
['Avda. Ramón y Cajal', '---', '---', '3417.0', '9288.0', '---', '---', '14549.0', '---', '396.3999999999997', '92.00000000000001', '69.30000000000014', '---', '---', '---', '---', '---', '---']
[]
['Arturo Soria', '---', '71.

#### Ejercicio 2[5 puntos]
Considerar los archivos  __Estaciones.csv__ y __Museos.json__ que incluye información sobre las estaciones de control de la calidad del aire y sobre los museos de Madrid respectivamente.

El objetivo de este ejercicio es utilizar la información obtenida en el ejercicio 1 de forma que para cada uno de los museos que aparece en el archivo dado realice las siguientes operaciones:
* Obtener las 3 estaciones más cercanas a cada museo.
* Obtener y mostrar por pantalla para cada museo la siguiente información donde ValorX es el subtotal del nivel de contaminación más alto de todos los contaminantes medidos en la estaciónX, y TipoContaminanteX es el tipo del contaminante cuyo valor es mostrado en la celda anterior.

|Museo|Estación1|TipoContaminante1| Estación2|TipoContaminante2| Estación3|TipoContaminante3|
|----|-------------|-------------|-------------|----|----|----|
|Museo1|Valor1 |Tipo1 |Valor2|Tipo2|Valor3|  Tipo3 |
|Museo2|--- |--- |--- |--- | --- | --- | 
|   ...|--- |--- |--- |--- | --- | --- |     
|Museon|Valor1 |Tipo1 |Valor2|Tipo2|Valor3|  Tipo3 |

* Generar un documento __Salida.json__ con la siguiente estructura:

Tanto en lo que mostréis por pantalla como lo que escribáis en el archivo usad los nombres de los contaminantes y de las estaciones que aparecen en los anexos de la documentación indicada más arriba.

Para leer los archivos usa un código como el siguiente:

In [None]:
import json
leer = json.loads(open('Museos.json',encoding="utf8").read())
print(leer)

En los documentos __Estación.csv__ y __Museos.json__ aparece la información de geolocalización en forma de longitud y latitud tanto de las estaciones como de los museos. En este sentido, para calcular la distancia entre dos puntos dadas sus coordenadas se utilizará la siguiente función en Python:

#### Normas de entrega

* Fecha tope de entrega: 03/10/2019
* La entrega se realizará subiendo al campus virtual un notebook de Jupyter con la solución. El archivo tendrá como nombre FormatosI_GrupoX donde X será el número de grupo correspondiente.