## Calidad del Aire en Comunidad Valenciana

Análisis Calidad de Aire en Comunidad Valenciana (2020)

fuente: https://bit.ly/3duKiXL

@jfrcaro

In [1]:
# Importar librerías

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from time import sleep
from random import randint
import os
  

In [2]:
# Cargar estaciones 

estaciones_cv= pd.read_excel("https://raw.githubusercontent.com/jfcaro/Calidad-de-Aire---Comunidad-Valenciana/master/Estaciones_CV.xls", usecols = ['Provincia ', 'Municipio ', 'Estación ', 'Código'], dtype = {"Estación ":"string",  "Código" : "string"})


In [3]:
# Analizar estaciones

estaciones_cv.describe()

# Quitamos estaciones que no tienen enlace para descarga de datos

estaciones_cv.drop([0,22,31,41,52,65,69],axis=0, inplace=True)


In [4]:
# Función que devuelve el enlace_web a partir del código

def enlace_web(codigo):
  enlace = "http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST" + codigo +"2020.txt"
  return enlace


In [5]:
# Descargar los datos

# Dicccionario con las lecturas
lecturas ={}

# Estaciones procedentes del listado
Estaciones = estaciones_cv['Estación '].tolist()
numero_estaciones =len (estaciones_cv)
contador = 1

# Se recorren todas las estaciones de la CV 
for estacion in Estaciones:
  
  # Se imprimen datos de la estación conforme se van leyendo
  print (contador," de ", numero_estaciones)
  print ("Estación:", estacion)
  web = enlace_web(estaciones_cv[estaciones_cv['Estación ']==estacion]['Código'].values[0])
  print ("Dirección web fichero: ", web)
  print ("\n")
  lecturas[estacion] =pd.read_csv( web, sep ='\t', encoding='ISO-8859-1',skiprows=[0,1,2,4], decimal=',')
  lecturas[estacion]['FECHA'] =pd.to_datetime(lecturas[estacion]['FECHA'],format='%d/%m/%Y')
  lecturas[estacion] = lecturas[estacion].set_index('FECHA')
  
  #Se añade la columna mes
  lecturas[estacion]['Mes']=lecturas[estacion].index.month 
  contador +=1
  
  # Por cada bloque de 5 esperamos entre 0 y 2 segundos para no bloqueo por parte del servidor
  if contador % 5 == 0 :
    tiempo_espera_bloque =randint(0,2)
    print ("Tiempo de espera por bloque de", contador, "ficheros: ", tiempo_espera_bloque )
    print ("\n\n")
    sleep(tiempo_espera_bloque)
    

1  de  67
Estación: Alacant - El Pla 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140062020.txt


2  de  67
Estación: Alacant - Florida Babel 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140082020.txt


3  de  67
Estación: Alacant - Rabassa 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140092020.txt


4  de  67
Estación: Alacant_AP_D_Pesquera 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140102020.txt


Tiempo de espera por bloque de 5 ficheros:  1



5  de  67
Estación: Alacant_AP_ISM 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140122020.txt


6  de  67
Estación: Alacant_AP_T_Frutero 
Dirección web fichero:  http://www.cma.gva.es/cidam/emedio/descargar.asp?fichero=2020/mh/MHEST030140132020.txt


7  de  67
Estación: Alacant_Pa

In [6]:
# Se muestran las medidas 

medidas = []
print ("Los campos registrados en cada una de las estaciones son: \n")

for estacion in Estaciones:
    
  # Se muestra lo que mide cada estación
  print (estacion+":")
  print (lecturas[estacion].columns.to_list())
  medidas = medidas+lecturas[estacion].columns.to_list()
  print ("\n") 

# conjunto de todas las medidas disponibles
medidas = set(medidas)

# Se quita la hora y el mes
medidas.discard('HORA')
medidas.discard('Mes')


Los campos registrados en cada una de las estaciones son: 

Alacant - El Pla :
['HORA', 'C8H10', 'SO2', 'CO', 'NO', 'NO2', 'NOx', 'O3', 'C7H8', 'C6H6', 'Mes']


Alacant - Florida Babel :
['HORA', 'SO2', 'NO', 'NO2', 'NOx', 'O3', 'Veloc.', 'Direc.', 'Temp.', 'H.Rel.', 'R.Sol.', 'Precip.', 'Mes']


Alacant - Rabassa :
['HORA', 'PM2.5', 'PM1', 'SO2', 'CO', 'NO', 'NO2', 'PM10', 'NOx', 'O3', 'Veloc.', 'Direc.', 'Temp.', 'H.Rel.', 'Pres.', 'R.Sol.', 'Precip.', 'Mes']


Alacant_AP_D_Pesquera :
['HORA', 'Veloc.máx.', 'PM10', 'Veloc.', 'Direc.', 'Temp.', 'H.Rel.', 'Mes']


Alacant_AP_ISM :
['HORA', 'PM10', 'Mes']


Alacant_AP_T_Frutero :
['HORA', 'PM10', 'Mes']


Alacant_Parc_Mar_Prov :
['HORA', 'Veloc.máx.', 'PM10', 'Veloc.', 'Direc.', 'Temp.', 'H.Rel.', 'Mes']


Albalat dels Tarongers :
['HORA', 'PM2.5', 'SO2', 'CO', 'NO', 'NO2', 'PM10', 'NOx', 'O3', 'Mes']


Alcoi - Verge dels Lliris :
['HORA', 'SO2', 'CO', 'NO', 'NO2', 'NOx', 'O3', 'Mes']


Algar de Palància :
['HORA', 'PM2.5', 'SO2', 'CO',

In [7]:
# Diccionario de unidades 

unidades = {'C6H6': ('µg/m³', 'benceno'),
 'C7H8': ('µg/m³', 'tolueno'),
 'C8H10': ('µg/m³','xileno'),
 'CO': ('mg/m³','monóxido de carbono'),
 'Direc.': ('grados','dirección del viento'),
 'H.Rel.': ('% H.R.','humedad relativa'),
 'NH3': ('µg/m³','amoníaco'),
 'NO': ('µg/m³','monóxido de nitrógeno'),
 'NO2': ('µg/m³','dióxido de nitrógeno'),
 'NOx': ('µg/m³','óxidos de nitrógeno totales'),
 'O3': ('µg/m³','ozono'),
 'PM1': ('µg/m³','particulas suspension <1 micra'),
 'PM10': ('µg/m³','particulas suspension <10 micras'),
 'PM2.5': ('µg/m³','particulas suspension <2.5 micras'),
 'Precip.': ('l/m²','precipitación'),
 'Pres.': ('mb','presión atmosférica'),
 'R.Sol.': ('W/m²','radiación Solar'),
 'SO2': ('µg/m³','dióxido de azufre'),
 'Temp.': ('°C','temperatura'),
 'Veloc.': ('m/s','velocidad viento'),
 'Veloc.máx.': ('m/s', 'velocidad viento max.'),
 'Ruido': ('dBA', 'ruido') }


In [8]:
# Analisis dataframe

lecturas['Alacant - El Pla '].describe()


Unnamed: 0,HORA,C8H10,SO2,CO,NO,NO2,NOx,O3,C7H8,C6H6,Mes
count,2174.0,1970.0,2174.0,2100.0,2174.0,2174.0,2174.0,2174.0,1970.0,1970.0,2174.0
mean,11.50276,0.889949,3.832107,0.222048,11.216191,26.714351,43.557958,53.684453,2.911168,0.37934,2.0
std,6.939005,1.185236,1.10717,0.176932,30.28679,24.931398,65.813114,30.270202,6.148394,0.261213,0.825837
min,0.0,0.2,3.0,0.1,1.0,2.0,4.0,1.0,0.2,0.2,1.0
25%,5.0,0.2,3.0,0.1,2.0,8.0,10.0,27.0,0.5,0.2,1.0
50%,12.0,0.5,4.0,0.2,2.0,19.0,21.0,57.0,1.5,0.3,2.0
75%,18.0,1.0,4.0,0.3,4.0,38.0,45.0,78.0,3.6,0.4,3.0
max,23.0,13.9,17.0,1.4,383.0,132.0,720.0,119.0,167.5,3.0,3.0


In [9]:
# Primeros datos del dataframe

lecturas['Alacant - El Pla '].head(5)


Unnamed: 0_level_0,HORA,C8H10,SO2,CO,NO,NO2,NOx,O3,C7H8,C6H6,Mes
FECHA,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
2020-01-01,0,0.2,5,0.6,23,46,81,4,0.8,0.3,1
2020-01-01,1,0.4,5,0.5,22,48,82,5,1.2,0.2,1
2020-01-01,2,2.2,6,0.4,7,45,55,4,2.2,0.4,1
2020-01-01,3,1.6,4,0.1,2,26,29,18,3.3,0.3,1
2020-01-01,4,1.1,5,0.1,2,19,21,25,3.2,0.2,1


In [10]:
# Función que obtiene la media horaria de cada medida por mes

def datos (mes,magnitud,estacion):
    return lecturas[estacion][lecturas[estacion]['Mes']==mes].groupby('HORA')[magnitud].mean().to_numpy()   


In [11]:
# Se crea subdirectorio para guardar los ficheros de las gráficas

directorio  ="./Graficas/"

try:
  os.stat(directorio)
except:
  os.mkdir(directorio)


In [12]:
# Guarda gráfica por estación y medida en fichero jpg

nombre_mes ={1:"Enero",2:"Febrero", 3:"Marzo", 4:"Abril", 5: "Mayo", 6: "Junio", 7:"Julio", 8:"Agosto", 9:"Septiembre", 10:"Octubre", 11:"Noviembre", 12:"Diciembre"}

figtamaño_h = 8
figtamaño_v = 6

# Recorre estaciones y medidas
for estacion in Estaciones: 
  for medida in medidas:    
    if medida in lecturas[estacion].columns.to_list(): 
      meses = lecturas[estacion]['Mes'].unique()
      plt.figure(figsize=(figtamaño_h,figtamaño_v))
      for mes in meses:   
        plt.plot(datos(mes, medida,estacion), marker ='*', label =nombre_mes[mes])        
      plt.title( 'Media horaria de ' +  unidades[medida][1] + ' en estacion ' + estacion)
      plt.xlabel("Hora")
      plt.ylabel( medida + " ("+ unidades[medida][0]+ ")")
      plt.legend() 
      plt.grid(b=True, which='major')
      plt.minorticks_on()
      plt.grid(b=True, which='minor', color='#999999', linestyle='-', alpha=0.2)
    
      # Se graba la figura
      plt.savefig(directorio + estacion+medida+".jpg")
      plt.close()
      #plt.show()   


In [13]:
# Instala reportlab para generar pdf

! pip install reportlab




In [57]:
# Carga liberías para generación de pdfs

from reportlab.lib.pagesizes import A4,landscape
from reportlab.pdfgen import canvas
from datetime import date

# Obtiene anchura y algura de la hoja 
w, h = landscape(A4)
    
# Crea archivo pdf    
c = canvas.Canvas("RVCCA-CV.pdf", pagesize=landscape(A4))

# Portada y metadatos 
tamaño_letra = 30

c.setFont("Helvetica",tamaño_letra)
c.setTitle("Análisis de datos de red de Vigilacia y Control de la contaminación atmosférica de la Comunidad Valenciana")
c.setAuthor("Jose Francisco Caro Martínez / @jfrcaro / 2.020")

texto = []
texto.append(" Análisis")
texto.append(" Red de Vigilancia y Control de la Contaminación atmosférica")
texto.append(" De la Comundad Valenciana")

tamaño_mapa = 150
c.drawImage("http://www.argos.gva.es/bdmun/img/map_comarques.gif",(w-tamaño_mapa)/2,20,width=tamaño_mapa,preserveAspectRatio=True)
contador_lineas = 0 
for linea in texto:    
    c.drawCentredString((w/2),h-(h/5)-50*contador_lineas, linea)
    contador_lineas +=1

c.setFont("Helvetica",8)
c.drawString(30, h/50, "Fuente: " + "http://www.agroambient.gva.es/es/web/calidad-ambiental")
c.drawString((w/2)-40, h/50, "Fecha: " + str(date.today()))
c.drawImage("https://image.freepik.com/iconos-gratis/twitter-circulo_318-10749.jpg",w-80,-(h/2),width=20,preserveAspectRatio=True)
c.drawString(w-55,+12, "@jfrcaro")
c.showPage()



# Apartado para calcular el número de figuras por hoja 
tamaño_horizontal_figura = 250
tamaño_vertical_figura = tamaño_horizontal_figura*(figtamaño_v/figtamaño_h)
tamaño_cabecera_vertical = 20

numero_figuras_horizontal = w // tamaño_horizontal_figura
numero_figuras_vertical = (h -tamaño_cabecera_vertical)// tamaño_vertical_figura

separacion_horizontal = round((w % tamaño_horizontal_figura)/(numero_figuras_horizontal+1),0)
separacion_vertical = round(((h -tamaño_cabecera_vertical)%tamaño_vertical_figura)/(numero_figuras_vertical+1),0) 


# Lista de provincias
provincias = estaciones_cv['Provincia '].unique()

# Se recorren provincias, municipios y estaciones y se graban en pdf

# contador de páginas
numero_de_pagina = 1 

for provincia in provincias:
    
# Portada provincia
    c.setFont("Helvetica",30)
    c.drawString(w/10,h/2,"PROVINCIA: " + provincia )   
    c.setFont("Helvetica-Bold",10)
    c.drawString(w/1.7,h-100,"MUNICIPIO:")
    c.drawString(w/1.7+120,h-100,"ESTACION:")
    c.setFont("Helvetica",10)
    cont = 1 
    
    for filas in estaciones_cv[estaciones_cv['Provincia ']==provincia][['Municipio ','Estación ']].iterrows():
        c.drawString(w/1.7,h-100-15*cont,filas[1]['Municipio '])
        c.drawString(w/1.7 +120,h-100-15*cont,filas[1]['Estación '])
        cont +=1
    c.showPage()
    
    # Por cada municipio se muestran las medidas, si no cabe en una página se añade otra.
    
    for municipio in estaciones_cv[estaciones_cv['Provincia ']==provincia]['Municipio '].unique().tolist():     
        Estaciones = estaciones_cv[estaciones_cv['Municipio ']==municipio]['Estación '].tolist()    
        
        for estacion in Estaciones:
            c.setFont("Helvetica",10)
            c.drawString(separacion_horizontal,h - tamaño_cabecera_vertical/2, "Provincia: "+ provincia )
            c.drawString(w-300,h - tamaño_cabecera_vertical/2, "Fuente: "+ "http://www.agroambient.gva.es/es/web/calidad-ambiental" )
            c.drawString(separacion_horizontal+140,h - tamaño_cabecera_vertical/2, "Municipio: "+ municipio )
            c.setFont("Helvetica-Bold",10)
            c.drawString(separacion_horizontal+320,h - tamaño_cabecera_vertical/2, "Estacion: "+ estacion )
            c.setFont("Helvetica",7)
            c.drawString(w-w/10, h/50, "Página: " + str(numero_de_pagina) )
            c.drawImage("https://image.freepik.com/iconos-gratis/twitter-circulo_318-10749.jpg",w/2-15,-(h/2),width=12,preserveAspectRatio=True)
            c.drawString(w/2,h/50, "@jfrcaro")
            c.drawString(30, h/50, "Fecha: " + str(date.today()))
            numero_medidas= len (lecturas[estacion].columns.to_list())-2
            contador_medidas = 0
            
            for medida in medidas:
                
                if medida in lecturas[estacion].columns.to_list(): 
                    
                    # Cálculo de las coordenadas de la figura.
                    horizontal = contador_medidas % numero_figuras_horizontal
                    vertical =  contador_medidas // numero_figuras_horizontal                  
                    c.drawImage(directorio + estacion+medida+".jpg",separacion_horizontal*(horizontal+1)+tamaño_horizontal_figura*(horizontal),h-(tamaño_cabecera_vertical)*2-(tamaño_vertical_figura)*(vertical+1.5),width=tamaño_horizontal_figura,preserveAspectRatio=True)                    
                    contador_medidas +=1
                    
                    if contador_medidas == numero_figuras_horizontal*numero_figuras_vertical and not(numero_medidas==numero_figuras_horizontal*numero_figuras_vertical):
                        c.showPage()
                        numero_de_pagina +=1
                        c.setFont("Helvetica",10)
                        c.drawString(separacion_horizontal,h - tamaño_cabecera_vertical/2, "Provincia: "+ provincia )
                        c.drawString(w-300,h - tamaño_cabecera_vertical/2, "Fuente: "+ "http://www.agroambient.gva.es/es/web/calidad-ambiental" )
                        c.drawString(separacion_horizontal+140,h - tamaño_cabecera_vertical/2, "Municipio: "+ municipio )                      
                        c.setFont("Helvetica-Bold",10)
                        c.drawString(separacion_horizontal+320,h - tamaño_cabecera_vertical/2, "Estacion: "+ estacion )
                        c.setFont("Helvetica",7)
                        c.drawString(w-w/10, h/50, "Página: " + str(numero_de_pagina) )
                        c.drawImage("https://image.freepik.com/iconos-gratis/twitter-circulo_318-10749.jpg",w/2-15,-(h/2),width=12,preserveAspectRatio=True)
                        c.drawString(w/2,h/50, "@jfrcaro")
                        c.drawString(30, h/50, "Fecha: " + str(date.today()))
                        contador_medidas = 0                     

            c.showPage()
            numero_de_pagina +=1

c.save()