# METEOCAT

In [0]:
!pip install tqdm sodapy

In [0]:
#Paquetes
import pandas as pd
import datetime
import pyspark.sql.functions as F
from tqdm import tqdm

#Estaciones AEMET
import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning

# Datos de METEOCAT
from sodapy import Socrata

### Carga de Estaciones de METEOCAT

Tabla con los metadatos asociados a cada una de las estaciones de la Red de Estaciones Meteorológicas Automáticas (XEMA), integrada en la Red de Equipamientos Meteorológicos de la Generalidad de Cataluña (Xemec), del Servicio Meteorológico de Cataluña. Cada estación se identifica con un código. 

**Metadatos disponibles en:**  https://analisi.transparenciacatalunya.cat/Medi-Ambient/Metadades-estacions-meteorol-giques-autom-tiques/yqwd-vj5e

In [0]:
# Unauthenticated client only works with public data sets. Note 'None' in place of application token, and no username or password:
client = Socrata("analisi.transparenciacatalunya.cat", None)

# First 100000 results, returned as JSON from API / converted to Python list of dictionaries by sodapy.
meteocat_stations = client.get("yqwd-vj5e", limit=100000)

# Convert to pandas DataFrame
meteocat_stations_df = pd.DataFrame.from_records(meteocat_stations)

spark.createDataFrame(meteocat_stations_df.astype(str)).coalesce(1).write.mode("overwrite").parquet(f"/mnt/IncendiosForestalesCAT/raw/meteocat/estaciones/")

In [0]:
meteocat_stations_df

Unnamed: 0,codi_estacio,nom_estacio,codi_tipus,latitud,longitud,geocoded_column,emplacament,altitud,codi_municipi,nom_municipi,codi_comarca,nom_comarca,codi_provincia,nom_provincia,codi_xarxa,nom_xarxa,codi_estat_ema,nom_estat_ema,data_inici,:@computed_region_bh64_c7uy,:@computed_region_wvic_k925,data_fi
0,X4,Barcelona - el Raval,A,41.3839,2.16775,"{'type': 'Point', 'coordinates': [2.16775, 41....",Facultat de Geografia i Història. c. Montalegr...,33,332,Barcelona,13,Barcelonès,8,Barcelona,1,XEMA,2,Operativa,2006-10-11T00:00:00.000,512,29,
1,YG,Tírvia,A,42.51881,1.24244,"{'type': 'Point', 'coordinates': [1.24244, 42....",Heliport de Tírvia,954,634,Tírvia,26,Pallars Sobirà,25,Lleida,1,XEMA,2,Operativa,2018-01-11T00:00:00.000,335,2,
2,DD,Vilassar de Mar,A,41.51175,2.38674,"{'type': 'Point', 'coordinates': [2.38674, 41....","Soc.Civil d'Aigües ""La Mina Vella",44.5,513,Vilassar de Mar,21,Maresme,8,Barcelona,1,XEMA,1,Desmantellada,1998-05-04T00:00:00.000,522,25,2015-01-16T00:00:00.000
3,VY,Nulles,A,41.25095,1.29863,"{'type': 'Point', 'coordinates': [1.29863, 41....",Cooperativa agrària,240,12,Nulles,1,Alt Camp,43,Tarragona,1,XEMA,2,Operativa,2000-09-18T00:00:00.000,375,30,
4,YD,les Borges Blanques,A,41.51135,0.85617,"{'type': 'Point', 'coordinates': [0.85617, 41....",Escola Agrària de les Borges Blanques,283,416,Les Borges Blanques,18,Garrigues,25,Lleida,1,XEMA,2,Operativa,2017-01-25T00:00:00.000,807,27,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
228,CW,l'Espluga de Francolí,A,41.39241,1.09894,"{'type': 'Point', 'coordinates': [1.09894, 41....",Urb. Espluga Parc,446,387,L'Espluga de Francolí,16,Conca de Barberà,43,Tarragona,1,XEMA,2,Operativa,1996-02-23T00:00:00.000,532,28,
229,Z6,Sasseuva (2.228 m),A,42.77011,0.73198,"{'type': 'Point', 'coordinates': [0.73198, 42....",Sasseuva,2228,872,Arres,39,Val d'Aran,25,Lleida,1,XEMA,2,Operativa,2001-09-20T00:00:00.000,310,1,
230,XF,Sabadell - Parc Agrari,A,41.56568,2.06952,"{'type': 'Point', 'coordinates': [2.06952, 41....",Parc Agrari,258,894,Sabadell,40,Vallès Occidental,8,Barcelona,1,XEMA,2,Operativa,2008-10-23T00:00:00.000,660,26,
231,X9,Caldes de Montbui,A,41.61265,2.16836,"{'type': 'Point', 'coordinates': [2.16836, 41....",Torre Marimon,176,907,Caldes de Montbui,41,Vallès Oriental,8,Barcelona,1,XEMA,2,Operativa,2007-03-08T00:00:00.000,758,22,


### Carga de Valores Climatologicos de METEOCAT

Datos meteorológicos registrados en todas las estaciones de la Red de Estaciones Meteorológicas Automáticas (XEMA) del Servicio Meteorológico de Cataluña (METEOCAT). Esta fecha base contiene variables medidas con una frecuencia inferior a la diaria, generalmente semi-horaria.

**Metadatos disponibles en:** https://analisi.transparenciacatalunya.cat/Medi-Ambient/Dades-meteorol-giques-de-la-XEMA/nzvn-apee

In [0]:
from dateutil.relativedelta import relativedelta

fechaini="2015-01-01"
fechafin="2022-02-01"
start = datetime.datetime.strptime(fechaini, '%Y-%m-%d').date()
end = datetime.datetime.strptime(fechafin, '%Y-%m-%d').date()
dates = pd.date_range(start, end, freq='d')

print(f'Downloading files for the period {start} - {end}')

client = Socrata("analisi.transparenciacatalunya.cat", None)
data = []

for d in tqdm(dates):
  print(f'Downloading files for the period {d:%Y-%m-%d}T00:00:00.000 - {d:%Y-%m-%d}T23:59:59.000')
  meteocat_diarios_vcm = client.get("nzvn-apee", where=f"data_lectura >= '{d:%Y-%m-%d}T00:00:00.000' AND data_lectura < '{d:%Y-%m-%d}T23:59:59.000' ", limit=100000000)
  meteocat_diarios_vcmPD = pd.DataFrame.from_records(meteocat_diarios_vcm)
  # Debido que la estacion reporta cada 30 min se filtran los valores de las YYYY-mm-ddT12:00:00.000
  try:
    meteocat_diarios_vcmPD = meteocat_diarios_vcmPD[meteocat_diarios_vcmPD['data_lectura'].str.contains('^\d{4}-\d{2}-\d{2}T12:00:00.000')]
  except KeyError:
    print("data_lectura not found")
    pass
  
  data.append(meteocat_diarios_vcmPD)

In [0]:
meteocat_diarios_vcmDF = spark.createDataFrame(pd.concat(data))
meteocat_diarios_vcmDF.coalesce(10).write.mode("overwrite").parquet(f"/mnt/IncendiosForestalesCAT/raw/meteocat/valores_clima_diarios/")

In [0]:
display(spark.read.parquet(f"/mnt/IncendiosForestalesCAT/raw/meteocat/valores_clima_diarios/"))

id,codi_estacio,codi_variable,data_lectura,valor_lectura,codi_estat,codi_base,data_extrem
W6032410161200,W6,3,2016-10-24T12:00:00.000,66.0,V,SH,2016-10-24T12:02:00.000
W6462410161200,W6,46,2016-10-24T12:00:00.000,1.3,V,SH,
W6472410161200,W6,47,2016-10-24T12:00:00.000,132.0,V,SH,
W6562410161200,W6,56,2016-10-24T12:00:00.000,3.6,V,SH,2016-10-24T12:28:00.000
W6422410161200,W6,42,2016-10-24T12:00:00.000,23.5,V,SH,2016-10-24T12:00:00.000
W6352410161200,W6,35,2016-10-24T12:00:00.000,0.0,V,SH,
W6722410161200,W6,72,2016-10-24T12:00:00.000,0.0,V,SH,2016-10-24T12:00:00.000
W6322410161200,W6,32,2016-10-24T12:00:00.000,24.0,V,SH,
W6362410161200,W6,36,2016-10-24T12:00:00.000,584.0,V,SH,
W6402410161200,W6,40,2016-10-24T12:00:00.000,24.3,V,SH,2016-10-24T12:18:00.000


### Codigos de Variables de METEOCAT

Tabla con los metadatos asociados a cada una de las variables de la Red de Estaciones Meteorológicas Automáticas (XEMA), integrada en la Red de Equipamientos Meteorológicos de la Generalidad de Cataluña (Xemec), del Servicio Meteorológico de Cataluña. Cada variable se identifica con un código.

**Metadatos disponibles en:** https://analisi.transparenciacatalunya.cat/Medi-Ambient/Metadades-variables-meteorol-giques/4fb2-n3yi

In [0]:
# Unauthenticated client only works with public data sets. Note 'None' in place of application token, and no username or password:
client = Socrata("analisi.transparenciacatalunya.cat", None)

# Returned as JSON from API / converted to Python list of dictionaries by sodapy.
meteocat_var = client.get("4fb2-n3yi")

# Convert to pandas DataFrame
meteocat_var_df = pd.DataFrame.from_records(meteocat_var)

#Ver datos
meteocat_var_df

spark.createDataFrame(meteocat_var_df.astype(str)).coalesce(1).write.mode("overwrite").parquet(f"/mnt/IncendiosForestalesCAT/raw/meteocat/variables/")

In [0]:
meteocat_var_df.display()

codi_variable,nom_variable,unitat,acronim,codi_tipus_var,decimals
72,Precipitació màxima en 1 minut,mm,PPTx1min,DAT,1
3,Humitat relativa màxima,%,HRx,DAT,0
30,Velocitat del vent a 10 m (esc.),m/s,VV10,DAT,1
31,Direcció de vent 10 m (m. 1),°,DV10,DAT,0
32,Temperatura,°C,T,DAT,1
33,Humitat relativa,%,HR,DAT,0
34,Pressió atmosfèrica,hPa,P,DAT,1
35,Precipitació,mm,PPT,DAT,1
36,Irradiància solar global,W/m²,RS,DAT,0
38,Gruix de neu a terra,mm,GNEU,DAT,0


### Incendios Forestales en Catalunya

Relación de los incendios forestales ocurridos en Cataluña desde el 1 de enero de 2011 al 31 de diciembre de 2021, con detalle de la fecha, el municipio en el que se ha iniciado y la superficie forestal y no forestal afectada, en hectáreas.

**Metadatos disponibles en:** https://analisi.transparenciacatalunya.cat/Medi-Rural-Pesca/Incendis-forestals-a-Catalunya-Anys-2011-2021/bks7-dkfd

In [0]:
#INCENDIOS FORESTALES POR COMARCAS EN CATALUÑA 2011 - 2021 -  FILTRAR AÑOS 2020 / 2022
client = Socrata("analisi.transparenciacatalunya.cat", None)
incendios_cat = client.get("bks7-dkfd", where="data_incendi >= '2015-01-01T00:00:00.000' AND data_incendi < '2021-12-31T23:59:59.000'",limit=10000000)

# Convert to pandas DataFrame
incendios_cat_df = pd.DataFrame.from_records(incendios_cat)
spark.createDataFrame(incendios_cat_df.astype(str)).coalesce(1).write.mode("overwrite").parquet(f"/mnt/IncendiosForestalesCAT/raw/meteocat/incendios_forestales/")

In [0]:
incendios_cat_df.display()

data_incendi,codi_comarca,comarca,codi_municipi,termemunic,haarbrades,hanoarbrad,hanoforest,haforestal
2015-01-01T00:00:00.000,2,Alt Empordà,171432,Rabós,0.0,0.0006,0.0,0.0006
2015-01-01T00:00:00.000,2,Alt Empordà,171002,Masarac,0.0,0.01,0.0,0.01
2015-01-02T00:00:00.000,9,Baix Ebre,431554,Tortosa,0.0,0.004,0.0,0.004
2015-01-03T00:00:00.000,9,Baix Ebre,439018,Deltebre,0.0,0.43,0.0,0.43
2015-01-05T00:00:00.000,14,Berguedà,80229,Berga,0.0,0.6,0.0,0.6
2015-01-06T00:00:00.000,25,Pallars Jussà,250984,Gavet de la Conca,0.0005,0.0,0.0,0.0005
2015-01-11T00:00:00.000,40,Vallès Occidental,82671,Sentmenat,0.005,0.005,0.0,0.01
2015-01-11T00:00:00.000,2,Alt Empordà,172348,Biure,0.0,0.15,0.0,0.15
2015-01-12T00:00:00.000,11,Baix Llobregat,80898,Gavà,0.0,0.005,0.0,0.005
2015-01-15T00:00:00.000,39,Aran,252477,Vilamòs,0.1,0.0,0.0,0.1
