# Preparación

## Descarga de librerías necesarias

In [1]:
!pip install pymongo[srv]
!pip install pymongo[tls]
!pip install dnspython

Collecting dnspython<2.0.0,>=1.16.0; extra == "srv"
[?25l  Downloading https://files.pythonhosted.org/packages/ec/d3/3aa0e7213ef72b8585747aa0e271a9523e713813b9a20177ebe1e939deb0/dnspython-1.16.0-py2.py3-none-any.whl (188kB)
[K     |████████████████████████████████| 194kB 2.9MB/s 
[?25hInstalling collected packages: dnspython
Successfully installed dnspython-1.16.0


## Librerías

In [2]:
import requests
import urllib

import pandas as pd

from pymongo import MongoClient
import dns
import json

import datetime

# Obtención del estado meteorológico

## Conexión con la API de AEMET

API key y cabecera con la autentificación

In [3]:
api_key = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJydWJlbi5tYXJxdWV6LnZpbGxhbHRhQGhvdG1haWwuZXMiLCJqdGkiOiJkYTllODQ0NC1lOWIxLTRiYWItOGM0Yy0wMzc3ZjUwNGYzZDYiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTYxODkyOTQ4MiwidXNlcklkIjoiZGE5ZTg0NDQtZTliMS00YmFiLThjNGMtMDM3N2Y1MDRmM2Q2Iiwicm9sZSI6IiJ9.uEMeJaaOe6atsOtHJN0UDxJiGVhnULBZlbCRkDCb2B4"
header = {'api_key': api_key}

Lista de estaciones meteorologicas de Madrid

In [4]:
# Ids de las estaciones de la ciudad de Madrid (existen más pero solo se incluyen
# las que se encuentran dentro de la ciudad)
estaciones = ['3129', '3194U', '3196', '3195']
estaciones_nombre = ['barajas', 'ciudad_universitaria', 'cuatro_vientos', 'retiro']

Función para la descarga de los datos meteorologicos en formato json

In [5]:
def getResponse(url):
    operUrl = urllib.request.urlopen(url)   # Abrimos la url que contiene los datos
    if(operUrl.getcode() == 200):
        data = operUrl.read()               # Leemos los datos de la url
        jsonData = json.loads(data.decode("utf-8","ignore"))   # Cargamos los datos en un diccionario
    else:
        print("Error receiving data", operUrl.getcode())
    return jsonData

## Descarga de los datos

Variables necesarias

In [6]:
fecha_ini_list = ['2010-01-01T00:00:00UTC', '2015-01-01T00:00:00UTC', '2020-01-01T00:00:00UTC']
fecha_fin_list = ['2014-12-31T00:00:00UTC', '2019-12-31T00:00:00UTC', '2020-12-31T00:00:00UTC']

url_base = 'https://opendata.aemet.es/opendata'

Descarga y almacenamiento automatizado de el estado meteorologico de todas las estaciones meteorologicas de Madrid desde 2010 hasta 2020

In [7]:
for i in range(len(estaciones)):
  print(f'Descargando el estado meteorologico de {estaciones_nombre[i]} [{estaciones[i]}]')
  df = pd.DataFrame()     # Creación de un dataframe vacio

  for fecha_ini, fecha_fin in zip(fecha_ini_list, fecha_fin_list):  # Las peticiones se hacen cada 4 años, porque la API no permite mas de 5 años
    print(f'\t{fecha_ini} - {fecha_fin}')
    endpoint = '/api/valores/climatologicos/diarios/datos/fechaini/{}/fechafin/{}/estacion/{}'.format(fecha_ini, fecha_fin, estaciones[i])  # Endpoint de la petición
    url = url_base + endpoint

    response = requests.get(url, headers=header)    # Realizamos la petición de los datos

    # Procesamos los datos convertiendolos a json
    content = json.loads(response.content.decode('UTF-8'))
    data = getResponse(content['datos'])

    # Añadimos los nuevos datos a los ya existentes de la estación actual
    df = pd.concat([df, pd.DataFrame(data)], axis=0)

  # Alamcenamos los datos del estado meteorologicos de una estación determinada en un csv
  df.to_csv(f'estado_meteorologico_{estaciones_nombre[i]}.csv', sep=';', encoding='utf-8', index=False)

Descargando el estado meteorologico de barajas [3129]
	2010-01-01T00:00:00UTC - 2014-12-31T00:00:00UTC
	2015-01-01T00:00:00UTC - 2019-12-31T00:00:00UTC
	2020-01-01T00:00:00UTC - 2020-12-31T00:00:00UTC
Descargando el estado meteorologico de ciudad_universitaria [3194U]
	2010-01-01T00:00:00UTC - 2014-12-31T00:00:00UTC
	2015-01-01T00:00:00UTC - 2019-12-31T00:00:00UTC
	2020-01-01T00:00:00UTC - 2020-12-31T00:00:00UTC
Descargando el estado meteorologico de cuatro_vientos [3196]
	2010-01-01T00:00:00UTC - 2014-12-31T00:00:00UTC
	2015-01-01T00:00:00UTC - 2019-12-31T00:00:00UTC
	2020-01-01T00:00:00UTC - 2020-12-31T00:00:00UTC
Descargando el estado meteorologico de retiro [3195]
	2010-01-01T00:00:00UTC - 2014-12-31T00:00:00UTC
	2015-01-01T00:00:00UTC - 2019-12-31T00:00:00UTC
	2020-01-01T00:00:00UTC - 2020-12-31T00:00:00UTC


# Almacenamiento de los datos en un database de MongoDB Atlas

## Conexión con MongoDB

In [8]:
# Conexión
client = MongoClient('mongodb+srv://alvaromarlo:tfmcice2021@cluster0.ryeld.mongodb.net/tfm?retryWrites=true&w=majority')

# Base de datos
tfm = client.tfm

## Almacenamiento automático de cada fichero en una colección

In [9]:
for estacion in estaciones_nombre:
  print(f'Estación meteorológica {estacion}:')

  print(f'\t Abriendo el fichero estado_meteorologico_{estacion}.csv')
  # Abrimos el estado meteorologico correspondiente con un pandas
  df = pd.read_csv(f'estado_meteorologico_{estacion}.csv', sep = ';', encoding = 'utf-8', parse_dates = ['fecha'])

  # Convertimos los indices en str
  df.index = df.index.astype(str)

  print(f'\t Creando la coleccion aemet_{estacion}')
  # Creamos una nueva colección para almacenar el estado meteorológico de la estación correspondiente
  estacion_col = tfm[f'aemet_{estacion}']

  print(f'\t Insertando el estado meteorológico de cada día en documentos json en la colección aemet_{estacion}')
  # Subimos a la colección correspondiente el estado meteorológico repartidos en diferentes
  # documentos
  df_dict = df.to_dict('records')
  estacion_col.insert_many(df_dict)

Estación meteorológica barajas:
	 Abriendo el fichero estado_meteorologico_barajas.csv
	 Creando la coleccion aemet_barajas
	 Insertando el estado meteorológico de cada día en documentos json en la colección aemet_barajas
Estación meteorológica ciudad_universitaria:
	 Abriendo el fichero estado_meteorologico_ciudad_universitaria.csv
	 Creando la coleccion aemet_ciudad_universitaria
	 Insertando el estado meteorológico de cada día en documentos json en la colección aemet_ciudad_universitaria
Estación meteorológica cuatro_vientos:
	 Abriendo el fichero estado_meteorologico_cuatro_vientos.csv
	 Creando la coleccion aemet_cuatro_vientos
	 Insertando el estado meteorológico de cada día en documentos json en la colección aemet_cuatro_vientos
Estación meteorológica retiro:
	 Abriendo el fichero estado_meteorologico_retiro.csv
	 Creando la coleccion aemet_retiro
	 Insertando el estado meteorológico de cada día en documentos json en la colección aemet_retiro


In [10]:
for estacion in estaciones_nombre:
  print(f'Estación meteorológica {estacion}:')

  print(f'\t Abriendo el fichero estado_meteorologico_{estacion}.csv')
  # Abrimos el estado meteorologico correspondiente con un pandas
  df = pd.read_csv(f'estado_meteorologico_{estacion}.csv', sep = ';', encoding = 'utf-8', parse_dates = ['fecha'])
  print(df.shape)

Estación meteorológica barajas:
	 Abriendo el fichero estado_meteorologico_barajas.csv
(4018, 20)
Estación meteorológica ciudad_universitaria:
	 Abriendo el fichero estado_meteorologico_ciudad_universitaria.csv
(3851, 15)
Estación meteorológica cuatro_vientos:
	 Abriendo el fichero estado_meteorologico_cuatro_vientos.csv
(4018, 20)
Estación meteorológica retiro:
	 Abriendo el fichero estado_meteorologico_retiro.csv
(4018, 19)
