_Autor:_    __Jesús Casado__ <br> _Revisión:_ __20/11/2019__ <br>

__Introducción__<br>
Código para descargar datos MODIS del [servidor USGS](https://e4ftl01.cr.usgs.gov/). En dicho enlace se pueden ver las misiones, productos y fechas disponibles.

Para poder descargar datos del servidor, es necesario estar registrado en https://urs.earthdata.nasa.gov/.

__Cosas que arreglar__ <br>

***

In [1]:
import os
import requests
import urllib
from http.cookiejar import CookieJar
from bs4 import BeautifulSoup
from datetime import datetime

In [2]:
def EarthdataLogin(username, password, url='https://urs.earthdata.nasa.gov'):
    """Entra en la cuenta de usuario de Earthdata, con lo que se obtiene permiso para descargar .hdf, y crea un contenedor de las 'cookies' en la sesión.
    
    Modificado de https://wiki.earthdata.nasa.gov/display/EL/How+To+Access+Data+With+Python
    
    Entradas:
    ---------
    username: string. Nombre de usuario en Earthdata
    password: string. Contraseña en Earthdata
    url:     string. URL del servidor de datos; por defecto 'https://e4ftl01.cr.usgs.gov/'
    """
    
    # Create a password manager to deal with the 401 reponse that is returned from Earthdata Login
    password_manager = urllib.request.HTTPPasswordMgrWithDefaultRealm()
    password_manager.add_password(None, "https://urs.earthdata.nasa.gov", username, password)
    
    # Create a cookie jar for storing cookies. This is used to store and return
    # the session cookie given to use by the data server (otherwise it will just
    # keep sending us back to Earthdata Login to authenticate).  Ideally, we
    # should use a file based cookie jar to preserve cookies between runs. This
    # will make it much more efficient.
    cookie_jar = CookieJar()
    
    # Install all the handlers.
    opener = urllib.request.build_opener(urllib.request.HTTPBasicAuthHandler(password_manager),
                                         #urllib.request.HTTPHandler(debuglevel=1),    # Uncomment these two lines to see
                                         #urllib.request.HTTPSHandler(debuglevel=1),   # details of the requests/responses
                                         urllib.request.HTTPCookieProcessor(cookie_jar))
    urllib.request.install_opener(opener)

In [3]:
def extract_dir(url, ext='/'):
    """Extrae los directorios existentes en una url.
    
    Entradas:
    ---------
    ulr:     string. Dirección url
    ext:     string. Caracter a buscar al final de cada nodo de la url para idenficarlo como un nuevo directorio"""
    
    # extrae el texto de la url
    page = requests.get(url).text
    # traduce el texto
    soup = BeautifulSoup(page, 'html.parser')
    # extrae las líneas del texto terminadas en 'ext'
    list_dir = [url + node.get('href') for node in soup.find_all('a') if node.get('href').endswith(ext)]
    
    return list_dir

In [4]:
def descarga_MODIS(username, password, path, product, start=None, end=None, tiles=None,
                   url='https://e4ftl01.cr.usgs.gov/', format='hdf'):
    """Descarga los archivos del producto MODIS de interés en las fechas, hojas y formato indicados.
    
    Entradas:
    ---------
    username: string. Nombre de usuario en Earthdata
    password: string. Contraseña en Earthdata
    path:    string. Carpeta donde guardar los datos descargados.
    product: string. Producto MODIS. P.ej.: 'MOD16A2.006', 'MYD16A2.006'
    start:   string. Fecha a partir de la que descargar datos. Formato 'YYYY-MM-DD'
    end:     string. Fecha hasta la que descargar datos. Formato 'YYYY-MM-DD'
    tiles:   list of strings. Hojas MODIS a descargar. Formato 'h00v00'
    url:     string. URL del servidor de datos; por defecto 'https://e4ftl01.cr.usgs.gov/'
    format:  string. Tipo de archivo a descargar: 'hdf', 'jpg', 'xml'
    
    Salidas:
    --------
    Se guardan en la carpeta 'path/product' los archivos (hdf, jpg o xml) para la selección indicada."""
    
    # entrar en Earth data con el usuario
    EarthdataLogin('casadoj', 'Chomolungma1619', url=url)
    
    # definir carpeta donde guardar los datos
    exportpath = path + '/' + product.split('.')[0] + '/'
    if os.path.isdir(exportpath) == False:
        os.mkdir(exportpath)
    os.chdir(exportpath)
    lsdir = os.listdir()
    
    # url de cada una de las misiones
    url_missions = extract_dir(url)
    # diccionario con las missiones y sus productos
    mission_products = {}
    for fd1 in url_missions:
        mission = fd1.split('/')[-2]
        url_products = extract_dir(fd1)
        products = [fd2.split('/')[-2] for fd2 in url_products if fd2.split('/')[-2] != '']
        mission_products[mission] = products

    # encontrar missión del producto de interés y url del producto
    for fd, mission in zip(url_missions, mission_products.keys()):
        if product in mission_products[mission]:
            urlproduct = fd + product + '/'
            break
    
    # convertir en datetime.date las fechas de inicio y fin de la búsqueda           
    if start != None:
        start = datetime.strptime(start, '%Y-%m-%d').date()
    else:
        start = datetime(1950, 1, 1).date()
    if end != None:        
        end = datetime.strptime(end, '%Y-%m-%d').date()
    else:
        end = datetime.now().date()
        
    # seleccionar fechas dentro del periodo de interés
    urldates = []
    for fd in extract_dir(urlproduct)[1:]:
        date = datetime.strptime(fd.split('/')[-2], '%Y.%m.%d').date()
        if (start <= date) & (end >= date):
            urldates.append(fd)
            
    for di, urldate in enumerate(urldates):
        # seleccionar archivos correspondientes a las hojas de interés
        urlfiles = extract_dir(urldate, ext='.' + format)
        if tiles == None:
            files = [file.split('/')[-1] for file in urlfiles]
        else:
            files = [file.split('/')[-1] for file in urlfiles if any(tile in file for tile in tiles)]

        # descargar archivos
        for fi, file in enumerate(files):
            print('Fecha {0:>4} de {1:>4}; archivo {2:>3} de {3:>3}'.format(di + 1, len(urldates),
                                                                            fi + 1, len(files)),
                  end='\r')
            if file in lsdir:
                continue
            else:
                urllib.request.urlretrieve(urldate + file, file)

In [5]:
rutaMODIS = 'F:/OneDrive - Universidad de Cantabria/Cartografia/MODIS/'

In [19]:
# Evapotranspiración (8 días, 500 m) de Aqua
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MYD16A2.006', tiles=['h17v04'])

Fecha  797 de  797; archivo   1 de   1

In [6]:
# Evapotranspiración (8 días, 500 m) de Terra
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MOD16A2.006', tiles=['h17v04'])

Fecha  866 de  866; archivo   1 de   1

In [8]:
# FPAR/LAI de Terra 
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MOD15A2H.006', tiles=['h17v04'])

Fecha  905 de  905; archivo   1 de   1

In [9]:
# FPAR/LAI de Aqua
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MYD15A2H.006', tiles=['h17v04'])

Fecha  799 de  799; archivo   1 de   1

In [10]:
# Vegetation indexes NDVI/EVI (16 días, 500m) de Terra ¡hay también a 250 m (MOD13Q1)!
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MOD13A1.006', tiles=['h17v04'])

Fecha  453 de  453; archivo   1 de   1

In [11]:
# Vegetation indexes NDVI/EVI (16 días, 500m) de Aqua ¡hay también a 250 m (MYD13Q1)!
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MYD13A1.006', tiles=['h17v04'])

Fecha  399 de  399; archivo   1 de   1

In [12]:
# Land cover type (anual, 500 m) combinado Aqua y Terra
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MCD12Q1.006', tiles=['h17v04'])

Fecha   18 de   18; archivo   1 de   1

In [13]:
# Land cover dynamics (anual, 500 m) combinado Aqua y Terra
descarga_MODIS('casadoj', 'Chomolungma1619', rutaMODIS, 'MCD12Q2.006', tiles=['h17v04'])

Fecha   17 de   17; archivo   1 de   1