# Descarga de datos

Este notebook detalla el proceso de descarga de los datos desde la plataforma de Radiant MLHub. Para acceder al contenido de esta plataforma es necesario registrarse en la plataforma y crear un API Key. En el siguiente enlace podrá acceder a la página principal de esta plataforma, por favor haga clic en el botón **Sign up for API access** para poder registrarse y obtener un API Key. En caso de solicitar ayuda, el equipo queda atento a sus solicitudes vía correo

Página principal de *Radiant MLHub*: [Enlace](https://mlhub.earth/)

## Configuración del cliente de descarga

A continuación vamos a descargar y configurar el cliente de descarga y su API Key

In [1]:
%%capture
!pip install radiant_mlhub

Tan pronto instale esta dependencia, abra una sesión de terminal y configure el API Key con el comando: **mlhub configure**

## Librerias

A continuación vamos a importar la libreria de Radiant MLHub para consultar el contenido del dataset y descargarlo

In [1]:
from radiant_mlhub import Dataset

## Descargar datos

In [2]:
# Nombre de la colección
COLLECTION = "landcovernet_v1"

In [3]:
# Ruta de descarga
DOWNLOAD_PATH = "/home/ggonzr_cloud/deeplearn/data"

In [4]:
# Obtener la colección del dataset
# Existen diversos tipos y tamaños
ds = Dataset.fetch(COLLECTION)
for c in ds.collections:
    print(f"Coleccion: {c.id}")

Coleccion: ref_landcovernet_v1_source
Coleccion: ref_landcovernet_v1_labels


Vamos a descargar ambas colecciones del conjunto de datos **LandCoverNet**. La primera colección, **ref_landcovernet_v1_source**, contiene las imágenes de satelite Sentinel-2 y el tamaño del archivo comprimido es de 81.91 GB.

La segunda coleccion, **ref_landcovernet_v1_labels**, contiene las máscaras de las regiones de interes detallando a que clase pertenece cada píxel, esta colección pesa 18.32 MB

In [5]:
# Obtener una referencia a la colección
source_data = ds.collections[0]

In [6]:
# Descargarla
source_data.download(DOWNLOAD_PATH)

  0%|          | 0/87954.8 [00:00<?, ?M/s]

PosixPath('/home/ggonzr_cloud/deeplearn/data/ref_landcovernet_v1_source.tar.gz')

Posteriormente, vamos a descargar también el dataset con las etiquetas 

In [5]:
labels_data = ds.collections[1]

In [6]:
# Descargarla
labels_data.download(DOWNLOAD_PATH)

  0%|          | 0/19.2 [00:00<?, ?M/s]

PosixPath('/home/ggonzr_cloud/deeplearn/data/ref_landcovernet_v1_labels.tar.gz')

Tan pronto se descargan las colecciones, se descomprimen los archivos y las dos carpetas resultantes se agrupan bajo una carpeta cuya ruta de acceso se referencia en otros notebooks bajo la variable **DATA_BASE**