## 1.1. Sitios web

Existen diversos portales web donde se pueden explorar, acceder y/o descargar diferentes datos marinos.

Aquí algunos ejemplos:
* Copernicus:
    * Marino : https://data.marine.copernicus.eu/products 
    * Clima : https://cds.climate.copernicus.eu/#!/search?text= 
* PODAAC (EEUU) https://podaac.jpl.nasa.gov/ 
* CDOM (Chile) http://www.cdom.cl/ (csv)
* Datos animales marinos https://seamap.env.duke.edu/ 
* Brazilian National Buoy Program: https://www.marinha.mil.br/chm/dados-do-goos-brasil/pnboia 
* GEBCO https://www.gebco.net/ 
* EMODnet https://emodnet.ec.europa.eu/en 
* SEAdatanet https://www.seadatanet.org/ 
* Repositorio de CSIRO (Australia) https://portal.aodn.org.au/search
* SOEST (EEUU) http://apdrc.soest.hawaii.edu/dods/public_data 
* Ifremer (Francia) https://www.seanoe.org/search
* Earth System Grid Federation https://esgf.llnl.gov/index.html

Algunos portales requieren regsitrarse gratuitamente antes de poder acceder a los datos (por ejemplo los de Copernicus), pero la mayoría de estos permiten acceso directo sin registro

## 1.2 Métodos de acceso a datos
Protocolos de acceso (estándares técnicos o métodos definidos para acceder a datos)
* OPeNDAP (Open-source Project for a Network Data Access Protocol): Permite acceder y extraer subgrupos de grandes conjuntos de datos científicos.
* OGC WCS (Web Feature Services): Ofrece acceso directo a características vectoriales y sus atributos.
* OGC WMS (Web Map Services): Proporciona mapas geoespaciales en formato de imagen a partir de datos geográficos.
* FTP (File Transfer Protocol): Todavía utilizado por agencias como NOAA para descargar grandes volúmenes de datos.
* HTTP 

Servicios sobre protocolos (capas intermedias)
* THREDDS: Usa OPeNDAP, WMS, WFS y HTTP mediante el THREDDS data server (TDS). Los catálogos THREDDS son documentos XML.
* ERDDAP: Una interfaz sobre OPeNDAP y otros protocolos, simplificando búsquedas y descargas.
* REST APIs: Son interfaces que suelen estar construidas sobre protocolos HTTP.

A menudo los portales ofrecen diferentes métodos de descarga.
Por ejemplo la universidad de Hamburgo https://icdc.cen.uni-hamburg.de/thredds/catalog/ftpthredds/knsc/ocean/catalog.html o la PODAAC 

## 1.3 Abrir dataset con xarray

In [29]:
#  Ejemplo Thredds  https://icdc.cen.uni-hamburg.de/thredds/catalog/ftpthredds/knsc/ocean/catalog.html
import xarray as xr
import json
from erddapy import ERDDAP

url ='https://icdc.cen.uni-hamburg.de/thredds/dodsC/ftpthredds/knsc/ocean/annual/KNSC_salinity__UHAM_ICDC__v2__0.5x0.25deg__1873.nc?lat[0:1:71],lon[0:1:59],time[0:1:0],salinity[0:1:0][0:1:0][0:1:0][0:1:0]'
ds = xr.open_dataset(url)
ds

In [30]:
# Datos de trajectorias de gliders de https://ioos.noaa.gov/ , https://ioos.github.io
url = (
    "https://data.ioos.us/thredds/dodsC/deployments/rutgers/"
    "ru29-20150623T1046/ru29-20150623T1046.nc3.nc"
)
ds = xr.open_dataset(url)
ds

In [31]:
# Ejemplo con opendap https://www.earthdata.nasa.gov/
#  http://test.opendap.org/opendap/data/nc/sst.mnmean.nc.gz.html
url ='http://test.opendap.org/opendap/data/nc/sst.mnmean.nc.gz?lat[0:1:88],lon[0:1:179],time[0:1:1],sst[0:1:1856][0:1:88][0:1:179]'
ds = xr.open_dataset(url)
ds

In [32]:
# Ejemplo erddap
# NOAA Coastwatch https://coastwatch.pfeg.noaa.gov/erddap/griddap/NWW3_Global_Best.html modelo WW3
# Tutorial completo  https://github.com/oceanhackweek/ohw22-proj-oleaje-costeros/blob/main/wavewatch3/WW3-CW-ERDDAP.ipynb

e = ERDDAP(
    server="CSWC",  # CoastWatch West Coast Node
    protocol="griddap",  # Protocol for gridded datasets
)

e.dataset_id = "NWW3_Global_Best"
e.griddap_initialize()
print(f"variables in this dataset:\n\n{e.variables}")
print(
    f"\nconstraints of this dataset:\n\n{json.dumps(e.constraints, indent=1)}"
)
e.variables = ['shgt', 'Thgt'] #shgt (swell significant wave height) y Thgt (significant wave height)
datos =  e.to_xarray()
datos

variables in this dataset:

['Tdir', 'Tper', 'Thgt', 'sdir', 'sper', 'shgt', 'wdir', 'wper', 'whgt']

constraints of this dataset:

{
 "time>=": "2024-11-26T18:00:00Z",
 "time<=": "2024-11-26T18:00:00Z",
 "time_step": 1,
 "depth>=": 0.0,
 "depth<=": 0.0,
 "depth_step": 1,
 "latitude>=": -77.5,
 "latitude<=": 77.5,
 "latitude_step": 1,
 "longitude>=": 0.0,
 "longitude<=": 359.5,
 "longitude_step": 1
}


## 1.4 Descarga de datos de de PODAAC
user: hackaton2024
pass: Hackaton2024.
aos17173@kisoq.com

Listado de datasets https://podaac.jpl.nasa.gov/cloud-datasets
![listado datasets](imagenes_datos_online\listado_datasets.PNG)

### Método 1 Con interfaz de usuario desde el navegador
* Desde la página del dataset --> Browse Granule Listing
* Desde el enlace a todas las colecciones https://cmr.earthdata.nasa.gov/search/site/collections/directory/POCLOUD/gov.nasa.eosdis
![lista colecciones](imagenes_datos_online\todas_colecciones.PNG)
Algunos datasets tienen enlace opendap
![browse_con_opendap](imagenes_datos_online\browse_con_opendap.PNG)


### Método 2 Descarga directa por EarthData
Desde la página del dataset --> Search granules
![earthdata_Search](imagenes_datos_online\earthdata_Search.PNG)

### Método 3 Descarga directa por acceso al subset de variables por EarthData Search (con OPeNDAP)
Dentro de cada gránulo, pulsar el menu de hamburguesa, y buscar el valor de href de OPeNDAP request URL
![subset](imagenes_datos_online\subset_variables.PNG)



Ejemplo del dataset de microplásticos 
https://opendap.earthdata.nasa.gov/collections/C2142677420-POCLOUD/granules/cyg.ddmi.s20170501-000000-e20170531-000000.l3.grid-microplastic.a10.d10

### Método 4 Acceso por API

In [None]:
import earthaccess
import xarray as xr
results = earthaccess.search_data(short_name="ATL06",
                                  version="006",
                                  cloud_hosted=True,
                                  temporal = ("2022-07-17","2022-07-18"),
                                  bounding_box = (-51.96423,68.10554,-48.71969,70.70529))
earthaccess.login()

files = earthaccess.download(results, "./local_folder")
# ds = xr.open_mfdataset(earthaccess.open(results), group='/gt1l/land_ice_segments') #me ha tardado 24 min
# type(ds) #xarray.core.dataset.Dataset
# ds

QUEUEING TASKS | : 100%|██████████| 2/2 [00:00<00:00, 245.38it/s]
PROCESSING TASKS | : 100%|██████████| 2/2 [00:02<00:00,  1.32s/it]
COLLECTING RESULTS | : 100%|██████████| 2/2 [00:00<?, ?it/s]


KeyboardInterrupt: 

![subset](\imagenes_datos_online\ds_land_ice.PNG)