# Téléchargement de données ERA5-Land pour le Puy-de-Dôme (2000-2007)

Ce notebook utilise l'API **Copernicus Climate Data Store (CDS)** pour télécharger des données climatiques ERA5-Land pour le **Puy-de-Dôme**, sur la période **2000-2007**.

---

## Colonnes / Variables de température récupérées

- **2m dewpoint temperature**  
- **2m temperature**  
- **Skin temperature**  
- **Soil temperature level 1**  
- **Soil temperature level 2**  
- **Soil temperature level 3**  
- **Soil temperature level 4**

---

## Période et fréquence

- Années : **2000 à 2007**  
- Données par **mois**  
- Données par **heure** (00:00 à 23:00)

---

## Zone géographique

- **Puy-de-Dôme** (coordonnées approximatives) :  
  - Latitude : 45.7° N  
  - Longitude : 3.1° E  
   (Wiki-Puy-de-Dome)

---

## Format et téléchargement

- Format de sortie : **NetCDF4 (Experimental)**  
- Téléchargement effectué via **CDS API request**  

> Pour plus d’informations sur l’utilisation de l’API, veuillez consulter la documentation officielle : [CDS API Documentation](https://cds.climate.copernicus.eu/api-how-to)


In [1]:
import cdsapi


### API Request code to download the dataset


```python
import cdsapi

dataset = "reanalysis-era5-land-monthly-means"

request = {
    "product_type": [
        "monthly_averaged_reanalysis",
        "monthly_averaged_reanalysis_by_hour_of_day"
    ],
    "variable": [
        "2m_dewpoint_temperature",
        "2m_temperature",
        "skin_temperature",
        "soil_temperature_level_1",
        "soil_temperature_level_2",
        "soil_temperature_level_3",
        "soil_temperature_level_4"
    ],
    "year": [
        "2000", "2001", "2002",
        "2003", "2004", "2005",
        "2006", "2007"
    ],
    "month": [
        "01", "02", "03",
        "04", "05", "06",
        "07", "08", "09",
        "10", "11", "12"
    ],
    "time": [
        "00:00", "01:00", "02:00",
        "03:00", "04:00", "05:00",
        "06:00", "07:00", "08:00",
        "09:00", "10:00", "11:00",
        "12:00", "13:00", "14:00",
        "15:00", "16:00", "17:00",
        "18:00", "19:00", "20:00",
        "21:00", "22:00", "23:00"
    ],
    "data_format": "netcdf",
    "download_format": "zip",
    "area": [45.7, 3.1, 45.6, 3.2]
}

client = cdsapi.Client(
    url="https://cds.climate.copernicus.eu/api",
    key="2e6ea876-1612-49b0-babe-4509b8eef269",
    verify=True
)

client.retrieve(dataset, request).download()


![image.png](attachment:image.png)

## Besoin d'installer une librairies : 

```python
pip install netcdf4


In [6]:
import xarray as xr

# Charger les fichiers NetCDF
ds_mnth = xr.open_dataset("bdd_temperature/data_stream-mnth.nc")
ds_moda = xr.open_dataset("bdd_temperature/data_stream-moda.nc")

# Fonction pour afficher les infos principales
def print_dataset_info(ds, name):
    print(f"--- {name} dataset ---\n")
    
    # Variables disponibles
    print("Variables disponibles :")
    for var in ds.data_vars:
        print(f"  - {var} : dimensions {ds[var].dims}, shape {ds[var].shape}")
    
    # Dimensions
    print("\nDimensions :")
    for dim, size in ds.sizes.items():  # Utiliser .sizes pour éviter le warning
        print(f"  - {dim} : {size}")
    
    # Aperçu des données (5 premiers éléments le long de la dimension temporelle si possible)
    print("\nAperçu des données (5 premiers éléments) :")
    for var in ds.data_vars:
        print(f"\nVariable '{var}':")
        
        # Identifier automatiquement la dimension temporelle
        time_dim = None
        for dim in ds[var].dims:
            if 'time' in dim.lower():  # Cherche un nom contenant "time"
                time_dim = dim
                break
        
        if time_dim:
            print(ds[var].isel({time_dim: slice(0, 5)}))
        else:
            print("Pas de dimension temporelle détectée, affichage complet :")
            print(ds[var])
    
    print("\n" + "-"*50 + "\n")

# Afficher les infos des deux datasets
print_dataset_info(ds_mnth, "MNTH")

--- MNTH dataset ---

Variables disponibles :
  - d2m : dimensions ('valid_time', 'latitude', 'longitude'), shape (2304, 2, 2)
  - t2m : dimensions ('valid_time', 'latitude', 'longitude'), shape (2304, 2, 2)

Dimensions :
  - valid_time : 2304
  - latitude : 2
  - longitude : 2

Aperçu des données (5 premiers éléments) :

Variable 'd2m':
<xarray.DataArray 'd2m' (valid_time: 5, latitude: 2, longitude: 2)> Size: 80B
[20 values with dtype=float32]
Coordinates:
    number      int64 8B ...
  * valid_time  (valid_time) datetime64[ns] 40B 2000-01-01T01:00:00 ... 2000-...
  * latitude    (latitude) float64 16B 45.7 45.6
  * longitude   (longitude) float64 16B 3.1 3.2
    expver      (valid_time) <U4 80B ...
Attributes: (12/31)
    GRIB_paramId:                             168
    GRIB_dataType:                            fc
    GRIB_numberOfPoints:                      4
    GRIB_typeOfLevel:                         surface
    GRIB_stepUnits:                           1
    GRIB_gridType:   

In [7]:
print_dataset_info(ds_moda, "MODA")


--- MODA dataset ---

Variables disponibles :
  - d2m : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - t2m : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - skt : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - stl1 : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - stl2 : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - stl3 : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)
  - stl4 : dimensions ('valid_time', 'latitude', 'longitude'), shape (96, 2, 2)

Dimensions :
  - valid_time : 96
  - latitude : 2
  - longitude : 2

Aperçu des données (5 premiers éléments) :

Variable 'd2m':
<xarray.DataArray 'd2m' (valid_time: 5, latitude: 2, longitude: 2)> Size: 80B
[20 values with dtype=float32]
Coordinates:
    number      int64 8B ...
  * valid_time  (valid_time) datetime64[ns] 40B 2000-01-01 ... 2000-05-01
  * latitude    (latitude) float64 16B 45.

In [9]:
ds_mnth.dims



In [10]:
ds_moda.dims

