***
# MF204 : Changements climatiques $-$ ENSTA $-$ 2021-2022

https://ecampus.paris-saclay.fr/course/view.php?id=18625

Responsable du cours : Nathaelle Bouttes (nathaelle.bouttes@lsce.ipsl.fr)

Responsable du TD : Cécile Agosta (cecile.agosta@lsce.ipsl.fr)

---
### ATTENTION, il faut activer le Kernel mf204 : Kernel -> Change Kernel -> mf204

Pour activer ce kernel, il faut avoir suivi les instructions d'installation python : https://climat.notion.site/MF204-Installation-python-bce5003425d54b168439606988d3d7e6

---

**Quelques commentaires sur les Notebook.**
Ce texte est rédigé sous la forme d'un notebook. Un notebook comporte des cellules de texte et des cellules de code, ici en Python. Quelques raccourcis clavier et remarques utiles:

- `CTRL+Entrée`: exécute la cellule de code, et affiche son résultat.
- `Tab`: Si l'on `Tab` après avoir tapé les premières lettres d'un nom de fonction, le système propose une liste de possibilités (ce qui peut permettre d'éviter des erreurs de frappe)
- `MAJ+Tab`: Affiche la documentation sur la fonction. Très utile pour ne pas se tromper sur l'ordre des paramètres. On peut voir une documentation plus complète en cliquant sur le '+'.
- `CTRL+s`: Enregistrer les modifications apportées au Notebook.
- Le symbole `[*]` à côté d'une cellule de code indique que le noyau Python est toujours en train de calculer. On peut l'interrompre via `Kernel -> Interrupt` ou le redémarrer via `Kernel -> Restart`. Le noyau Python repart alors de zéro, et il faut donc relancer les cellules antérieures à celle sur laquelle on travaillait.

Une aide complète, ainsi que la documentation de Python et Numpy, est disponible dans le menu `Aide`.
***

# Partie 0 : Objectifs du TD

## 0.1. Contexte des simulations climatiques

L'objectif de ce TD est de comprendre comment sont réalisées les projections climatiques au cours du 21ème siècle. Pour cela nous utiliserons les **sorties de modèles de climat** utilisés pour réaliser les rapports du Groupe d'experts intergouvernemental sur l'évolution du climat (GIEC) / Intergovernmental Panel on Climate Change (IPCC).

Les modèles de climats utilisés pour réaliser les rapports du GIEC suivent un protocol commun défini au sein des exercices [CMIP](https://www.wcrp-climate.org/wgcm-cmip) (*Coupled Model Intercomparison Project*), qui sont des exercices d'intercomparaison de **modèles de climat couplés océan-atmosphère (Global Climate Models, GCMs)**, appelés **Earth System Models (ESMs)** quand ils incluent la modélisation de processus chimiques et biologiques relatifs au cycle du carbone. Ces exercices définissent notamment des scénarios de forçages radiatifs communs à tous les modèles et une nomenclature commune pour les champs climatiques modélisés (nom des variables, caractéristiques des grilles, etc.).

Le 5ème rapport du GIEC ([IPCC AR5, 2013](https://www.ipcc.ch/report/ar5/wg1/)) était basé sur l'ensembre de simulations climatiques **CMIP5**. Nous utiliserons certaines de ces simulations au cours de ce TD.

Le dernier rapport du GIEC ([IPCC AR6, 2021](https://www.ipcc.ch/report/sixth-assessment-report-working-group-i/)) est basé sur l'excercice [CMIP6](https://www.wcrp-climate.org/wgcm-cmip/wgcm-cmip6). Une petite vidéo d'introduction aux simulations CMIP [ici](https://www.wcrp-climate.org/wgcm-cmip).

Une autre ressource interessante : [https://www.carbonbrief.org/cmip6-the-next-generation-of-climate-models-explained](https://www.carbonbrief.org/cmip6-the-next-generation-of-climate-models-explained)

## 0.2. Choix d'une variable climatique et d'une région à étudier

**Nous nous concentrerons sur 4 variables de surface :**
   - précipitations (`pr`)
   - temparature de l'air en surface (`tas`, pour *surface air temperature*)
   - température de surface des océans (`tos`, pour *surface ocean temperature*)
   - concentration de glace de mer (`sic`, pour *sea ice concentration*)

Nous considérons ces variables en moyennes annuelle et saisonières. Pour simplifier le traitement de données, les variables ont été préalablement interpollées sur une grille régulière longitude/latitude de 1°$\times$1° et moyennées par saison (DJF et JJA) et en valeurs annuelles (annual) à partir des valeurs mensuelles.

**Informations importantes :** vous travaillerez par groupe de 2 pour faciliter l'entraide, mais chacun doit travailler sur son propre notebook et son propre ordinateur.


**Q0.2.1** Renommez votre fichier sous la forme : votre-nom-de-famille_mf204.ipynb (par exemple : agosta_mf204.ipynb)

**Q0.2.2** Choisissez un couple variable/région par groupes de 2, parmi ceux proposés ci-dessous. Inscrivez vos noms à côté du numéro choisi au tableau.
    1. Température en Australie
    2. Précipitations en Australie
    3. Température des eaux de surface dans la mer de Caraïbe
    4. Température en Arctique
    5. Précipitations en Arctique
    6. Glace de mer en Arctique
    7. Température en Antarctique
    8. Précipitations en Antarctique
    9. Glace de mer en Antarctique
    10. Température de l’océan tropical de la « warm pool » du Pacifique
    11. Température en Méditerranée
    12. Précipitations en Méditerranée
    13. Température de l'Eurasie Nord (Scandinavie, Sibérie)
    14. Précipitations de l'Eurasie Nord (Scandinavie, Sibérie)
    15. Température du Canada
    16. Précipitations du Canada
    17. Température en Asie du Sud
    18. Précipitations en Asie du Sud
    19. Température au Sud de l'Afrique (Namibie, Botswana, Zimbabwe, Mozambique, Afrique du Sud)
    20. Précipitations au Sud de l'Afrique (Namibie, Botswana, Zimbabwe, Mozambique, Afrique du Sud)

**Q0.2.3** Chargez votre variables à partir de l'archive suivante et mettez le dossier dézippé dans le dossier `./in/` du TD : https://zenodo.org/record/5642616

## 0.3 Chargement des modules python

**[Répétiton] ATTENTION, il faut activer le Kernel mf204 : Kernel -> Change Kernel -> mf204**

Pour activer ce kernel, il faut avoir suivi les instructions d'installation python : https://climat.notion.site/MF204-Installation-python-bce5003425d54b168439606988d3d7e6

Chargez ensuite les modules pythons utiles pour la suite du TD :

In [None]:
# %reset
# python module needed
# = import modules ============================= #
# import netCDF4 as nc # read and write netcdf files
# from os.path import exists # check if file exists
import matplotlib.pyplot as plt  # interactive plots
import cartopy.crs as ccrs  # spatial projections
import numpy as np  # arrays
import xarray as xr  # netcdf data
import cftime  # time decoding

# =============================================== #
# define the figure size
plt.rcParams['figure.figsize'] = [9., 6.]

In [None]:
from platform import python_version

print(python_version())

---
### [Optionnel] : téléchargez des sorties de modèle CMIP6 vous-même

Le TD utilise des sorties de CMIP5, mais les sorties CMIP6 sont maintenant disponibles. Vous pouvez essayer de télécharger des fichiers pour explorer de nouvelles simulations.

Les instructions pour charger les sorties CMIP6 sont ici : https://climat.notion.site/MF204-charger-des-sorties-CMIP6-25f353c3925a46c0ae05b54249388aff


---
# Partie 1: Définir un domaine spatial et tracer une climatologie avec une projection adaptée


## 1.1. Lire un fichier netcdf

**Qu'est-ce qu'un netcdf ?** (un petit résumé de la page [Wikipedia](https://fr.wikipedia.org/wiki/NetCDF))

Netcdf est un format de données ouvert qui permet la création, l'accès et le partage de données scientifiques stockées sous la forme de tableaux. Le format de données est « auto-documenté » c'est-à-dire qu'il existe un en-tête qui décrit la disposition des données dans le reste du fichier, et en particulier des tableaux de données. Ce format est couramment utilisé dans des applications de climatologie, de météorologie et d'océanographie (ex., prévision météorologique, changement climatique et applications des S.I.G.).

Mieux vaut une application pratique que de longs discours. Que trouve-t'on dans un netcdf ?

**Q1.1.1.** Lire un fichier netcdf et comprendre les variables stockées

a) Ouvrir le fichier ./in/grid_1x1.nc4

In [None]:
# read grid dataset with xarray
grid = xr.open_dataset('./in/grid_1x1.nc4')

b) Regarder ce qu'il y a dans le dataset `grid`

In [None]:
# look what's inside `grid`
grid

c) Donner un nom aux variables que nous allons utiliser souvent et regarder ce qu'il y a dedans

In [None]:
# longitude variable
lon1d = grid['lon']
# latitude variable
lat1d = grid['lat']
# grid cell area variable
area2d = grid['area']
# transform the lon and lat axes (1d variables) to 2d variables
lon2d = lon1d.broadcast_like(area2d)
lat2d = lat1d.broadcast_like(area2d)

In [None]:
# look what's in the variables lon1d, lat1d, area2d, lon2d and lat2d
lon1d

In [None]:
lon1d.values

In [None]:
area2d

## 1.2. Faire des plots rapides dans la projection d'origine

**Q.1.2.1.** Regarder rapidement les variables xarray avec `.plot()`.
Quelle est la projection des données ? Quel est le principal problème de cette projection ?

In [None]:
area2d.plot()

In [None]:
lon1d.plot()

In [None]:
lon2d.plot()

**Q1.2.2.** Faire une "bonne carte" de l'aire des cellules.
La lisibilité des cartes est meilleure avec une échelle de couleur discrète, ayant une dizaine d'incrément, une vingtaine max.

a) Faire une carte avec les fonctions matplotlib.pyplot :
   * échelle discrète de couleur : `plt.contourf()`
   * légende de l'échelle de couleur : `plt.colorbar()`
   * un label de légende indiquant la variable représentée et son unité : `plt.colorbar(label='my label')`
   * label de l'axe x : `plt.xlabel('my label')`
   * label de l'axe y : `plt.ylabel('my label')`
   * titre de la figure, qui doit donner toutes les autres infos nécessaire à son interprétation : `plt.suptitle('my title')`

In [None]:
# make a first map
plt.contourf(...
plt.colorbar(label=...
plt.xlabel(...
plt.ylabel(...
plt.suptitle(...

b) Ajustez votre échelle de couleur pour qu'elle soit bien discrétisée :
   * choisir vmin, vmax, delta pour ajuster les incréments (`levels`, voir code ci-dessous)
   * choisir l'option `extend` adaptée (`'min'`, `'max'` ou `'both'`).
Vous pouvez faire des tests.

In [None]:
vmin = ...
vmax = ...
delta = ...
levels = np.arange(vmin, vmax + delta, delta)
# here your new maps using levels and extend in `plt.contourf()`
plt.contourf(...
plt.colorbar(label=...
plt.xlabel(...
plt.ylabel(...
plt.suptitle(...


## 1.3. Faire une carte dans une projection adaptée avec cartopy

L'objectif de cette section est de créer une carte avec une projection correcte pour l'ensemble du globe, de définir votre région d'intérêt, puis de créer une carte avec une projection correcte pour votre région.

Les projections disponibles dans cartopy sont listées ici : https://scitools.org.uk/cartopy/docs/v0.18/crs/projections.html

Et pour une meilleure description des projections, vous pouvez aller voir là : https://matplotlib.org/basemap/users/mapsetup.html

a) Choisir une projection et la tracer sur une carte

In [None]:
# plot a map with a nice projection using cartopy #
# =============================================== #
# indicate the Coordinate Reference System (crs) of your input data
data_crs = ccrs.PlateCarree()
# choose a projection
# e.g. a global equal-area projection: Mollweide (https://matplotlib.org/basemap/users/moll.html)
ax = plt.axes(projection=ccrs.Mollweide())
ax.coastlines()

In [None]:
# test this projection
fig = plt.figure(figsize=(12, 4))
ax = plt.axes(projection=ccrs.Mollweide())
plt.contourf(lon1d, lat1d, area2d, transform=data_crs)
plt.colorbar(label='Grid cell area (km$^{2}$)')
ax.coastlines()
title = fig.suptitle('1x1 Grid')

In [None]:
# add levels and extend
vmin, vmax, delta = ...
levels = ...
fig = plt.figure(figsize=(12, 4))
ax = plt.axes(projection=ccrs.Mollweide())
plt.contourf(...
plt.colorbar(label=...
ax.coastlines()
title = fig.suptitle('1x1 Grid')


b) Nous créeons maintenant une fonction `shade` qui regroupe toutes ces commandes et qui permettra de faire des cartes automatiquement par la suite.

In [None]:
# define a shade function
def shade(var2d, var_name='', units='', title='', vmin=None, vmax=None, delta=None, cmap='viridis', extend='both'):
    """Shade the 2-dimensional variable var2d with a nice projection and colorbar.
    Parameters
    ----------
    var2d : np.array or xarray
        2-dimensional array
    var_name : str, optional
        Name of the ploted variable.
    units : str, optional
        Units of the ploted variable.
    title : str, optional
        Title of the graph. Should describe the specificities of the graph (model, period, etc.).
    vmin : real, default: minimum of var2d
        Minimum value of the colorbar.
    vmax : real, default: maximum of var2d
        Maximum value of the colorbar.
    delta : real, default: var2d range (max - min) divided by 10
        Increment of the colorbar.
    cmap : str, default: default matplotlib cmap 'viridis'
        Name of the colormap.
    extend : str
        Define the extremity of the colorbar, can be 'min' or 'max' or 'both' or 'neither'
    Returns
    -------
    a matplotlib figure
    """
    fig = plt.figure(figsize=(12, 4))
    ax = plt.axes(projection=ccrs.Mollweide())
    ax.set_global()  # to show the whole Earth
    # define the colorbar
    vmin = var2d.min() if vmin is None else vmin
    vmax = var2d.max() if vmax is None else vmax
    # default delta give 10 increments from vmin to vmax
    delta = (vmax - vmin) / 10. if delta is None else delta
    levels = np.arange(vmin, vmax + delta, delta)
    # plot
    plt.contourf(lon1d, lat1d, var2d, levels, vmin=vmin, vmax=vmax, extend=extend, cmap=cmap, transform=data_crs)
    plt.colorbar(label=var_name + ' (' + units + ')')
    ax.coastlines()
    fig.suptitle(title)

c) Test de la fonction shade

In [None]:
# test the shade function
shade(area2d, var_name='Grid cell area', units='km$^{2}$', title='1x1 grid')

**Q1.3.1** Ajustez les incréments de votre échelle de couleur ainsi que les extrémités de l'échelle

In [None]:
# choose nice levels and extend for your colorbar
shade(...

---
### Question bonus TD1

**Qbonus1** Tester différentes projections

# ===== END OF TD1 =====
---

**Q1.3.2** Définissez votre région

In [None]:
# a reminder of the 2d latitude field. You have the same for longitude.
lat2d.plot()

In [None]:
# define a region : example for Antarctica
region2d = (lat2d <= -50)
reg_name = 'Antarctica'
# mask area2d everywhere except over your region
marea2d = area2d.where(region2d)
# have a quick look on marea2d
marea2d.plot()

In [None]:
# plot your region with the shade function
shade(marea2d, var_name='Grid cell area', units='km$^2$', title='1x1 grid over ' + reg_name, extend='neither')

In [None]:
# define your own region
region2d = ...
reg_name = ...
marea2d = ...
# have a look on your region with .plot() and/or shade
...
...

**Q1.3.3** Définissez une projection adaptée pour votre région. Par exemple, pour Arctique/Antarctique: NorthPolarStereo/SouthPolarStereo, ailleurs: Mercator ou Mollweide. Testez cette projection en plotant `marea2d`.

Ajustez les parallèles, les méridiens et leurs labels en customisant gridlines : https://www.net-analysis.com/blog/cartopyintro.html ; https://scitools.org.uk/cartopy/docs/v0.13/matplotlib/geoaxes.html?highlight=gridlines#cartopy.mpl.geoaxes.GeoAxes.gridlines

Un exemple pour l'Antarctique :

In [None]:
fig = plt.figure(figsize=(8, 6))
# define a new projection for your region.
ax = plt.axes(projection=ccrs.SouthPolarStereo())
# the extent is set in longitude/latitude, i.e. in projection "PlateCarree"
ax.set_extent([-180, 180, -90, -48], crs=ccrs.PlateCarree())
# test this projection
# `transform` gives the information of the *data projection*
# the *plot projection* is defined above
plt.contourf(lon1d, lat1d, marea2d, transform=data_crs)
plt.colorbar(label='Grid cell area (km$^{2}$)')
ax.coastlines(resolution='50m')
ax.gridlines(xlocs=np.arange(-180, 180, 45), ylocs=np.arange(-80, -40, 10), draw_labels=True, crs=data_crs)
title = fig.suptitle('1x1 Grid')

Adaptez cet exemple pour votre région :

In [None]:
fig = plt.figure(figsize=(8,6))
# define a new projection for your region.
ax = plt.axes(projection=...
# the extent is set in longitude/latitude, i.e. in projection "PlateCarree"
ax.set_extent(...
# test this projection
plt.contourf(...
plt.colorbar(...
ax.coastlines(...
ax.gridlines(...
title = ...

**Q1.3.4** Adaptez la fonction `shade` ci-dessus pour votre nouvelle projection, en incluant les parallèles et méridiens.

In [None]:
def shade(var2d, var_name='', units='', title='', vmin=None, vmax=None, delta=None, cmap=None, extend='both'):
    """Shade the 2-dimensional variable var2d with a nice projection and colorbar.
    Parameters
    ----------
    var2d : np.array or xarray
        2-dimensional array
    var_name : str, optional
        Name of the ploted variable.
    units : str, optional
        Units of the ploted variable.
    title : str, optional
        Title of the graph. Should describe the specificities of the graph (model, period, etc.).
    vmin : real, default: minimum of var2d
        Minimum value of the colorbar.
    vmax : real, default: maximum of var2d
        Maximum value of the colorbar.
    delta : real, default: var2d range (max - min) divided by 10
        Increment of the colorbar.
    cmap : str, default: default matplotlib cmap 'viridis'
        Name of the colormap.
    extend : str
        Define the extremity of the colorbar, can be 'min' or 'max' or 'both' or 'neither'
    Returns
    -------
    a matplotlib figure
    """
    ... to be adapted ...


# test your new shade function
shade(marea2d, var_name='Grid cell area', units='km$^{2}$', title='1x1 grid')

## 1.4. Faire une carte climatologique

Le vif du sujet. Ici on commence par lire les données climatiques contenues dans les fichiers netcdf stockés dans le dossier `./in/`. Ces fichiers contiennent les valeurs annuelles (`*1x1_annual.nc4`) et saisonnières (DJF et JJA) pour la période "historical" (1850-2005) et la projection "rcp85" (2006-2100). Les deux périodes ont été concaténées dans un seul fichier pour plus de facilité.

Pour la période "historical", les forçages radiatifs des modèles de climat couplés océan-atmosphère sont basés sur des valeurs observées. Pour les projections "rcp85", les forçages radiatifs augmentent de +8,5 W/m2 entre la fin du 20ème siècle et la fin du 21ème siècle, ce qui correspond à continuer sur notre trajectoire actuelle d'émission de gaz à effet de serre (["business-as-usual"](https://fr.wikipedia.org/wiki/Scénario_RCP)).

Pour commencer :
* sélectionnez votre variable
* choisissez les valeurs annuelles : `season = 'annual'`. Vous pourrez tester les saisons `DJF` et `JJA` ensuite.
* sélectionnez un modèle, appelé `gcm` = global climate model. Vous pourrez tester différents gcm ensuite.

In [None]:
# select your variable and your list of GCMs
var_name = 'tas'  # 'pr' or 'tas' or 'tos' or 'sic'
season = 'annual'  # 'annual' or 'DJF' or 'JJA'
gcm = 'ACCESS1-3'  # 'ACCESS1-3' or 'NorESM1-M' or 'GFDL-CM3' or 'CCSM4'
# for 'sic' : only 'ACCESS1-3' or 'NorESM1-M'
# ========

In [None]:
# define the name of the file
file_in = './in/' + var_name + '/' + season + '/' + var_name + '_' + gcm + '_histo-rcp85_r1i1p1_1x1_' + season + '.nc4'

In [None]:
# read variable
var3d_in = xr.open_dataset(file_in)[var_name]
# reformat time axis (for calendar issues)
year_min, year_max = var3d_in['time.year'].min(), var3d_in['time.year'].max()
time1d = np.array([cftime.datetime(year, 1, 1) for year in np.arange(year_min, year_max + 1)])
var3d_in['time'] = time1d
# remove NaN
var3d_in = var3d_in.where(var3d_in < 9999.)
var3d_in = var3d_in.where(var3d_in > -9999.)

In [None]:
# check what's in var3d_in
var3d_in

In [None]:
# check what's in time1d
time1d

In [None]:
# have a quick look of the first time step of var3d
var3d_in[0].plot()

In [None]:
# Variables readable names and units
name = {'pr': 'precipitation',
        'tas': 'surface air temperature',
        'tos': 'surface ocean temperature',
        'sic': 'sea ice cover'}
units = {'pr': 'kg m$^{-2}$ yr$^{-1}$',
         'tas': 'C',
         'tos': 'C',
         'sic': '%'}

In [None]:
# convert your variable into the readable unit given above
add_constant = 0.
mult_constant = 1.
if var_name == 'pr':
    # kg m-2 s-1 -> kg m-2 yr-1
    mult_constant = 3600 * 24 * 365.25
elif var_name in ('tas', 'tos'):
    # K -> degC
    add_constant = -273.15

# change unit
var3d = var3d_in * mult_constant + add_constant

In [None]:
# change the `units` attribute of your variable
var3d.attrs["units"] = units[var_name]

In [None]:
# check your variable
var3d

In [None]:
# have again a quick view of your variable
var3d.sel(time='2020').plot()

**Q1.4.1** Calculer la moyenne historique pour 20 ans (1980-2000) de votre variable (=climatologie)

In [None]:
# define a time period
year_min, year_max = 1980, 2000
period = ...
# average the gcm for this period
var2d = ...

In [None]:
# have a quick look on var2d
...

**Q1.4.2** Masquez votre variable 2d (moyenne sur 20 ans) partout sauf sur votre région.

In [None]:
# mask the data outside your region
mvar2d = ...

In [None]:
# have a quick look on mvar2d
...

**Q1.4.3** Faites une carte de la climatologie de votre variable en utilisant votre fonction `shade`, avec un **titre correct**, une **échelle de couleur correcte** et une **colormap correcte** (https://matplotlib.org/users/colormaps.html). Vous pouvez, par exemple, utiliser les colormap suivantes :
- 'pr':'YlGnBu'
- 'tas':'YlOrRd'
- 'tos':'YlOrRd'
- 'sic': 'Blues_r'

In [None]:
# choose your colormap
cmap = ...

In [None]:
# plot mvar2d using your shade function, with a **nice title** and a **nice colorbar**
title = ...
vmin, vmax, delta = ...
shade(...
# save your figure in the ./fig/ directory
fig_name = './fig/' + gcm + '_time-average_' + str(year_min) + '-' + str(year_max) + '_' + season + '.png'
plt.savefig(fig_name, dpi=300)

---
### Questions bonus TD2

- **Qbonus2.a** Refaire cette carte climatologique pour différents gcms, avec la même échelle de couleur pour tous les gcm si possible.
- **Qbonus2.b** Refaire cette carte climatologique pour l'été et l'hiver, avec la même échelle de couleur pour toutes les saisons.

## La magie des dictionnaires
Pour répondre aux questions bonus, vous pouvez au choix :
1. refaire tourner votre notebook en changeant le nom du modèle (`gcm`) et le nom de la saison (`season`) à la section 1.4
2. créer un dictionnaire, c'est à dire une variable indexée par des mots : voir exemple ci-dessous

In [None]:
# define your dictionary keys
gcm_list = 'ACCESS1-3', 'NorESM1-M', 'GFDL-CM3', 'CCSM4'
# gcm_list = 'ACCESS1-3', 'NorESM1-M' # for sic
season_list = 'annual', 'DJF', 'JJA'

In [None]:
# initialize dictionaries, which depend on GCMs and seasons and contain empty arrays
var3d_dict = {gcm_name: {
        season_name: xr.DataArray([]) for season_name in season_list
                } for gcm_name in gcm_list}

time1d_dict = {gcm_name: {
        season_name: xr.DataArray([]) for season_name in season_list
                } for gcm_name in gcm_list}

In [None]:
# choose your variable
# var_name = 'pr'
# read the netcdf files and put the data in dictionaries
for gcm_name in gcm_list:
    for season_name in season_list:
        print(gcm_name, season_name)
        # define the name of the file
        file_in = './in/' + var_name + '/' + season_name + '/' + var_name + '_' + gcm_name + '_histo-rcp85_r1i1p1_1x1_' + season_name + '.nc4'
        # read variable and put it in the dictionary
        var3d_dict[gcm_name][season_name] = xr.open_dataset(file_in)[var_name]
        # reformat time axis (for calendar issues)
        year_min, year_max = var3d_dict[gcm_name][season_name]['time.year'].min(), var3d_dict[gcm_name][season_name][
            'time.year'].max()
        time1d_dict[gcm_name][season_name] = np.array([cftime.datetime(year, 1, 1) for year in np.arange(year_min, year_max + 1)])
        var3d_dict[gcm_name][season_name]['time'] = time1d_dict[gcm_name][season_name]
        # remove NaN
        var3d_dict[gcm_name][season_name] = var3d_dict[gcm_name][season_name].where(
            var3d_dict[gcm_name][season_name] < 9999.)
        var3d_dict[gcm_name][season_name] = var3d_dict[gcm_name][season_name].where(
            var3d_dict[gcm_name][season_name] > -9999.)
        # convert your variable into the readable unit given above
        add_constant = 0.
        mult_constant = 1.
        if var_name == 'pr':
            # kg m-2 s-1 -> kg m-2 yr-1
            mult_constant = 3600 * 24 * 365.25
        elif var_name in ('tas', 'tos'):
            # K -> degC
            add_constant = -273.15
        # change unit
        var3d_dict[gcm_name][season_name] = var3d_dict[gcm_name][season_name] * mult_constant + add_constant
        # change the `units` attribute of your variable
        var3d_dict[gcm_name][season_name].attrs["units"] = units[var_name]

In [None]:
# and after you can do a loop on `gcm_name` and `season_name`, an example:
for gcm_name in gcm_list:
    for season_name in season_list:
        # just as an example
        # WARNING : this plot is just an example, it must be improved for readability
        lon, lat = 0., 80.
        plt.plot(time1d_dict[gcm_name][season_name], var3d_dict[gcm_name][season_name].sel(lon=lon, lat=lat, method='nearest'),
                 label=gcm_name + ' (' + season_name + ')')
plt.title(name[var_name] + ' at ' + str(lon) +'°E and ' + str(lat) + '°N')
plt.legend()

# ===== END OF TD2 =====

---
# Partie 2. Calculer et tracer des séries temporelles

Le but de cette partie est de visualiser comment évolue votre variable en moyenne sur votre domaine, entre 1850 et 2100 pour le scénario "historical"+"rcp85". Pour cela il faut faire une moyenne de votre variable sur votre région, qui doit **être pondérée par l'aire des cellules**. Nous travaillons sur les moyennes annuel car l'amplitude du cycle saisonnier peut masquer le signal climatique. Mais il est recommandé de travailler regarder aussi l'évolution par saison (en priorité : DJF et JJA, et en bonus : MAM et SON) pour évaluer les contributions saisonnières au signal annuel.

Idéalement ce travail devra être fait pour plusieurs GCMs, mais nous nous concentrerons sur un seul GCM pour commencer.

## 2.1. Moyenne spatiale et série temporelle annuelle

**Q2.1.1** Faire une carte de la variable 3d masquée pour votre région pour une année donnée, avec un titre et une jolie colormap, et les valeurs vmin/vmax qui vont bien, en utilisant votre fonction `shade`.

In [None]:
# mask the data over your region
mvar3d = ...

In [None]:
# have a quick look on mvar3d for one year
...

In [None]:
# define mvar2d = mvar3d for the year of your choice. Tip: use .squeeze() to remove the time dimension
year = ...
mvar2d = ...

In [None]:
# plot mvar3d for the year of your choice, with a title and a nice colormap
year = ...
mvar2d = ...
title = ...
vmin, vmax, delta = ...
shade(...

**Q2.2.2** Faire une moyenne spatiale : il faut **pondérer chaque cellule par l'aire de la cellule**.

In [None]:
# create a weighted variable 
mvar3d_weighted = mvar3d.weighted(area2d)

In [None]:
# check what's in mvar3d_weighted
mvar3d_weighted

In [None]:
# mvar1d = var3d, masked for your region, weighted by grid cell area, and spatially averaged
mvar1d = mvar3d_weighted.mean(("lon", "lat"))

In [None]:
# check what's in mvar1d
mvar1d

In [None]:
# plot quickly what's in mvar1d
mvar1d.plot()

**Q2.1.3** Tracer les valeurs annuelles de votre variable en moyenne sur votre région, avec :
* plot `pyplot` à la place du plot `xarray`, pour mieux gérer les dates : `plt.plot(time1d, mvar1d, label=season)`
* titre : `plt.suptitle(title)`
* labels d'axes : `plt.xlabel(my_x_label)`, `plt.ylabel(my_y_label)`
* ajuster les limites d'axes x et y : `plt.xlim(xmin, xmax)`, `plt.ylim(ymin, ymax)`
    * -> pour xlim, comme `x` est un axe des temps, il faut définir les dates xmin et xmax avec `cftime.datetime(year, month, day)`

In [None]:
title = ...
plt.plot(...
plt.legend()
plt.suptitle(...
plt.xlabel(...
plt.ylabel(...
xmin, xmax = cftime.datetime(1850, 6, 15), cftime.datetime(2100, 6, 15)
ymin, ymax = mvar1d.min() - 2., mvar1d.max() + 2.
plt.xlim(xmin, xmax)
plt.ylim(ymin, ymax)
# fig_name = './fig/' + gcm + '_spatial-average_' + season + '.png'
# plt.savefig(fig_name, dpi=300)

---
### Questions bonus TD3

- **Qbonus3.a** Ajouter sur le même graphe les moyennes saisonières d'été et d'hiver.
- **Qbonus3.b** Faire une figure avec uniquement les valeurs annuelles, mais montrant 3 GCMs.

**Alternative :** refaire ce graph pour différents gcm et différentes saisons, avec la même échelle verticale pour tous les graphs.

# ===== END OF TD3 =====
---

## 2.2. Statistiques climatiques et variabilité interne du climat

Ici vous estimerez les changements de votre variable pour des échelles de temps climatiques, c'est-à-dire sur des périodes de 20 à 30 ans. Vous calculerez une métrique permettant de quantifier la variabilité interne (ou "naturelle") du climat. Vous calculerez ensuite le "temps d'émergence", c'est-à-dire le moment où le signal de changement climatique sort de la variabilité naturelle du climat. 

---
**Résumé du calcul de la variabilité interne dans le cinquième rapport du GIEC (IPCC AR5)**

*Extrait du Chapitre 12 Box 12.1 p1041*

*A number of methods to indicate model robustness, involving an assessment of the significance of the change when compared to internal variability, have been proposed since AR4. The different methods share the purpose of identifying regions with large, significant or robust changes, regions with small changes, regions where models disagree or a combination of those. They do, however, use different assumptions about the statistical properties of the model ensemble, and therefore different criteria for synthesizing the information from it. Different methods also differ in the way they estimate internal variability. We briefly describe and compare several of these methods here.*

*Method (a): The default method used in Chapters 11,12 and 14 as well as in the Annex I (hatching only) is shown in Box 12.1, Figure 1a, and is based on relating the climate change signal to internal variability in 20-year means of the models as a reference[1] . Regions where the multi-model mean change exceeds **two standard deviations of internal variability** and where at least 90% of the models agree on the sign of change are stippled and interpreted as ‘large change with high model agreement’. Regions where the model mean is less than one standard deviation of internal variability are hatched and interpreted as ‘small signal or low agreement of models’. This can have various reasons: (1) changes in individual models are smaller than internal variability, or (2) although changes in individual models are significant, they disagree about the sign and the multi-model mean change remains small. Using this method, the case where all models scatter widely around zero and the case where all models agree on near zero change therefore are both hatched (e.g., precipitation change over the Amazon region by the end of the 21st century, which the following methods mark as ‘inconsistent model response’).*

*[1] The internal variability in this method is estimated using pre-industrial control runs for each of the models which are at least 500 years long. The first 100 years of the pre-industrial are ignored. Variability is calculated for every grid point as the standard deviation of non-overlapping 20-year means, multiplied by the square root of 2 to account for the fact that the variability of a difference in means is of interest. A quadratic fit as a function of time is subtracted from these at every grid point to eliminate model drift. This is by definition the standard deviation of the difference between two independent 20-year averages having the same variance and estimates the variation of that difference that would be expected due to unforced internal variability. The median across all models of that quantity is used.*

*Variability in methods b–d is estimated from **interannual variations in the base period (1986–2005)** within each model.*

---
Dans notre cas nous considèrerons :
- la période 1980-2000 comme notre **période de référence**. Vous devez vérifier si cette période est bien représentative du climat sur la période 1850-1980
- la variabilité interannuelle (i.e. l'écart type des valeurs interannuelles) de cette période de référence comme une mesure de la **variabilité interne**
- le **temps d'émergence** est défini comme l'année à partir de laquelle toutes les années sont en dehors de la variabilité interne par rapport à la période de référence.

**Q2.2.1** Calculer la valeur moyenne et la variabilité interannuelle (standard deviation, `std`) de votre variable régionale pour la période de référence `period_ref`. Inspirez-vous de ce qui a été fait plus haut.

In [None]:
# reference period
year_min, year_max = 1980, 2000
period_ref = ...
# time mean and standard deviation for this period
mean_ref = ...
std_ref = ...

**Q2.2.2** Représentez, vérifiez et ajustez votre période de référence. Commencez par tracer une boîte qui représente la variabilité interne autour de la moyenne pour la période de référence 1980-2000.

In [None]:
# a nice figure : add title, axes and labels
title = ...
# plot the time series
plt.plot(...
# plot the mean over the period
date_min, date_max = cftime.datetime(year_min, 1, 1), cftime.datetime(year_max, 1, 1)
plt.hlines(mean_ref, date_min, date_max, colors='b')
# shade 2 std around the mean
min_val, max_val = ...
label = str(year_min) + '-' + str(year_max) + ' : mean =' + str(np.round(mean_ref.values, 1)) + '; std=' + str(
    np.round(std_ref.values, 2))
plt.fill_between([date_min, date_max], [min_val, min_val], [max_val, max_val], color='b', alpha=0.2, label=label)
plt.legend()
plt.xlabel('Year')
plt.ylabel(name[var_name] + ' (' + units[var_name] + ')')
plt.suptitle(title)

On va maintenant automatiser cela pour vérifier visuellement la validité de cette période de référence. En fonction du graph obtenu, jouez avec les bornes de votre période de référence pour qu'elle représente le climat "stable" avant 1980 (l'allonger ? la reculer dans le temps ?).

In [None]:
def compute_time_mean_std(mvar1d, year_min, year_max):
    '''
    The time mean and std of the variable mvar1d for the period between year_min and year_max
    Parameters
    ----------
    mvar2d: np.array or xarray
        2-dimensional
    year_min: integer
        first year of the period
    year_max: integer
        last year of the period
    Returns
    -------
    real, real
        time mean, time std
    '''
    period = (mvar1d['time.year'] >= year_min) & (mvar1d['time.year'] <= year_max)
    # mean and standard deviation for this period
    tmean = mvar1d[period].mean("time")
    tstd = mvar1d[period].std("time")
    return tmean.values, tstd.values


def show_time_mean_std(mvar1d, year_min, year_max):
    '''
    Plot a box representing the mean and temporal variability over the period between year_min and year_max
    Parameters
    ----------
    mvar2d: np.array or xarray
        2-dimensional
    year_min: integer
        first year of the period
    year_max: integer
        last year of the period
    Returns
    -------
    real, real
        time mean, time std
    '''
    # transform year in date
    date_min, date_max = cftime.datetime(year_min, 6, 15), cftime.datetime(year_max, 6, 15)
    # compute the mean, the std and the levels
    tmean, tstd = compute_time_mean_std(mvar1d, year_min, year_max)
    tmin, tmax = tmean - 2 * tstd, tmean + 2 * tstd
    # plot
    # select a color depending of the year
    color = plt.get_cmap('viridis')((year_min - 1850) / 200)
    # label of the period
    label = str(year_min) + '-' + str(year_max) + ' : mean = ' + str(np.round(tmean, 1)) + ' ' + units[var_name] + '; std = ' + str(np.round(tstd, 1)) + ' ' + units[var_name]
    # plot the mean over the period with an horizontal line
    plt.hlines(tmean, date_min, date_max, colors='b')
    # shade 2 std around the mean
    plt.fill_between([date_min, date_max], [tmin, tmin], [tmax, tmax], color=color, alpha=0.2, label=label)
    return tmean, tstd

# a nice figure : add title, axes and labels
title = ...
# plot the time series
plt.plot(...
# plot boxes of means +- 2 std
for year_min in np.arange(1860, 2000, 20):
    show_time_mean_std(mvar1d, year_min, year_min + 20)
xmin, xmax = cftime.datetime(1850, 1, 1), cftime.datetime(2100, 1, 1)
ymin, ymax = mvar1d.min() - 2., mvar1d.max() + 2.
plt.xlim(xmin, xmax)
plt.ylim(ymin, ymax)
# test your reference period and modify it
# ========================================
year_min, year_max = ...
show_time_mean_std(mvar1d, year_min, year_max)
plt.legend()
plt.xlabel('Year')
plt.ylabel(name[var_name] + ' (' + units[var_name] + ')')
plt.suptitle(title)
# fig_name = './fig/' + gcm + '_spatial-average_boxes_' + season + '.png'
# plt.savefig(fig_name, dpi=300)

In [None]:
# define your final year_min, year_max for your reference period
year_min, year_max = ...
mean_ref, std_ref = compute_time_mean_std(mvar1d, year_min, year_max)

In [None]:
# print your reference mean and std
print(str(year_min) + '-' + str(year_max) + ' : mean = ' + str(np.round(mean_ref, 1)) + units[
    var_name] + '; std = ' + str(np.round(std_ref, 1)) + units[var_name])

**Q2.2.3** Calculez le temps d'émergence `toe`, c'est à dire l'année à partir de laquelle toutes les années sont en dehors de la variabilité interne par rapport à la période de référence.

In [None]:
# define the condition of emergence
emergence = ...

In [None]:
# have a quick look on emergence
...

In [None]:
# find the year toe for which all the following years verify the condition of emergence
# on se place à la fin de la période
n = ...
# tant que la condition d'émergence est égale à 1 on recule dans le temps
while ...
# si la période d'émergence est trop courte (< 10 ans), on décide qu'il n'y a pas d'émergence
if ...
    print('no time of emergence for ' + gcm)
else:
    ...
    print('The time of emergence for ' + gcm + ' is: ' + str(toe))


**Q2.2.4** Représentez graphiquement le temps d'émergence en repartant de la figure précédente. Vous pouvez utiliser les fonctions `plt.hline`, `plt.vline`, `plt.annotate`

In [None]:
# a nice figure : add title, axes and labels
title = ...
# plot the time series
plt.plot(...
# your own reference period
year_min, year_max = ...
show_time_mean_std(mvar1d, year_min, year_max)
plt.legend()
plt.xlabel('Year')
plt.ylabel(season + ' ' + name[var_name] + ' (' + units[var_name] + ')')
plt.suptitle(title)
# add a representation of the time of emergence toe
...

# fig_name = './fig/' + gcm + '_spatial-average_toe_' + season + '.png'
# plt.savefig(fig_name, dpi=300)

## Questions bonus TD4
- **Qbonus4.a** : Faites la même figure pour d'autres GCMs
- **Qbonus4.b** : Faites la même figure pour l'été et/ou pour l'hiver

# ===== END OF TD4 =====
---

# 3. Carte du changement climatique projeté et de sa significativité
Au cours du TD3, vous réaliserez une carte du changement climatique modélisé entre la fin du 21ème siècle et la fin du 20ème siècle pour un GCM et le scénario rcp85, en hachurant les zones où le changement climatique est significatif, c'est à dire qu'il sort de la variabilité interne du climat.

**Q3.1.** Calculer les valeurs moyennes 2d pour la période future (fin du 21ème siècle: 2080-2100) et la période de référence (fin du 20ème siècle: 1980-2000)

In [None]:
# see Q1.3.1
# define the time periods
period_21c = ...
period_20c = ...
# average the gcm for these time periods
mvar2d_21c_mean = ...
mvar2d_20c_mean = ...

**Q3.2** Faire une carte de différence entre ces deux périodes en utilisant la fonction `shade`. Utiliser une palette de couleur centrée (voir https://matplotlib.org/users/colormaps.html) et des valeurs min et max centrées autour de `0`.

Recommandations de palettes de couleur :
* pour des températures, 'RdBu_r'
* pour des précipitation, 'BrBG'

In [None]:
# plot a map of the difference between the periods
dvar2d = ...
cmap = ...
title = ...
vmin, vmax, delta = ...  # to be adjusted, centered around 0
shade(...

**Q3.3** Montrer les zones où le changement climatique est significatif, en utilisant la même définition que pour la Section 2 : la différence de moyenne entre la fin du 21ème siècle et la fin du 20ème siècle est supérieur à 2 fois la variabilité interne. La variabilité interne est définie comme l'écart type des valeurs annuelles pour la fin du 20ème siècle.

In [None]:
# first define and look at the internal variability
mvar2d_20c_std = ...

In [None]:
# define a 2d variable equal to one where the change is significant, and equal to 0 elsewhere.
significant_change = ...

In [None]:
# have a quick look to significant_change
...

In [None]:
# then print dots
shade(dvar2d...
sig_change_dots = significant_change.where(significant_change)
plt.contourf(lon1d, lat1d, sig_change_dots, hatches='.', colors='none', transform=data_crs)
#plt.savefig('./fig/' + gcm + '_map_climate-change_' + season + '.png', dpi=300)

## Questions bonus TD5

- **Qbonus5.a** : Faites la même figure pour d'autres GCMs
- **Qbonus5.b** : Faites la même figure pour l'été et/ou pour l'hiver

# == The End ==
***