# Attributs "classiques" des objets _Resource_ et _Provider_

Initialisation de vortex

In [1]:
%load_ext ivortex
%vortex tmpcocoon

# [2019/01/22-11:10:47][vortex.sessions][_set_rundir:0155][INFO]: Session <root> set rundir </home/meunierlf/vortex-workdir/auto_cocoon_mfmqjsky>


Vortex 1.6.0 loaded ( Tuesday 22. January 2019, at 11:10:46 )
The working directory is now: /home/meunierlf/vortex-workdir/auto_cocoon_mfmqjsky/root


'/home/meunierlf/vortex-workdir/auto_cocoon_mfmqjsky'

## Exemple précédement utilisé...

In [2]:
# Préréglages
import bronx
toolbox.defaults(
    date = bronx.stdtypes.date.Date('2017060118'),
    cutoff = 'production',
    model = 'arpege',
    geometry = vortex.data.geometries.get(tag='euroc25'),
)
t.glove.vapp = 'arpege'
t.glove.vconf = 'pearp'  # En l'état de nos connaissances, je ne peux expliquer cela...
# Toolbox
toolbox.active_verbose = False

In [3]:
# Récupération de la ressource
rhandlers = toolbox.input(# Method/Section
                          loglevel='warning', role='InitialCondition', intent='inout',
                          # Resource
                          term=3, kind='gridpoint', origin='historic', nativefmt='grib',
                          # Provider
                          member=2, experiment='DBLE', namespace='vortex.archive.fr',
                          block='forecast',
                          # Container
                          local='GRIB_[geometry:area]_[member%04d]+[term:fmthm]', format='grib')
rh = rhandlers[0]  # Petit raccourci pour la suite

## Autopsie des objets

Pour le cas particulier de notre exemple, les attributs "_footprints_" de nos objets *Resource* et *Provider* sont :

In [4]:
rh.resource.footprint_attributes

['clscontents',
 'cutoff',
 'date',
 'geometry',
 'kind',
 'model',
 'nativefmt',
 'origin',
 'term']

In [5]:
rh.provider.footprint_attributes

['block',
 'expected',
 'experiment',
 'member',
 'namebuild',
 'namespace',
 'scenario',
 'username',
 'vapp',
 'vconf']

### Attributs classiques d'un objet _Resource_ : dimension temporelle

Attributs présents lorsque cela a du sens :

* **date** : Réseau auquel est rattaché la ressource (ce n'est pas la date de validité, qui peut être obtenue par l'opération *date* + *term*).

In [6]:
print(type(rh.resource.date))
print(rh.resource.date.iso8601())  # Voir la doc Sphinx pour cette classe
                                   # ou "help(bronx.stdtypes.date.Date)" dans un shell interactif

<class 'bronx.stdtypes.date.Date'>
2017-06-01T18:00:00Z


* **cutoff** : Deux valeurs possibles, "assim" et "production". C'est une notion courante en PNT mais qui peut probablement se généraliser à d'autres domaines (ne serait-ce que par le couplage entre applications).

* **term** : L'échéance des données.

In [7]:
print(type(rh.resource.term))
print(rh.resource.term.iso8601())  # Voir la doc Sphinx pour cette classe
                                   # ou "help(bronx.stdtypes.date.Time)" dans un shell interactif

<class 'bronx.stdtypes.date.Time'>
T03:00Z


### Attributs classiques d'un objet _Resource_ : dimension horizontale

Attribut présent lorsque cela a du sens :

* **geometry** : Cet attribut décrit la structure horizontale des données. Cet attribut est important car il intervient dans le nommage des fichiers (via la fabrique de noms Vortex).

In [8]:
print(rh.resource.geometry.idcard())

  Geometry <vortex.data.geometries.LonlatGeometry object at 0x7f5d79afdd30>
    Info       : Large european BDAP target
    LAM        : True
    Area       : EUROC25
    Resolution : 2.5
    Nlon       : 129
    Nlat       : 105


Les objets _Geometry_ sont définis dans le module **vortex.data.geometries** :  voir la documentation de ce module.

**Note importante** : Les géométries doivent être définies avant leur utilisation. Les géométries par défaut de Vortex sont définies dans le fichier de configuration ``geometries.ini`` (une liste de ces géométries, basée sur ce fichier, est disponible dans la documentation sous l'item : "List of default geometries"). Pour des besoins temporaires, un utilisateur peut ajouter des géométries personnalisées en créant un fichier ``~/.vortexrc/geometries.ini`` dans son home directory.

### Attributs classiques d'un objet _Resource_ : identification du modèle

Attribut présent lorsque cela a du sens :

* **model** : Il s'agit d'une chaîne de caractères décrivant le modèle utilisé (par exemple arpege, arome, hycom, surfex, ...). Au besoin, il est tout à fait possible d'ajouter de nouveau modèles. Il faut simplement les mentionner dans la liste ad-hoc...

In [9]:
print(vortex.syntax.stdattrs.models)

{'aearp', 'aladin', 'arp', 'arp_court', 'arome', 'aro', 'mocage', 'psy4', 'ifs', 'ald', 'aroifs', 'mesonh', 'pearp', 'surfex', 'hycom', 'safran', 'arpege'}


### Attributs classiques d'un objet _Resource_ : format des données

* **nativefmt** : Format de stockage des données (GRIB, FA, LFI, NetCDF, ...). Au besoin, il est tout à fait possible d'ajouter de nouveaux formats. Il faut simplement les mentionner dans la liste ad-hoc...

In [10]:
print(vortex.syntax.stdattrs.knownfmt)

{'foo', 'png', 'txt', 'sx', 'nam', 'grib', 'bullx', 'autoconfig', 'obsoul', 'ecma', 'grib1', 'netcdf', 'arpifslist', 'auto', 'obsfirepack', 'tar', 'lfi', 'bufr', 'fa', 'obslocationpack', 'odb', 'pdf', 'geo', 'grib2', 'json', 'bin', 'binary', 'dir/hdr', 'ascii', 'ddhpack', 'hdf5', 'rawfiles', 'lfa', 'unknown', 'ccma'}


### Attributs classiques d'un objet _Provider_ : vapp et vconf

La plupart des providers utilisent les attributs **vapp** et **vconf**. Ces attributs (chaînes de caractères) définissent l'application (par exemple "arome") et sa configuration (par exemple "3dvarfr", "pefrance", "indien", ...).

Il n'y pas de contrôle dans le code mais il faut rester rigoureux car ces deux attributs sont largement utilisés pour stocker les données. À cette fin, une page de Wiki a été mise en place pour répertorier les différents **vapp**/**vconf** connus. Merci de compléter cette page lorsque de nouvelles configurations sont créées.

http://vortex.meteo.fr/vortex/doku.php/documentation:mise_en_oeuvre:vapp_vconf

### Attributs classiques d'un objet _Provider_ : member

Dans le provider Vortex, la possibilité de gérer des ensembles est directement intégrée. C'est pourquoi l'attribut **member** fait partie de la liste des attributs. Il s'agit en revanche d'un attribut totalement optionnel : si aucune valeur n'est fournie (ce qui équivaut à *None*), on considère qu'il s'agit d'une ressource déterministe.

### Attributs classiques d'un objet _Provider_ : block

C'est un attribut typique des providers Vortex et Olive : Il s'agit du sous-répertoire dans lequel seront stockées les données. Le **block** permet une flexibilité supplémentaire dans la création des configurations.

Par exemple, imaginons qu'une tâche de diagnostics produise des données GRIB en se basant sur les données GRIB issues de la prévision. Les deux objets *Resource* seront identiques car il s'agit de données très similaires. En revanche, les GRIBs issus de la prévision seront archivés dans le **block** ``forecast`` alors que ceux issus d'un diagnostic pourront être déposés dans ``diagnostic``.

## Implications sur l'arbre d'héritage des classes *Resource*

![](../images/ResourceInheritance.png)

**Note:** La liste des classes n'est pas exhaustive. De même, certains attributs typiques sont précisés en italique. La liste est loin d'être exhaustive. La convention utilisée pour figurer l'héritage est celle de l'UML (la flèche pointe vers la classe dont on hérite).

Quelques explications :

* Tout ce qui a vocation a être exécuté hérite de la classe **Executable**. Arrivé à un certain niveau de spécialisation, un attribut *model* est attribué à la *Resource*.
* Les ressources qui sont associées à un réseau donné héritent de **FlowResource** et possèdent donc des attributs *date*, *cutoff*, *model*. La classe **GeoFlowResource** ajoute une information sur la structure horizontale des données.
* Les ressources ne dépendant pas du réseau (typiquement un fichier de constantes) héritent généralement de **ModelResource** ou **StaticGeoResource**. Des variantes de ces classes existent dans le cas où il s'agit de données qui peuvent être récupérée via l'outil Genv.

Lors de la création d'une nouvelle classe *Resource*, il faut donc réfléchir au placement de celle-ci dans l'arbre d'héritage.

Cette structure d'héritage permet une certaine classification des ressources. Cela ne doit toutefois pas être appliqué de façon rigide.

Prenons l'exemple d'un fichier contenant la partie diagonale d'une matrice d'erreur d'ébauche (dans un contexte d'assimilation de donnée) : ce fichier vient généralement de l'ensemble d'assimilation et possède une géométrie, on va donc le faire hériter de **GeoFlowResource**. Néanmoins, dans de rares cas, on récupérera une version climatologique de ce fichier, qui est archivée par GCO : on ajoute donc manuellement l'attribut *gvar* à cet objet. Dans ce cas, l'arbre d'héritage décrit donc l'usage "majoritaire".

## Quelques exemples de providers

De nombreux providers sont implémentés dans Vortex. Nous en évoquerons certains dans la suite de ce document :

* **Vortex** : Données archivées par Vortex
* **Olive** : Données archivées par la toolbox Olive "historique" (i.e. Olive-Perl)
* **Archive** : Données archivées par la chaîne DSI/IGA "historique" (i.e. chaine ksh)
* **Genv** : Données constantes historisées par GCO
* **Uenv** Données constantes "Utilisateur" (contre-partie non officielle du Genv)

Nous en passerons certains sous silence :

* **Remote**
* **Magic**
* **BDPE**

### Provider Vortex

Attributs classiques :

* **vapp** : Déjà évoqué,
* **vconf** : Déjà évoqué,
* **experiment** : L'identifiant d'expérience peut prendre trois formats différents :
    * ``OPER``, ``DBLE``, ``MIRR``, ``TEST`` : expériences Vortex/DSI
    * ``ABCD`` : expériences SWAPP/Olive-Vortex (identifiant à 4 lettres/chiffres différent de ceux mentionnés ci-dessus)
    * ``nomlibre@utilisateur`` : expérience hors Oper ou Olive. C'est l'utilisateur propriétaire de l'expérience qui choisit un nom (champ ``nomlibre``). L'identifiant est précisé dans le champ ``utilisateur`` (a priori il s'agit du login Hendrix)
* **block** : Sous-répertoire de stockage (obligatoire)
* **member** : Numéro de membre (optionnel)
* **scenario** : Dans le cadre de simulations climatiques (optionel), scénario de concentration en gases à effet de serre.
* **namespace** : ``vortex.[cache|archive|multi].fr``

En fonction de **experiment**, **footprints** choisira la bonne classe de provider (respectivement, **VortexOp**, **VortexStd** et **VortexFree**)

L'idée de Vortex (et Olive avant lui) est de pouvoir facilement partager des données, d'où l'importance de l'attribut **experiment** qui permet d'aller chercher des données à droite à gauche :

In [11]:
rhandlers = toolbox.input(# Method/Section
                          loglevel='warning', role='InitialCondition', intent='inout',
                          # Resource
                          term=3, kind='gridpoint', origin='historic', nativefmt='grib',
                          # Provider
                          member=2, experiment='ABCD', namespace='vortex.archive.fr',
                          block='forecast', scenario='RCP4.5',
                          # Container
                          local='GRIB_[geometry:area]_[member%04d]+[term:fmthm]', format='grib')
rhandlers[0].locate()

'meunierlf@hendrix.meteo.fr:/home/m/marp/marp999/vortex/arpege/pearp/A/B/C/D/20170601T1800P/sRCP4.5/mb002/forecast/grid.arpege-forecast.euroc25+0003:00.grib'

In [16]:
rhandlers = toolbox.input(# Method/Section
                          loglevel='warning', role='InitialCondition', intent='inout',
                          # Resource
                          term=3, kind='gridpoint', origin='historic', nativefmt='grib',
                          # Provider
                          member=2, experiment='fausseXP@toto', namespace='vortex.archive.fr',
                          block='forecast', scenario='RCP4.5',
                          # Container
                          local='GRIB_[geometry:area]_[member%04d]+[term:fmthm]', format='grib')
rhandlers[0].locate()

'meunierlf@hendrix.meteo.fr:~toto/vortex/arpege/pearp/fausseXP/20170601T1800P/sRCP4.5/mb002/forecast/grid.arpege-forecast.euroc25+0003:00.grib'

## Provider Olive-Perl (fourni par le package **olive**)

Attributs classiques :

* **vapp** : Déjà évoqué,
* **vconf** : Déjà évoqué,
* **experiment** : L'identifiant d'expérience Olive-Perl
* **block** : Sous-répertoire de stockage (obligatoire)
* **member** : Numéro de membre optionnel (ne fonctionne pas pour toutes les ressources)
* **namespace** : ``olive.[cache|archive|multi].fr``

In [13]:
rhandlers = toolbox.input(# Method/Section
                          loglevel='warning', role='InitialCondition', intent='inout',
                          # Resource
                          term=3, kind='gridpoint', origin='historic', nativefmt='grib',
                          # Provider
                          member=2, experiment='ABCD', namespace='olive.archive.fr',
                          block='forecast',
                          # Container
                          local='GRIB_[geometry:area]_[member%04d]+[term:fmthm]', format='grib')
rhandlers[0].locate()

'meunierlf@hendrix.meteo.fr:/home/m/marp/marp999/xp/A/B/C/D/20170601H18P/fc_002/forecast/GRIDHSTEUROC25+0003'

## Provider archive DSI/ksh (fourni par le package **olive**)

Attributs classiques :

* **vapp** : Déjà évoqué,
* **vconf** : Déjà évoqué,
* **suite** : ``oper``, ``dble`` ou ``mirr``
* **member** : Numéro de membre optionnel (ne fonctionne pas pour toutes les ressources)
* **namespace** : ``[suite].[cache|archive|multi].fr``
* **block** : Sous-répertoire de stockage (optionnel dans la très grande majorité des cas)

In [14]:
rhandlers = toolbox.input(# Method/Section
                          loglevel='warning', role='InitialCondition', intent='inout',
                          # Resource
                          term=3, kind='gridpoint', origin='historic', nativefmt='grib',
                          # Provider
                          member=2, suite='oper', namespace='[suite].archive.fr',
                          # Container
                          local='GRIB_[geometry:area]_[member%04d]+[term:fmthm]', format='grib')
rhandlers[0].locate()

'meunierlf@hendrix.meteo.fr:/home/m/mxpt/mxpt001/pearp/oper/01/r18/fc_DH_2_EUROC25_0003'

## Provider Genv (fourni par le package **gco**)

Attributs classiques :

* **genv** : Numéro de cycle au sens de GCO (voir la présentation de Gaëlle cet après-midi)

NB: Les ressources doivent être prévues à cet effet (généralement, hériter des classes adhoc + définir un attribut **gvar**)



## Provider Uenv (fourni par le package **gco**)

Il s'agit d'un *Genv* détourné pour:

* permettre à un utilisateur d'archiver/récupérer des constantes pour des cycles non encore opérationnels
* pour des cycles opérationnels, permettre à l'utilisateur de modifier lourdement les constantes (cadre R&D uniquement)

Les attributs sont exactement les mêmes que ceux de _genv_ mais la "forme" du cycle est très différente (l'idée est que le passage de _Uenv_ à _Genv_ soit le plus transparent possible).


In [15]:
import common
class MyDemoResource(common.data.consts.GenvModelResource):
    _footprint = dict(
        info = 'Demo constant file',
        attr = dict(kind = dict(values  = [ 'democst' ]),
                    gvar = dict(default = 'demo_cstfile'), )
    )

    @property
    def realkind(self):
        return 'democst'


rh_uenv= toolbox.input(role='DemoConstant',
                       model='arpege', kind='democst',
                       genv='uenv:cy00_demo.01@ugetdemo',
                       local='the_demo_cst')
# Temporarily decrease the logging level
with bronx.fancies.loggers.contextboundGlobalLevel('WARNING'):
    print(rh_uenv[0].locate())

/home/meunierlf/.vortexrc/hack/uget/ugetdemo/data/demo.constant.01;/home/meunierlf/cache/uget/ugetdemo/data/demo.constant.01;meunierlf@hendrix.meteo.fr:~meunierlf/ugetdemo/uget/data/a/demo.constant.01



Questions éventuelles : *vortex.support@meteo.fr*