# Exemple d'API de flux

La [classe sarracenia.flow](../Reference/code.html#module-sarracenia.flow) fournit un filtrage d'acceptation/rejet intégré pour les messages, prend en charge le téléchargement intégré dans plusieurs protocoles, réessaye en cas d'échec et permet la création de rappels pour personnaliser le traitement.

Vous devez fournir une configuration comme argument lors de l'instanciation d'un abonné. 
La _sarracenia.config.no_file_config()_ renvoie une configuration vide sans consulter 
l'arborescence des fichiers de configuration sr3.

Après avoir apporté les modifications nécessaires à la configuration, l'abonné est alors initié et exécuté.

In [1]:
!mkdir /tmp/flow_demo

Créer un répertoire pour les fichiers que vous allez télécharger. La racine de l'arborescence de répertoires doit exister.

In [1]:
import re
import sarracenia.config
from sarracenia.flow.subscribe import Subscribe
import sarracenia.flowcb
import sarracenia.credentials

cfg = sarracenia.config.no_file_config()

cfg.broker = sarracenia.credentials.Credential('amqps://anonymous:anonymous@hpfx.collab.science.gc.ca')
cfg.topicPrefix = [ 'v02', 'post']
cfg.component = 'subscribe'
cfg.config = 'flow_demo'
cfg.bindings = [ ('xpublic', ['v02', 'post'], ['*', 'WXO-DD', 'observations', 'swob-ml', '#' ]) ]
cfg.queueName='q_anonymous.subscriber_test2'
cfg.download=True
cfg.batch=1
cfg.messageCountMax=5

# set the instance number for the flow class.
cfg.no=0

# set flow class to put working files in ~/.cache/sr3/subscrribe/flow_demo directory.
cfg.pid_filename = sarracenia.config.get_pid_filename( None, cfg.component, cfg.config, 0)

# accept/reject patterns:
pattern=".*"
#              to_match, write_to_dir, DESTFN, regex_to_match, accept=True,mirror,strip, pstrip,flatten
cfg.masks= [ ( pattern, "/tmp/flow_demo", None, re.compile(pattern), True, False, False, False, '/' ) ]





## démareurs.
les paramètres du courtier, des liaisons et du nom de la file d'attente sont expliqués dans le bloc-notes de moth.

## cfg.download

Si vous souhaitez que le flux télécharge les fichiers correspondant aux messages. 
Si vrai, il téléchargera les fichiers.

## cfg.batch

Les messages sont traités par lots. Le nombre de messages à récupérer par appel à newMessages() 
est limité par le paramètre _batch_. Nous le définissons ici sur 1 afin que vous puissiez voir chaque fichier téléchargé immédiatement lorsque le message correspondant est téléchargé. vous pouvez laisser ce champ vide et la valeur par défaut est 25. Les paramètres sont une question de goût et de cas d'utilisation.

## cfg.messageCountMax

Normalement, nous laissons ce paramètre à sa valeur par défaut (0) qui n'a aucun effet sur le traitement. 
à des fins de démonstration, nous limitons le nombre de messages que l'abonné traitera avec ce paramètre. 
après la réception de _messageCountMax_ messages, arrêtez le traitement.

## cfg.masks

Les masques sont une forme compilée de directives d'acceptation/rejet. un relPath est comparé à la regex dans le masque. 
Si l'expression régulière correspond et que accept est True, le message est accepté pour un traitement ultérieur. 
Si l'expression régulière correspond, mais accept vaut False, le traitement du message est arrêté (le message est rejeté.)

les masques sont un tuple. la signification peut être recherchée dans la page de manuel sr3(1).

*  pattern_string,      la chaîne d'expression régulière d'entrée, à compiler par les routines.
*  directory,           où mettre les fichiers téléchargés (racine de l'arborescence, lors de la mise en miroir)
*  fn,                  transformation du filename à faire. NONE est utilisé 99% des cas d'utilisation.
*  regex,               version regex compilée de pattern_string
*  accept(True/False),  si le modèle correspond, acceptez le message pour un traitement ultérieur.
*  mirror(True/False),  lors du téléchargement, créez une arborescence complète pour refléter la source, ou videz-la simplement dans le répertoire
*  strip(True/False),   modifier le relpath en supprimant les entrées de la gauche.
*  pstrip(True/False),  entrées de bande basées sur le modèle
*  flatten(char ... '/' signifie ne pas aplatir.) )

## cfg.no, cfg.pid_filename

Ces paramètres sont nécessaires car ils seraient normalement définis par la classe sarracenia.instance 
qui est normalement utilisée pour lancer des flux. Ils permettent de configurer des chemins d'exécution pour retry_queues et des fichiers d'état, 
afin de mémoriser les paramètres si nécessaire entre les exécutions.


In [2]:
subscriber = sarracenia.flow.subscribe.Subscribe( cfg )

subscriber.run()

2022-03-19 13:21:09,354 [INFO] sarracenia.flow loadCallbacks plugins to load: ['sarracenia.flowcb.gather.message.Message', 'sarracenia.flowcb.retry.Retry', 'sarracenia.flowcb.housekeeping.resources.Resources']
2022-03-19 13:21:09,586 [DEBUG] amqp _on_start Start from server, version: 0.9, properties: {'capabilities': {'publisher_confirms': True, 'exchange_exchange_bindings': True, 'basic.nack': True, 'consumer_cancel_notify': True, 'connection.blocked': True, 'consumer_priorities': True, 'authentication_failure_close': True, 'per_consumer_qos': True, 'direct_reply_to': True}, 'cluster_name': 'rabbit@hpfx2.collab.science.gc.ca', 'copyright': 'Copyright (C) 2007-2019 Pivotal Software, Inc.', 'information': 'Licensed under the MPL.  See http://www.rabbitmq.com/', 'platform': 'Erlang/OTP 21.3', 'product': 'RabbitMQ', 'version': '3.7.13'}, mechanisms: [b'AMQPLAIN', b'PLAIN'], locales: ['en_US']
2022-03-19 13:21:09,640 [DEBUG] amqp __init__ using channel_id: 1
2022-03-19 13:21:09,661 [DEBUG]

_Config__admin=None, _Config__broker="...ymous:anonymous@hpfx.collab.science.gc.ca None True True False False None None", _Config__post_broker=None,
accel_threshold=0, acceptSizeWrong=False, acceptUnmatched=False, attempts=3, auto_delete=False, baseDir=None, baseUrl_relPath=False, batch=1,
bindings="...('xpublic', ['v02', 'post'], ['*', 'WXO-DD', 'observations', 'swob-ml', '#'])]", bufsize=1048576, bytes_per_second=None, bytes_ps=0,
cfg_run_dir='.', component='subscribe', config='flow_demo', currentDir=None, debug=False, declared_exchanges=[], declared_users={}, delete=False,
destfn_script=None, directory=None, discard=False, documentRoot=None, download=True, durable=True, env_declared=[], exchange=None, exchangeDeclare=True,
expire=300, fileEvents={'modify', 'delete', 'create', 'link'}, filename='WHATFN', fixed_headers={}, flatten='/', hostdir='fractal', hostname='fractal',
housekeeping=300, imports=[], inflight=None, inline=False, inline_encoding='guess', inline_max=4096, inline_only

2022-03-19 13:21:10,792 [DEBUG] sarracenia.config add_option accel_wget_command declared as type:<class 'str'> value:/usr/bin/wget %s -O %d
2022-03-19 13:21:11,380 [DEBUG] amqp collect Closed channel #1
2022-03-19 13:21:11,380 [INFO] sarracenia.flowcb.gather.message on_stop closing
2022-03-19 13:21:11,381 [INFO] sarracenia.flow close flow/close completed cleanly pid: 2725204 subscribe/flow_demo instance: 0


## Conclusion:

Avec la classe sarracenia.flow, une méthode de fonctionnement asynchrone est prise en charge, elle peut être personnalisée à l'aide de la classe flowcb (rappel de flux) pour introduire un traitement spécifique à des moments spécifiques. C'est comme l'invocation d'une seule instance à partir de la ligne de commande, sauf que toute la configuration est effectuée dans python en définissant des champs cfg, plutôt qu'en utilisant le langage de configuration.

Qu'est-ce qui est perdu par rapport à l'utilisation de l'outil de ligne de commande :

* possibilité d'utiliser le langage de configuration (légèrement plus simple que d'attribuer des valeurs à l'objet cfg) 
* exécution facile de plusieurs instances, 
* surveillance coordonnée des instances (redémarrages en cas d'échec, et nombre programmable d'abonnés démarrés par configuration.) 
* gestion des fichiers journaux.

L'outil de ligne de commande fournit ces fonctionnalités supplémentaires.