Skip to content

Informations sur les extractions RPPS et MSSanté (version T3 2018)

License

Notifications You must be signed in to change notification settings

flrt/ref-rpps-ne

Repository files navigation

Informations sur le RPPS

Le projet analyse

  • la nouvelle extraction publique du RPPS, disponible sur le site annuaire.sante.fr;
  • la nouvelle extraction publique de la MSSanté, disponible sur le site annuaire.sante.fr

Il effectue les actions suivantes (en fonction de la configuration) :

  • téléchargement de la version actuelle (zip+extraction)
  • calcul de la différence avec la version précédente
  • production d'un flux d'informations Atom/RSS avec des données de suivi (générales et plus spécifiques)
  • production pour chaque fichier, de fichiers résultant de l'analyse

Deux fichiers RSS2 et Atom sont disponibles sur la page dédiée opikanoba.org/feeds, permettant de voir ce qui est produit.

Structure du projet

Structure minimale

Pour démarrer aucun fichier n'est nécessaire. Voir la commande avec docker. La structure est la suivante :

  • repertoire log : logs
  • repertoire conf : la configuration
  • repertoire files : les fichiers telechargés et de travail (sha des fichiers, fichiers index, fichiers diff)

Structure complète

La structure est la suivante :

  • répertoire cert : fichiers contenant les fichiers permettant de faire les requetes https
  • repertoire log : logs
  • répertoire default : fichiers de configuration par défaut
  • repertoire conf : la configuration
  • répertoire feed : contient les fichiers RSS2 et Atom produits
  • repertoire files : les fichiers telechargés et de travail (sha des fichiers, fichiers index, fichiers diff)
  • répertoire test : tests
  • à la racine les fichiers *.py

Configuration

La configuration du projet par défaut permet de produire :

  • des fichiers de différences : un contenant les numéros de lignes ayant changées (index_<nom fichier original>), un contenant les lignes complètes (new_<nom fichier original>)

  • des fichiers `json d'informations de données principalement axés sur des statistiques en lien avec les adresses mail MSSanté :

    • top 10 des domaines MSSanté
    • suivi du nombre de mail MSSanté par CHU
    • suivi du nombre de mail MSSanté dans des groupements d'établissements (GHT)

Configuration RPPS

Le fichier de configuration `config-rpps.json est pris en compte dans le répertoire conf. S'il est absent, le programme en initialise un. Il contient :

  • des informations sur la date du dernier fichier analysé
  • des données de configuration locale
  • l'URL de publication des fichiers RSS/Atom
  • des données de configuration sur les données à suivre

Configuration MSSanté

Le même principe est appliqué que sur config-rpps.json est appliqué sur config-mssante.json.

Configuration d'upload des données

Le fichier de configuration ftp-data.json` permet d'uploader par FTP sur un site distant les données produites. Les fichiers pouvant être uploadé :

  • fichier d'index des nouveautés : fichiers index_*.txt
  • fichier des différences contenant les données : fichiers new_*.txt
  • fichiers de suivi : `*.json

Si le fichier de configuration n'est pas présent dans le répertoire conf, les fichiers restent en local.

Le fichier de configuration `ftp-feed.json permet d'uploader par FTP les fichiers RSS2 et Atom produits. Si le fichier n'est pas présent dans le répertoire conf, aucune action d'upload n'est faite.

Exécution sans docker

Après avoir cloner le projet, le fichier run.sh contient les commandes de lancement de l'analyse RPPS et MSSanté.

Un simple

sh run.sh 

Pour paramétrer le lancement et connaitre les paramètres :

$ python3.6 lookout.py
/!\ Aucune action définie !

usage: lookout.py [-h] [--config CONFIG] [--feedftp FEEDFTP]
              [--dataftp DATAFTP] [--zip ZIP] [--txt TXT] [--stat STAT]

optional arguments:
  -h, --help         show this help message and exit
  --config CONFIG    fichier de parametres
  --feedftp FEEDFTP  configuration FTP pour upload du flux ATOM, format JSON
  --dataftp DATAFTP  configuration FTP pour upload des données, format JSON
  --zip ZIP          Fichier ZIP contenant l'extraction RPPS ou MSSante
  --txt TXT          Fichier texte contenant l'extraction RPPS ou MSSante
                     (pour stats)
 --stat STAT        Affiche les stats

Execution avec docker

Le conteneur est nommé ref-rpps-ne dans docker hub. Pour lancer l'analyse, il suffit de créer un répertoire d'accueil des fichiers produits :

mkdir rpps-mssante
cd rpps-mssante

et de lancer

docker run -t --rm -v "$PWD"/log:/opt/log  \
            -v "$PWD"/conf:/opt/conf \
            -v "$PWD"/files:/opt/files \
            flrt/ref-rpps-ne sh run.sh

Cette commande permet de lancer l'analyse des fichiers RPPS et MSSanté en utilisant les répertoires locaux dans lesquels seront stockés :

La commande peut être lancée sans aucune donnée de configuration. Les données de configuration peuvent être changées par la suite pour être prises en compte.

Informations techniques:

  • génération flux RSS : utilisation du projet atom_to_rss2
  • génération flux Atom : utilisation du projet atom_gen
  • upload flux RSS + donnees sur FTP : utilisation du projet atom_gen
  • utilisation de pandas pour l'exploitation des données

Licence

MIT pour le code

CC BY-SA 3.0 FR pour le contenu ATOM

About

Informations sur les extractions RPPS et MSSanté (version T3 2018)

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published