Skip to content
Ce package R a été conçu pour faciliter la lecture, le chargement et l'exploitation des données du PMSI.
R
Branch: master
Clone or download

Latest commit

Fetching latest commit…
Cannot retrieve the latest commit at this time.

Files

Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
R rsf 19,20, rum 120, remove warning as_tibble et tibble tdiag May 14, 2020
data rsf 19,20, rum 120, remove warning as_tibble et tibble tdiag May 14, 2020
docs update docs Feb 2, 2020
inst Ajout ana_r Feb 1, 2020
man roxygen document et NAMESPACE pour irsf May 14, 2020
tests adezip2 n'est plus qu'un wrapper de adezip. Adezip a un nouveau param… Dec 28, 2017
vignettes vvr ++ Feb 2, 2020
.DS_Store format ion Feb 13, 2020
.Rbuildignore fin du carT cells Apr 26, 2019
.gitignore fin du carT cells Apr 26, 2019
CONTRIBUTING.md Première version de Contributing Dec 15, 2017
DESCRIPTION ajout vignette ana_r Feb 1, 2020
LICENSE Initial commit Jan 19, 2017
NAMESPACE roxygen document et NAMESPACE pour irsf May 14, 2020
NEWS.md Ajout ana_r Feb 1, 2020
README.md Ajout ana_r Feb 1, 2020
_pkgdown.yml update docs Feb 2, 2020
pmeasyr.Rproj enelver quelques warnings et notes au check Jan 4, 2018
rigologo_pmeasyr.png ajout logo readme Sep 7, 2018

README.md

pmeasyr : données PMSI avec R

rigologo

Guillaume Pressiat

1 février 2020

Le développement de ce package a été initié au DIM du siège de l'AP-HP. Il était auparavant hébergé sur le github IM-APHP.

Contenu du package

Ce package contient des fonctions pour :

  • la gestion des archives PMSI en entrée / sortie des logiciels de l'ATIH : dézippage, suppression des archives, voir ici
  • l'import des fichiers des champs PMSI MCO, SSR, HAD, PSY et RSF, voir ici et
  • Administrer les données dans une base de données avec R, voir ici ou
  • Requêter les données aisément, voir ici
  • Valoriser les résumés anonymes PMSI du MCO et de l'HAD, voir ici et

Support documentaire et annexes

  • Un livret numérique en ligne présente le fonctionnement du package et donne des exemples de codes (imports, requêtes, analyses) pour se familiariser à son utilisation.

  • pmeasyr s'inscrit désormais dans un ensemble de packages et de projets pour le PMSI avec R, auquel appartient par exemple le package nomensland.

  • Une page github rassemble toutes les informations autour du package : la documentation, des exemples ainsi que la présentation et le suivi des évolutions avec la partie bloc-notes.

Une vidéo est aussi disponible.

Installation du package

Depuis github avec devtools

# install.packages('devtools')
library(devtools)
install_github('guillaumepressiat/pmeasyr')

Cette commande lance l'installation du package et de ses dépendances.

Installation derrière un proxy

Souvent, les établissements hospitaliers ont mis en place un proxy qui empèche l'installation pratique d'un package sur github. Voici comment faire dans ce cas.

# install.packages('httr')
library(httr)
set_config( use_proxy(
    url = "proxy_url",    # Remplacer proxy_url par l'URL de votre proxy
    port = 8080,
    username = "user",    # Remplacer user par votre nom d'utilisateur du proxy
    password = "password" #Remplacer password par votre nom d'utilisateur du proxy
))

# install.packages('devtools')
library(devtools)
install_github('guillaumepressiat/pmeasyr')

Une autre option dans ce contexte est la configuration définitive des proxys du logiciel R au sein du fichier Renviron.site, voir ici par exemple. En cas de question, n'hésitez pas à ouvrir une issue.

Par exemple, si vous ne connaissez pas votre proxy, vous pouvez faire comme indiqué ici.

Pour commencer

La vignette introductive du package donne des exemples de commandes pour les traitements des données du champ PMSI MCO.

browseVignettes('pmeasyr')

Ou bien consulter la vignette en ligne.

Le pourquoi du package

Ci-après, des arguments en faveur de l'utilisation de R dans le contexte des données PMSI.

Contexte

Les données du Programme de Médicalisation des Systèmes d'Informations (PMSI) sont souvent traitées via des logiciels spécifiques au PMSI (ou des outils statistiques / bases de données du marché) ne permettant pas de réaliser des traitements statistiques et des infographies satisfaisantes. Les départements d'information médicale sont donc souvent amenés à retraiter ces données avec R.

L'évolution récente de R intègre la manipulation de bases de données de taille importante. Le package pmeasyr s'inscrit dans cette veine et permet de réaliser de façon autonome l'ensemble des traitements (de l'import des données à leur analyse) avec R.

Avantages de R

Un flux de travail unique

En travaillant uniquement avec R, on peut mettre en place un flux de travail épuré : un seul projet, un seul programme, un seul logiciel. La traçabilité, la reproductibilité et la mise à jour des opérations sont ainsi facilitées.

Le travail avec de multiples logiciels oblige à l'export / import de fichiers entre les différents logiciels, et chaque modification du début du flux de travail génère des fichiers exportés v1, v2, ...

Avec un flux complet dans R, toute nouvelle modification est intégrée au processus de travail global. La localisation de toutes les étapes d'une analyse en un seul point évite les erreurs et la confusion lorsque l'on reprend l'analyse ultérieurement.

R et le PMSI

L'utilisation de R confère aux données du PMSI la liberté proposée par le logiciel :

  • les requêtes sur les diagnostics et les actes peuvent s'écrire de multiples façons et c'est l'utilisateur qui crée ses propres programmes
  • les données sont dans R : prêtes pour des modèles linéaires, logistiques, des classifications...
  • la confrontation des données in* (reflet du codage des établissements) aux données out* (reflet de la valorisation accordée à l'établissement) est facilitée par l'import du fichier tra (cf vignette), cela peut permettre aux équipes DIM d'améliorer leur recueil
  • le reporting de l'activité en excel, pdf, word, html, ou en créant des applications (shiny)
  • l'utilisation des graphiques pour représenter des volumes d'activités et des cartographies interactives pour visualiser la localisation d'activités, de patientèles, et les flux de patients
  • le partage de projets RStudio, qui facilite et encourage les travaux en équipe.

*NB: Données In / Out : données en entrée / sortie des logiciels de l'ATIH

Des outils performants

L'engouement autour de R est lié au développement de packages intuitifs et performants : readr, dplyr, tidyr, magrittr, pour n'en citer que quelques-uns. pmeasyr s'appuie sur ces packages pour proposer des imports de données rapides sur des fichiers de taille importante (l'entité juridique de l'AP-HP est prise en charge sans problème avec un ordinateur récent).

Dans le cas de pmeasyr, l'import de 100 000 rsa (partie fixe, parsing des passages unités médicales, des diagnostics associés et des actes) nécessite en moyenne 5 secondes avec un processeur i7 -- 16Go de ram.

En dernier ressort, R travaillant en mémoire vive, les exécutions de requêtes sont très rapides.


You can’t perform that action at this time.