# Parcours de soins des patients

Ce notebook permet de générer la liste des parcours de soins des patients, à partir de la base de données "hospitalisation". En particulier, on s'intéresse ici à la base de données où l'on a supprimé les hospitalisations non chroniques.

In [1]:
import pandas as pd
import numpy as np
from tqdm import tqdm
import os
import csv
import time

In [2]:
data=pd.read_csv("base_hospit_non_chr_anonyme.csv")

  data=pd.read_csv("base_hospit_non_chr_anonyme.csv")


## Nombre d'hospitalisation par patients

In [3]:
nb_hospit=data.groupby("BEN_NIR_IDT").count()
nb_hospit=nb_hospit[["RSA_NUM"]]
nb_hospit.rename(columns={"RSA_NUM": "NB_HOSPIT"})

Unnamed: 0_level_0,NB_HOSPIT
BEN_NIR_IDT,Unnamed: 1_level_1
P0,9
P10001,9
P10003,3
P10004,8
P10006,1
...,...
P9984,4
P9985,1
P9987,76
P999,1


## Création du dataframe des parcours de soins des patients

In [4]:
patients=data["BEN_NIR_IDT"].drop_duplicates()

In [5]:
dates=data['EXE_SOI_DTD'].drop_duplicates().dropna().reset_index(drop=True).sort_values()
p_soins=pd.DataFrame(columns=dates, index=patients)

In [6]:
p_soins

EXE_SOI_DTD,2008-01-15,2008-02-15,2008-03-15,2008-04-15,2008-05-15,2008-06-15,2008-07-15,2008-08-15,2008-09-15,2008-10-15,...,2018-12-19,2018-12-20,2018-12-21,2018-12-22,2018-12-24,2018-12-25,2018-12-26,2018-12-27,2018-12-28,2018-12-29
BEN_NIR_IDT,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
P0,,,,,,,,,,,...,,,,,,,,,,
P6,,,,,,,,,,,...,,,,,,,,,,
P8,,,,,,,,,,,...,,,,,,,,,,
P13,,,,,,,,,,,...,,,,,,,,,,
P16,,,,,,,,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
P24302,,,,,,,,,,,...,,,,,,,,,,
P24303,,,,,,,,,,,...,,,,,,,,,,
P24304,,,,,,,,,,,...,,,,,,,,,,
P24308,,,,,,,,,,,...,,,,,,,,,,


In [7]:
for i in tqdm(range(len(data))):
    patient=data.iloc[i].BEN_NIR_IDT
    ghm=data.iloc[i].GRG_GHM
    date=data.iloc[i].EXE_SOI_DTD
    p_soins.loc[patient, date]=ghm

100%|██████████| 85594/85594 [00:35<00:00, 2419.28it/s]


In [8]:
p_soins=p_soins.drop(columns=np.NaN)
p_soins

EXE_SOI_DTD,2008-01-15,2008-02-15,2008-03-15,2008-04-15,2008-05-15,2008-06-15,2008-07-15,2008-08-15,2008-09-15,2008-10-15,...,2018-12-19,2018-12-20,2018-12-21,2018-12-22,2018-12-24,2018-12-25,2018-12-26,2018-12-27,2018-12-28,2018-12-29
BEN_NIR_IDT,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
P0,,,,,,,,,,,...,,,,,,,,,,
P6,,,,,,,,,,,...,,,,,,,,,,
P8,,,,,,,,,,,...,,,,,,,,,,
P13,,,,,,,,,,,...,,,,,,,,,,
P16,,,,,,,,,,08C11V,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
P24302,,,,,,,,,,04M05V,...,,,,,,,,,,
P24303,,,,,,,,,,,...,,,,,,,,,,
P24304,,,,,,,,,,,...,,,,,,,,,,
P24308,,,,,,,,,,,...,,,,,,,,,,


## Export des parcours de soins au format csv

In [9]:
p_soins.to_csv("./data/parcours_soins.csv")