# Reconnaissances contractuelles ET SAN

In [None]:
import pandas as pd
import numpy as np
from sqlalchemy.engine import create_engine

In [None]:
df = pd.read_xml(
  path_or_buffer='../../data_test/finess/enrichi/finess_cs1600102_stock_20211214-0417.xml',
  xpath='./activitesoumiseareco'
)
reconnaissances_contractuelles = df[[
  'nofinessej', 'nofinesset', 'idcpom', 'dateeffetcpom', 'datefincpom', 'codeautorarhgos', 'activite',
  'libactivite', 'modalite', 'libmodalite', 'forme', 'libforme', 'dateeffetasr', 'capaciteautorisee'
]]
reconnaissances_contractuelles

## Combien de reconnaissances contractuelles a-t-on ?

In [None]:
nombre_de_reconnaissances_contractuelles = reconnaissances_contractuelles['nofinesset'].nunique()
nombre_de_reconnaissances_contractuelles

### Par établissement et activité

In [None]:
activite_soumise_a_reco_par_numero_finess = reconnaissances_contractuelles.groupby(['nofinesset'])['activite'].nunique()
activite_soumise_a_reco_par_numero_finess.describe()

In [None]:
activite_soumise_a_reco_par_numero_finess.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
activite_soumise_a_reco_par_numero_finess.hist()

### Par établissement, activité et modalité

In [None]:
modalites_par_activite_et_etablissement = reconnaissances_contractuelles.groupby(['nofinesset', 'activite'])['modalite'].nunique()
modalites_par_activite_et_etablissement.describe()

In [None]:
modalites_par_activite_et_etablissement.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
modalites_par_activite_et_etablissement.hist(bins=50)

### Par établissement, activité, modalité et forme

In [None]:
formes_par_modalite_activite_et_etablissement = reconnaissances_contractuelles.groupby(['nofinesset', 'activite', 'modalite'])['forme'].nunique()
formes_par_modalite_activite_et_etablissement.describe()

In [None]:
formes_par_modalite_activite_et_etablissement.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
formes_par_modalite_activite_et_etablissement.hist(bins=10)

### Nombre d'autorisation ARHGOS pour une même forme

In [None]:
autorisations_par_forme_modalite_activite_et_etablissement = reconnaissances_contractuelles.groupby(['nofinesset', 'activite', 'modalite', 'forme'])['codeautorarhgos'].nunique()
autorisations_par_forme_modalite_activite_et_etablissement.describe()

In [None]:
autorisations_par_forme_modalite_activite_et_etablissement.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
autorisations_par_forme_modalite_activite_et_etablissement.hist(bins=10)

## Comparaison avec notre référentiel d'établissements

In [None]:
connection = create_engine('postgresql://helios:h3li0s@localhost:5432/helios')
établissements_sanitaires_en_base = pd.read_sql_query(
    '''
    SELECT numero_finess_etablissement_territorial
    FROM etablissement_territorial
    WHERE etablissement_territorial.domaine = 'Sanitaire'
    ''',
    connection
)
nombre_et_san_bdd = len(établissements_sanitaires_en_base)
nombre_et_san_bdd

In [None]:
connection = create_engine('postgresql://helios:h3li0s@localhost:5432/helios')
établissements_médico_sociaux_en_base = pd.read_sql_query(
    '''
    SELECT numero_finess_etablissement_territorial
    FROM etablissement_territorial
    WHERE etablissement_territorial.domaine = 'Médico-social'
    ''',
    connection
)
nombre_et_ms_bdd = len(établissements_médico_sociaux_en_base)
nombre_et_ms_bdd

In [None]:
numéros_finess_sanitaires_en_base = set(établissements_sanitaires_en_base['numero_finess_etablissement_territorial'])
numéros_finess_médico_sociaux_en_base = set(établissements_médico_sociaux_en_base['numero_finess_etablissement_territorial'])
numéros_finess_reconnaissances_contractuelles = set(reconnaissances_contractuelles['nofinesset'])

In [None]:
nombre_et_san_xml = len(numéros_finess_reconnaissances_contractuelles.intersection(numéros_finess_sanitaires_en_base))
print(f"{nombre_et_san_xml} établissements sanitaires ont au moins une reconnaissance contractuelle soit {nombre_et_san_xml / nombre_et_san_bdd * 100} %")

In [None]:
diff = len(numéros_finess_reconnaissances_contractuelles.difference(numéros_finess_sanitaires_en_base))
print(f"{diff} ayant une reconnaissance contractuelle mais pas d'établissement en base de données")

In [None]:
nombre_et_ms_xml = len(numéros_finess_reconnaissances_contractuelles.intersection(numéros_finess_médico_sociaux_en_base))
print(f"{nombre_et_ms_xml} établissements médico-sociaux ont au moins une reconnaissance contractuelle soit {nombre_et_ms_xml / nombre_et_ms_bdd * 100} %")

In [None]:
if nombre_et_san_xml + diff + nombre_et_ms_xml == nombre_de_reconnaissances_contractuelles:
  print(f"Le compte est bon")
else:
  print(f"⚠ Il y a une incohérence")

## Vérification des valeurs manquantes

In [None]:
reconnaissances_contractuelles.isna().sum()

In [None]:
dateeffetcpom = reconnaissances_contractuelles.loc[reconnaissances_contractuelles['dateeffetcpom'].isna(), 'nofinessej']
datefincpom = reconnaissances_contractuelles.loc[reconnaissances_contractuelles['datefincpom'].isna(), 'nofinessej']
dateeffetasr = reconnaissances_contractuelles.loc[reconnaissances_contractuelles['dateeffetasr'].isna(), 'nofinessej']
capaciteautorisee = reconnaissances_contractuelles.loc[reconnaissances_contractuelles['capaciteautorisee'].isna(), 'nofinessej']
print(f"⚠ Il manque {len(dateeffetcpom)} dates d’effet du CPOM")
print(f"⚠ Il manque {len(datefincpom)} dates de fin du CPOM")
print(f"⚠ Il manque {len(dateeffetasr)} dates d’effet de l’ASR")
print(f"⚠ Il manque {len(capaciteautorisee)} capacités autorisées")