# Équipements matériels lourds ET SAN

In [None]:
import pandas as pd
import numpy as np
from sqlalchemy.engine import create_engine

In [None]:
df = pd.read_xml(
  path_or_buffer='../../data_test/finess/enrichi/finess_cs1400104_stock_20211214-0345.xml',
  xpath='./equipmateriellourd'
)
equipements_materiels_lourds = df[[
  'nofinessej', 'nofinesset', 'eml', 'libeml', 'noautorarhgos', 'dateautor', 'datemeo', 'datefin',
  'datemaj', 'noimplarhgos'
]]
equipements_materiels_lourds

## Combien d'équipements matériels lourds a-t-on ?

In [None]:
nombre_dequipements_materiels_lourds = equipements_materiels_lourds['nofinesset'].nunique()
print(f"Il y a {nombre_dequipements_materiels_lourds} équipements matériels lourds dans le fichier XML")

### Par établissement et eml

In [None]:
equipements_materiels_lourds_par_numero_finess = equipements_materiels_lourds.groupby(['nofinesset'])['eml'].nunique()
equipements_materiels_lourds_par_numero_finess.describe()

In [None]:
equipements_materiels_lourds_par_numero_finess.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
equipements_materiels_lourds_par_numero_finess.hist()

### Par établissement, eml et autorisation ARHGOS

In [None]:
activites_par_eml = equipements_materiels_lourds.groupby(['nofinesset', 'eml'])['noautorarhgos'].nunique()
activites_par_eml.describe()

In [None]:
activites_par_eml.quantile(np.linspace(0.1, 0.9, 9))

In [None]:
activites_par_eml.hist(bins=50)

### Doublons d'autorisation ARHGOS

In [None]:
doublon = equipements_materiels_lourds.duplicated('noautorarhgos').sum()
if doublon == 0:
  print(f"Il n'y a pas de doublon")
else:
  print(f"Il y a des doublons")

## Comparaison avec notre référentiel d'établissements

In [None]:
connection = create_engine('postgresql://helios:h3li0s@localhost:5432/helios')
établissements_sanitaires_en_base = pd.read_sql_query(
    '''
    SELECT numero_finess_etablissement_territorial
    FROM etablissement_territorial
    WHERE etablissement_territorial.domaine = 'Sanitaire'
    ''',
    connection
)
nombre_et_san_bdd = len(établissements_sanitaires_en_base)
nombre_et_san_bdd

In [None]:
connection = create_engine('postgresql://helios:h3li0s@localhost:5432/helios')
établissements_médico_sociaux_en_base = pd.read_sql_query(
    '''
    SELECT numero_finess_etablissement_territorial
    FROM etablissement_territorial
    WHERE etablissement_territorial.domaine = 'Médico-social'
    ''',
    connection
)
nombre_et_ms_bdd = len(établissements_médico_sociaux_en_base)
nombre_et_ms_bdd

In [None]:
numéros_finess_sanitaires_en_base = set(établissements_sanitaires_en_base['numero_finess_etablissement_territorial'])
numéros_finess_médico_sociaux_en_base = set(établissements_médico_sociaux_en_base['numero_finess_etablissement_territorial'])
numéros_finess_équipements_matériels_lourds = set(equipements_materiels_lourds['nofinesset'])

In [None]:
nombre_et_san_xml = len(numéros_finess_équipements_matériels_lourds.intersection(numéros_finess_sanitaires_en_base))
print(f"{nombre_et_san_xml} établissements sanitaires ont au moins un équipement matériel lourd soit {nombre_et_san_xml / nombre_et_san_bdd * 100} %")

In [None]:
diff = len(numéros_finess_équipements_matériels_lourds.difference(numéros_finess_sanitaires_en_base))
print(f"{diff} ayant un équipement matériel lourd mais pas d'établissement en base de données")

In [None]:
nombre_et_ms_xml = len(numéros_finess_équipements_matériels_lourds.intersection(numéros_finess_médico_sociaux_en_base))
print(f"{nombre_et_ms_xml} établissements médico-sociaux ont au moins un équipement matériel lourd soit {nombre_et_ms_xml / nombre_et_ms_bdd * 100} %")

In [None]:
if nombre_et_san_xml + diff + nombre_et_ms_xml == nombre_dequipements_materiels_lourds:
  print(f"Le compte est bon")
else:
  print(f"⚠ Il y a une incohérence")

## Vérification que les numéros d'implémentation et numéros d'autorisation ARGHOS sont toujours les mêmes

In [None]:
diff = (~(equipements_materiels_lourds['noautorarhgos'] == equipements_materiels_lourds['noimplarhgos'])).sum()
if diff == 0:
  print(f"Aucune différence")
else:
  print(f"⚠ Il y a des différences")

## Vérification des valeurs manquantes

In [None]:
equipements_materiels_lourds.isna().sum()

In [None]:
numéro_finess = equipements_materiels_lourds.loc[equipements_materiels_lourds['datefin'].isna(), 'nofinessej']
print(f"⚠ Nous nous apercevons qu'il ne manque aucune donnée sauf la date de fin pour le numéro FINESS {numéro_finess[619]}")