# Riammissione Pazienti Diabetici

Il numero di riammissioni ospedaliere per alcune patologie viene considerato un importante indicatore di qualità di un ospedale, oltre ad impattare in modo pesante sul budget destinato alla sanità.

A causa della privacy trovare un buon dataset è difficile: in assenza di dati reali ci siamo basati su un dataset pubblico, reperibile al link https://archive.ics.uci.edu/ml/datasets/diabetes+130-us+hospitals+for+years+1999-2008# e che copre i dati di ricovero relativi a pazienti diabetici in 130 ospedali statunitensi, durante un periodo di 10 anni (1999 - 2008).

### Tipi di feature nel dataset
Sono registrati 101766 ricoveri unici, fatti da 71518 pazienti differenti, con feature di diverso tipo: 
* dati anagrafici (sesso, fascia di età, peso)
* tipo di ammissione / dimissione / tempo di permanenza in ospedale
* reparto di ammissione
* numero di esami / operazioni / medicazioni effettuati sul paziente
* numero di visite al pronto soccorso / visite specialistiche / ricoveri nell'anno precedente
* numero di diagnosi effettuate sul paziente durante il ricovero
* codice identificativo delle prime tre diagnosi secondo il codice ICD https://en.wikipedia.org/wiki/International_Classification_of_Diseases 
* tipo di reparto dove è avvenuto il ricovero
* terapia farmacologica, viene indicato se un farmaco è stato usato e come il dosaggio è cambiato nel tempo (stabile, crescente, decrescente)
* cambio di terapia diabetica (dosaggio o farmaco)
* utilizzo di terapia diabetica
* valori glicemia nel sangue, divisi in range ( > 200, > 300, Normale) ed eventualmente "None" se l'esame non è stato effettuato
* valori del test A1C, divisi per range ( > 7 %, > 8 %, Normale) ed eventualmente "None" se l'esame non è stato effettuato

**Il campo più importante è quello che indica se il paziente è stato nuovamente ricoverato entro 30 giorni, oltre i 30 giorni o se non è mai stato riammesso in ospedale: sarà oggetto del nostro modello predittivo.**

### Preprocessing dei dati
Alla base di un buon modello di ML si trovano 

In [9]:
import pandas as pd

original = pd.read_csv('demo_dataset.csv')
cleaned = pd.read_csv('demo_dataset_cleaned.csv')

In [10]:
X = original.sample(10)
ids = X['patient_nbr'].unique()
cleaned_X = cleaned.loc[cleaned['patient_nbr'].isin(ids)]

In [11]:
data = cleaned_X.drop(['readmitted', 'patient_nbr', 'encounter_id'], axis = 1)

In [12]:
scoring_uri = "http://51219778-b190-4555-8416-bb15bcba4112.westeurope.azurecontainer.io/score"
import requests
import json

scoring_dataset = data.values.tolist()
# Convert the array to a serializable list in a JSON document
input_json = json.dumps({"data": scoring_dataset})

# Set the content type
headers = { 'Content-Type':'application/json' }

predictions = requests.post(scoring_uri , input_json, headers = headers)
predicted_classes = json.loads(predictions.json())

for i in range(len(scoring_dataset)):
    print ("Patient {}".format([i]), predicted_classes[i] )

Patient [0] not readmitted
Patient [1] not readmitted
Patient [2] not readmitted
Patient [3] not readmitted
Patient [4] not readmitted
Patient [5] not readmitted
Patient [6] not readmitted
Patient [7] not readmitted
Patient [8] not readmitted
Patient [9] not readmitted
