# Predizione di opportunità di Cross Sell di assicurazioni

Il cliente è una compagnia di assicurazioni che ha fornito un'assicurazione sanitaria ai suoi clienti, adesso hanno bisogno del tuo aiuto per costruire un modello predittivo in grado di prevedere se gli assicurati dell'anno passato potrebbero essere interessati ad acquistare anche un'assicurazione per il proprio veicolo.

Il dataset è composto dalle seguenti proprietà:
- **id**: id univoco dell'acquirente.
- **Gender**: sesso dell'acquirente.
- **Age**: età dell'acquirente.
- **Driving_License**: 1 se l'utente ha la patente di guida, 0 altrimenti.
- **Region_Code**: codice univoco della regione dell'acquirente.
- **Previously_Insured**: 1 se l'utente ha già un veicolo assicurato, 0 altrimenti.
- **Vehicle_Age**: età del veicolo
- **Vehicle_Damage**: 1 se l'utente ha danneggiato il veicolo in passato, 0 altrimenti.
- **Annual_Premium**: la cifra che l'utente deve pagare come premio durante l'anno.
- **Policy_Sales_Channel**: codice anonimizzato del canale utilizzato per la proposta (es. per email, per telefono, di persona, ecc...)
- **Vintage**: numero di giorni dalla quale l'utente è cliente dell'azienda.
- **Response**: 1 se l'acquirente ha risposto positivametne alla proposta di vendità, 0 altrimenti.

L'obiettivo del modello è prevedere il valore di **Response** in base al valore delle altre proprietà

## Dipendenze

In [None]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import tensorflow as tf
from sklearn.feature_selection import mutual_info_classif
from tensorboard.plugins.hparams import api as hp
from tensorflow.keras.callbacks import Callback
from tensorflow.keras.models import load_model
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
from sklearn.linear_model import LogisticRegression
import seaborn as sns
from datetime import datetime

In [None]:
pd.set_option('display.max_rows', 300)
plt.rcParams["figure.figsize"] = (60,15)
plt.rcParams['font.size'] = 14

## Scarichiamo il Dataset
Il dataset è disponibile su Kaggle a [questo indirizzo](https://www.kaggle.com/anmolkumar/health-insurance-cross-sell-prediction). Per scaricarlo usiamo direttamente le API di Kaggle. Creiamo il file json di autenticazione con il nostro nome utente Kaggle e la chiave.

In [None]:
!mkdir ~/.kaggle/
!echo '{"username":"guizard","key":"9b4890694553490c6c688d77c3048922"}' > ~/.kaggle/kaggle.json
!chmod 600 ~/.kaggle/kaggle.json

mkdir: cannot create directory ‘/root/.kaggle/’: File exists


Ora scarichiamo il dataset

In [None]:
!kaggle datasets download anmolkumar/health-insurance-cross-sell-prediction

health-insurance-cross-sell-prediction.zip: Skipping, found more recently modified local copy (use --force to force download)


ed estraiamo lo zip scaricato

In [None]:
!unzip health-insurance-cross-sell-prediction.zip
!ls

Archive:  health-insurance-cross-sell-prediction.zip
replace sample_submission.csv? [y]es, [n]o, [A]ll, [N]one, [r]ename: health-insurance-cross-sell-prediction.zip  sample_submission.csv  train.csv
sample_data				    test.csv
