# Preparazione dei Dati
## Importa le librerie necessarie

In [5]:
import tabulate as tb
import matplotlib
import numpy as np
import pandas as pd


# Adatto l'output stampato a schermo alla larghezza attuale della finestra
from IPython.display import HTML, display

display(HTML("<style>.container { width:100% !important; }</style>"))
pd.set_option("display.width", 1000)

# Cambio la palette dei colori standard per adattarli alla palette del sito
# definire i colori specificati dall'utente
colors = ["#0077b5", "#7cb82f", "#dd5143", "#00aeb3", "#8d6cab", "#edb220", "#262626"]

# cambiare la palette di colori di default
matplotlib.rcParams["axes.prop_cycle"] = matplotlib.cycler(color=colors)

## Carica i dati da file o da una fonte di dati esterna o interna

In [None]:
https://www.kaggle.com/datasets/uciml/default-of-credit-card-clients-dataset
df = pd.read_csv("UCI_Credit_Card.csv", sep=",", encoding="utf-8")

## Esplora e comprendi la struttura e le caratteristiche dei dati

In [None]:
# Visualizza le prime righe del dataframe
df.head()

# Visualizza le informazioni sul dataframe, come il numero di righe, colonne, tipi di dati e valori nulli
df.info()

# Visualizza le statistiche descrittive del dataframe, come la media, la deviazione standard, i valori minimi e massimi
df.describe()

# Mostra l'asimmetria della distribuzione delle colonne numeriche
df.skew()

# Mostra la curtosi della distribuzione delle colonne numeriche
df.kurt()

# Visualizza la frequenza delle modalità delle colonne categoriche
df.value_counts() 

# Visualizza il numero di valori unici per ogni colonna
df.nunique()

## Effettua la pulizia dei dati, come la gestione dei valori mancanti o la correzione degli errori

In [None]:
# Identifica le colonne con valori mancanti
missing_cols = df.columns[df.isnull().any()]

# Visualizza il numero e la percentuale di valori mancanti per ogni colonna
for col in missing_cols:
    num_missing = df[col].isnull().sum()
    pct_missing = num_missing / len(df) * 100
    print(f"{col}: {num_missing} ({pct_missing:.2f}%)")

## Effettua la normalizzazione, la standardizzazione o altre trasformazioni dei dati, se necessario

---
# Analisi esplorativa dei dati
## Visualizza e riassumi i dati utilizzando grafici, tabelle e statistiche descrittive


## Identifica pattern, tendenze o anomalie nei dati


## Esegui analisi delle correlazioni tra le variabili


## Utilizza tecniche di visualizzazione dei dati per presentare informazioni chiave

---
# Preparazione dei dati per il modello
## Effettua la divisione dei dati in set di addestramento e set di test

## Applica tecniche di selezione delle caratteristiche o riduzione della dimensionalità, se necessario

## Gestisci eventuali sbilanciamenti di classe nei dati, ad esempio tramite campionamento o pesatura

---
# Creazione e addestramento del modello
## Scegli l'algoritmo di machine learning o di data science appropriato per il tuo problema


## Configura gli iperparametri del modello


## Addestra il modello utilizzando il set di addestramento


## Valuta le prestazioni del modello utilizzando metriche appropriate

---
# Ottimizzazione del modello
## Esegui l'ottimizzazione degli iperparametri del modello(ricerca a griglia, ricerca casuale, ricerca bayesiana)

## Valuta le prestazioni del modello ottimizzato utilizzando metriche aggiuntive o convalida incrociata

## Effettua eventuali modifiche o regolazioni al modello per migliorarne le prestazioni

---
# Valutazione del modello
## Valuta il modello utilizzando il set di test o altre metriche di valutazione appropriate

## Analizza e interpreta i risultati del modello

## Identifica i punti di forza e di debolezza del modello e considera eventuali miglioramenti

---
# Presentazione dei risultati
## Crea visualizzazioni chiare e informative per presentare i risultati e le conclusioni

## Documenta il processo, le decisioni prese e le sfide affrontate durante il progetto

## Spiega i passaggi chiave e le scelte effettuate all'interno del notebook utilizzando commenti, markdown e annotazioni

## Fornisci una conclusione sintetica e un riepilogo dei risultati ottenuti