# 📊 Exploratory Data Analysis (EDA)
Questo notebook esegue l'analisi esplorativa dei dati (EDA) per il progetto **AI Credit Risk Analytics**.


In [None]:
# Import delle librerie
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Caricamento dei dati
df = pd.read_csv("../data/german_credit.csv")

# Mostra le prime righe del dataset
df.head()


In [None]:
# Informazioni generali sui dati
df.info()
df.describe()


In [None]:
# Controlliamo la distribuzione delle variabili categoriche
categorical_cols = df.select_dtypes(include=['object']).columns

for col in categorical_cols:
    plt.figure(figsize=(8, 4))
    sns.countplot(x=col, data=df)
    plt.xticks(rotation=45)
    plt.title(f"Distribuzione della variabile {col}")
    plt.show()


In [None]:
# Matrice di correlazione per le feature numeriche
plt.figure(figsize=(10, 6))
sns.heatmap(df.corr(), annot=True, cmap="coolwarm", fmt=".2f")
plt.title("Matrice di Correlazione")
plt.show()


In [None]:
# Analisi dei valori nulli
missing_values = df.isnull().sum()
missing_values = missing_values[missing_values > 0]

if not missing_values.empty:
    print("Valori nulli trovati:")
    print(missing_values)
else:
    print("Nessun valore nullo nel dataset.")
