In [None]:
# Cell 1: Imports
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# (คุณต้อง pip install fairvis)
# from fairvis import adapters, visuals

# Set plot style
sns.set_style('whitegrid')
pd.set_option('display.max_columns', None)

# ---

# Cell 2: Load Data
try:
    df = pd.read_csv("../data/raw/application_train.csv")
    print(f"Data loaded successfully: {df.shape}")
except FileNotFoundError:
    print("Error: ไม่พบไฟล์ application_train.csv ใน data/raw/")
    print("โปรดรัน 'src/train.py' ก่อน 1 ครั้งเพื่อให้มันดาวน์โหลดข้อมูลมา")
    
df.head()

# ---

# Cell 3: Basic Info
df.info()
df.describe()

# ---

# Cell 4: Target Distribution (ดูความไม่สมดุลของข้อมูล)
plt.figure(figsize=(8, 5))
sns.countplot(x='TARGET', data=df)
plt.title('Target Variable Distribution (0 = No Default, 1 = Default)')
plt.show()
print(df['TARGET'].value_counts(normalize=True))
# (ผลลัพธ์จะแสดงว่าข้อมูล Imbalanced มาก)

# ---

# Cell 5: EDA & Bias Analysis (ตามโจทย์)
# ตัวอย่าง: วิเคราะห์อัตราการผิดนัดชำระหนี้ (TARGET) เทียบกับเพศ (CODE_GENDER)

plt.figure(figsize=(10, 6))
sns.barplot(x='CODE_GENDER', y='TARGET', data=df)
plt.title('Default Rate by Gender')
plt.ylabel('Average Default Rate')
plt.show()

# ---

# Cell 6: ตัวอย่าง: วิเคราะห์เทียบกับประเภทสัญญา (NAME_CONTRACT_TYPE)
plt.figure(figsize=(10, 6))
sns.barplot(x='NAME_CONTRACT_TYPE', y='TARGET', data=df)
plt.title('Default Rate by Contract Type')
plt.ylabel('Average Default Rate')
plt.show()

# ---

# Cell 7: วิเคราะห์เทียบกับรายได้ (AMT_INCOME_TOTAL)
# (ตัด Outliers เพื่อให้ดูกราฟง่ายขึ้น)
df_income = df[df['AMT_INCOME_TOTAL'] < 500000]

plt.figure(figsize=(12, 7))
sns.kdeplot(df_income.loc[df_income['TARGET'] == 0, 'AMT_INCOME_TOTAL'], label='Target == 0', fill=True)
sns.kdeplot(df_income.loc[df_income['TARGET'] == 1, 'AMT_INCOME_TOTAL'], label='Target == 1', fill=True)
plt.title('Income Distribution by Target')
plt.xlabel('Total Income')
plt.legend()
plt.show()

# ---

# Cell 8: (Optional) การใช้งาน fairVIS (ตามโจทย์)
# (ต้องใช้โมเดลที่เทรนแล้ว)
# from fairvis import Fairvis
# from fairvis import adapters
# 
# # 1. สร้าง Adapter
# # (ต้องเทรนโมเดล lr และมี X_train, y_train ก่อน)
# # data_adapter = adapters.Sklearn(lr, X_train, y_train, protected_attribute='CODE_GENDER')
# 
# # 2. สร้าง Visualizer
# # visualizer = Fairvis(data_adapter)
# 
# # 3. แสดงผล (จะเปิด Dashboard ใหม่ใน Browser)
# # visualizer.show()
#
# (หมายเหตุ: fairVIS อาจจะต้องตั้งค่าซับซ้อนกว่านี้ ลองดู Document ของเขาครับ)