### 1. 구글 드라이브 마운트

구글 코랩 환경에서 구글 드라이브를 연결하기 위한 코드입니다. 이를 통해 드라이브 내의 파일에 접근할 수 있으며, 여기서는 금융 상품 이탈률 데이터를 사용합니다.

In [None]:
# 구글 드라이브 마운트 코드 (실제 사용시에는 적절한 코드로 대체해 주세요)
from google.colab import drive
drive.mount('/content/drive')

### 2. 데이터 로딩 및 전처리
데이터를 로드하고 전처리하는 과정입니다. `pandas`를 사용해 CSV 파일을 읽고, 필요한 피처와 라벨을 분리합니다. 이후, 데이터를 트레이닝 세트와 테스트 세트로 나눕니다.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix

# 데이터 로드
data = pd.read_csv('BankChurners.csv')

# 필요한 열 선택
data = data[['Customer_Age', 'Gender', 'Dependent_count', 'Education_Level', 'Marital_Status', 'Income_Category', 'Card_Category', 'Months_on_book', 'Total_Relationship_Count', 'Months_Inactive_12_mon', 'Contacts_Count_12_mon', 'Credit_Limit', 'Total_Revolving_Bal', 'Avg_Open_To_Buy', 'Total_Amt_Chng_Q4_Q1', 'Total_Trans_Amt', 'Total_Trans_Ct', 'Total_Ct_Chng_Q4_Q1', 'Avg_Utilization_Ratio', 'Attrition_Flag']]

# 카테고리형 변수를 숫자로 매핑
data['Gender'] = data['Gender'].map({'M': 0, 'F': 1})
data['Education_Level'] = data['Education_Level'].map({'Unknown': 0, 'Uneducated': 1, 'High School': 2, 'College': 3, 'Graduate': 4, 'Post-Graduate': 5, 'Doctorate': 6})
data['Marital_Status'] = data['Marital_Status'].map({'Unknown': 0, 'Single': 1, 'Married': 2, 'Divorced': 3})
data['Income_Category'] = data['Income_Category'].map({'Unknown': 0, 'Less than $40K': 1, '$40K - $60K': 2, '$60K - $80K': 3, '$80K - $120K': 4, '$120K +': 5})
data['Card_Category'] = data['Card_Category'].map({'Blue': 0, 'Silver': 1, 'Gold': 2, 'Platinum': 3})
data['Attrition_Flag'] = data['Attrition_Flag'].map({'Existing Customer': 0, 'Attrited Customer': 1})

# 특성과 타겟 분리
X = data.drop('Attrition_Flag', axis=1)
y = data['Attrition_Flag']

# 학습 데이터와 테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
data


### 3. 딥러닝 모델 생성 및 훈련
`tensorflow`와 `keras`를 사용하여 딥러닝 모델을 구성하고 컴파일하는 과정입니다. 여기서는 다층 퍼셉트론 모델을 구성하고, 이진 분류를 수행합니다. `ModelCheckpoint` 콜백을 사용하여 최적의 모델을 저장합니다. 모델의 성능을 평가하기 위해 정확도, 정밀도, 재현율을 메트릭으로 사용합니다.


In [None]:
# 필요 라이브러리 import


# ModelCheckpoint 콜백 생성


# 모델 생성


# 모델 컴파일


# 모델 학습



### 4. 모델 성능 평가
모델의 예측 결과를 실제 라벨과 비교하여 성능을 평가하는 과정입니다. `classification_report`를 사용하여 각 클래스별 정밀도, 재현율, f1-점수 등을 출력합니다. 이는 모델의 세부 성능을 이해하는 데 도움을 줍니다.


In [None]:
# 실제 라벨과 예측 라벨 계산



# classification report 결과 평가



### 5. 혼동 행렬
혼동 행렬을 계산하고 시각화하는 과정입니다. `matplotlib`와 `seaborn` 라이브러리를 사용하여 혼동 행렬을 그래프로 나타냅니다. 이를 통해 모델이 어떤 클래스를 어떻게 잘못 분류했는지 직관적으로 이해할 수 있습니다.


In [None]:
import matplotlib.pyplot as plt
import numpy as np
from sklearn.metrics import confusion_matrix
import seaborn as sns

# 혼동 행렬 계산


# 혼동 행렬 시각화
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt="d", cmap='Blues', cbar=False)
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.xticks(np.arange(2) + 0.5, ['True', 'False'])
plt.yticks(np.arange(2) + 0.5, ['True', 'False'], rotation=0)
plt.title('Confusion Matrix')
plt.show()