python 3.8.8
pandas 1.2.4
numpy 1.20.1
matplotlib 3.3.4
seaborn 0.11.1
sklearn 0.24.1
├── data
│ ├── train.csv
│ ├── test.csv
│ └── sample_submission.csv
├── hyperparameter_search
│ ├── data.py
│ ├── utils.py
│ └── ...
└── main.ipynb
- income 제외 중복 1680행
- income 포함 중복 1499행 -> drop
- education_status, income_status 수정
- gain, loss, dividend binary 처리
- income status = under median / income status = over median 범주 내 outlier 제거
- stratify (income 범위 기준)
- income 75% percentile 900
- income 50% percentile 500
- gbr + mlp 앙상블