JOB_CARE_AI_Contest

최종 성적

비고

독립변수에 범주형 변수만 존재할 때, 분류 모형은 catboost의 성능이 뛰어남
optuna를 통해 하이퍼 파라미터 최적화 가능, GridSearch보다 시간이 덜 걸리나 최적값이 아닌 그에 근사한 수치를 제공
교차 검증을 통해 다수의 모델을 생성한 뒤 이를 앙상블로 엮을 시 유의미한 성능 향상을 기대할 수 있음
교차 검증 시 전체 학습 데이터의 target 변수 분포와 동일하게 데이터를 나눠주는 StratifiedKFold 활용하면 분류 모형의 성능 향상을 어느정도 기대 가능
binary classification 시 predictproba를 통해 기존 threshold=0.5 가 아닌 다른 최적 threshold를 적용 시 성능 향상 가능

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
Recommen_JOB.ipynb		Recommen_JOB.ipynb

Provide feedback