데이콘 구내식당 식수 인원 예측 AI 경진대회 (51/480, 상위 11%)
- 월(중식), 월(석식) : 일자 파생변수
- 요일, 요일(석식) : 요일 파생변수
- 일 : 일자 파생변수
- 식사가능자수 : 본사정원수 파생변수
- 본사출장자수 : 기본변수
- 본사시간외근무명령서승인건수 : 기본변수
- 공휴일전후 : 임의로 추가 ( 더미화 하여 이용 )
기상청의 체감기온, 기온등의 변수도 사용해보았지만, 성능이 좋지않아 제외
또한 월, 요일 별로 특별하게 식수인원이 많은 월과 요일이 있는듯한 양상을 보여 월과 요일에 순위를 부여하여서 사용
XG Boost, LightGBM, RandomForest 등 다양한 모델들을 사용해보았지만 CatBoost의 성능이 가장 좋아 CatBoost 사용
한동안 Public 점수로 1등을 유지하다가, 5등까지 떨어졌다. 7/23 Private 점수가 공개되자 최종발표된 순위는 51등이었다. Train 데이터와 Public Test 데이터에 심하게 과적합되었던듯하다. 첫 대회치고는 나쁘지않은 결과지만, 아쉬움이 남았다