이전 롯데멤버스 추천시스템 구현 공모전에서 받은 데이터와 추천시스템을 구현하기 위해 Faiss(유사도), GRU4REC(session based recommandatein), XGBoost, DNN 등 몇가지 알고리즘을 테스트 해보았었는데 GRU4REC와 XGBOOST의 TOP1의 정확도가 상당히 비슷하게 나와서
XGBOOST를 이용해서 추천시스템을 구현하는 것을 Kubeflow pipeline을 활용해서 로컬에서 구축
- convert-data : AWS S3에서 CSV 다운 후 json으로 변환
- preprocess-data : 불필요한 데이터 삭제 및 merge
- spilt-data : train, val, test data로 분할
- train-model : xgboost 학습
- test-model : 학습된 모델 성능 측정
- extract-top5-10 : 상위 5, 10 추론 정확도 측정