2021.07.17 제 12회 투빅스 빅데이터 컨퍼런스 발표작
Steam에서 제공하는 Multimodal 데이터를 다양한 방법으로 이용하여 개인화된 추천 게임플레이리스트를 제공하는 서비스입니다.
NLP method(LDA, Sentiment Analysis)를 통해 Textual Feature를 생성했습니다.
그 외 변수들은 Feature Engineering을 통해 파생변수를 생성했습니다.
Play Sequence, 이미지, 텍스트 데이터를 각각 Prod2Vec, Convolutional AutoEncoder, AutoEncoder를 이용하여
Multimodal Feature인 Game2Vec을 생성했습니다.
앞에서 생성한 Game2Vec을 모델 레이어에 추가하여 학습했습니다.
추천 게임플레이리스트를 제공하는 웹페이지를 구현했습니다.
Model | Game2Vec 사용 | Test ACC | Test AUC | Test F1 | - |
---|---|---|---|---|---|
Vanilla GMF | ❌ | 78.51% | 0.7746 | 0.8711 | |
GMF | ⭕ | 83.62% | 0.8526 | 0.8956 | |
MLP | ⭕ | 81.50% | 0.8391 | 0.8837 | |
NMF | ⭕ | 84.33% | 0.8715 | 0.9007 | 👑 Best Model |
DCN Parallel | ⭕ | 82.31% | 0.8463 | 0.8868 | |
DCN Stacked | ⭕ | 82.55% | 0.8500 | 0.8876 | |
DeepFM | ⭕ | 80.61% | 0.8194 | 0.8868 |
- Multimodal Feature인 Game2Vec을 사용했을 때 모델 성능이 향상했습니다.
- Neural Collaborative Filtering 계열 모델들의 성능이 좋았습니다.
- 서비스 화면
- 선호 게임 리스트
- 시연 예시1
- 시연 예시2
컨퍼런스 발표영상과 보고서입니다. 자세한 분석 내용은 아래 링크를 통해 확인해주세요!
빅데이터 동아리 ToBig's 13기・14기・15기가 함께 하였습니다😃
Jieun Park | Hyerin Lee | Donghyun Kim |
Seongbeom Lee | Ayeon Jang | Sangyeon Jo |