## 1. 넷플릭스 챌린지 소개

### 1.1 넷플릭스 챌린지 데이터셋

> - 넷플릭스 챌린지(Netflix Challenge)에서는 사용자별 영화 평점 데이터가 사용되었다.
> - 훈련 데이터(Training Data)는 2000년부터 2005년까지 수집한 48만명 사용자의 1만 8천개의 영화에 대한 1억 개의 평점으로 구성되어 있다.
> - 평가 데이터(Test Data)는 각 사용자의 최신 평점 280만개로 구성되어 있다.

> - 넷플릭스 챌린지의 목표는 **추천시스템의 성능을 10%이상 향상시키는 것**이었다.
> - 평균 제곱근 오차 0.9514을 0.8563까지 낮출 경우 100만불의 상금을 받는 조건이었다.
> - 2006년부터 2009년까지 진행되었으며, 2700개의 팀이 참여하였습니다 넷플릭스 챌린지를 통해 추천시스템의 성능이 비약적으로 발전했다.

## 2. 잠재 인수 모형

### 2.1 잠재 인수 모형 개요

> - **`잠재 인수 모형`(Latent Factor Model)**의 핵심은 **사용자와 상품을 벡터로 표현**하는 것이다.
> - 잠재 인수 모형에서는 고정된 인수 대신 **효과적인 인수를 학습**하는 것을 목표로 한다.
> - 학습한 인수를 **잠재 인수(Latent Factor)**라 부른다.

### 2.2 손실 함수

> - **사용자와 상품을 임베딩하는 기준은?**
> - 사용자와 상품의 임베딩의 내적(Inner Product)이 평점과 최대한 유사하도록 하는 것이다.
> - 사용자 $x$의 임베딩을 $p_x$, 상품 $i$의 임베딩을 $q_i$라고 하자.
> - 사용자 $x$의 상품 $i$에 대한 평점을 $r_{xi}$라고 하자.
> - 임베딩의 목표는 $p_x^\top q_i$이 $r_{xi}$와 유사하도록 하는 것이다.

> - 행렬 차원에서 살펴보자.
> - 사용자 수의 열과 상품 수의 행을 가진 **평점 행렬을 $R$**이라고 하자.
> - 사용자들의 임베딩, 즉 벡터를 쌓아서 만든 **사용자 행렬을 $P$**라고 하자.
> - 영화들의 임베딩, 즉 벡터를 쌓아서 만든 **상품 행렬을 $Q$**라고 하자.

### 2.3 최적화

> - 잠재 인수 모형은 다음 손실 함수를 최소화하는 $P$와 $Q$를 찾는 것을 목표로 한다.
> - $\mathbf{\sum_{(i, x) \in R} (r_{xi} - p_x^\top q_i)^2}$
> - 하지만, 위 손실 함수를 사용할 경우 **과적합(Overfitting)**이 발생할 수 있다.
> - 과적합이란 기계학습 모형이 훈련 데이터의 잡음(Noise)까지 학습하여, 평가 성능은 오히려 감소하는 현상을 의미한다.

> - **과적합을 방지하기 위하여 정규화 항을 손실 함수에 더해준다.**
> - $\sum_{(i, x) \in R} (r_{xi} - p_x^\top q_i)^2 + [\lambda_1 \sum_{x} ||p_x||^2 + \lambda_2 \sum_{i} ||q_i||^2]$
> - **정규화**는 극단적인, 즉 **절댓값이 너무 큰 임베딩을 방지하는 효과**가 있다.

> - 손실함수를 최소화하는 $P$와 $Q$를 찾기 위해서는 (확률적) 경사하강법을 사용한다.
    - 경사하강법은 손실함수를 안정적으로 하지만 느리게 감소시킨다.
    - 확률적 경사하강법은 손실함수를 불안정하지만 빠르게 감소시킨다.
    - 실제로는 확률적 경사하강법이 더 많이 사용된다.
    
## 3. 고급 잠재 인수 모형

### 3.1 사용자와 상품의 편향을 고려한 잠재 인수 모형

> - 각 **사용자의 편향**은 **해당 사용자의 평점 평균과 전체 평점 평균의 차**이다.
    - 나연이 매긴 평점의 평균이 4.0개의 별, 다현이 매긴 평점의 평균이 3.5개의 별이라고 하자.
    - 전체 평점 평균이 3.7개의 별인 경우, 나연의 사용자 편향은 4.0 - 3.7 = 0.3개의 별이다.
    - 다현의 사용자 편향은 3.5 - 3.7 = -0.2개의 별이다.
    
> - 개선된 잠재 인수 모형에서는 평점을 **`전체 평균`, `사용자 편향`, `상품 편향`, `상호작용`**으로 분리한다.
> - $r_{xi} = \mu + b_x + b_i + p_x^{\top}q_i$

> - 개선된 잠재 인수 모형의 손실 함수는 아래와 같다.
> - $\sum_{(i, x) \in R} (r_{xi} - (\mu + b_x + b_i + p_x^{\top}q_i))^2 + [\lambda_1 \sum_{x} ||p_x||^2 + \lambda_2 \sum_{i} ||q_i||^2 + \lambda_3 \sum_{x} b_x^2 + \lambda_4 \sum_{i} b_i^2]$

### 3.2 시간에 따른 편향을 고려한 잠재 인수 모형

> - 넷플릭스 시스템의 변화로 평균 평점이 크게 상승하는 사건이 있었다.
> - 영화의 평점은 출시일 이후 시간이 지남에 따라 상승하는 경향을 갖는다.

> - 개선된 잠재 인수 모형에서는 이러한 **시간적 편향을 고려**한다.
> - 구체적으로 사용자 편향과 상품 편향을 시간에 따른 함수로 가정한다.
> - $r_{xi} = \mu + b_x(t) + b_i(t) + p_x^{\top}q_i$

## 4. 넷플릭스 챌린지의 결과

### 4.1 넷플릭스 챌린지의 우승팀

> - **BellKor팀**은 **앙상블 학습**을 사용하여 처음으로 목표 성능에 도달했다.
> - BellKor 팀의 독주에 위기감을 느낀 다른 팀들은 연합팀 Ensemble을 만들었다.
> - 넷플릭스 챌린지 종료 시점에 BellKor 팀 Ensemble 팀의 오차는 정확히 동일했다.
> - 하지만 BellKor 팀의 제출이 20분 빨라 BellKor 팀이 우승을 했다.