In [2]:
import numpy as np

# 내적 vs 요소별 곱셈 비교

추천 시스템에서 사용자-항목 매칭 점수를 계산하는 두 가지 방식을 비교합니다.

## 핵심 차이점

### 전통적 행렬분해 (Matrix Factorization)
- 사용자 벡터와 항목 벡터의 **내적(Dot Product)** 사용
- 결과: **스칼라** (단일 점수)
- 모든 차원의 정보를 합쳐서 하나의 값으로 압축

### CFNet (Collaborative Filtering Network)
- 사용자 벡터와 항목 벡터의 **요소별 곱셈(Element-wise Product)** 사용
- 결과: **벡터** (차원별 상호작용 보존)
- 학습된 가중치로 각 차원의 중요도를 다르게 반영

## 왜 이것이 중요한가?

내적은 모든 차원을 동등하게 취급하지만, CFNet은 **어떤 차원이 더 중요한지 학습**할 수 있습니다!

In [None]:
# 가상의 사용자 잠재 벡터 (User Latent Factor: Pu)
# 1차원: 액션 선호 (높음) / 2차원: 코미디 선호 (중간) / 3차원: 고전 선호 (낮음)
Pu = np.array([0.9, 0.5, 0.1]) 

# 가상의 항목 잠재 벡터 (Item Latent Factor: Qi)
# 1차원: 액션 영화 (강함) / 2차원: 코미디 영화 (약함) / 3차원: 고전 영화 (강함)
Qi = np.array([0.8, 0.2, 0.9])

print("사용자 잠재 벡터 (Pu):", Pu)
print("  -> 액션 선호 높음, 코미디 중간, 고전 낮음")
print()
print("항목 잠재 벡터 (Qi):", Qi)
print("  -> 액션 영화 강함, 코미디 약함, 고전 강함")

## 2. 전통적 방식: 내적 (Dot Product)

**계산 방법:** 각 차원의 곱을 모두 더해서 **하나의 스칼라 값**으로 압축

**공식:** `score = Pu · Qi = Pu[0]*Qi[0] + Pu[1]*Qi[1] + Pu[2]*Qi[2]`

**특징:**
- 모든 차원을 동등하게 취급
- 결과가 단일 숫자 (스칼라)
- 차원별 기여도를 구분할 수 없음

## 1. 잠재 벡터 정의

한 명의 사용자와 한 개의 영화에 대한 잠재 벡터를 정의합니다.

**잠재 요인 3개:**
- 1차원: 액션 장르 선호도/특성
- 2차원: 코미디 장르 선호도/특성  
- 3차원: 고전 장르 선호도/특성

각 값은 0~1 사이로, 높을수록 해당 장르에 대한 선호/특성이 강함을 의미합니다.

In [None]:
# 내적 계산: 각 차원의 곱을 합산
dot_product_score = np.dot(Pu, Qi)

print("=" * 50)
print("내적 (Dot Product) 계산 과정")
print("=" * 50)

# 각 차원별 계산 상세히 보여주기
dim_products = Pu * Qi
print(f"1차원 (액션):   {Pu[0]:.1f} x {Qi[0]:.1f} = {dim_products[0]:.2f}")
print(f"2차원 (코미디): {Pu[1]:.1f} x {Qi[1]:.1f} = {dim_products[1]:.2f}")
print(f"3차원 (고전):   {Pu[2]:.1f} x {Qi[2]:.1f} = {dim_products[2]:.2f}")
print("-" * 50)
print(f"합산 (Sum):     {dim_products[0]:.2f} + {dim_products[1]:.2f} + {dim_products[2]:.2f} = {dot_product_score:.4f}")
print("=" * 50)
print(f"\n최종 매칭 점수 (스칼라): {dot_product_score:.4f}")
print("\n-> 모든 차원이 하나의 값으로 합쳐져서 개별 기여도를 알 수 없음!")

## 3. CFNet 방식: 요소별 곱셈 (Element-wise Product)

**계산 방법:** 각 차원의 곱을 **벡터로 유지** (합산하지 않음!)

**공식:** `vector = Pu ⊙ Qi = [Pu[0]*Qi[0], Pu[1]*Qi[1], Pu[2]*Qi[2]]`

**특징:**
- 각 차원의 상호작용을 별도로 보존
- 결과가 벡터 (차원별 정보 유지)
- 이후 학습된 가중치로 중요도를 다르게 반영 가능

**핵심 차이:** 내적은 바로 합산하지만, 요소별 곱셈은 **나중에** 가중치를 적용해서 합산!

In [None]:
# 요소별 곱셈: 각 차원의 상호작용을 벡터로 보존
interaction_vector = Pu * Qi

print("=" * 50)
print("요소별 곱셈 (Element-wise Product) 계산 과정")
print("=" * 50)

# 각 차원별 계산 상세히 보여주기
print(f"1차원 (액션):   {Pu[0]:.1f} x {Qi[0]:.1f} = {interaction_vector[0]:.2f}")
print(f"2차원 (코미디): {Pu[1]:.1f} x {Qi[1]:.1f} = {interaction_vector[1]:.2f}")
print(f"3차원 (고전):   {Pu[2]:.1f} x {Qi[2]:.1f} = {interaction_vector[2]:.2f}")
print("=" * 50)
print(f"\n예측 벡터 (Vector): {interaction_vector}")
print("\n-> 각 차원의 정보가 벡터로 보존됨!")
print("-> 이제 학습된 가중치로 각 차원의 중요도를 다르게 반영 가능")

## 4. 학습된 가중치로 최종 점수 계산

CFNet은 예측 벡터에 **학습된 가중치 W_out**를 적용하여 최종 점수를 계산합니다.

**공식:** `final_score = W_out · interaction_vector`

**가중치의 의미:**
- W_out[0] (액션 차원의 중요도)
- W_out[1] (코미디 차원의 중요도)
- W_out[2] (고전 차원의 중요도)

**학습 과정에서:**
- 이 가중치들은 데이터로부터 자동으로 학습됨
- 예측 정확도가 높아지도록 최적화됨
- 어떤 장르가 평점에 더 중요한지 모델이 스스로 발견!

In [None]:
# 가중치 벡터 (학습을 통해 얻어진 각 차원의 중요도)
# 이 예제에서는 액션(0.5)과 고전(0.4)이 중요하고, 코미디(0.1)는 덜 중요하다고 가정
W_out = np.array([0.5, 0.1, 0.4])

# 가중치와 예측 벡터의 내적으로 최종 점수 계산
final_matching_score_cfnet = np.dot(W_out, interaction_vector)

print("=" * 50)
print("CFNet 최종 점수 계산 (가중치 적용)")
print("=" * 50)

print(f"\n가중치 벡터 (W_out): {W_out}")
print("  -> 액션: {:.1f} (중요), 코미디: {:.1f} (덜 중요), 고전: {:.1f} (중요)".format(W_out[0], W_out[1], W_out[2]))

print(f"\n예측 벡터: {interaction_vector}")

print("\n가중합 계산:")
print(f"  액션 기여:   {W_out[0]:.1f} x {interaction_vector[0]:.2f} = {W_out[0] * interaction_vector[0]:.4f}")
print(f"  코미디 기여: {W_out[1]:.1f} x {interaction_vector[1]:.2f} = {W_out[1] * interaction_vector[1]:.4f}")
print(f"  고전 기여:   {W_out[2]:.1f} x {interaction_vector[2]:.2f} = {W_out[2] * interaction_vector[2]:.4f}")
print("-" * 50)
print(f"  합산: {W_out[0] * interaction_vector[0]:.4f} + {W_out[1] * interaction_vector[1]:.4f} + {W_out[2] * interaction_vector[2]:.4f} = {final_matching_score_cfnet:.4f}")

print("=" * 50)
print(f"\n최종 매칭 점수 (CFNet): {final_matching_score_cfnet:.4f}")

## 5. 두 방식 비교

내적 방식과 CFNet 방식의 최종 점수를 비교해봅시다.

In [None]:
print("\n" + "=" * 60)
print("최종 비교: 내적 vs CFNet")
print("=" * 60)

print(f"\n내적 방식 점수:     {dot_product_score:.4f}")
print(f"CFNet 방식 점수:    {final_matching_score_cfnet:.4f}")
print(f"점수 차이:          {abs(dot_product_score - final_matching_score_cfnet):.4f}")

print("\n" + "-" * 60)
print("왜 결과가 다를까?")
print("-" * 60)

print("\n내적 방식:")
print("  - 모든 차원을 동등하게 (1:1:1 비율로) 합산")
print("  - 암묵적 가중치: [1.0, 1.0, 1.0]")
print(f"  - 계산: 1.0*{interaction_vector[0]:.2f} + 1.0*{interaction_vector[1]:.2f} + 1.0*{interaction_vector[2]:.2f} = {dot_product_score:.4f}")

print("\nCFNet 방식:")
print("  - 학습된 가중치로 차원별 중요도를 다르게 반영")
print(f"  - 학습된 가중치: {W_out}")
print(f"  - 계산: {W_out[0]:.1f}*{interaction_vector[0]:.2f} + {W_out[1]:.1f}*{interaction_vector[1]:.2f} + {W_out[2]:.1f}*{interaction_vector[2]:.2f} = {final_matching_score_cfnet:.4f}")

print("\n결론:")
print("  CFNet은 데이터를 통해 어떤 장르가 더 중요한지 학습하므로")
print("  더 정확한 예측이 가능합니다!")

## 핵심 요약

### 내적 방식의 한계
1. **고정된 가중치**: 모든 차원을 동등하게 취급 (암묵적으로 가중치 = 1)
2. **표현력 부족**: 어떤 장르가 더 중요한지 구분 불가
3. **정보 손실**: 차원별 기여도를 합산 과정에서 잃어버림

### CFNet 방식의 장점
1. **학습 가능한 가중치**: 데이터로부터 각 차원의 중요도를 자동으로 학습
2. **높은 표현력**: 장르별로 다른 중요도 반영 가능
3. **정보 보존**: 요소별 곱셈으로 차원별 상호작용을 벡터로 유지

### 실제 적용
- **전통적 행렬분해**: 간단하고 빠르지만 표현력 제한
- **CFNet (딥러닝 기반)**: 더 복잡하지만 더 정확한 예측 가능
- **실무에서**: 데이터가 많고 정확도가 중요하면 CFNet 방식 선호

### 수식 정리
```
전통적 방식: score = Pu · Qi = Σ(Pu[i] * Qi[i])
CFNet 방식:  score = W_out · (Pu ⊙ Qi) = Σ(W_out[i] * Pu[i] * Qi[i])
```

차이는 **학습 가능한 가중치 W_out**의 유무!