## 1. **통계 기반 추천 (Popularity-Based Recommendation)**

### **알고리즘 원리**
- 사용자의 행동 데이터를 기반으로 인기 있는 아이템을 계산.
- 평점의 평균, 구매 횟수, 조회 수 등 특정 메트릭으로 상위 N개의 아이템을 추천.

### **예시**
```python
import pandas as pd

# 데이터 예제: 사용자 행동
data = pd.DataFrame({
    'item_id': [1, 2, 1, 3, 2, 4],
    'rating': [5, 4, 4, 5, 3, 2]
})

# 아이템별 평균 평점 계산
popularity = data.groupby('item_id')['rating'].mean()

# 상위 2개의 인기 아이템 추천
top_items = popularity.nlargest(2)
print(top_items)
```


## 2. **연관 규칙 학습 (Apriori Algorithm)**

### **알고리즘 원리**
1. **지지도(Support)**:
   - 특정 아이템 집합이 전체 거래에서 등장한 비율.
   - \( \text{Support}(A) = \frac{\text{거래 중 A가 포함된 횟수}}{\text{전체 거래 수}} \)
2. **신뢰도(Confidence)**:
   - 아이템 A가 포함된 거래 중 아이템 B도 포함될 확률.
   - \( \text{Confidence}(A \Rightarrow B) = \frac{\text{Support}(A \cap B)}{\text{Support}(A)} \)
3. **향상도(Lift)**:
   - 두 아이템 간의 실제 상관관계를 평가.
   - \( \text{Lift}(A \Rightarrow B) = \frac{\text{Confidence}(A \Rightarrow B)}{\text{Support}(B)} \)

### **예시**
```python
from mlxtend.frequent_patterns import apriori, association_rules

# 거래 데이터
data = pd.DataFrame({
    'milk': [1, 0, 1, 0, 1],
    'bread': [1, 1, 1, 0, 1],
    'butter': [0, 1, 0, 1, 1]
})

# 자주 등장하는 아이템 집합 찾기
frequent_itemsets = apriori(data, min_support=0.5, use_colnames=True)

# 연관 규칙 생성
rules = association_rules(frequent_itemsets, metric="confidence", min_threshold=0.7)
print(rules)
```


## 3. **콘텐츠 기반 추천 (Content-Based Filtering)**

### **알고리즘 원리**
1. 아이템의 특징을 벡터로 표현 (예: TF-IDF, Word2Vec 등).
2. 사용자가 선호한 아이템과 다른 아이템 간의 유사도를 계산.
3. 가장 유사한 아이템을 추천.

### **TF-IDF 활용**
- **TF (Term Frequency)**: 특정 단어가 문서에서 등장한 빈도.
- **IDF (Inverse Document Frequency)**: 단어가 전체 문서에서 얼마나 드문지를 나타냄.
  \[
  \text{TF-IDF}(t, d) = \text{TF}(t, d) \times \log\left(\frac{N}{\text{DF}(t)}\right)
  \]

### **예시**
```python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# 아이템과 장르 데이터
items = ['Star Wars', 'Avengers', 'Inception']
genres = ['Sci-Fi Adventure', 'Action Adventure', 'Sci-Fi Thriller']

# TF-IDF로 장르를 벡터화
vectorizer = TfidfVectorizer()
genre_vectors = vectorizer.fit_transform(genres)

# 아이템 간 코사인 유사도 계산
cosine_sim = cosine_similarity(genre_vectors)
print(cosine_sim)
```


## 4. **협업 필터링 (Collaborative Filtering)**

### **알고리즘 원리**
1. **사용자 기반**: 비슷한 행동을 보이는 사용자 그룹을 찾아 추천.
   - \( \text{유사도} = \text{코사인 유사도} \, \text{또는 피어슨 상관계수} \)
2. **아이템 기반**: 유사한 아이템을 찾고 이를 바탕으로 추천.

### **코사인 유사도**
\[
\text{Cosine Similarity} = \frac{\mathbf{A} \cdot \mathbf{B}}{\|\mathbf{A}\| \|\mathbf{B}\|}
\]

### **예시**
```python
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

# 사용자-아이템 평점 행렬
ratings = np.array([
    [5, 0, 3],
    [4, 0, 0],
    [1, 1, 0]
])

# 사용자 간 유사도 계산
user_similarity = cosine_similarity(ratings)
print(user_similarity)

# 아이템 간 유사도 계산
item_similarity = cosine_similarity(ratings.T)
print(item_similarity)
```


## 5. **행렬 분해 (Matrix Factorization)**

### **알고리즘 원리**
- 사용자-아이템 평점 행렬 \( R \)을 분해:
  \[
  R \approx U \Sigma V^T
  \]
  - \( U \): 사용자 잠재 요인.
  - \( V^T \): 아이템 잠재 요인.
- **잠재 요인**: 사용자와 아이템의 숨겨진 관계를 학습.

### **SVD 활용**
```python
from scipy.sparse.linalg import svds

# 사용자-아이템 평점 행렬
ratings = np.array([
    [4, 0, 0, 5],
    [5, 5, 0, 0],
    [0, 0, 5, 4]
])

# SVD를 사용한 행렬 분해
U, sigma, Vt = svds(ratings, k=2)
sigma = np.diag(sigma)

# 분해된 행렬로 예측
predicted_ratings = np.dot(np.dot(U, sigma), Vt)
print(predicted_ratings)
```

## 6. **딥러닝 기반 추천**

### **Autoencoder 활용**
- **원리**: 입력 데이터를 압축(인코딩)했다가 복원(디코딩)하며 특징을 학습.
- **구조**: 입력층 → 숨겨진 층 (Latent Factors) → 출력층.

### **예시**
```python
from keras.models import Sequential
from keras.layers import Dense

# 사용자-아이템 평점 행렬
ratings = np.array([
    [5, 0, 3],
    [4, 0, 0],
    [1, 1, 0]
])

# Autoencoder 모델 정의
model = Sequential([
    Dense(64, activation='relu', input_dim=ratings.shape[1]),
    Dense(32, activation='relu'),
    Dense(ratings.shape[1], activation='sigmoid')
])

model.compile(optimizer='adam', loss='mse')
model.fit(ratings, ratings, epochs=50, verbose=0)
predictions = model.predict(ratings)
print(predictions)
```