### 추천시스템의 주요 알고리즘 분석

#### 1. 통계 기반의 추천
- **개념**: 사용자의 과거 행동 데이터(예: 구매 이력, 클릭 수 등)를 기반으로 간단한 통계적 방법으로 추천.
예를 들어, A제품을 100명이 샀는데 이 중 70명이 B제품도 샀다 라는 단순 통계를 근거해 A를 산 사람은 B도 살 확률이 높다 라고 추천하는 방법
- **장점**:
  - 구현이 간단하고 빠르게 적용 가능.
  - 초기 데이터가 적은 경우에도 사용할 수 있음.
- **단점**:
  - 복잡한 사용자 선호 패턴을 반영하기 어려움.
  - 새로운 사용자나 아이템에 대해 추천하기 어려움(콜드스타트 문제).
> 콜드스타드 문제는 추천 시스템에서 발생하는 문제로, 새롭게 추가된 사용자나 아이템에 대해 충분한 데이터가 없어서 정확한 추천을 제공하기 어려운 상황을 말함.

#### 2. 연관 규칙 (Association Rule)
- **개념**: A 상품을 구매한 사용자가 B 상품도 구매할 확률과 같은 규칙을 발견하여 추천.
- 예: Apriori: 연관 규칙 알고리즘 중 가장 기본적이고 직관적인 방법. “자주 나오는 부분 집합이면, 더 큰 집합도 자주 나올 것이다”라는 간단한 원리
- FP-Grouth:  Apriori는 계산량(검색 공간)이 커지는 단점이 있습니다. -> 트리 구조를 활용해 중복을 압축하고, 조건부 검색을 통해 더 효율적으로 빈번한 아이템 집합을 찾아냄
- **장점**:
  - 특정 상품 간의 명확한 관계를 파악: 예) 빵을 사면 우유를 살 확률이 40% 같은 규칙을 뽑을 수 있다.
  - 마케팅 전략에 활용 가능.
- **단점**:
  - 계산 비용이 큼: 데이터가 커질수록 규칙을 찾는 데 드는 시간이 많아진다.
  - 사용자 맥락 반영 어려움: 왜 함께 구매하는지는 분석하기 어려움.
> 

#### 3. 콘텐츠 기반 필터링 (Content-Based Filtering)
- **개념**: 사용자와 아이템의 특성을 기반으로 비슷한 콘텐츠를 추천.
아이템의 특징을 분석하고, 사용자가 좋아하는 아이템과 비슷한 특징을 가진 아이템을 추천
  - 예: 영화의 장르, 배우 정보, 사용자가 좋아하는 영화와 비슷한 영화 추천.
- **장점**:
  - 개인화된 추천: 사용자 취향에 집중해 학습해 정확도가 높음.
  - 타인 데이터에 의존하기 않음: 사용자 본인 데이터만 있음 됨.
- **단점**:
  - 초기 데이터 부족 시 어려움: 사용자 취향 정보를 얻기 어려우면 제대로 추천하기 힘듬.
  - 추천 다양성 부족: 다양성이 부족할 수 있음(비슷한 아이템만 추천).

#### 4. 협업 필터링 (Collaborative Filtering)
- **개념**: 사용자 간의 유사성을 기반으로 추천하거나 아이템 간의 유사성을 기반으로 추천.
비슷한 취향을 가진 사용자들의 행동을 바탕으로 추천하거나, 비슷한 아이템을 그룹화해서 다른 사용자에게 추천하는 방식.
  - 예: "비슷한 사용자들이 좋아한 아이템 추천".
- **대표 유형**:
  - 사용자 기반(User-Based): 나와 취향이 비슷한 사람이 좋아하는 것을 나도 좋아할 가능성이 높음
  - 아이템 기반(Item-Based): A 아이템을 좋아하는 사람들이 자주 함께 좋아하는 또 다른 아이템도 추천
- **장점**:
  - 콘텐츠 정보 없이도 가능: 제품 설명 없이도 ‘비슷한 사람의 행동’만으로 추천이 가능.
  - 추천 정확도 높음: 사용자들이 남긴 평가나 행동 데이터를 직접 활용하기 때문.
- **단점**:
  - 데이터가 희소할 때 힘듦: 평점이나 구매 이력이 적으면 유사도 계산이 어려움.
  - 콜드스타트 문제: 새 상품이나 새 사용자는 추천 데이터가 부족.

#### 5. 행렬 분해 (Matrix Factorization)
- **개념**: 사용자-아이템 행렬을 분해해 잠재 요인을 찾아 추천.
사용자와 아이템의 관계를 행렬로 만든 뒤, 이를 여러 개의 잠재요인(latent factors)으로 분해합니다.
- 예) 사용자 잠재 요인 벡터와 아이템 잠재 요인 벡터를 곱해 평점을 예측
  - 대표 기법:
    - SVD(Singular Value Decomposition): 
    - ALS(Alternating Least Squares): 
- **장점**:
  - 잠재적 취향 파악: 사용자의 보이지 않는 취향을 수치로 표현해줄 수 있음.
  - 대규모 데이터에 적합: 규모가 커질수록 성능이 좋아질 수 있음 (적절한 하드웨어 전제)
- **단점**:
  - 학습에 많은 자원 필요: 행렬 크기가 클수록 계산량이 커짐.
  - 명시적 피드백이 없으면 어려움: 평점처럼 명확한 숫자 데이터가 없는 경우엔 적용이 까다로울 수 있음.

#### 6. 하이브리드 방법 (Hybrid Methods)
- **개념**: 위의 여러 알고리즘을 조합하여 추천 성능을 개선.
위에서 언급한 여러 방법을 조합해 사용하는 기법.
  - 예: 협업 필터링으로 1차 후보를 뽑고, 콘텐츠 기반 필터링으로 최종 점수를 매기는 방식
- **장점**:
  - 단일 방법의 한계를 보완: 협업 필터링 + 콘텐츠 기반 등 다양한 조합으로 성능 개선 가능
  - 유연한 적용: 상황과 데이터 특성에 따라 적절한 알고리즘만 골라 합칠 수 있음.
- **단점**:
  - 복잡도 증가: 여러 모델을 동시에 운영하고 조정해야 하므로 구현이 까다로움.
  - 자원 소모: 모델마다 필요한 연산, 데이터 전처리가 추가로 필요.

#### 7. 딥러닝 기반의 추천 (Deep Learning)
- **개념**: 신경망을 사용하여 사용자와 아이템의 복잡한 상호작용을 학습하여 추천.
딥러닝 모델(신경망)을 활용해 사용자-아이템 간 복잡한 상호작용 관계를 학습합니다.
  - 예: Autoencoder로 아이템 벡터를 압축/복원하여 추천, RNN으로 시계열 클릭 정보를 학습해 개인화 추천 등을 구현
- **장점**:
  - 비선형적 패턴 학습: 단순한 유사도 계산을 넘어 더 복잡한 취향 패턴까지 파악 가능.
  - 대규모 데이터에 효과적: 데이터가 많을수록 딥러닝의 강점이 극대화.
- **단점**:
  - 학습 비용 증가: GPU등 하드웨어 비용과 많은 학습 시간이 필요.
  - 해석 어려움: 딥러닝 모델은 '왜 추천했는지' 직관적으로 설명하기가 어려움.

### 결론
추천 시스템은 다양한 알고리즘으로 구성되며, 각 방법마다 장단점이 있음.
- 초기에 빠르게 테스트 하려면 **통계 기반** 또는 **연관 규칙**처럼 단순한 방법 사용.
- 사용자 개개인의 섬세한 취향을 반영하려면 **콘텐츠 기반** 또는 **협업 필터링**이 효과적.
- 더 발전된 방법으로는 **행렬 분해**나 **딥러닝 기반** 모델을 도입해 높은 정확도를 노릴 수 있음.
