# 추천 시스템 강의

## 강사

- 멀티캠퍼스 강선구 프로(sunku0316.kang@multicampus.com)


## 강의 목표

- **추천 시스템**을 연구하고 이해하기 위한 **기본적인 지식**을 살펴 봅니다.

- **머신 러닝**(Machine Learning)기반의 추천 시스템의 기본 지식을 다룹니다. 

- 사용자와 아이템간의 **상호작용을 패턴**을 모델링에 적합한 **Matrix Factorization(행렬 분해)** 모델을 깊숙히 알아 봅니다. 

- 모수적 모델(Parameteric Model)을 만들고 학습하기 위한 Framework인 **Tensorflow**을 활용해 봅니다.

- **Cold Start Problem**을 극복하기 위한 다양한 속성을 활용과 학습 방법을 알아 봅니다.

- 간접 피드백 데이터를 **Negative sampling**기법을 다루어 봅니다.


## 진행 방식

모든 강의 자료는 Python Notebook(ipynb) 중심으로 구성되었습니다. 

ipynb에는 Markdown으로 추천 관련 내용과 개념을 설명하기 위한 코드들과 약간의 실습이 주어집니다. 

노트에서 설명하는 내용을 같이 이해해보는 형식으로 진행됩니다.

→ 노트에서 제시된 추천 시스템을 구현 사항 들은 하나의 참고 자료일 뿐입니다.


# 환경 구성

**OS: WSL2(Windows Subsystem for Linux 2)**

In [None]:
import os
import sys
print('Python', sys.version)

## 주요 패키지

### pandas

데이터 처리 라이브러리

In [None]:
try:
    import pandas as pd
except:
    !pip install --upgrade pandas
    import pandas as pd

pd.__name__, pd.__version__

### numpy

수치 연산 라이브러리

In [None]:
try:
    import numpy as np
except:
    !pip install --upgrade numpy 
    import numpy as np

np.__name__, np.__version__

### scipy

과학용 수치 연산 라이브러리

In [None]:
try:
    import scipy
except:
    !pip install --upgrade scipy
    import scipy

scipy.__name__, scipy.__version__

### scikit-learn

머신러닝 라이브러리

In [None]:
try:
    import sklearn
except:
    !pip install --upgrade scikit-learn
    import sklearn
sklearn.__name__, sklearn.__version__

### matplotlib

시각화 라이브러리

In [None]:
try:
    import matplotlib as mpl
except:
    !pip install --upgrade matplotlib
    import matplotlib as mpl
mpl.__name__, mpl.__version__

### seaborn

차트 중심 시각화 라이브러리

In [None]:
try:
    import seaborn as sns
except:
    !pip install --upgrade seaborn
    import seaborn as sns
sns.__name__, sns.__version__

### LightGBM

Gradient Boosting Tree 라이브러리

In [None]:
try:
    import lightgbm as lgb
except:
    !pip install --upgrade lightgbm
    import lightgbm as lgb
lgb.__name__, lgb.__version__

### KIWI

한글 형태소 분석기: [KIWI](https://github.com/bab2min/kiwipiepy)

In [None]:
try:
    import kiwipiepy
except:
    !pip install --upgrade kiwipiepy
    import kiwipiepy

kiwipiepy.__name__, kiwipiepy.__version__

## Tensorflow 

딥러닝 프레임웤: [Tensorflow](https://www.tensorflow.org/)

# GPU 버젼 Tensorflow 설치

교육장 환경 설치 기준

Windows 버젼에서는 WSL 2(Window Subversion for Linux 2)을 이용을 해야만 최신 버젼의 Tensorflow를

GPU 환경에서 구동을 시킬 수 있습니다.

Windows 10 Version H2 업데이트가 되어야만 WSL 2를 구동시킬수 있습니다.

**WSL** 환경 구축 방법

커멘드 라인을 구동시킵니다.
```
cmd
```

```
wsl --update
```

```
wsl --install -d Ubuntu
```

**WSL** 실행 방법

```
cmd
wsl
```

**GPU** 환경 구축 방법

최신 GPU 드라이버를 다운로드 받습니다: [다운로드 링크](https://www.nvidia.com/download/index.aspx)



```bash
nvidia-smi
```

만일 nvidia-smi가 동작을 하지 않을 경우. nvidia-smi를 최신버젼으로 업데이트 합니다.
```bash
```

**Tensorflow 설치**

```bash
pip install --upgrade tensorflow[and-cuda]
```

In [None]:
# TF_CPP_MIN_LOG_LEVEL: Tensorflow에서 출력할 로그의 수준을 지정합니다. 
# 0 = all messages are logged (default behavior)
# 1 = INFO messages are not printed
# 2 = INFO and WARNING messages are not printed
# 3 = INFO, WARNING, and ERROR messages are not printed

# 불필요한 경고 메세지가 너무 많이 나와서 내용 파악에 어려움이 있어
# Tensorflow에서 출력하는 경고 메세지를 보이지 않게 조정합니다.
# 개발 단계에서는 비활성화 시키지 않는 것을 권장드립니다. 
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
import tensorflow as tf

tf.__name__, tf.__version__

## 기타

### tqdm 

프로그레스바 모듈입니다.

In [None]:
try:
    import tqdm
except:
    !pip install --upgrade tqdm

## 강의 목차

### 1일차

**오전**

1. MovieLens 데이터셋 소개

2. 추천 시스템 개론 I - 초간단 추천 로직 만들기

**오후**

2. 추천 시스템 개론 II

3. 머신 러닝 I - 지도학습

### 2일차

**오전**

3. 머신 러닝 II - 비지도학습

4. Matrix Factorization 1-1

**오후**

4. Matrix Factorization 1-2

5. Matrix Factorization 2

### 3일차

**오전**

6. Matrix Factorization 3

**오후**

7. Negative Sampling