In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
data = np.array([[1, 0, 1, 1, 0, 0, 0, 0, 0, 0], #1번 유저의 1~10번 레시피 선호도
                [0, 1, 0, 0, 1, np.nan, 0, 0, 0, 1], #2번 유저
                [1, np.nan, 1, 1, 1, 0, 1, 0, 0, 0],
                [0, 1, 0, 0, 1, 1, 0, 1, 0, 1],
                [1, 1, 0, np.nan, 0, 0, 0, 0, 1, 0],
                [1, 0, 1, 0, 1, np.nan, 1, 1, 0, 0],
                [0, 0, 0, 1, 1, 0, 1, 0, 1, 1],
                [np.nan, 1, 0, 0, np.nan, 1, 0, 1, 0, 0],
                [0, np.nan, 0, 1, 0, 0, 0, 1, 0, 0],
                [1, 0, 0, 0, 1, 1, 0, 1, np.nan, 1], #10번 유저
                [1, 1, 1, 0, 0, 1, 1, 1, 1, 1],
                [0, np.nan, np.nan, np.nan, 1, np.nan, 1, 1, np.nan, np.nan],
                [0, 0, 0, 0, 1, 0, 1, np.nan, 0, 1],
                [1, np.nan, 0, 0, np.nan, 1, 1, 0, 1, 1]]) 

In [None]:
np.set_printoptions(precision=2)
np.set_printoptions(suppress=True)

def predict(Theta, X): #행렬곱으로 예측값 계산하는 함수
    return Theta @ X

def cost(prediction, R): #손실함수(비용함수) 평균제곱오차(MSE) 계산
    return np.nansum((prediction - R)**2)

def initialize(R, num_features): #랜덤값을 채워 임의의 theta, x를 만들어주는 함수
    num_users, num_items = R.shape    
    Theta = np.random.rand(num_users, num_features)
    X = np.random.rand(num_features, num_items)   
    return Theta, X

#평점 데이터 행렬 R, 유저 행렬 Theta, 레시피 행렬 X, 경사 하강 횟수 iteration, 학습률 alpha, 그리고 정규화 상수 lambda_
def gradient_descent(R, Theta, X, iteration, alpha, lambda_):
    num_user, num_items = R.shape
    num_features = len(X) 
    costs = []  #손실계산값을 담을 리스트
    for _ in range(iteration):
        prediction = predict(Theta, X) #예측값 계산
        error = prediction - R #오차 계산
        costs.append(cost(prediction, R)) #손실을 costs 리스트에 추가

        for i in range(num_user):
            for j in range(num_items):
                if not np.isnan(R[i][j]): #실제 데이터 평점이 없는값은 건너뛰기
                    for k in range(num_features):
                        Theta[i][k] -= alpha * (np.nansum(error[i, :]*X[k, :]) + lambda_*Theta[i][k])
                        X[k][j] -= alpha * (np.nansum(error[:, j]*Theta[:, k]) + lambda_*X[k][j])
                        
    return Theta, X, costs


R = data        
Theta, X = initialize(R, 5)  #행렬들 초기화
Theta, X, costs = gradient_descent(R, Theta, X, 300, 0.001, 0.01)  #경사 하강
    
plt.plot(costs)

Theta, X

In [None]:
result = Theta @ X
print('기존 data:\n', data)
print('머신러닝으로 추측:\n', result)

In [None]:
num_user, num_items = R.shape
for i in range(num_user):
    for j in range(num_items):
        if np.isnan(R[i][j]):
            R[i][j] = (Theta[i,:] @ X[:,j])
            if R[i][j] > 0.5:
                print("%d 번 유저에게 추천하는 레시피: %d"%(i+1,j))