## 실습설명
$$
X=
\begin{bmatrix}
x_0^{(1)} & x_1^{(1)} & \cdots & x_n^{(1)} \\
x_0^{(2)} & x_1^{(2)} & \cdots & x_n^{(2)} \\
\vdots \\
x_0^{(m)} & x_1^{(m)} & \cdots & x_n^{(m)}
\end{bmatrix}
,
\theta =
\begin{bmatrix}
\theta_0 \\
\theta_1 \\
\theta_2 \\
\vdots \\
\theta_n \\
\end{bmatrix}
,
y = 
\begin{bmatrix}
y^{(1)} \\
y^{(2)} \\
\vdots \\
y^{(n)}
\end{bmatrix}
$$

일 때, 다중선형회귀 경사하강법을 행렬연산으로

$$
손실함수 \, J(\theta)\, 최소점을\, 찾을\, 때\, 까지(또는\, 미리\, 정한\, 횟수\, 만큼):\\
\\[10pt]
\theta \leftarrow \theta - a\frac{1}{m}X^T(X\theta - y)
$$

이렇게 표현할 수 있다고 했는데요, 이번 레슨에서는 이 내용을 한번 코드로 구현해 보겠습니다.

## `gradient_descent` 함수
`gradient_descent` 함수는 경사하강법을 구현하는 함수입니다.  
파라미터로는 설계행렬 `X`, 파라미터 `theta`, 목표변수 `y`, 경사하강법을 실행하는 횟수 `iterations`,  
그리고 학습률 `alpha`를 받습니다.

`iterations`번 만큼 경사하강법을 진행하고, 그 결과(`theta`)를 리턴합니다.

In [1]:
import numpy as np

In [8]:
def prediction(X, theta):
    """다중 선형 회귀 가정 함수. 모든 데이터에 대한 예측 값을 numpy 배열로 리턴한다"""
    # 지난 실습의 코드를 여기에 붙여 넣으세요
    return X @ theta  # hθ(x⁽¹⁾), hθ(x⁽²⁾), ... hθ(x⁽ᵐ⁾) 벡터.
    

def gradient_descent(X, theta, y, iterations, alpha):
    """다중 선형 회귀 경사 하강법을 구현한 함수"""
    m = len(X)  # 입력 변수 개수 저장
    
    for i in range(iterations):
        # 일단 오류를 구함
        error = prediction(X, theta) - y  # 오차값의 벡터 -- hθ(x⁽ᵐ⁾) - y⁽ᵐ⁾ 벡터
        # X @ error을 계산 -- ∑(hθ(x⁽ᵐ⁾) - y⁽ᵐ⁾)을 구하기 위해.
        # X는 행렬이고 error는 벡터니까 행렬곱 연산자 사용 (X는 전치시켜야 함.)
        # 공식 적용
        theta = theta - alpha / m * (X.T@error)  # 기존 theta 업데이트
        
    return theta

In [9]:
# 입력 변수
house_size = np.array([1.0, 1.5, 1.8, 5, 2.0, 2.5, 3.0, 3.5, 4.0, 5.0, 6.0, 7.0, 8.0, 8.5, 9.0, 10.0])  # 집 크기
distance_from_station = np.array([5, 4.6, 4.2, 3.9, 3.9, 3.6, 3.5, 3.4, 2.9, 2.8, 2.7, 2.3, 2.0, 1.8, 1.5, 1.0])  # 지하철역으로부터의 거리 (km)
number_of_rooms = np.array([1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4])  # 방 수

# 목표 변수
house_price = np.array([3, 3.2, 3.6 , 8, 3.4, 4.5, 5, 5.8, 6, 6.5, 9, 9, 10, 12, 13, 15])  # 집 가격

# 설계 행렬 X 정의
X = np.array([
    np.ones(16),
    house_size,
    distance_from_station,
    number_of_rooms
]).T

# 목표 변수 y 정의
y = house_price

# 파라미터 theta 초기화
theta = np.array([0, 0, 0, 0])

# 학습률 0.01로 100번 경사 하강
theta = gradient_descent(X, theta, y, 100, 0.01)

theta

array([0.11484521, 1.21120425, 0.18270523, 0.30060782])