__Import thư viện__

In [1]:
import numpy as np

# I. Thuật toán

## 1. Toán:
### Dạng của Linear Regression: 
$$ y \approx \mathbf{\bar{x}}\mathbf{w} = \hat{y} ~~~(1)$$
Ghi chú:

- $\mathbf{\bar{x}} = [1, x_1, x_2, x_3]$ (vectơ dòng)
- $\mathbf{w} = [w_0, w_1, w_2, w_3]^T$ (vectơ cột)

###  Công thức tính sai số:
$$ \frac{1}{2}e^2 = \frac{1}{2}(y - \hat{y})^2 = \frac{1}{2}(y - \mathbf{\bar{x}}\mathbf{w})^2 $$
Ghi chú:
- Hệ số $\frac{1}{2}$ để thuận tiện cho việc tính toán (khi tính đạo hàm thì số $\frac{1}{2}$ sẽ bị triệt tiêu).
- Không dùng trị tuyệt đối $|e|$ mà lại dùng bình phương $e^2$ hàm bình phương có đạo hàm tại mọi nơi, trong khi hàm trị tuyệt đối thì đạo hàm không xác định tại 0.

### Hàm mất mát:
$$\mathcal{L}(\mathbf{w}) = \frac{1}{2}\sum_{i=1}^N (y_i - \mathbf{\bar{x}}_i\mathbf{w})^2$$
$$= \frac{1}{2}\|\mathbf{y} - \mathbf{\bar{X}}\mathbf{w} \|_2^2$$
Ghi chú:
- $\| \mathbf{z} \|_2^2$ là tổng của bình phương mỗi phần tử của vecto $\mathbf{z}$

### Đạo hàm:
$$\frac{\partial{\mathcal{L}(\mathbf{w})}}{\partial{\mathbf{w}}} = \frac{1}{2}(\|\mathbf{y} - \mathbf{\bar{X}}\mathbf{w} \|_2^2)'$$
$$= -\frac{1}{2}(\|\mathbf{\bar{X}}\mathbf{w} - \mathbf{y} \|_2^2)'$$
$$= -\frac{1}{2}2\mathbf{\bar{X}}^T(\mathbf{\bar{X}}\mathbf{w} - \mathbf{y})$$
$$= \mathbf{\bar{X}}^T(\mathbf{\bar{X}}\mathbf{w} - \mathbf{y})$$
Ghi chú:
- $(\|\mathbf{A}\mathbf{x} - \mathbf{b} \|_2^2)' = 2\mathbf{A}^T(\mathbf{A}\mathbf{x} - \mathbf{b})$

### Theta:
$$\mathbf{\bar{X}}^T(\mathbf{\bar{X}}\mathbf{w} - \mathbf{y})=0$$
$$\mathbf{\bar{X}}^T\mathbf{\bar{X}}\mathbf{w} = \mathbf{\bar{X}}^T\mathbf{y}$$
$$\mathbf{w}= (\mathbf{\bar{X}}^T\mathbf{\bar{X}})^{\dagger} \mathbf{\bar{X}}^T\mathbf{y} ~~~(2)$$

## 2. Code:
- Bước 1: Dùng công thức (2) tính $\mathbf{w}$
- Bước 2: Dùng công thức (1) tính $\hat{y}$ từ $\mathbf{X}$ và $\mathbf{w}$

In [5]:
# Tính theta
def calculate_theta(X_train, y_train):
    X_bar = np.c_[np.ones(X_train.shape), X_train]
    theta = np.dot(np.linalg.pinv(np.dot(X_bar.T, X_bar)), np.dot(X_bar.T, y_train))
    return theta

In [3]:
# Tính y_predict
def predict(X_test, theta):
    X_bar = np.c_[np.ones(X_test.shape), X_test]
    y_pre = np.dot(X_bar, theta)
    return y_pre

# II. Áp dụng

Dự đoán cân nặng của một người dựa vào chiều cao của họ.
<table>
  <thead>
    <tr>
      <th style="text-align: center">Chiều cao (cm)</th>
      <th style="text-align: center">Cân nặng (kg)</th>
      <th style="text-align: center">Chiều cao (cm)</th>
      <th style="text-align: center">Cân nặng (kg)</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td style="text-align: center">147</td>
      <td style="text-align: center">49</td>
      <td style="text-align: center">168</td>
      <td style="text-align: center">60</td>
    </tr>
    <tr>
      <td style="text-align: center">150</td>
      <td style="text-align: center">50</td>
      <td style="text-align: center">170</td>
      <td style="text-align: center">72</td>
    </tr>
    <tr>
      <td style="text-align: center">153</td>
      <td style="text-align: center">51</td>
      <td style="text-align: center">173</td>
      <td style="text-align: center">63</td>
    </tr>
    <tr>
      <td style="text-align: center">155</td>
      <td style="text-align: center">52</td>
      <td style="text-align: center">175</td>
      <td style="text-align: center">64</td>
    </tr>
    <tr>
      <td style="text-align: center">158</td>
      <td style="text-align: center">54</td>
      <td style="text-align: center">178</td>
      <td style="text-align: center">66</td>
    </tr>
    <tr>
      <td style="text-align: center">160</td>
      <td style="text-align: center">56</td>
      <td style="text-align: center">180</td>
      <td style="text-align: center">67</td>
    </tr>
    <tr>
      <td style="text-align: center">163</td>
      <td style="text-align: center">58</td>
      <td style="text-align: center">183</td>
      <td style="text-align: center">68</td>
    </tr>
    <tr>
      <td style="text-align: center">165</td>
      <td style="text-align: center">59</td>
      <td style="text-align: center">&nbsp;</td>
      <td style="text-align: center">&nbsp;</td>
    </tr>
  </tbody>
</table>

In [4]:
# Load dữ liệu
X_train = np.array([147, 150, 153, 158, 163, 165, 168, 170, 173, 175, 178, 180, 183]).reshape(-1,1)
y_train = np.array([ 49, 50, 51,  54, 58, 59, 60, 62, 63, 64, 66, 67, 68]).reshape(-1,1)
# Tính theta
theta = calculate_theta(X_train, y_train)
# Predict
X_test = np.array([155, 160]).reshape(-1,1)
y_pre = predict(X_test, theta)
print (y_pre)

[[52.94135889]
 [55.7373837 ]]
