# Simple Linear Regression Introduction

## 相關方程式

### 簡單線性迴歸

$\hat{y} = mx + b$

where:
- $\hat{y}$ 表示預測的輸出值或目標值，它是一個由模型計算出的估計值，用於近似真實值 y。
- $m$ 為斜率
- $b$ 為截距

### 斜率

$m = \frac{n\sum{xy}-\sum{x}\sum{y}}{n\sum{x^{2}}-(\sum{x})^2}$

where:
- $n$ 表示有多少個值

### 截距

$b = \frac{\sum{y}-m\sum{x}}{n}$

### 殘差

$residual = actual - predicted$

### 殘差平方和

$residual square = actual - predicted$

## 實作

### 生成數據

In [5]:
import pandas as pd

In [6]:
data = pd.DataFrame({'x': [1, 2, 3, 4, 5, 6], 
                     'y': [28, 38, 23, 112, 79, 115]})
data

Unnamed: 0,x,y
0,1,28
1,2,38
2,3,23
3,4,112
4,5,79
5,6,115


### 斜率計算

In [7]:
n = 6
sum_x = sum(data['x'])
sum_y = sum(data['y'])
sum_xy = sum(data['x'] * data['y'])
sum_multiple_x_square = sum(pow(data['x'], 2))

In [8]:
m = (n * sum_xy - sum_x * sum_y) / (n * sum_multiple_x_square - (sum_x) ** 2)
m

18.485714285714284

### 截距計算

In [9]:
b = (sum_y - m * sum_x) / n
b

1.1333333333333353

### 預測

設 x = 7

In [10]:
m * 7 + b

130.5333333333333