# Polynomial Regression <hr>
## Polynomial Regression 理論概述

### Regression Equation

![](回歸方程式.png)

這邊主要在介紹幾種回歸的本身的差異：<br>
1.簡單線性回歸 ：截距項+單一變數 $X_1$ 的線性方程式。<br>
2.複回歸      ：截距項+多個變數 $X_1$~$X_n$的線性方程式。<br>
3.多項式回歸   ：截距項+單一變數 $X_1^n$的非線性方程式，屬於複回歸的一種特例。<hr>

### Simple Linear Regression Plot

![](plot_simple.png)

### Ploynomial Regression Plot

![](plot_ploynomial.png)

### why <font color='blue'>"Linear"</font>?
通常在判斷是否為線性方程式時，不是在觀察X變數是否為線性，而是去觀察它的係數$b_n$是否可以用線性組合來表達，可不可以再加上X的值去預測出Y，所以線性還非線性是去看係數，當係數相對於y呈線性關係，即稱線性模型。
***

## Python範例

### 分成幾個部分：<br>
 1.資料集說明。<br> 
 2.資料預處理。<br>
 3.建立預測模型。<br>
 4.圖形比較。 <br>
 5.預測比較。<hr>

### <font color='blue'>1.資料集說明 </font>

![](dataset.png)

<font color='blue'>情境描述 </font>：有一個公司的人資團隊為了要雇用新員工，在面試的過程中談論到預期薪資，面試者說他過去有20年以上的工作經驗，前一份工作年薪16萬，所以預期年薪不低於原薪水，而人資向面試者前公司索取他們各職等的年薪，人資根據面試者在此的經歷(<font color='red'>Region Manager兩年 </font>，且平均四年可以往上升一階，所以約在<font color='red'>6.5 </font>的職等上)，去判斷他說的年薪真假與否。<br>

此資料集共有三個欄位：職位(Position)、職等(Level)、年薪(Salary)。而職位和職等是屬於相同的概念，所以我們只取職等(Level)、年薪(Salary)兩個欄位，用職等(Level)對年薪(Salary)進行預測。<Hr>


### <font color='blue'>2.資料預處理 </font>

#### 載入套件

In [3]:
#Polynomial Regression
#importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os

#### 修改當下檔案開啟目錄

In [4]:
os.chdir("/Users/aa006/Desktop/Machine Learning A-Z Template Folder/Part 2 - Regression/Section 6 - Polynomial Regression")

#### 載入資料

In [5]:
#Importing the dataset
dataset  =pd.read_csv('Position_Salaries.csv')
X =dataset.iloc[:,1:2].values
y =dataset.iloc[:,2].values

因為資料筆數過少(10筆)，所以作者在這邊沒有做 Data Split 。<br>
在這裡不做Data Split 有兩個原因，一個是資料筆數太少，二是我們需要很精確的預測結果，因為要用來談薪水，所以需要盡可能多的資訊。

### <font color='blue'>3.建立預測模型 </font>

因為X變數只有一個，所以作者在這邊分別利用簡單線性回歸VS多項式回歸進行預測模型並且比較結果。

##### 簡單線性回歸

In [6]:
#Fitting Linear Regression to the dataset
from sklearn.linear_model import LinearRegression
lin_reg =LinearRegression()
lin_reg.fit(X,y)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

#####  多項式回歸

In [7]:
#Fitting polynomial Regression to the dataset
from sklearn.preprocessing import PolynomialFeatures
poly_reg =PolynomialFeatures(degree =2)
X_poly =poly_reg.fit_transform(X)
lin_reg2 =LinearRegression()
lin_reg2.fit(X_poly,y)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)

為了比較一般線性和多項式回歸的差異，作者在這邊建立了兩個方程式，一個簡單線性回歸取名為lin_reg，一個多項式回歸取名為poly_reg。<br>
多項式回歸在執行前要利用預處理的library將多項式的class PolynomialFeatures讀入。