# Support Vector Regression(SVR)

課程範例程式及資料檔下載網址： https://www.superdatascience.com/machine-learning/

## Importing the Libraries 載入套件

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib notebook

## Importing the Dataset 讀入資料

利用 pd.read_csv 來載入資料，這組資料是一個 10 列(row) 3 行(column) 職稱位階與薪資的資料，其中共包含了 10 個位階的資訊。

In [2]:
path = '/Users/hsinyu/Desktop/SVR/'
dataset = pd.read_csv( path+'Position_Salaries.csv' )

In [3]:
dataset

Unnamed: 0,Position,Level,Salary
0,Business Analyst,1,45000
1,Junior Consultant,2,50000
2,Senior Consultant,3,60000
3,Manager,4,80000
4,Country Manager,5,110000
5,Region Manager,6,150000
6,Partner,7,200000
7,Senior Partner,8,300000
8,C-level,9,500000
9,CEO,10,1000000


## Dependent & independent variables 定義解釋變數及反應變數

In [4]:
X = dataset.iloc[:, 1:2].values 
y = dataset.iloc[:, 2:3].values

[Note] <br>
> 1. Independent Variable 的部分只會用到 Level 
> 2. 使用 `dataset.iloc[:, 1:2].values ` 而不是 `dataset.iloc[:, 1].values` 的原因是因為待會建立模型時，X 必須是 Matrix 而非Vector

<div class="alert alert-warning" role="alert">
  <strong>My Note</strong>
</div>

#### Support Vector Regression(SVR) Intuition

<b>Support Vector Regression 支持向量迴歸</b>

SVR 是從 SVM 衍生而來的， SVR 的目標是為了尋找空間中的最適平面，並能準確的預測資料的分佈
<br><br>
SVR 中會使用到核函數(Kernel Function)，常用的核函數(Kernel Function)有四個：
1. 線性核函數(Linear kernel)
2. 多項式核函數(Polynomial Kernel) 
3. 輻射基底核函數(Radial Base Function)
4. Sigmoid 核函數 

以這個 dataset 為例，想了解位階與薪資之間的關係 <br>
> 假設位階與薪資之間是呈現一個曲線關係，那麼想判定一名新進員工的預期年薪是否符合他所說的標準，則可以使用該名員工前公司各職稱與位階的年薪，建立出一個多項式迴歸模型來做判定。 <br><br>
> 下圖為各位階與薪水的關係，可以發現確實有一個曲線的關係存在
![](plot_2_4_1.png)

> [Note] 因為是一個曲線關係，因此 Kernel Function 的部分，就不考慮線性核函數(Linear kernel)

<div class="alert alert-danger" role="alert">
  <strong>Exercise!</strong>
</div>
有一名 Level=6.5 的員工，宣稱他的年薪要 16 萬，希望利用支持向量回歸模型來驗證他說的話是否誠實

## Splitting the dataset into the Training set and Test set 切分訓練及測試樣本

因為這個 dataset 只有 10 筆觀測值，若硬要做切分訓練及測試樣本那麼會不夠資訊來建立模型，因此不建議做切分訓練及測試樣本。

## Feature Scaling

In [5]:
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
sc_y = StandardScaler()
X_s = sc_X.fit_transform(X)
y_s = sc_y.fit_transform(y)



> [Note]
> 1. sklearn.svm 中 SVR 這個 class 沒有幫忙做 Feature Scaling，且因為 SVR 會考慮到距離，所以要記得先做 Feature Scaling 最後配適的模型才會比較好

## Fitting Support Vector Regression(SVR) to the dataset

> [Note]
常用的核函數(Kernel Function)有四個：
1. linear ： 線性核函數(Linear kernel)
2. ploy ： 多項式核函數(Polynomial Kernel) 
3. rbf ： 輻射基底核函數(Radial Base Function)
4. sigomid ： Sigmoid 核函數 

> 因為資料為非線性的，因此不選擇 linear 改用 rbf，而 rbf 是較常使用的 Kernel ， ploy 會在計算上花很長的時間

#### A. 沒有做 Feature Scaling，`kernel = 'rbf'`

In [6]:
from sklearn.svm import SVR
regressor_A = SVR(kernel = 'rbf')
regressor_A.fit(X, y)

  y = column_or_1d(y, warn=True)


SVR(C=1.0, cache_size=200, coef0=0.0, degree=3, epsilon=0.1, gamma='auto',
  kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False)

#### B. 做 Feature Scaling，`kernel = 'rbf'`

In [7]:
from sklearn.svm import SVR
regressor_B = SVR(kernel = 'rbf')
regressor_B.fit(X_s, y_s)

  y = column_or_1d(y, warn=True)


SVR(C=1.0, cache_size=200, coef0=0.0, degree=3, epsilon=0.1, gamma='auto',
  kernel='rbf', max_iter=-1, shrinking=True, tol=0.001, verbose=False)

## Visualising the Support Vector Regression(SVR)  results (for higher resolution and smoother curve)

#### A. 沒有做 Feature Scaling，kernel = 'rbf'

In [8]:
plt.scatter(X, y, color = 'red')
plt.plot(X, regressor_A.predict(X), color = 'blue')
plt.title('Truth or Bluff (SVR)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

<IPython.core.display.Javascript object>

> [Note] 發現沒有做 Feature Scaling Fit 出來的 Model 很差

#### B. 做 Feature Scaling，`kernel = 'rbf'`

In [9]:
plt.scatter(X_s, y_s, color = 'red')
plt.plot(X_s, regressor_B.predict(X_s), color = 'blue')
plt.title('Truth or Bluff (SVR)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

<IPython.core.display.Javascript object>

In [10]:
X_grid = np.arange(min(X_s), max(X_s), 0.1)
X_grid = X_grid.reshape((len(X_grid), 1))
plt.scatter(X_s, y_s, color = 'red')
plt.plot(X_grid, regressor_B.predict(X_grid), color = 'blue')
plt.title('Truth or Bluff (SVR)')
plt.xlabel('Position level')
plt.ylabel('Salary')
plt.show()

<IPython.core.display.Javascript object>

> [Note]
> 從圖中可以看出實際值跟預測值間差距很小，所以可以判定 SVR 運用在這組資料上表現還不錯。

## Predicting a new result with Support Vector Regression(SVR) 

#### A. 沒有做 Feature Scaling，`kernel = 'rbf'`

In [11]:
regressor_A.predict(6.5)

array([ 130001.55760156])

> [Note] 預測 level=6.5 的年薪約有 13 萬 

#### B. 做 Feature Scaling，`kernel = 'rbf'`

In [12]:
regressor_B.predict(sc_X.transform(np.array([[6.5]])))

array([-0.27861589])

In [13]:
sc_y.inverse_transform( regressor_B.predict(sc_X.transform(np.array([[6.5]]))) )

array([ 170370.0204065])

> [Note] 
1. transform 這個 Method 有規定放進去的 input 必須要是 np.array
2. regressor_B 在建立 Model 時，X 有做 Feature Scaling ，所以若要去預測 y 丟入 Model 的 X 也必須經過相同的 Feature Scaling 轉換，而最後 y 還需要再做 inverse_transform 將預測出來的 y 值轉回原本資料集的 Scaling。

<div class="alert alert-success" role="alert">
  <strong>Answer!</strong>
</div>
利用 Polynomial Regression 預測 level=6.5 的年薪約有 17 萬，表示該名員工提出的需求很誠實。