## 06 R Squared (R^2)

#### RMSE 和 MAE 的问题
* 分类问题可以比较：不同的问题，结果都在0~1这个区间
* 回归问题：比如预测房价误差是1万元；预测成绩，误差是10分，哪个模型更准确呢？

所以我们要统一这个比较水平

![IMAGE](https://farm2.staticflickr.com/1734/42632427042_6ebd7df76d_o.png)
![IMAGE](https://farm2.staticflickr.com/1732/27812357077_cf551d4e43_o.png)

分母是一个比较「粗犷」的模型，分子是我们「比较精密」的模型
![IMAGE](https://farm2.staticflickr.com/1728/27812468387_3ec4f989b5_o.png)

> 它反映了我们的误差和平均值作为误差的相似程度，相似性越高，说明还不如用均值，模型越差。

* R^2 <= 1

* R^2 越大越好。当我们的预测模型不犯任何错误是，R^2 得到最大值 1
> 若果 R^2 = 0，说明我们的模型和平均值作为的模型一样，所以太差了

* 当我们的模型等于基准模型时，R^2 为 0 如果 R^2 <0，说明我们学习到的模型还不如基准模型。**此时，很有可能我们的数据不存在任何线性关系。**

![IMAGE](https://farm2.staticflickr.com/1743/41962986584_d719bb469e_o.png)更好进行运算

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets

In [2]:
boston = datasets.load_boston()
x = boston.data[:,5] # 只使用房间数量这个特征
y = boston.target

x = x[y < 50.0]
y = y[y < 50.0]

In [3]:
from playML.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, seed=666)

In [4]:
from playML.SimpleLinearRegression import SimpleLinearRegression

reg = SimpleLinearRegression()
reg.fit(x_train, y_train)

SimpleLinearRegression()

In [5]:
reg.a_

7.8608543562689563

In [6]:
reg.b_

-27.45934280670555

In [7]:
y_predict = reg.predict(x_test)

### R Square

In [8]:
from playML.metrics import mean_squared_error

1 - mean_squared_error(y_test, y_predict)/np.var(y_test)

0.61293168039373236

### 封装我们自己的 R Score

代码参见 [这里](playML/metrics.py) 

In [9]:
from playML.metrics import r2_score

r2_score(y_test, y_predict)

0.61293168039373236

### scikit-learn中的 r2_score

In [10]:
from sklearn.metrics import r2_score

r2_score(y_test, y_predict)

0.61293168039373236

scikit-learn中的LinearRegression中的score返回r2_score:[http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html](http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html)

### 在我们的SimpleRegression中添加score

In [11]:
reg.score(x_test, y_test)

0.61293168039373236