# 可选实验：使用Scikit-learn进行线性回归

有一个开源的、可商业使用的机器学习工具包，称为[scikit-learn](https://scikit-learn.org/stable/index.html)。该工具包包含您将在本课程中使用的许多算法的实现。

## 目标

在本实验室中，您将：

- 利用scikit-learn使用基于正规方程的封闭形式解来实现线性回归

## 工具

您将使用scikit-learn以及matplotlib和NumPy中的函数。

In [1]:
import numpy as np

np.set_printoptions(precision=2)
from sklearn.linear_model import LinearRegression, SGDRegressor
from sklearn.preprocessing import StandardScaler
from lab_utils_multi import load_house_data
import matplotlib.pyplot as plt

dlblue = '#0096ff'
dlorange = '#FF9300'
dldarkred = '#C00000'
dlmagenta = '#FF40FF'
dlpurple = '#7030A0'
plt.style.use('./deeplearning.mplstyle')

# 线性回归，封闭式解

scikit-learn具有[线性回归模型](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression)，它实现了封闭式线性回归。

让我们使用早期实验室的数据——一栋1000平方英尺的房子售价为30万美元，一栋2000平方英尺的房子售价为50万美元。

| 尺寸（1000 平方英尺） | 价格（千美元） |
|---------------|---------|
| 1             | 300     | 
| 2             | 500     | 

### 加载数据集

In [2]:
X_train = np.array([1.0, 2.0])
y_train = np.array([300, 500])

### 创建并拟合模型

下面的代码使用scikit-learn执行回归。

第一步创建一个回归对象。

第二步利用与对象`fit`关联的方法之一。这将执行回归，将参数拟合到输入数据。该工具包需要一个二维$\mathbf{X}$矩阵。

In [3]:
linear_model = LinearRegression()
linear_model.fit(X_train.reshape(-1, 1), y_train)

### 查看参数

$\mathbf{w}$和$\mathbf{b}$参数在scikit-learn中被称为“系数”和“截距”。

In [4]:
b = linear_model.intercept_
w = linear_model.coef_
print(f"w = {w:}, b = {b:0.2f}")
print(f"'manual' prediction: f_wb = wx+b : {1200 * w + b}")

### 作出预测

调用`predict`函数会生成预测。

In [5]:
y_pred = linear_model.predict(X_train.reshape(-1, 1))
print("Prediction on training set:", y_pred)
X_test = np.array([[1200]])
print(f"Prediction for 1200 sqft house: ${linear_model.predict(X_test)[0]:0.2f}")

## 第二个例子

第二个示例来自早期的具有多个功能的实验室。最终的参数值和预测非常接近该实验室的非标准化“长期”结果。这种非标准化的运行需要几个小时才能产生结果，而这几乎是瞬时的。封闭式解决方案在较小的数据集（例如这些数据集）上运行良好，但在较大的数据集上可能需要计算。

>闭式解不需要归一化。

In [7]:
X_train, y_train = load_house_data()
X_features = ['size(sqft)', 'bedrooms', 'floors', 'age']

In [9]:
linear_model = LinearRegression()
linear_model.fit(X_train, y_train)

In [10]:
b = linear_model.intercept_
w = linear_model.coef_
print(f"w = {w:}, b = {b:0.2f}")

In [11]:
print(f"Prediction on training set:\n {linear_model.predict(X_train)[:4]}")
print(f"prediction using w,b:\n {(X_train @ w + b)[:4]}")
print(f"Target values \n {y_train[:4]}")

x_house = np.array([1200, 3, 1, 40]).reshape(-1, 4)
x_house_predict = linear_model.predict(x_house)[0]
print(f" predicted price of a house with 1200 sqft, 3 bedrooms, 1 floor, 40 years old = ${x_house_predict * 1000:0.2f}")

## 恭喜！

在本实验室中，您：

- 使用开源机器学习工具包scikit-learn
- 使用该工具包中的封闭式解决方案实现线性回归