## 线性模型

In [6]:
%config ZMQInteractiveShell.ast_node_interactivity='all'

### 普通最小二乘法 LinearRegression
![image.png](attachment:image.png)

In [7]:
from sklearn import linear_model

X_train = [[0, 0], [1, 1], [2, 2]]
y_train = [0, 1, 2]
X_test = [[3, 3], [4, 4]]

reg = linear_model.LinearRegression()
reg.fit(X_train, y_train)
y_predict = reg.predict(X_test)

reg.coef_
reg.intercept_
y_predict

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

array([0.5, 0.5])

2.220446049250313e-16

array([3., 4.])

### 岭回归 Ridge 
![image.png](attachment:image.png)

In [12]:
from sklearn import linear_model
reg = linear_model.Ridge (alpha = .5)
reg.fit ([[0, 0], [0, 0], [1, 1]], [0, .1, 1])
reg.coef_
reg.intercept_

Ridge(alpha=0.5, copy_X=True, fit_intercept=True, max_iter=None,
      normalize=False, random_state=None, solver='auto', tol=0.001)

array([0.34545455, 0.34545455])

0.1363636363636364

In [17]:
# 加入对alpha参数交叉验证的岭回归.
from sklearn import linear_model

# cv参数: 指定KFlod的折数
reg = linear_model.RidgeCV(alphas=[0.1, 1.0, 10.0])
reg.fit([[0, 0], [0, 0], [1, 1]], [0, .1, 1])       
reg.alpha_       

RidgeCV(alphas=array([ 0.1,  1. , 10. ]), cv=None, fit_intercept=True,
        gcv_mode=None, normalize=False, scoring=None, store_cv_values=False)

0.1

### Lasso
+ 是拟合稀疏系数的线性模型, 实现使用了 coordinate descent （坐标下降算法）来拟合系数
![image.png](attachment:image.png)

* 注意: 使用 Lasso 进行特征选择
    * 由于 Lasso 回归产生稀疏模型，因此可以用于执行特征选择，详见 基于 L1 的特征选取 。

In [15]:
from sklearn import linear_model
reg = linear_model.Lasso(alpha = 0.1)
reg.fit([[0, 0], [1, 1]], [0, 1])
reg.predict([[1, 1]])
reg.coef_

Lasso(alpha=0.1, copy_X=True, fit_intercept=True, max_iter=1000,
      normalize=False, positive=False, precompute=False, random_state=None,
      selection='cyclic', tol=0.0001, warm_start=False)

array([0.8])

array([0.6, 0. ])

### 通过交叉验证来设置$\alpha$的Lasso
+ LassoCV 和 LassoLarsCV(基于最小角回归)
+ alpha 参数控制估计系数的稀疏度

### 多任务 Lasso
+ MultiTaskLasso 估计多元回归稀疏系数的线性模型
![image.png](attachment:image.png)
![title](https://sklearn.apachecn.org/docs/0.21.3/img/9259b19a18f30f67db9e45b8c0b361c7.jpg)
![title](https://sklearn.apachecn.org/docs/0.21.3/img/2f373d871220ee042a8c2ee44e6fff3a.jpg)


### 弹性网络
+ 最小化的目标函数 ![image.png](attachment:image.png)
+ ElasticNetCV 通过交叉验证来设置参数 alpha ($\alpha$) 和 l1_ratio($\rho$)
+ 多任务弹性网络 MultiTaskElasticNet

In [19]:
from sklearn import linear_model
reg = linear_model.LassoLars(alpha=.1)
reg.fit([[0, 0], [1, 1]], [0, 1])  
reg.coef_    

LassoLars(alpha=0.1, copy_X=True, eps=2.220446049250313e-16, fit_intercept=True,
          fit_path=True, max_iter=500, normalize=True, positive=False,
          precompute='auto', verbose=False)

array([0.71715729, 0.        ])

### SVM,SVC,SVR

In [148]:
from sklearn import svm

X = [[0, 0], [1, 1]]
y = [0, 1]

# svc作分类
clf = svm.SVC(gamma='scale')
clf.fit(X, y)  
clf.predict([[2., 2.], [2, -10]])


## 支持向量的部分特性可以在 support_vectors_, support_ 和 n_support 找到
# 获得支持向量
clf.support_vectors_

# 获得支持向量的索引
clf.support_

# 为每一个类别获得支持向量的数量
clf.n_support_


SVC(C=1.0, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovr', degree=3, gamma='scale', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)

array([1, 0])

array([[0., 0.],
       [1., 1.]])

array([0, 1])

array([1, 1])

#### 多元分类
+ SVC 和 NuSVC 为多元分类实现了 “one-against-one” 的方法
    * 将构建n_class * (n_class - 1) / 2 个分类器（n_class为类别数）
    * decision_function_shape属性:允许 “one-against-one” 分类器生成(n_samples, n_classes)大小决策函数:
+ LinearSVC 实现 “one-vs-the-rest” 多类别策略
    * 将构建n_class个分类器（n_class为类别数）

In [152]:
X = [[0], [1], [2], [3]]
Y = [0, 1, 2, 3]
clf = svm.SVC(gamma='scale', decision_function_shape='ovo')
clf.fit(X, Y)

dec = clf.decision_function([[1],[2]])
dec.shape

clf.decision_function_shape = "ovr"
dec = clf.decision_function([[1]])
dec.shape[1] # 4 classes

SVC(C=1.0, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,
    decision_function_shape='ovo', degree=3, gamma='scale', kernel='rbf',
    max_iter=-1, probability=False, random_state=None, shrinking=True,
    tol=0.001, verbose=False)

(2, 6)

4