ML-in-Action

Perceptron

感知机是典型的分类模型。通过迭代训练来更新参数值，对权重w的更新为 lr*(target_i-predict(x_i))*x_i，对偏执bias的更新为lr*(target_i-predict(x_i))。

Logistic Regression

感知机与逻辑回归的异同：
同
（1）两者都为线性分类器，只能处理线性可分的数据。
（2）两者的优化方法可以统一为GD\SGD。GD是每个训练样本都会出发参数更新，SGD是整个训练迭代结束后进行参数更新。
异
（1）两者的损失函数有所不同，PLA针对误分类点到超平面的距离总和进行建模，LR使用交叉熵损失建模。
LR比PLA的优点之一在于对于激活函数的改进。前者为sigmoid function，后者为step function。 LR使得最终结果有了概率解释的能力（将结果限制在0-1之间），sigmoid为平滑函数（连续可导），能够得到更好的分类结果，而step function为分段函数，对于分类的结果处理比较粗糙，非0即1，而不是返回一个分类的概率。

Linear Regression

(1) 回归模型正是表示从输入变量到输出变量之间映射的函数。回归问题的学习等价于函数拟合：选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。回归就是要尽可能的把所有的样本点拟合到一条曲线上，尽管有的样本点不满足曲线，但是要使得离曲线距离尽可能近。
(2) 分为两个类别：简单线性回归和岭回归（岭回归是添加L2正则化约束）
(3) 实现问题：在公式推导中，我们已经将W矩阵利用样本的特征与label进行了表示，故直接运算即可，不需要进行迭代
(4) 为什么引入岭回归：防止过拟合；这种情况是数据的特征比样本还多，此时的矩阵X不是满秩矩阵，无法求逆。岭回归就是在普通线性回归的基础上引入单位矩阵，使其可逆

KNN

k近邻法(k-NN)是一种基本分类方法。存在一个样本数据集合，每个数据都存在标签，输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本最相似数据(最近邻)的分类标签。
算法：
（1）计算已知类别数据集中的点与当前点之间的距离；
（2）按照距离递增次序排序；
（3）选取与当前点距离最小的k个点；
（4）确定前k个点所在类别的出现频率；
（5）返回前k个点所出现频率最高的类别作为当前点的预测分类。

Decision Tree

决策树是典型的分类算法，简单看就是if-else集合。
算法：
（1）计算样本类别的经验熵
（2）计算每个特征的条件熵
（3）计算每个特征的信息增益（经验熵-条件熵），信息增益越大，则为最优特征，作为根节点
（4）使用ID3算法进行决策树构建
ID3：ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征，递归地构建决策树。
具体方法是：从根结点(root node)开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该特征的不同取值建立子节点；再对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为止。最后得到一个决策树。

SVM

SVM有三宝，间隔、对偶、核技巧
定义：在特征空间上的间隔最大的线性分类器，即求解能够正确划分训练数据集并且几何间隔最大的分离超平面。
区别于感知机：对于线性可分的数据集来说，感知机划分的超平面有无穷多个，但是几何间隔最大的分离超平面却是唯一的

推导

Linear Regression

回归用于预测输入变量和输出变量之间的关系，特别是当输入变量的值发生变化时，输出变量的值随之发生变化。回归模型正是表示从输入变量到输出变量之间映射的函数。回归问题的学习等价于函数拟合：选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。回归就是要尽可能的把所有的样本点拟合到一条曲线上，尽管有的样本点不满足曲线，但是要使得离曲线距离尽可能近。

Name		Name	Last commit message	Last commit date
Latest commit History 42 Commits
Decision Tree		Decision Tree
KNN		KNN
LinearRegression		LinearRegression
LogisticRegression		LogisticRegression
Perceptron		Perceptron
SVM		SVM
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Decision Tree

Decision Tree

KNN

KNN

LinearRegression

LinearRegression

LogisticRegression

LogisticRegression

Perceptron

Perceptron

SVM

SVM

README.md

README.md

Repository files navigation

ML-in-Action

Perceptron

Logistic Regression

Linear Regression

KNN

Decision Tree

SVM

推导

Linear Regression

推导

About

Releases

Packages

Languages

zhenshen-mla/ML-in-Action

Folders and files

Latest commit

History

Repository files navigation

ML-in-Action

Perceptron

Logistic Regression

Linear Regression

KNN

Decision Tree

SVM

推导

Linear Regression

推导

About

Resources

Stars

Watchers

Forks

Languages