#### 感知机学习算法  
**输入**：训练数据集$T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N) \}$，其中：  
$x_i \in \chi =R^n$，  
$y_i \in Y=\{-1,+1 \}$，  
$i=1,2,...N$；  
学习率$\eta(1<\eta \le 1)$  
**输出**：$w,b$；感知机模型$f(x)=sign(w\cdot x+b)$  
（1）选取初始值$w_0,b_0$；  
（2）在训练集中选取数据$(x_i,y_i)$；  
（3）如果$y_i(w\cdot x_i+b)\le 0$，  
$w\gets w+\eta y_ix_i$  
$b \gets b+\eta y_i$
（4）转至（2），直至训练集中没有误分类点

In [1]:
import numpy as np

#### 加载Mnist数据集：http://yann.lecun.com/exdb/mnist/
*$fileName$*: 要加载的数据集路径  
*return*: list形式的数据集及标记

In [2]:
def loadData(fileName):
    dataArr = []
    labelArr = []
    fr = open(fileName, 'r')
    # 将文件按行读取
    for line in fr.readlines():
        curLine = line.strip().split(',')
        # Mnsit有0-9是个标记，由于是二分类任务，所以将>=5的作为1，<5为-1
        if int(curLine[0]) >= 5:
            labelArr.append(1)
        else:
            labelArr.append(-1)
        dataArr.append([int(num)/255 for num in curLine[1:]])
    #返回data和label
    return dataArr, labelArr

#### 感知器训练过程  
*$dataArr$*:训练集的数据 (list)  
*$labelArr$*: 训练集的标签(list)  
*$iter$*: 迭代次数，默认50  
*return*: 训练好的w和b

In [18]:
def perceptron(dataArr, labelArr, iter=50):
    #将数据转换成矩阵形式
    dataMat = np.mat(dataArr)
    labelMat = np.mat(labelArr).T
    m, n = np.shape(dataMat)
    #创建初始权重w，偏置b，学习率lr，初始值全为0。
    w = np.zeros((1, np.shape(dataMat)[1]))
    b = 0
    lr = 0.0001
    #进行迭代计算（lter次）
    for k in range(iter):
        #对于每一个样本进行梯度下降
        for i in range(m):
            xi = dataMat[i]
            yi = labelMat[i]
            if -1 * yi * (w * xi.T + b) >= 0:
                #对于误分类样本，进行梯度下降，更新w和b
                w = w + lr *  yi * xi
                b = b + lr * yi
        if k%5 == 0:
            print('Round %d:%d training' % (k, iter))

    #返回训练完的w、b
    return w, b

#### 测试准确率  
*$dataArr$*:测试集  
*$labelArr$*: 测试集标签    
*$w$*: 训练获得的权重w  
*$b$*: 训练获得的偏置b  
*return*: 正确率

In [19]:
def model_test(dataArr, labelArr, w, b):
    dataMat = np.mat(dataArr)
    #将label转换为矩阵并转置
    labelMat = np.mat(labelArr).T
    m, n = np.shape(dataMat)
    #错误样本数计数
    errorCnt = 0
    #遍历所有测试样本
    for i in range(m):
        xi = dataMat[i]
        yi = labelMat[i]
        result = -1 * yi * (w * xi.T + b)
        #如果-yi(w*xi+b)>=0，说明该样本被误分类，错误样本数加一
        if result >= 0: errorCnt += 1
    #正确率 = 1 - （样本分类错误数 / 样本总数）
    accruRate = 1 - (errorCnt / m)
    #返回正确率
    return accruRate

#### 开始实验

In [20]:
#获取训练集及标签
trainData, trainLabel = loadData('Mnist/mnist_train.csv')
#获取测试集及标签
testData, testLabel = loadData('Mnist/mnist_test.csv')

#训练获得权重
w, b = perceptron(trainData, trainLabel, iter = 30)
#进行测试，获得正确率
accuracy = model_test(testData, testLabel, w, b)

#显示正确率
print('accuracy rate is:', accuracy)

Round 0:30 training
Round 5:30 training
Round 10:30 training
Round 15:30 training
Round 20:30 training
Round 25:30 training
accuracy rate is: 0.8172
