In [1]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_breast_cancer

In [136]:
from modelPractice.Model import Model
class PLA(Model):
    def __init__(self,X,y,with_regular=False,penalty='l1',C=1.0):
        super().__init__(name='Perceptron Learning Algorithm')
        self.n_samples,self.n_features = X.shape
        self.X = np.array(X) # (n_samples,n_features)
        self.y = [1 if y_val==1 else -1 for y_val in y]
        self.y = np.array(self.y)
        self.bias = 0
        self.weights = self.initWeight()
        self.n = np.zeros(self.n_samples)
    def initWeight(self):
        """初始化权重(1,n_features)"""
        return np.random.rand(self.n_features)
    @staticmethod
    def sign(scores):
        return np.sign(scores)
    def compute(self,X):
        """return (n_samples,1)"""
        return np.dot(X,self.weights.T) + self.bias
    def loss(self,X,y):
        """错分类点距分割平面的距离"""
        scores = self.compute(X)
        pred = self.sign(scores)
        loss = 0
        count = 0
        for index,y_real in enumerate(y):
            if y_real != pred[index]:
                loss += scores[index]
                count += 1
        return loss / count
    def train(self,epochs=100,learning_rate=0.1):
        for epoch in range(epochs):
            print(">>>>>第{}轮训练>>>>>>".format(epoch))
            for index,x in enumerate(self.X):
                score = np.dot(x,self.weights.T) + self.bias
                pred = np.sign(score)
                if pred != self.y[index]:
                    self.weights = self.weights + learning_rate * self.y[index] * x
                    self.bias = self.bias + learning_rate * self.y[index]   
            print(">>>>>loss：{}".format(self.loss(self.X,self.y)))
    def trainDual(self,epochs=100,learning_rate=0.1):
        """对偶形式"""
        grams = self.gram()
        for epoch in range(epochs):
            print(">>>>>第{}轮训练>>>>>>".format(epoch))
            for index,x in enumerate(self.X):
                sum_t = np.sum(self.n * learning_rate * grams[index]) + np.sum(self.n * learning_rate * self.y)
                if self.y[index] * sum_t <= 0:
                    self.n[index] += 1
    def gram(self):
        return self.X @ self.X.T 
    def predict(self,X_test,y_test):
        scores = self.compute(X_test)
        pred = self.sign(scores)
        y_test = [1 if y_val==1 else -1 for y_val in y_test]
        return np.sum([y_test[index]==pred[index] for index in range(len(y_test))]) / len(y_test)
    def predictDual(self,X_test,y_test):
        """对偶形式的预测"""
        self.weights = np.sum(self.n*learning_rate*self.y*self.X,axis=1,keepdims=True)
        self.bias = np.sum(self.n*learning_rate*self.y,axis=1,keepdims=True)
        scores = self.compute(X_test)
        pred = self.sign(scores)
        y_test = [1 if y_val==1 else -1 for y_val in y_test]
        return np.sum([y_test[index]==pred[index] for index in range(len(y_test))]) / len(y_test)

In [137]:
data = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(data['data'], data['target'], test_size=0.3)
pla = PLA(X_train,y_train)

In [115]:
pla.train(200,learning_rate=0.3)

>>>>>第0轮训练>>>>>>
>>>>>loss：352472.199506851
>>>>>第1轮训练>>>>>>
>>>>>loss：220922.01640743864
>>>>>第2轮训练>>>>>>
>>>>>loss：69598.0114904969
>>>>>第3轮训练>>>>>>
>>>>>loss：174647.0283700827
>>>>>第4轮训练>>>>>>
>>>>>loss：187724.141813181
>>>>>第5轮训练>>>>>>
>>>>>loss：83878.96964081103
>>>>>第6轮训练>>>>>>
>>>>>loss：112292.76879331352
>>>>>第7轮训练>>>>>>
>>>>>loss：117282.28997216347
>>>>>第8轮训练>>>>>>
>>>>>loss：160709.73957882327
>>>>>第9轮训练>>>>>>
>>>>>loss：107818.88257575271
>>>>>第10轮训练>>>>>>
>>>>>loss：137500.68148144486
>>>>>第11轮训练>>>>>>
>>>>>loss：149361.27577871567
>>>>>第12轮训练>>>>>>
>>>>>loss：140620.52337511236
>>>>>第13轮训练>>>>>>
>>>>>loss：136891.7025993227
>>>>>第14轮训练>>>>>>
>>>>>loss：172871.15440785442
>>>>>第15轮训练>>>>>>
>>>>>loss：158337.78350493818
>>>>>第16轮训练>>>>>>
>>>>>loss：150558.15878781743
>>>>>第17轮训练>>>>>>
>>>>>loss：147180.81972925516
>>>>>第18轮训练>>>>>>
>>>>>loss：161423.1212262091
>>>>>第19轮训练>>>>>>
>>>>>loss：137082.8816439626
>>>>>第20轮训练>>>>>>
>>>>>loss：163485.88753076427
>>>>>第21轮训练>>>>>>
>>>>>loss：138957

In [116]:
pla.predict(X_test,y_test)

0.9239766081871345

In [138]:
pla.trainDual(200,learning_rate=0.3)

>>>>>第0轮训练>>>>>>
>>>>>第1轮训练>>>>>>
>>>>>第2轮训练>>>>>>
>>>>>第3轮训练>>>>>>
>>>>>第4轮训练>>>>>>
>>>>>第5轮训练>>>>>>
>>>>>第6轮训练>>>>>>
>>>>>第7轮训练>>>>>>
>>>>>第8轮训练>>>>>>
>>>>>第9轮训练>>>>>>
>>>>>第10轮训练>>>>>>
>>>>>第11轮训练>>>>>>
>>>>>第12轮训练>>>>>>
>>>>>第13轮训练>>>>>>
>>>>>第14轮训练>>>>>>
>>>>>第15轮训练>>>>>>
>>>>>第16轮训练>>>>>>
>>>>>第17轮训练>>>>>>
>>>>>第18轮训练>>>>>>
>>>>>第19轮训练>>>>>>
>>>>>第20轮训练>>>>>>
>>>>>第21轮训练>>>>>>
>>>>>第22轮训练>>>>>>
>>>>>第23轮训练>>>>>>
>>>>>第24轮训练>>>>>>
>>>>>第25轮训练>>>>>>
>>>>>第26轮训练>>>>>>
>>>>>第27轮训练>>>>>>
>>>>>第28轮训练>>>>>>
>>>>>第29轮训练>>>>>>
>>>>>第30轮训练>>>>>>
>>>>>第31轮训练>>>>>>
>>>>>第32轮训练>>>>>>
>>>>>第33轮训练>>>>>>
>>>>>第34轮训练>>>>>>
>>>>>第35轮训练>>>>>>
>>>>>第36轮训练>>>>>>
>>>>>第37轮训练>>>>>>
>>>>>第38轮训练>>>>>>
>>>>>第39轮训练>>>>>>
>>>>>第40轮训练>>>>>>
>>>>>第41轮训练>>>>>>
>>>>>第42轮训练>>>>>>
>>>>>第43轮训练>>>>>>
>>>>>第44轮训练>>>>>>
>>>>>第45轮训练>>>>>>
>>>>>第46轮训练>>>>>>
>>>>>第47轮训练>>>>>>
>>>>>第48轮训练>>>>>>
>>>>>第49轮训练>>>>>>
>>>>>第50轮训练>>>>>>
>>>>>第51轮训练>>>>>>
>>>>>第52轮训练>>>>>>
>>>>>第53轮训练>>>>>>
>>>>>第54轮训练>>>>>>
>>>>>第55轮训练>>>>>>
>>

In [None]:
pla.predictDual(X_test,y_test)