In [2]:
import numpy as np

class AdalineGD(object):
    def __init__(self, eta = 0.01, n_iter = 50, random_state = 1):
        self.eta = eta ## 학습률
        self.n_iter = n_iter ## 훈련 반복 횟수
        self.random_state = random_state ## 난수 시드

    def fit(self, X, y):
        rgen = np.random.RandomState(self.random_state) ## 난수 생성
        self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1]) ## 초기 가중치 생성
        self.cost_ = [] ## 비용 담을 리스트 생성
        
        for i in range(self.n_iter): ## 전체 훈련 데이터셋을 기반으로 가중치 업데이트
            net_input = self.net_input(X)
            output = self.activation(net_input)
            errors = y - output
            self.w_[1:] += self.eta * X.T.dot(errors) ## X.T.dot(errors): 특성 행렬과 오차 벡터간의 행렬-벡터 곱셈
            self.w_[0] += self.eta * errors.sum()
            cost = (errors ** 2).sum() / 2.0
            self.cost_.append(cost)
        return self
            
            
    def net_input(self, X):
        return np.dot(X, self.w_[1:]) + self.w_[0] ## 입력에 대한 계산 결과

    def activation(self, X):
        return X ## 액티베이션 함수로 y = x 사용

    def predict(self, X):
        return np.where(self.activation(self.net_input(X)) >= 0.0, 1, -1) ## 분류 함수: 1 혹은 -1