# 01 신경망의 개요

코드 1-1 [1] 필요한 패키지 불러오기

In [1]:
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_iris

코드 1-1 [2] 데이터 준비 함수 정의하기

In [2]:
def prepare_data(target):
    iris = load_iris()          # iris data set 읽기
    X_tr = iris.data[:, 2:]     # 4개의 특징 중 꽃잎의 길이와 폭 선택
    labels = iris.target_names  # 'setosa', 'versicolor', 'vriginica'
    y = iris.target
    
    # 학습표본의 레이블 지정 - target에 지정된 레이블이면 1, 그 외는 0
    target_lable = np.where(labels == target)[0]
    y_tr = (y == target_lable).astype(int)
    return X_tr, y_tr, ['(1) '+target, '(0) the others']

코드 1-1 [3] 활성화 함수 - 단위 계단 함수

In [3]:
def step(x):
    return np.heaviside(x, 1)

코드 1-1 [4] 퍼셉트론 클래스 선언

In [4]:
class Perceptron:
    def __init__(self, dim, activation):
        rnd = np.random.default_rng()
        self.dim = dim
        self.activation = activation
        # 가중치(w)와 바이어스(b)를 He normal 방식으로 초기화
        self.w = rnd.normal(scale=np.sqrt(2.0 / dim), size=dim)
        self.b = rnd.normal(scale=np.sqrt(2.0 / dim))

    def print_w(self):
        for i in range(self.dim):
            print('  w{} = {:6.3f}'.format(i+1, self.w[i]), end='')
        print('  b = {:6.3f}'.format(self.b))

    def predict(self, x) : # numpy 배열 x에 저장된 표본의 출력 계산
        return self.activation(np.dot(x, self.w) + self.b)

    def fit(self, X, y, N, epochs, eta=0.01):
        # 학습표본의 인덱스를 무작위 순서로 섞음
        random_idx = np.random.permutation(N)
        X = X[random_idx]
        y = y[random_idx]
        print('w의 초깃값 ', end='')
        self.print_w()
        for j in range(epochs):
            for i in range(N):
                # x[1]에 대한 출력 오차 계산
                delta = self.predict(X[i]) - y[i]
                self.w -= eta * delta * X[i]
                self.b -= eta * delta
            # 학습 과정 출력
            if j < 10 or (j+1) % 100 == 0:
                loss = self.predict(X) - y
                loss = (loss * loss).sum() / N
                print('에포크 = {:4d}    손실 = {:8.5f}'.format(j+1, loss), end='')
                self.print_w()

코드 1-1 [6] 훈련 데이터 준비하기

In [5]:
samples = 60
dim = 2
target = 'setosa'
X_tr, y_tr, labels = prepare_data(target)

코드 1-1 [7] 페셉트론 객체 생성 및 학습

In [6]:
p = Perceptron(dim, activation=step)
p.fit(X_tr, y_tr, samples, epochs=1000, eta=0.01)

w의 초깃값   w1 =  1.624  w2 = -0.193  b =  0.552
에포크 =    1    손실 =  0.16667  w1 =  1.187  w2 = -0.331  b =  0.452
에포크 =    2    손실 =  0.16667  w1 =  0.750  w2 = -0.469  b =  0.352
에포크 =    3    손실 =  0.16667  w1 =  0.313  w2 = -0.607  b =  0.252
에포크 =    4    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =    5    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =    6    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =    7    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =    8    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =    9    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =   10    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =  100    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =  200    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =  300    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =  400    손실 =  0.00000  w1 =  0.124  w2 = -0.665  b =  0.212
에포크 =  500    손실 =  0.00000  w