In [1]:
# 초기 설정
import sys
assert sys.version_info >= (3, 5)
import sklearn
assert sklearn.__version__ >= "0.20"
import numpy as np
import os
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings(action="ignore", message="internal gelsd")

mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)

PROJECT_ROOT_DIR = "."
CHARTER_ID = "end_to_end_project"
IMAGE_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHARTER_ID)
os.makedirs(IMAGE_PATH, exist_ok=True)

# 그림을 저장하는 method
def save_fig(fig_id, tight_layout=True, fig_extension="png", resolution = 300):
    path = os.path.join(IMAGE_PATH, fig_id + "."+ fig_extension)
    print("그림 저장", path, fig_id)
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format=fig_extension, dpi=resolution)

## Perceptron

In [2]:
def AND(x1, x2):
    w1, w2, theta = 0.5, 0.5, 0.7
    tmp = x1*w2 + x2*w2
    if tmp <= theta:
        return 0 
    elif tmp > theta:
        return 1

In [3]:
AND(0, 0)

0

In [4]:
AND(1, 0)

0

In [5]:
AND(0, 1)

0

In [6]:
AND(1,1)

1

### 가중치(weight)와 편향(bias)
- 가중치 : 입력이 결과에 주는 영향력(중요도) 조절
- 편향 : 뉴런이 얼마나 쉽게 활성화 하느냐를 조정

#### AND GATE

In [8]:
def AND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0 
    else:
        return 1

In [11]:
print("========== A N D ==========")
print(AND(1, 1))
print(AND(1, 0))
print(AND(0, 1))
print(AND(0, 0))
print("========== A N D ==========")

1
0
0
0


#### NAND

In [14]:
def NAND(x1, x2):
    x = np.array([x1, x2])
    w = np.array([-0.5, -0.5])
    b = 0.7
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0 
    else:
        return 1

In [16]:
print("========== N A N D ==========")
print(NAND(1, 1))
print(NAND(1, 0))
print(NAND(0, 1))
print(NAND(0, 0))
print("========== N A N D ==========")

0
1
1
1


#### OR

In [17]:
def OR(x1, x2):
    x = np.array([x1, x2])
    w = np.array([0.5, 0.5])
    b = -0.2
    tmp = np.sum(w*x) + b
    if tmp <= 0:
        return 0 
    else:
        return 1

In [18]:
print("========== O R ==========")
print(OR(1, 1))
print(OR(1, 0))
print(OR(0, 1))
print(OR(0, 0))
print("========== O R ==========")

1
1
1
0


#### XOR
- AND, NAND, OR은 같은 구조의 PERCEPTRON임
- 차이는 가중치 매개변수의 값
- XOR 게이트는 직선 하나로 나눌 수 없음
- 단층 퍼셉트론으로는 비선형 영역을 분리할 수 없다
- 다층 퍼셉트론으로 만들 수 있음

In [21]:
def XOR(x1, x2):
    s1 = NAND(x1, x2)
    s2 = OR(x1, x2)
    y = AND(s1, s2)
    return y

In [22]:
print("========== X O R ==========")
print(OR(1, 1))
print(OR(1, 0))
print(OR(0, 1))
print(OR(0, 0))
print("========== X O R ==========")

1
1
1
0


### Conclusion
- 선형으로 해결하지 못하는 것은 layer를 쌓아서 해결할 수 있음
- layer가 많아질수록 성능은 올라가지만 일반화가 안됨
- 특정 parameter에만 적합한 모델이 됨