# 머신러닝의 이해 14주차 이론 : 신경망과 딥러닝(1)
24.06.04(화)


기말 범위에는 포함되지 않지만 과제 #2와 연관된 내용

## 단층 퍼셉트론

### 신경망 표현을 위한 행렬 표현

In [1]:
import numpy as np

X = np.array([1, 2])     # 입력 벡터 X
W = np.array([0.5, 0.6]) # 가중치 벡터 W
X * W                    # 두 벡터의 성분별 곱셈

array([0.5, 1.2])

In [2]:
# 가중합 구하기 : sum(), dot()
np.sum(X * W), np.dot(X, W)

(1.7, 1.7)

In [3]:
# 2개의 층으로 이루어진 퍼셉트론 계산
X = np.array([1, 2])    # 넘파이 ndarray 객체 X 생성
W = np.array([[1, 2, 3], [4, 5, 6]]) # 2x3 크기의 ndarray 객체 W 생성
A = np.dot(X, W)
print('A =', A)

A = [ 9 12 15]


### AND와 OR 회로를 퍼셉트론으로 만들기

In [4]:
# 활성화 함수 : 양수면 참(1), 나머지는 거짓(-1)
# 일반적으로 참(1), 거짓(0)이지만, 신호를 크게 분리하기 위해 참(1), 거짓(-1) 사용
def activation(s):
   if s > 0: return 1
   else : return -1

# 퍼셉트론 함수 : tmp가 활성화 함수를 통과하도록
# tmp = 두 개의 입력에 대해 w 벡터가 곱해지고, 편향 b가 더해진 결과값
def perceptron(x1, x2):
   x = np.array([x1, x2])
   tmp = np.sum( W * x ) + b
   return activation(tmp)

In [5]:
# AND 회로
# W를 [0.5, 0.5] 벡터로 하고, b를 -0.7이라는 값으로 초기화하고 활성화 됐는지 확인
print('--- 퍼셉트론으로 구현한 AND 회로 ---')
W = np.array([0.5, 0.5])
b = -0.7
for x1, x2 in [(-1, -1), (-1, 1), (1, -1), (1, 1)]:
    y = perceptron(x1, x2)
    print('{:3d} {:3d} : {:3d}'.format(x1, x2, y))

--- 퍼셉트론으로 구현한 AND 회로 ---
 -1  -1 :  -1
 -1   1 :  -1
  1  -1 :  -1
  1   1 :   1


In [7]:
# 이번에는 b를 0.7로 변경 후 동일하게 실행 => OR 회로가 됨
# 똑같은 perceptron() 함수에 b값을 다르게 적용하니 다른 결과가 나옴
W = np.array([0.5, 0.5])
b = 0.7
print('--- 퍼셉트론으로 구현한 OR 회로 ---')
for x1, x2  in [(-1, -1), (-1, 1), (1, -1), (1, 1)]:
    y = perceptron(x1, x2)
    print('{:3d} {:3d} : {:3d}'.format(x1, x2, y))

--- 퍼셉트론으로 구현한 OR 회로 ---
 -1  -1 :  -1
 -1   1 :   1
  1  -1 :   1
  1   1 :   1


### 퍼셉트론을 학습시키자

In [8]:
def activation(s):
   if s > 0: return 1
   else : return -1

# out(): W의 모든 성분과 x의 모든 성분을 곱한 후 더한 결과값
def out(x):
   return activation(W.dot(x))

In [9]:
# train()
# ephco : 최적의 W를 얻기 위해 학습을 수행하는 반복문의 반복 횟수(=훈련 몇 번 반복할 것인지)
def train(X, Y, epochs=10):
   global W, learning_rate
   for t in range(epochs):
       print('epoch =', t, '\n==============================')
       ajusted = 0 # 원하는 값이 나오면 종료시키기 위한 값
       for i in range(len(X)):
           Y_hat = out(X[i])
           error = Y[i] - Y_hat # 실제 정답과의 차이
           if error != 0 : ajusted += 1 # 가중치가 바뀔 때마다 업데이트
           W += learning_rate * error * X[i]
           print('입력:', X[i], '정답:', Y[i], '출력:', Y_hat, \
                 '변경된 가중치:', W, 'error:', error)
       if ajusted == 0 : return

# 학습 결과 확인(AND gate)
# 학습률이 0.1이므로 오차가 2일 때 가중치가 0.2씩 변경됨
# 정답 잘 맞췄으면 가중치 안 바꿈
X = np.array([[-1, -1, 1],
             [-1,  1, 1],
             [ 1, -1, 1],
             [ 1,  1, 1]])
Y = np.array([-1, -1, -1, 1])
W = np.array([0, 0, 0], dtype=np.float64)  # 임의의 초기 가중치
learning_rate = 0.1
train(X, Y, 100)

epoch = 0 
입력: [-1 -1  1] 정답: -1 출력: -1 변경된 가중치: [0. 0. 0.] error: 0
입력: [-1  1  1] 정답: -1 출력: -1 변경된 가중치: [0. 0. 0.] error: 0
입력: [ 1 -1  1] 정답: -1 출력: -1 변경된 가중치: [0. 0. 0.] error: 0
입력: [1 1 1] 정답: 1 출력: -1 변경된 가중치: [0.2 0.2 0.2] error: 2
epoch = 1 
입력: [-1 -1  1] 정답: -1 출력: -1 변경된 가중치: [0.2 0.2 0.2] error: 0
입력: [-1  1  1] 정답: -1 출력: 1 변경된 가중치: [0.4 0.  0. ] error: -2
입력: [ 1 -1  1] 정답: -1 출력: 1 변경된 가중치: [ 0.2  0.2 -0.2] error: -2
입력: [1 1 1] 정답: 1 출력: 1 변경된 가중치: [ 0.2  0.2 -0.2] error: 0
epoch = 2 
입력: [-1 -1  1] 정답: -1 출력: -1 변경된 가중치: [ 0.2  0.2 -0.2] error: 0
입력: [-1  1  1] 정답: -1 출력: -1 변경된 가중치: [ 0.2  0.2 -0.2] error: 0
입력: [ 1 -1  1] 정답: -1 출력: -1 변경된 가중치: [ 0.2  0.2 -0.2] error: 0
입력: [1 1 1] 정답: 1 출력: 1 변경된 가중치: [ 0.2  0.2 -0.2] error: 0


In [10]:
# 학습된 가중치로 AND 회로 출력
def predict(X, circuit) :
  print('\n퍼셉트론의 예측 결과({} 회로)\nx0  x1   y'.format(circuit))
  for x in X:
      print('{:2d} {:3d} {:3d}'.format(x[0], x[1], out(x)))

predict(X, 'AND')


퍼셉트론의 예측 결과(AND 회로)
x0  x1   y
-1  -1  -1
-1   1  -1
 1  -1  -1
 1   1   1


### 인공지능의 겨울 : 퍼셉트론의 한계와 XOR 문제

In [13]:
# XOR 연산도 할 수 있는가?
# 두 입력값이 같으면 0(여기선 -1), 다르면 1
# 두 번째 반복부터 계속 같은 패턴의 가중치 변경만 보임
X = np.array([[-1, -1, 1],
              [-1,  1, 1],
              [ 1, -1, 1],
              [ 1,  1, 1]])
Y = np.array([-1, 1, 1, -1])
W = np.array([0, 0, 0], dtype=np.float64)  # 임의의 초기 가중치
learning_rate = 0.1

train(X, Y, 100)
predict(X, 'XOR')

epoch = 0 
입력: [-1 -1  1] 정답: -1 출력: -1 변경된 가중치: [0. 0. 0.] error: 0
입력: [-1  1  1] 정답: 1 출력: -1 변경된 가중치: [-0.2  0.2  0.2] error: 2
입력: [ 1 -1  1] 정답: 1 출력: -1 변경된 가중치: [0.  0.  0.4] error: 2
입력: [1 1 1] 정답: -1 출력: 1 변경된 가중치: [-0.2 -0.2  0.2] error: -2
epoch = 1 
입력: [-1 -1  1] 정답: -1 출력: 1 변경된 가중치: [0. 0. 0.] error: -2
입력: [-1  1  1] 정답: 1 출력: -1 변경된 가중치: [-0.2  0.2  0.2] error: 2
입력: [ 1 -1  1] 정답: 1 출력: -1 변경된 가중치: [0.  0.  0.4] error: 2
입력: [1 1 1] 정답: -1 출력: 1 변경된 가중치: [-0.2 -0.2  0.2] error: -2
epoch = 2 
입력: [-1 -1  1] 정답: -1 출력: 1 변경된 가중치: [0. 0. 0.] error: -2
입력: [-1  1  1] 정답: 1 출력: -1 변경된 가중치: [-0.2  0.2  0.2] error: 2
입력: [ 1 -1  1] 정답: 1 출력: -1 변경된 가중치: [0.  0.  0.4] error: 2
입력: [1 1 1] 정답: -1 출력: 1 변경된 가중치: [-0.2 -0.2  0.2] error: -2
epoch = 3 
입력: [-1 -1  1] 정답: -1 출력: 1 변경된 가중치: [0. 0. 0.] error: -2
입력: [-1  1  1] 정답: 1 출력: -1 변경된 가중치: [-0.2  0.2  0.2] error: 2
입력: [ 1 -1  1] 정답: 1 출력: -1 변경된 가중치: [0.  0.  0.4] error: 2
입력: [1 1 1] 정답: -1 출력: 1 변경된 가중치: [-0.2 -0.2  0.2

In [14]:
# 가중치와 편향(bias) 등을 설정
w1 = np.array([.5, .5])
w2 = np.array([.5, .5])
b1, b2 = -0.7, 0.7

def activation(s):
   if s > 0: return 1
   else : return -1

def perceptron(x, w, b):  # 퍼셉트론
   y = np.sum(w * x) + b
   return activation(y)

# XOR 연산에 필요한 논리 회로들을 선언
def AND(x1, x2):          # AND 게이트
   return perceptron(np.array([x1, x2]), w1, b1)

def NAND(x1, x2):         # NAND 게이트
   return perceptron(np.array([x1, x2]), -w1, -b1)

def OR(x1, x2):           # OR 게이트
   return perceptron(np.array([x1, x2]), w2, b2)

def XOR(x1, x2):          # XOR 게이트
   return AND(NAND(x1, x2),OR(x1, x2))

# 다소 복잡하긴 하지만 이런 구조의 퍼셉트론은 XOR 문제를 해결함
# 이러한 다층 퍼셉트론은 신경망이라고도 불림
print('--- 다층 퍼셉트론으로 구현한 XOR 회로 ---')
for x in [(-1, -1), (1, -1), (-1, 1), (1, 1)]:
   y = XOR(x[0], x[1])
   print('{:2d} {:3d} : {:3d}'.format(x[0], x[1], y))

--- 다층 퍼셉트론으로 구현한 XOR 회로 ---
-1  -1 :  -1
 1  -1 :   1
-1   1 :   1
 1   1 :  -1
