In [1]:
import tensorflow as tf
import math
import numpy as np

print(tf.__version__)

2.10.0


#### OR연산 텐서플로로 네트워크 구축하기

In [2]:
def sigmoid(x):
    return 1 / (1 + math.exp(-x))

In [70]:
# OR 연산은 입력값 둘 중의 하나만 True여도 출력값이 True인 연산이다.
# x = [[1,1],[1,0],[0,1],[0,0]] --> y = [[1],[1],[1],[0]] 
# 입력값이 2차원이므로 가중치역시 2차원이다. 절편은 그냥 1차원이고 1로 한다.
# 활성화함수로 sigmoid를 사용한다.

x = np.array([[1,1],[1,0],[0,1],[0,0]])
y = np.array([[1],[1],[1],[0]])
w = tf.random.normal([2], 0, 1)
b = tf.random.normal([1], 0, 1)
b_x = 1

for i in range(2000):
    error_sum = 0
    for j in range(4):
        output = sigmoid(np.sum(x[j] * w) + b_x * b)
        error = y[j][0] - output
        w = w + x[j] * 0.1 * error
        b = b + b_x * 0.1 * error
        error_sum += error
        
    if i % 200 == 199:
        print(f"시행횟수 : {i:4d},   오차합 : {error_sum:3f}")

시행횟수 :  199,   오차합 : -0.040429
시행횟수 :  399,   오차합 : -0.023122
시행횟수 :  599,   오차합 : -0.016088
시행횟수 :  799,   오차합 : -0.012299
시행횟수 :  999,   오차합 : -0.009939
시행횟수 : 1199,   오차합 : -0.008331
시행횟수 : 1399,   오차합 : -0.007166
시행횟수 : 1599,   오차합 : -0.006285
시행횟수 : 1799,   오차합 : -0.005596
시행횟수 : 1999,   오차합 : -0.005040


In [71]:
print(f"가중치 : {[np.round(x, 4) for x in w]},   절편 : {np.round(b, 4)}")

가중치 : [8.2589, 8.2576],   절편 : [-3.6638]


In [72]:
w[0] + w[1]

<tf.Tensor: shape=(), dtype=float32, numpy=16.51648>

In [73]:
# 이렇게 학습시킨 네트워크가 정상적으로 작동하는지 평가해보자.
print(f"학습시킨 가중치 : {[np.round(x, 4) for x in w]},   편차 : {np.round(b, 4)}")

for i in range(4):
    print(f"X : {x[i]},    Y : {y[i][0]},\
    중간계산 : {np.sum(x[i]*w)+b_x*b[0]:3f},   Output : {np.round(sigmoid(np.sum(x[i] * w) + b_x * b), 5)}")

학습시킨 가중치 : [8.2589, 8.2576],   편차 : [-3.6638]
X : [1 1],    Y : 1,    중간계산 : 12.852700,   Output : 1.0
X : [1 0],    Y : 1,    중간계산 : 4.595146,   Output : 0.99
X : [0 1],    Y : 1,    중간계산 : 4.593774,   Output : 0.98999
X : [0 0],    Y : 0,    중간계산 : -3.663779,   Output : 0.02499


#### XOR연산 텐서플로로 네트워크 구축하기

In [81]:
# XOR 연산은 입력값 둘의 값들이 다르면 출력값이 True, 같으면 출력값이 False인 연산이다.
# x = [[1,1],[1,0],[0,1],[0,0]] --> y = [[1],[1],[1],[0]] 
# 입력값이 2차원이므로 가중치역시 2차원이다. 절편은 그냥 1차원이고 1로 한다.
# 활성화함수로 sigmoid를 사용한다.

x = np.array([[1,1],[1,0],[0,1],[0,0]])
y = np.array([[0],[1],[1],[0]])
w = tf.random.normal([2], 0, 1)
b = tf.random.normal([1], 0, 1)
b_x = 1

for i in range(2000):
    error_sum = 0
    for j in range(4):
        output = sigmoid(np.sum(x[j] * w) + b_x * b)
        error = y[j][0] - output
        w = w + x[j] * 0.1 * error
        b = b + b_x * 0.1 * error
        error_sum += error
        
    if i % 200 == 199:
        print(f"시행횟수 : {i:4d},   오차합 : {error_sum:3f}")

시행횟수 :  199,   오차합 : 0.007722
시행횟수 :  399,   오차합 : 0.000314
시행횟수 :  599,   오차합 : 0.000013
시행횟수 :  799,   오차합 : 0.000001
시행횟수 :  999,   오차합 : 0.000000
시행횟수 : 1199,   오차합 : 0.000000
시행횟수 : 1399,   오차합 : 0.000000
시행횟수 : 1599,   오차합 : 0.000000
시행횟수 : 1799,   오차합 : 0.000000
시행횟수 : 1999,   오차합 : 0.000000


##### 위에서 보면 에러값은 점점 줄어들다가 어느 순간 변하지 않는다. 이렇게 학습시킨 네트워크를 평가하기 위해 sigmoid함수의 인자값을 중간계산이라는 이름으로 출력해보자.

In [79]:
# 이렇게 학습시킨 네트워크가 정상적으로 작동하는지 평가해보자.
print(f"학습시킨 가중치 : {[np.round(x, 4) for x in w]},   편차 : {np.round(b, 4)}")

for i in range(4):
    print(f"X : {x[i]},    Y : {y[i][0]},\
    중간계산 : {np.sum(x[i]*w)+b_x*b[0]:3f},   Output : {np.round(sigmoid(np.sum(x[i] * w) + b_x * b[0]), 5)}")

학습시킨 가중치 : [0.0513, 0.0],   편차 : [-0.]
X : [1 1],    Y : 0,    중간계산 : 0.051282,   Output : 0.51282
X : [1 0],    Y : 1,    중간계산 : 0.051282,   Output : 0.51282
X : [0 1],    Y : 1,    중간계산 : -0.000000,   Output : 0.5
X : [0 0],    Y : 0,    중간계산 : -0.000000,   Output : 0.5


##### 위의 결과값을 보면 Y와 Output값간에 큰 차이가 있어 보인다. X가 변해도 Output값은 0.5근처에서 머물고 있다. 왜 이럴까를 알아내기 위해서 가중치와 편향을 살펴보기로 하자.

In [92]:
print(f"가중치 : {[np.round(x, 5) for x in w]},   편향 : {np.round(b[0], 7)}")

가중치 : [0.05128, 0.0],   편향 : -0.0


##### 가중치의 첫번째 값이 두번째 값보다 더 큰 영향을 끼치는데 반해 두번째 값과 편향의 영향은 아주 미미함을 볼수 있다. 결과적으로 X의 첫번째 값이 1인 경우와 0인경우에 따라 중간계산값과 Output값이 달라짐을 알 수 있다.