In [7]:
import numpy as np

def sigmoid(x):
    return 1. / (1. + np.exp(-x))

def numerical_derivative(f, x):
    delta_x = 1e-4
    grad = np.zeros_like(x)
    it = np.nditer(x, flags=['multi_index'], op_flags=['readwrite'])
    while not it.finished:
        idx = it.multi_index
        tmp_val = x[idx]
        x[idx] = float(tmp_val) + delta_x
        fx1 = f(x)
        x[idx] = float(tmp_val) - delta_x
        fx2 = f(x)
        grad[idx] = (fx1 - fx2) / (2 * delta_x)
        x[idx] = tmp_val
        it.iternext()
    return grad



In [21]:
class LogicGate:
    def __init__(self, gate_name, xdata, tdata):
        self.name = gate_name  # 게이트 이름 (예: XOR, AND 등)

        # 입력 데이터와 정답 데이터를 reshape 해서 내부에 저장
        self.xdata = xdata.reshape(4, 2)   # 입력: 4개 샘플, 각 샘플은 2개의 입력
        self.tdata = tdata.reshape(4, 1)   # 정답: 4개 샘플, 각 정답은 1개의 출력

        # 은닉층 가중치(2입력 -> 6노드)와 편향 초기화
        self.W2 = np.random.rand(2, 6)
        self.b2 = np.random.rand(6)

        # 출력층 가중치(6노드 -> 1출력)와 편향 초기화
        self.W3 = np.random.rand(6, 1)
        self.b3 = np.random.rand(1)

        # 학습률 설정
        self.learning_rate = 1e-2

    def loss_val(self):
        # 손실 함수 계산 (Cross Entropy)
        delta = 1e-7  # 로그 안정화를 위한 작은 값

        # 순전파 계산
        z2 = np.dot(self.xdata, self.W2) + self.b2  # 은닉층 선형 결합
        a2 = sigmoid(z2)                            # 은닉층 활성화
        z3 = np.dot(a2, self.W3) + self.b3          # 출력층 선형 결합
        y = a3 = sigmoid(z3)                        # 출력값 (시그모이드)

        # 크로스 엔트로피 손실 계산
        return -np.sum(
            self.tdata * np.log(y + delta) + 
            (1 - self.tdata) * np.log(1 - y + delta)
        )

    def train(self):
        # 손실값을 기준으로 기울기를 구할 함수 정의 (입력 x는 사용 안 함)
        f = lambda x: self.loss_val()

        # 2만 번 반복 학습
        for step in range(20001):
            # 기울기 계산 및 파라미터 갱신
            self.W2 -= self.learning_rate * numerical_derivative(f, self.W2)
            self.b2 -= self.learning_rate * numerical_derivative(f, self.b2)
            self.W3 -= self.learning_rate * numerical_derivative(f, self.W3)
            self.b3 -= self.learning_rate * numerical_derivative(f, self.b3)

            # 1000 step마다 손실 출력
            if step % 1000 == 0:
                print(f"{self.name} step = {step}, loss = {self.loss_val()}")

    def predict(self, input_data):
        # 입력 데이터를 2차원으로 reshape (1, 2)
        x = input_data.reshape(1, -1)

        # 순전파 계산
        z2 = np.dot(x, self.W2) + self.b2
        a2 = sigmoid(z2)
        z3 = np.dot(a2, self.W3) + self.b3
        y = a3 = sigmoid(z3)  # 최종 출력 확률

        # 확률을 0 또는 1로 이진 분류
        result = 1 if y > 0.5 else 0

        return y, result  # 확률값, 분류결과 반환


In [22]:
xdata = np.array([[0,0],[0,1],[1,0],[1,1]])
tdata = np.array([0,1,1,0])
xor_obj = LogicGate("XOR", xdata, tdata)
xor_obj.train()

XOR step = 0, loss = 4.426675866848697
XOR step = 1000, loss = 2.766439303683773
XOR step = 2000, loss = 2.7562137135024507
XOR step = 3000, loss = 2.730715539267342
XOR step = 4000, loss = 2.6666802484442913
XOR step = 5000, loss = 2.5254541848523337
XOR step = 6000, loss = 2.2894869646408904
XOR step = 7000, loss = 2.0125836248392814
XOR step = 8000, loss = 1.713488806820763
XOR step = 9000, loss = 1.372151704384752
XOR step = 10000, loss = 1.0459822849250826
XOR step = 11000, loss = 0.7946064002029839
XOR step = 12000, loss = 0.6128216037365363
XOR step = 13000, loss = 0.47990913886674735
XOR step = 14000, loss = 0.3814596860081468
XOR step = 15000, loss = 0.30816733055666806
XOR step = 16000, loss = 0.25319307581615197
XOR step = 17000, loss = 0.21142366214516056
XOR step = 18000, loss = 0.17917481504370394
XOR step = 19000, loss = 0.15385823531165616
XOR step = 20000, loss = 0.13366786921476195


In [25]:
test_data =np.array([[0,0], [0,1], [1,0], [1,1]])
for data in test_data:
    sigmoid_val, logical_Val =xor_obj.predict(data)
    print(f"입력: {data}, 출력: {sigmoid_val.flatten()[0]:.4f}, 판별값: {logical_Val}")

입력: [0 0], 출력: 0.0373, 판별값: 0
입력: [0 1], 출력: 0.9732, 판별값: 1
입력: [1 0], 출력: 0.9670, 판별값: 1
입력: [1 1], 출력: 0.0343, 판별값: 0


In [26]:
#은닉층 추가

In [45]:
class LogicGate:
    def __init__(self, gate_name, xdata, tdata):
        self.name = gate_name  # 게이트 이름 (예: "XOR")
        self.xdata = xdata.reshape(4, 2)  # 입력 데이터 (4행 2열로 reshape)
        self.tdata = tdata.reshape(4, 1)  # 정답 레이블 (4행 1열)

        # 입력층(2) → 은닉층1(6) 가중치 및 편향 초기화
        self.W2 = np.random.rand(2, 6)     # 입력 노드 2개 → 은닉층1 노드 6개
       # print("입력층 입력노도" , self.W2)
        self.b2 = np.random.rand(6)        # 은닉층1 편향 (노드 수 6개)
       # print("입력층 출력 노도" , self.b2)
        
        # 은닉층1(6) → 은닉층2(2) 가중치 및 편향 초기화
        self.W3 = np.random.rand(6, 2)     # 은닉층1 노드 6개 → 은닉층2 노드 2개
      #  print("은닉층-1 출력 노도" , self.W3)
        self.b3 = np.random.rand(2)        # 은닉층2 편향 (노드 수 2개)
      #  print("은닉층-1 출력 노도" , self.b3)
        
        # 은닉층2(2) → 출력층(1) 가중치 및 편향 초기화
        self.W4 = np.random.rand(2, 1)     # 은닉층2 노드 2개 → 출력 노드 1개
      #  print("은닉층 입력 노도" , self.W4)
        self.b4 = np.random.rand(1)        # 출력층 편향 (노드 수 1개)
       # print("은닉층 출력 노도" , self.W4)
        
        self.learning_rate = 1e-2         # 학습률 설정

    def loss_val(self):
        delta = 1e-7  # log 계산 시 0으로 인한 오류 방지용

        # 순전파: 입력 → 은닉층1 → 은닉층2 → 출력
        z2 = np.dot(self.xdata, self.W2) + self.b2  # 은닉층1의 입력 계산
        a2 = sigmoid(z2)                            # 은닉층1의 출력 (활성화)

        z3 = np.dot(a2, self.W3) + self.b3          # 은닉층2의 입력 계산
        a3 = sigmoid(z3)                            # 은닉층2의 출력 (활성화)

        z4 = np.dot(a3, self.W4) + self.b4          # 출력층 입력 계산
        y = sigmoid(z4)                             # 최종 출력 계산

        # 교차 엔트로피 손실 함수
        return -np.sum(
            self.tdata * np.log(y + delta) + 
            (1 - self.tdata) * np.log(1 - y + delta)
        )

    def train(self):
        f = lambda x: self.loss_val()  # 손실 함수를 미분하기 위한 람다

        for step in range(50001):  
            # 수치 미분을 이용한 가중치 및 편향 업데이트
            self.W2 -= self.learning_rate * numerical_derivative(f, self.W2)
            self.b2 -= self.learning_rate * numerical_derivative(f, self.b2)
            self.W3 -= self.learning_rate * numerical_derivative(f, self.W3)
            self.b3 -= self.learning_rate * numerical_derivative(f, self.b3)
            self.W4 -= self.learning_rate * numerical_derivative(f, self.W4)
            self.b4 -= self.learning_rate * numerical_derivative(f, self.b4)

            # 일정 주기마다 손실 출력
            if step % 10000 == 0:
                print(f"{self.name} step = {step}, loss = {self.loss_val()}")

    def predict(self, input_data):
        # 입력 데이터를 1행 2열로 reshape
        self.xdata = input_data

        # 순전파 계산 (입력층 → 은닉층1 → 은닉층2 → 출력층)
        z2 = np.dot(self.xdata, self.W2) + self.b2
        a2 = sigmoid(z2)

        z3 = np.dot(a2, self.W3) + self.b3
        a3 = sigmoid(z3)

        z4 = np.dot(a3, self.W4) + self.b4
        y = sigmoid(z4)

        # 출력값을 기준으로 논리값(0 또는 1) 결정
        result = 1 if y > 0.5 else 0
        return y, result


In [None]:
xdata = np.array([[0,0],[0,1],[1,0],[1,1]])
tdata = np.array([0,1,1,0])
xor_obj = LogicGate("XOR", xdata, tdata)
xor_obj.train()

XOR step = 0, loss = 3.7579897462404865
XOR step = 10000, loss = 2.7767957995116945
XOR step = 20000, loss = 2.771549695090852
XOR step = 30000, loss = 2.7715119680231584
XOR step = 40000, loss = 2.771495802399211


In [42]:
test_data =np.array([[0,0], [0,1], [1,0], [1,1]])
for data in test_data:
    sigmoid_val, logical_Val =xor_obj.predict(data)
    print(f"입력: {data}, 출력: {sigmoid_val.flatten()[0]:.4f}, 판별값: {logical_Val}")

입력: [0 0], 출력: 0.0386, 판별값: 0
입력: [0 1], 출력: 0.9441, 판별값: 1
입력: [1 0], 출력: 0.9416, 판별값: 1
입력: [1 1], 출력: 0.0801, 판별값: 0
