### SLP로 논리 게이트 구현

In [1]:
import numpy as np

In [2]:
# 퍼셉트론
class Perceptron:
    def __init__(self, N, alpha):# 생성자
        # 가중치 초기화
        self.W = np.random.randn(N+1) / np.sqrt(N) # bias 값까지 N+1개

        # 학습률(learning rate) alpha 초기화
        self.alpha = alpha


    def step(self, x):  # 활성화 함수 - 계단 함수(step function)
        if x > 0:
          return 1
        else: return 0

    def fit(self, X, y, epochs = 10):
        # X 데이터에 바이어스 항목을 추가. np.ones로 1로 채워진 열을 X에 추가함.
        X = np.c_[X, np.ones(X.shape[0])] # 행렬 붙이기

        # 지정된 에포크 수만큼 반복 학습.
        for epoch in range(epochs):
             # X의 각 샘플과 y의 타겟 레이블에 대해 반복.
            for (x, target) in zip(X, y):
                # self.W :계수 x: AND 논리 입력값 x1 x2
                p = self.step(np.dot(x, self.W))

                # 예측값 p와 실제 타겟 값이 다르면 가중치를 업데이트.
                if p != target: # 같지 않으면 역전파법에 의해서 계수를 업데이트 하기
                    # 오류를 계산.
                    error = p - target
                    # 가중치 업데이트.
                    self.W += -self.alpha * error * x

    def predict(self, X):  # 예측 메서드
        # X를 최소 2차원 배열로 변환.
        X = np.atleast_2d(X)

        # X에 바이어스 항목 추가.
        X = np.c_[X, np.ones(1)]

        # 예측을 수행. 가중치와 입력값의 점곱을 계산 후 활성화 함수 적용.
        p = self.step(np.dot(X, self.W)) # 여기의 self.W는 이미 트레이닝 이 끝난 상태 즉 추론파일
        print(p)
        print('------------------')

AND 게이트

In [3]:
# 객체 생성
per1 = Perceptron(2, 0.9)

In [4]:
X =  np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
Y = np.array([[0], [0], [0], [1]]) # label

#학습하기
per1.fit(X, Y)

In [6]:
# 예측 
# flase and false
x = np.array([0,0])
per1.predict(x)

0
------------------


In [7]:
# true and false
x = np.array([1,0])
per1.predict(x)

0
------------------


In [8]:
# false and true
x = np.array([0,1])
per1.predict(x)

0
------------------


In [9]:
# true and true
x = np.array([1,1])
per1.predict(x)

1
------------------


XOR 게이트

In [10]:
# 객체 생성
per2 = Perceptron(2, 0.9)

In [11]:
X =  np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
Y = np.array([[0], [1], [1], [0]])

# 학습하기
per2.fit(X, Y)

In [12]:
# 예측
# false xor false
x = np.array([0,0])
per2.predict(x)

1
------------------


In [13]:
# true xor false
x = np.array([1,0])
per2.predict(x)

0
------------------


In [14]:
# false xor true
x = np.array([0,1])
per2.predict(x)

0
------------------


In [15]:
# true xor true
x = np.array([1,1])
per2.predict(x)

0
------------------


xor 결과가 예상대로 나오지 않음 > xor문제는 비선형문제이기 때문에 SLP로 해결 불가

### MLP로 논리 게이트 구현

In [16]:
class NeuralNetwork:

    def __init__(self, layers, alpha=0.1):
        # 생성자: 신경망 초기화
        # alpha: 학습률
        self.W = [] # 가중치를 저장할 리스트

        self.layers = layers  # list [ 2, 2, 2, 1]
        self.alpha = alpha

        # 가중치 초기화: 입력 레이어부터 마지막 은닉 레이어까지의 가중치를 초기화
        for i in np.arange(0, len(layers) - 2): # 마지막 레이어는 가중치 적용x
          w = np.random.randn(layers[i]+1, layers[i+1]+1)
          self.W.append(w/np.sqrt(layers[i]))

        # 마지막 은닉층에서 출력층으로의 가중치를 초기화합니다., 마지막 hidden - out 사이의 계수
        w = np.random.randn(layers[-2]+1, layers[-1])
        self.W.append(w/np.sqrt(layers[-2]))



    def sigmoid(self, x):
        # 시그모이드(로지스틱스) 활성화 함수: 신경망의 각 노드에서 사용

        return 1.0/(1+np.exp(-x))

    def sigmoid_deriv(self, x):
        # 시그모이드 활성화 함수의 미분: 이는 역전파 시 그래디언트(기울기)를 계산할 때 사용

        return x*(1-x)

    # 신경망을 학습시키는 메서드입니다.
    # 입력 X = np.array([[ 0,0], [ 0,1], [1,0], [0,0]])
    # 타겟 y = np.array([[0], [1], [1], [0]])
    # epochs: 학습을 위해 데이터셋을 반복할 횟수입니다.
    def fit(self, X, y, epochs=1000):
        # 입력 데이터에 바이어스를 위한 1 추가
        X = np.c_[X, np.ones((X.shape[0]))]

        for epoch in np.arange(0,epochs):
          for (x, target) in zip(X,y):
            self.fit_partial(x,target)


    def fit_partial(self, x, y):
        # 부분 학습 메서드: x는 단일 데이터 샘플, y는 해당 타겟 레이블
        A = [np.atleast_2d(x)]

        # 순전파 단계: 입력 데이터가 네트워크를 통해 전파되면서 각 레이어의 출력 계산
        for  layers in np.arange(0, len(self.W)):
          net = A[layers].dot(self.W[layers])
          out = self.sigmoid(net)
          A.append(out)

        # 역전파 단계: 신경망의 출력과 실제 타겟 값의 차이를 계산합니다.
        error = A[-1] - y

        # 오류의 시그모이드 미분값을 사용하여 오류 신호 계산
        # 그래디언트
        D =[error * self.sigmoid_deriv(A[-1])]

        # 모든 층에 대해 역전파를 수행합니다. 출력층부터 시작하여 입력층 방향으로 진행합니다.
        for  layers in np.arange(len(A) -2, 0, -1):
          delta = D[-1].dot(self.W[layers].T)
          delta = delta* self.sigmoid_deriv(A[layers])
          D.append(delta)


        # D 리스트를 뒤집습니다. 이렇게 하여 입력층에 가까운 오류부터 시작하게 됩니다.
        D = D[::-1]

        # 가중치 업데이트: 모든 레이어에 대해 가중치를 업데이트합니다.
        for layer in np.arange(0, len(self.W)):
          self.W[layer] += -self.alpha *  A[layer].T.dot(D[layer])


    # 예측 메서드: 새로운 데이터에 대한 예측을 수행합니다.
    def predict(self, X):  # X = [0 1]
        # 입력 데이터를 최소 2차원 배열로 변환합니다.
        p = np.atleast_2d(X)

        # 바이어스를 위한 1을 추가합니다.
        p = np.c_[p, np.ones((p.shape[0]))]

        # 신경망을 통해 순전파를 수행하여 예측 결과를 계산합니다.
        for layer in np.arange(0, len(self.W)):
            p = self.sigmoid(np.dot(p, self.W[layer]))
        return p

In [17]:
# 객체 생성 : 1 hidden layer, learning rate 0.5
nn = NeuralNetwork([2, 2, 1], 0.5)

In [18]:
X = np.array([[ 0,0], [ 0,1], [1,0], [1,1]])
y = np.array([[0], [1], [1], [0]])

# 학습 - 역전파 사용
nn.fit(X,y,100000)

In [19]:
# 예측 - 순전파
for (x, target) in zip(X,y):
  pred = nn.predict(x)[0][0]
  step  = 1 if pred > 0.5 else 0
  print(target[0], pred,step)

0 0.004848633565687469 0
1 0.9970251615522081 1
1 0.9939909879107264 1
0 0.006357017912846011 0


값이 예상대로 나오는 것을 확인 가능