In [1]:
import torch
import torch.optim as optim
import numpy as np
import torch.nn as nn

In [2]:
#XOR 연산의 x1, x2를 저장하는 배열
X = torch.FloatTensor([
        [0, 0],
        [1, 0],
        [0, 1],
        [1, 1]
])

In [3]:
#XOR 연산의 y 출력을 저장하는 배열
y = torch.FloatTensor([
        [0],
        [1],
        [1],
        [0]
])

In [6]:
class MyModule(nn.Module):
    #생성자
    def __init__(self):
        super(MyModule, self).__init__()
        #2개의 입력을 받아 선형회귀를 10회 실행하고 sigmoid 실행
        self.linear1 = nn.Linear(2, 10)
        self.sigmoid1 = nn.Sigmoid()

        #10개의 입력을 받아 선형회귀를 1회 실행하고 sigmoid 실행
        self.linear2 = nn.Linear(10, 1)
        self.sigmoid2 = nn.Sigmoid()

    #딥러닝 연산 실행
    def forward(self, x):
        x = self.linear1(x)
        x = self.sigmoid1(x)
        x = self.linear2(x)
        x = self.sigmoid2(x)

        #예측값 리턴
        return x

In [7]:
#MyModule() 객체 생성
mlp_model = MyModule()

#weight와 bias를 순서대로 리턴
list(mlp_model.parameters())

[Parameter containing:
 tensor([[-0.1327, -0.0329],
         [ 0.3449,  0.3991],
         [ 0.0991, -0.4522],
         [-0.2588,  0.3787],
         [ 0.0383, -0.5700],
         [-0.0512,  0.5802],
         [-0.3939, -0.3607],
         [-0.0265, -0.0669],
         [ 0.3873,  0.4708],
         [ 0.0589, -0.2169]], requires_grad=True),
 Parameter containing:
 tensor([-0.2704,  0.4452, -0.3442, -0.5167,  0.0311, -0.3001, -0.0257, -0.6705,
         -0.2743, -0.0789], requires_grad=True),
 Parameter containing:
 tensor([[-0.0736, -0.0903, -0.1034,  0.1025,  0.0411, -0.0476, -0.0698, -0.2886,
          -0.0368,  0.0455]], requires_grad=True),
 Parameter containing:
 tensor([-0.1072], requires_grad=True)]

In [8]:
#미분을 자동 계산해서 w0, w1, b0, b1을 수정할 객체 생성
#learning_rate는 0.01로 설정
#weight와 bias를 순서대로 리턴
optimizer = optim.Adam(mlp_model.parameters(), lr = 0.01)

In [9]:
#5000번 반복해서 오차가 0으로 수렴되는 w, b를 찾음
for i in range(5000):
    print("i=", i)
    print("w0=", list(mlp_model.parameters())[0])
    print("b0=", list(mlp_model.parameters())[1])
    print("w1=", list(mlp_model.parameters())[2])
    print("b2=", list(mlp_model.parameters())[3])

    #심층 신경망 연산을 실행해서 결과를 리턴
    hypothesis = mlp_model(X)
    print("hypothesis=", hypothesis)

    #퍼셉트론 오차를 계산해서 cost에 저장
    cost = torch.mean(-y * torch.log(hypothesis) - (1 - y) * torch.log(1 - hypothesis))
    print("cost=", cost)

    #cost를 이용해서 미분을 계산하고 w0, w1, b0, b1 업데이트
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    print("=" * 100)

i= 0
w0= Parameter containing:
tensor([[-0.1327, -0.0329],
        [ 0.3449,  0.3991],
        [ 0.0991, -0.4522],
        [-0.2588,  0.3787],
        [ 0.0383, -0.5700],
        [-0.0512,  0.5802],
        [-0.3939, -0.3607],
        [-0.0265, -0.0669],
        [ 0.3873,  0.4708],
        [ 0.0589, -0.2169]], requires_grad=True)
b0= Parameter containing:
tensor([-0.2704,  0.4452, -0.3442, -0.5167,  0.0311, -0.3001, -0.0257, -0.6705,
        -0.2743, -0.0789], requires_grad=True)
w1= Parameter containing:
tensor([[-0.0736, -0.0903, -0.1034,  0.1025,  0.0411, -0.0476, -0.0698, -0.2886,
         -0.0368,  0.0455]], requires_grad=True)
b2= Parameter containing:
tensor([-0.1072], requires_grad=True)
hypothesis= tensor([[0.4196],
        [0.4180],
        [0.4206],
        [0.4190]], grad_fn=<SigmoidBackward0>)
cost= tensor(0.7064, grad_fn=<MeanBackward0>)
i= 1
w0= Parameter containing:
tensor([[-0.1427, -0.0429],
        [ 0.3349,  0.3891],
        [ 0.0891, -0.4622],
        [-0.2488,  0.

In [10]:
#입력값 X의 예측값 리턴
predict = mlp_model(X)
predict

tensor([[3.0748e-05],
        [9.9992e-01],
        [9.9992e-01],
        [1.0364e-04]], grad_fn=<SigmoidBackward0>)

In [11]:
#predict를 numpy 배열로 변환한 값이 0.5 초과이면 1, 아니면 0 리턴
predict01 = np.where(predict.detach().numpy() >= 0.5, 1, 0)
predict01

array([[0],
       [1],
       [1],
       [0]])

In [12]:
#y를 numpy 배열로 변환하고 predict01과 y가 같으면 true, 다르면 false 리턴
predict02 = (predict01 == (y.detach().numpy()))
predict02

array([[ True],
       [ True],
       [ True],
       [ True]])

In [13]:
#0, 1의 XOR 연산 실행
arr = torch.FloatTensor([[0, 1]])

#입력값 arr의 예측값 리턴
predict = mlp_model(arr)
predict

tensor([[0.9999]], grad_fn=<SigmoidBackward0>)

In [14]:
#0, 1의 XOR 연산 예측값 = 1(0.99)

In [15]:
#1, 1의 XOR 연산 실행
arr = torch.FloatTensor([[1, 1]])

#입력값 arr의 예측값 리턴
predict = mlp_model(arr)
predict

tensor([[0.0001]], grad_fn=<SigmoidBackward0>)

In [16]:
#1, 1의 XOR 연산 예측값 = 0