In [1]:
import torch
import torch.optim as optim
import numpy as np
import torch.nn as nn

In [2]:
#XOR 연산의 x1, x2를 저장하는 배열
X = torch.FloatTensor([
        [0, 0],
        [1, 0],
        [0, 1],
        [1, 1]
])

In [3]:
#XOR 연산의 y 출력을 저장하는 배열
y = torch.FloatTensor([
        [0],
        [1],
        [1],
        [0]
])

In [4]:
#파이토치 연산을 저장하는 객체
mlp_model = nn.Sequential(
    #2개의 입력을 받아 선형회귀 10회 실행
    nn.Linear(in_features=2, out_features=10),

    #활성함수 sigmoid 실행
    nn.Sigmoid(),

    #10개의 입력을 받아 선형회귀 10회 실행
    nn.Linear(in_features=10, out_features=1),

    #활성함수 sigmoid 실행
    nn.Sigmoid()
)

mlp_model

Sequential(
  (0): Linear(in_features=2, out_features=10, bias=True)
  (1): Sigmoid()
  (2): Linear(in_features=10, out_features=1, bias=True)
  (3): Sigmoid()
)

In [5]:
#mlp_model의 weight와 bias를 순서대로 리턴
list(mlp_model.parameters())

[Parameter containing:
 tensor([[-0.3930,  0.4725],
         [ 0.4148, -0.6929],
         [-0.6717,  0.5969],
         [ 0.1911,  0.2778],
         [ 0.0779, -0.1143],
         [ 0.0974,  0.0730],
         [ 0.2221, -0.4259],
         [-0.5336,  0.1359],
         [-0.1125,  0.5155],
         [-0.1878,  0.3440]], requires_grad=True),
 Parameter containing:
 tensor([ 0.6445, -0.4614,  0.2245,  0.5696, -0.3775, -0.6385,  0.5513,  0.3571,
          0.0513, -0.1370], requires_grad=True),
 Parameter containing:
 tensor([[-0.2733,  0.0525,  0.0595,  0.0948,  0.0319, -0.2034,  0.0641, -0.0722,
          -0.1755,  0.0251]], requires_grad=True),
 Parameter containing:
 tensor([0.2429], requires_grad=True)]

In [6]:
#첫번째 선형 회귀의 weight
list(mlp_model.parameters())[0]

Parameter containing:
tensor([[-0.3930,  0.4725],
        [ 0.4148, -0.6929],
        [-0.6717,  0.5969],
        [ 0.1911,  0.2778],
        [ 0.0779, -0.1143],
        [ 0.0974,  0.0730],
        [ 0.2221, -0.4259],
        [-0.5336,  0.1359],
        [-0.1125,  0.5155],
        [-0.1878,  0.3440]], requires_grad=True)

In [7]:
#첫번째 선형 회귀의 bias
list(mlp_model.parameters())[1]

Parameter containing:
tensor([ 0.6445, -0.4614,  0.2245,  0.5696, -0.3775, -0.6385,  0.5513,  0.3571,
         0.0513, -0.1370], requires_grad=True)

In [8]:
#미분을 자동 계산해서 w0, w1, b0, b1을 수정할 객체 생성
#learning_rate는 0.01로 설정
#weight와 bias를 순서대로 리턴
optimizer = optim.Adam(mlp_model.parameters(), lr = 0.01)

In [9]:
#5000번 반복해서 오차가 0으로 수렴되는 w, b를 찾음
for i in range(5000):
    print("i=", i)
    print("w0=", list(mlp_model.parameters())[0])
    print("b0=", list(mlp_model.parameters())[1])
    print("w1=", list(mlp_model.parameters())[2])
    print("b2=", list(mlp_model.parameters())[3])

    #심층 신경망 연산을 실행해서 결과를 리턴
    hypothesis = mlp_model(X)
    print("hypothesis=", hypothesis)

    #퍼셉트론 오차를 계산해서 cost에 저장
    cost = torch.mean(-y * torch.log(hypothesis) - (1 - y) * torch.log(1 - hypothesis))
    print("cost=", cost)

    #cost를 이용해서 미분을 계산하고 w0, w1, b0, b1 업데이트
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    print("=" * 100)

i= 0
w0= Parameter containing:
tensor([[-0.3930,  0.4725],
        [ 0.4148, -0.6929],
        [-0.6717,  0.5969],
        [ 0.1911,  0.2778],
        [ 0.0779, -0.1143],
        [ 0.0974,  0.0730],
        [ 0.2221, -0.4259],
        [-0.5336,  0.1359],
        [-0.1125,  0.5155],
        [-0.1878,  0.3440]], requires_grad=True)
b0= Parameter containing:
tensor([ 0.6445, -0.4614,  0.2245,  0.5696, -0.3775, -0.6385,  0.5513,  0.3571,
         0.0513, -0.1370], requires_grad=True)
w1= Parameter containing:
tensor([[-0.2733,  0.0525,  0.0595,  0.0948,  0.0319, -0.2034,  0.0641, -0.0722,
         -0.1755,  0.0251]], requires_grad=True)
b2= Parameter containing:
tensor([0.2429], requires_grad=True)
hypothesis= tensor([[0.5101],
        [0.5195],
        [0.4967],
        [0.5050]], grad_fn=<SigmoidBackward0>)
cost= tensor(0.6928, grad_fn=<MeanBackward0>)
i= 1
w0= Parameter containing:
tensor([[-0.4030,  0.4825],
        [ 0.4248, -0.7029],
        [-0.6817,  0.5869],
        [ 0.2011,  0.2

In [10]:
#cost가 0에 수렴하는 첫번째 선형 회귀의 weight
list(mlp_model.parameters())[0]

Parameter containing:
tensor([[-4.5460,  4.3635],
        [ 4.8789, -4.8703],
        [-4.7154,  4.5565],
        [ 4.9555,  4.7897],
        [-5.2864,  5.7562],
        [ 4.1226,  4.2740],
        [ 4.9526, -5.5130],
        [-5.5171,  5.2202],
        [-5.2172,  5.2396],
        [-4.4071,  4.8283]], requires_grad=True)

In [11]:
#cost가 0에 수렴하는 첫번째 선형 회귀의 bias
list(mlp_model.parameters())[1]

Parameter containing:
tensor([ 2.4483, -2.5730, -2.4206, -1.9085, -3.1429, -6.7189,  3.0794,  2.9559,
         2.7234, -2.6929], requires_grad=True)

In [12]:
#입력값 X의 예측값 리턴
predict = mlp_model(X)
predict

tensor([[5.7022e-05],
        [9.9993e-01],
        [9.9993e-01],
        [3.6595e-05]], grad_fn=<SigmoidBackward0>)

In [13]:
#predict를 numpy 배열로 변환한 값이 0.5 초과이면 1, 아니면 0 리턴
predict01 = np.where(predict.detach().numpy() >= 0.5, 1, 0)
predict01

array([[0],
       [1],
       [1],
       [0]])

In [14]:
#y를 numpy 배열로 변환하고 predict01과 y가 같으면 true, 다르면 false 리턴
predict02 = (predict01 == (y.detach().numpy()))
predict02

array([[ True],
       [ True],
       [ True],
       [ True]])

In [15]:
#true는 1로, false는 0으로 합을 계산하고 배열의 길이로 나누어 정확도 계산
np.sum(predict02) / 4

1.0

In [16]:
#0, 1의 XOR 연산 실행
arr = torch.FloatTensor([[0, 1]])

#입력값 arr의 예측값 리턴
predict = mlp_model(arr)
predict

tensor([[0.9999]], grad_fn=<SigmoidBackward0>)

In [17]:
#0, 1의 XOR 연산 예측값 = 1(0.99)

In [18]:
#1, 1의 XOR 연산 실행
arr = torch.FloatTensor([[1, 1]])

#입력값 arr의 예측값 리턴
predict = mlp_model(arr)
predict

tensor([[3.6595e-05]], grad_fn=<SigmoidBackward0>)

In [19]:
#1, 1의 XOR 연산 예측값 = 0