In [None]:
# XOR 문제 - 다층 퍼셉트론 구현하기

In [1]:
import torch
import torch.nn as nn

In [2]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'

# for reproducibility
torch.manual_seed(777)
if device == 'cuda':
    torch.cuda.manual_seed_all(777)

In [3]:
#  XOR 문제를 풀기 위한 입력과 출력을 정의
X = torch.FloatTensor([[0, 0], [0, 1], [1, 0], [1, 1]]).to(device)
Y = torch.FloatTensor([[0], [1], [1], [0]]).to(device)

In [4]:
# 다층 퍼셉트론 설계
# 입력층, 은닉층1, 은닉층2, 은닉층3, 출력층 -> 은닉층이 3개인 인공 신경망
model = nn.Sequential(
    nn.Linear(2, 10, bias=True), # input_layer = 2, hidden_layer1 = 10
    nn.Sigmoid(),
    nn.Linear(10, 10, bias=True), # hidden_layer1 = 10, hidden_lyer2 = 10 
    nn.Sigmoid(),
    nn.Linear(10, 10, bias=True), # hidden_layer2 = 10, hidden_layer3 = 10
    nn.Sigmoid(),
    nn.Linear(10, 1, bias=True), # hidden_layer3 = 10, output_layer = 1
    nn.Sigmoid()
).to(device)

In [5]:
# 비용 함수와 옵티마이저 선언
# nn.BCELoss() : 이진 분류에서 사용하는 크로스엔트로피 함수

criterion = torch.nn.BCELoss().to(device)
optimizer = torch.optim.SGD(model.parameters(), lr=1) # modified learning rate from 0.1 to 1

In [6]:
# 10000번의 에포크 수행, 각 에포크마다 역전파 수행
for epoch in range(10001):
    optimizer.zero_grad()
    # forward 연산
    hypothesis = model(X)

    # 비용 함수
    cost = criterion(hypothesis, Y)
    cost.backward()
    optimizer.step()

    # 100의 배수에 해당하는 에포크마다 비용 출력
    if epoch % 100 == 0:
        print(epoch, cost.item())

0 0.6949131488800049
100 0.6931622624397278
200 0.6931502819061279
300 0.6931345462799072
400 0.6931537389755249
500 0.6931641101837158
600 0.6931809186935425
700 0.69313645362854
800 0.6931185126304626
900 0.693184494972229
1000 0.6931403875350952
1100 0.6931554675102234
1200 0.6931544542312622
1300 0.6931189894676208
1400 0.6931456923484802
1500 0.6931308507919312
1600 0.6931318044662476
1700 0.6930997371673584
1800 0.6931360960006714
1900 0.6931014657020569
2000 0.693150520324707
2100 0.6930890679359436
2200 0.6931199431419373
2300 0.6930897831916809
2400 0.6931056976318359
2500 0.6931024789810181
2600 0.6931039690971375
2700 0.6930993795394897
2800 0.6930652260780334
2900 0.6931310892105103
3000 0.6931076049804688
3100 0.6930739879608154
3200 0.693059504032135
3300 0.6930493116378784
3400 0.6930738687515259
3500 0.693045973777771
3600 0.6929928064346313
3700 0.6930471658706665
3800 0.6929964423179626
3900 0.6929124593734741
4000 0.6929401159286499
4100 0.6928843259811401
4200 0.692

In [14]:
# 학습된 다층 퍼셉트론의 예측값 확인

with torch.no_grad():
    hypothesis = model(X)
    predicted = (hypothesis > 0.5).float()
    accuracy = (predicted == Y).float().mean()
    print('모델의 출력값(Hypothesis): ', hypothesis.detach().cpu().numpy())
    print('모델의 예측값(Predicted): ', predicted.detach().cpu().numpy())
    print('실제값(Y): ', Y.cpu().numpy())
    print('정확도(Accuracy): ', accuracy.item())

모델의 출력값(Hypothesis):  [[1.09550994e-04]
 [9.99828100e-01]
 [9.99841452e-01]
 [1.84289776e-04]]
모델의 예측값(Predicted):  [[0.]
 [1.]
 [1.]
 [0.]]
실제값(Y):  [[0.]
 [1.]
 [1.]
 [0.]]
정확도(Accuracy):  1.0
