## 6-5. XOR 문제 - 다층 퍼셉트론 구현하기
### 1. 파이토치로 다층 퍼셉트론 구현하기

In [1]:
import torch
import torch.nn as nn

In [2]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'

#for erproducibility
torch.manual_seed(777)
if device == 'cuda':
    torch.cuda.manual_seed_all(777)

In [3]:
# XOR 문제에 해당되는 입력과 출력 정의
X = torch.FloatTensor([[0,0], [0,1], [1,0], [1,1]]).to(device)
Y = torch.FloatTensor([[0], [1], [1], [0]]).to(device)

In [4]:
# 다층 퍼셉트론 설계
model = nn.Sequential(
    nn.Linear(2, 10, bias=True), #input_layer=2, hidden_layer1=10
    nn.Sigmoid(),
    nn.Linear(10, 10, bias=True), #hidden_layer1=10, hidden_layer2=10
    nn.Sigmoid(),
    nn.Linear(10, 10, bias=True), #hidden_layer2=10, hidden_layer3=10
    nn.Sigmoid(),
    nn.Linear(10, 1, bias=True), #hidden_layer3=10, output_layer=1
    nn.Sigmoid()
).to(device)

In [5]:
# 비용함수와 옵티마이저 선언
criterion = torch.nn.BCELoss().to(device) #nn.BCELoss()는 이진 분류에서 사용하는 크로스엔트로피 함수
optimizer = torch.optim.SGD(model.parameters(), lr=1) #modified learning rate from 0.1 to 1

In [6]:
for epoch in range(10001):
    optimizer.zero_grad()
    #forward 연산
    hypothesis = model(X)
    
    #비용 함수
    cost = criterion(hypothesis, Y)
    cost.backward()
    optimizer.step()
    
    if epoch % 100 == 0:
        print(epoch, cost.item())

0 0.6948983669281006
100 0.693155825138092
200 0.6931535005569458
300 0.6931513547897339
400 0.6931493282318115
500 0.6931473016738892
600 0.6931453943252563
700 0.6931434869766235
800 0.6931415796279907
900 0.6931397318840027
1000 0.6931380033493042
1100 0.6931362152099609
1200 0.6931343078613281
1300 0.6931324005126953
1400 0.6931304931640625
1500 0.6931284070014954
1600 0.6931263208389282
1700 0.6931242346763611
1800 0.6931220293045044
1900 0.6931195855140686
2000 0.6931171417236328
2100 0.6931143999099731
2200 0.6931115984916687
2300 0.6931084394454956
2400 0.6931050419807434
2500 0.6931013464927673
2600 0.6930973529815674
2700 0.693092942237854
2800 0.6930879950523376
2900 0.6930823922157288
3000 0.6930762529373169
3100 0.6930690407752991
3200 0.6930609941482544
3300 0.6930516958236694
3400 0.6930409073829651
3500 0.6930281519889832
3600 0.6930128931999207
3700 0.6929945945739746
3800 0.6929723024368286
3900 0.6929444074630737
4000 0.6929091811180115
4100 0.6928634643554688
4200 0

### 2. 학습된 다층 퍼셉트론의 예측값 확인하기

In [7]:
with torch.no_grad():
    hypothesis = model(X)
    predicted = (hypothesis > 0.5).float()
    accuracy = (predicted == Y).float().mean()
    print('모델의 출력값(Hypothesis): ', hypothesis.detach().cpu().numpy())
    print('모델의 예측값(Predicted): ', predicted.detach().cpu().numpy())
    print('실제값(Y): ', Y.cpu().numpy())
    print('정확도(Accuracy): ', accuracy.item()) #6-4와 다르게 문제 해결하는 것을 확인할 수 있음.

모델의 출력값(Hypothesis):  [[1.1180725e-04]
 [9.9982882e-01]
 [9.9984229e-01]
 [1.8483389e-04]]
모델의 예측값(Predicted):  [[0.]
 [1.]
 [1.]
 [0.]]
실제값(Y):  [[0.]
 [1.]
 [1.]
 [0.]]
정확도(Accuracy):  1.0
