### 03. XOR 문제 - 단층 퍼셉트론 구현하기

#### 1. 파이토치로 단층 퍼셉트론 구현하기

In [6]:
import torch
import torch.nn as nn

In [2]:
device = 'cude' if torch.cuda.is_available() else 'cpu'
torch.manual_seed(777)
if device == 'cuda' : 
    torch.cuda.manual_seed_all(777)

XOR 문제에 해당되는 입력과 출력을 정의

In [4]:
X = torch.FloatTensor([[0, 0], [0, 1], [1, 0], [1, 1]]).to(device)
Y = torch.FloatTensor([[0], [1], [1], [0]]).to(device)

1개의 뉴런을 가지는 단층 퍼셉트론 구현
- 단층 퍼셉트론이 처음 소개되었을 때는 계단 함수였지만, 이미 다른 활성화 함수인 시그모이드 함수를 알고 있으므로 시그모이드 함수를 사용

In [7]:
linear = nn.Linear(2, 1, bias=True)
sigmoid = nn.Sigmoid()
model = nn.Sequential(linear, sigmoid).to(device)

- 0 또는 1을 예측하는 이진 분류 문제이므로 비용함수로는 크로스엔트로피 함수를 사용
- nn.BCELoss() : 이진 분류에서 사용하는 크로스엔트로피 함수

In [8]:
criterion = torch.nn.BCELoss().to(device)
optimizer = torch.optim.SGD(model.parameters(), lr=1)

In [9]:
# 10001번의 에포크 수행. (0~1000번까지)
for step in range(10001) : 
    optimizer.zero_grad()
    hypothesis = model(X)
    
    cost = criterion(hypothesis, Y)
    cost.backward()
    optimizer.step()
    
    if step % 100 == 0 : 
        print(step, cost.item())

0 0.7273974418640137
100 0.6931476593017578
200 0.6931471824645996
300 0.6931471824645996
400 0.6931471824645996
500 0.6931471824645996
600 0.6931471824645996
700 0.6931471824645996
800 0.6931471824645996
900 0.6931471824645996
1000 0.6931471824645996
1100 0.6931471824645996
1200 0.6931471824645996
1300 0.6931471824645996
1400 0.6931471824645996
1500 0.6931471824645996
1600 0.6931471824645996
1700 0.6931471824645996
1800 0.6931471824645996
1900 0.6931471824645996
2000 0.6931471824645996
2100 0.6931471824645996
2200 0.6931471824645996
2300 0.6931471824645996
2400 0.6931471824645996
2500 0.6931471824645996
2600 0.6931471824645996
2700 0.6931471824645996
2800 0.6931471824645996
2900 0.6931471824645996
3000 0.6931471824645996
3100 0.6931471824645996
3200 0.6931471824645996
3300 0.6931471824645996
3400 0.6931471824645996
3500 0.6931471824645996
3600 0.6931471824645996
3700 0.6931471824645996
3800 0.6931471824645996
3900 0.6931471824645996
4000 0.6931471824645996
4100 0.6931471824645996
4200

해석) 200번 에포크의 손실값이 출력된 이후에는 더이상 줄어들지 않는다. 단층 퍼셉트론은 XOR 문제를 풀 수 없기 때문

------------------------------------------------------------------------------------------------------------

#### 2. 학습된 단층 퍼셉트론의 예측값 확인하기 

In [12]:
with torch.no_grad() : 
    hypothesis = model(X)
    predicted = (hypothesis > 0.5).float()
    accuracy = (predicted == Y).float().mean()
    print('모델의 출력값(Hypothesis) : ', hypothesis.detach().cpu().numpy())
    print('모델의 예측값(Predicted) : ', predicted.detach().cpu().numpy())
    print('실제값(Y) : ', Y.cpu().numpy())
    print('정확도(Accuracy) : ', accuracy.item())

모델의 출력값(Hypothesis) :  [[0.5]
 [0.5]
 [0.5]
 [0.5]]
모델의 예측값(Predicted) :  [[0.]
 [0.]
 [0.]
 [0.]]
실제값(Y) :  [[0.]
 [1.]
 [1.]
 [0.]]
정확도(Accuracy) :  0.5


잘 예측하지 못함