### 08. Perception

- and, or 문제는 선형 구분이 가능하다 (perceptron availalbe) 
- 반면 xor 문제는 하나의 perceptron으로 구분 불가, 다수의 perceptron을 사용해야 한다. 
- 다수의 perceptron을 사용할 수 있는 방법으로써 Backpropagation(역전파 알고리즘)이 개발되었다. 
    - target값과 실제 모델이 계산한 output이 얼마나 차이가 나는지 구한 후, 그 오차값을 다시 뒤로 전파해가면서 각 노드가 가지고 있는 변수들을 갱신하는 알고리즘 (즉, 출력부터 반대 방향으로 순차 편미분 수행하여, W와 b값들을 갱신)

- <font color = 'yellow'> #01 선형모델 2개를 사용하여 xor 문제를 해결하는 코드 

In [5]:
import torch 
import torch.nn as nn 
import torch.optim as optim
device = 'cpu' 

## xor data 
X = torch.FloatTensor([
    [0,0], [0,1], [1,0], [1,1]
]).to(device)

Y = torch.FloatTensor([
    [0], [1], [1], [0]
])

## models, function(Sigmoid), loss function, optimizer 
linear1 = nn.Linear(2,2, bias = True)
linear2 = nn.Linear(2,1, bias = True)
sigmoid = nn.Sigmoid()
model = nn.Sequential(linear1, sigmoid, linear2, sigmoid).to(device) ## Sequential: 모델들을 순차적으로 담아 수행시켜 준다. 

criterion = nn.BCELoss().to(device)  ## 0, 1로 구분하는 문제이므로, crossEntropyLoss 대신 BCELoss를 사용 
optimizer = optim.SGD(model.parameters(), lr = 1)

for epoch in range(10001): 
    hypothesis = model(X)
    cost = criterion(hypothesis, Y)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 1000 == 0 : 
        print('epoch: {}  cost:{:.4f}'.format(epoch, cost.item())
        )

epoch: 0  cost:0.6945
epoch: 1000  cost:0.6169
epoch: 2000  cost:0.0111
epoch: 3000  cost:0.0051
epoch: 4000  cost:0.0033
epoch: 5000  cost:0.0024
epoch: 6000  cost:0.0019
epoch: 7000  cost:0.0016
epoch: 8000  cost:0.0014
epoch: 9000  cost:0.0012
epoch: 10000  cost:0.0010


In [12]:
with torch.no_grad():
    hypothesis = model(X)
    predicted = (hypothesis > 0.5).float()
    accuracy = (predicted == Y).float().mean()
    print('Hypothesis: ', hypothesis, '\nAccuracy: ', accuracy)

Hypothesis:  tensor([[1.0020e-03],
        [9.9862e-01],
        [9.9907e-01],
        [8.7177e-04]]) 
Accuracy:  tensor(1.)


- <font color = 'yellow'> #02. 같은 방식으로 선형모형을 4개로 확장한 코드 
    - 앞서 대비 cost의 감소 주목 

In [13]:
import torch 
import torch.nn as nn 
import torch.optim as optim
device = 'cpu' 

## xor data 
X = torch.FloatTensor([
    [0,0], [0,1], [1,0], [1,1]
]).to(device)

Y = torch.FloatTensor([
    [0], [1], [1], [0]
])

## models, function(Sigmoid), loss function, optimizer 
linear1 = nn.Linear(2,10, bias = True)
linear2 = nn.Linear(10,10, bias = True)
linear3 = nn.Linear(10,10, bias = True)
linear4 = nn.Linear(10,1, bias = True)

sigmoid = nn.Sigmoid()
model = nn.Sequential(linear1, sigmoid, 
                      linear2, sigmoid, 
                      linear3, sigmoid, 
                      linear4, sigmoid, 
                     ).to(device) ## Sequential: 모델들을 순차적으로 담아 수행시켜 준다. 

criterion = nn.BCELoss().to(device)  ## 0, 1로 구분하는 문제이므로, crossEntropyLoss 대신 BCELoss를 사용 
optimizer = optim.SGD(model.parameters(), lr = 1)

for epoch in range(10001): 
    hypothesis = model(X)
    cost = criterion(hypothesis, Y)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 1000 == 0 : 
        print('epoch: {}  cost:{:.4f}'.format(epoch, cost.item())
        )

epoch: 0  cost:0.6944
epoch: 1000  cost:0.6931
epoch: 2000  cost:0.6930
epoch: 3000  cost:0.6922
epoch: 4000  cost:0.0049
epoch: 5000  cost:0.0008
epoch: 6000  cost:0.0004
epoch: 7000  cost:0.0003
epoch: 8000  cost:0.0002
epoch: 9000  cost:0.0002
epoch: 10000  cost:0.0001


In [14]:
with torch.no_grad():
    hypothesis = model(X)
    predicted = (hypothesis > 0.5).float()
    accuracy = (predicted == Y).float().mean()
    print('Hypothesis: ', hypothesis, '\nAccuracy: ', accuracy)

Hypothesis:  tensor([[1.1590e-04],
        [9.9988e-01],
        [9.9987e-01],
        [1.3150e-04]]) 
Accuracy:  tensor(1.)
