In [19]:
# 파이토치로 다층 퍼셉트론 구현하기 

import torch 
import torch.nn as nn
from tqdm.notebook import tqdm

# GPU 연산이 가능하다면 Random seed 

# GPU가 사용가능한 여부 파악 test code 
device = 'cuda' if torch.cuda.is_available() else 'cup'

torch.manual_seed(777)
if device == 'cuda' :
    torch.cuda.manual_seed_all(777)
    
# XOR 문제를 풀기 위한 입력과 출력을 정의 
# x = torch.FloatTensor([[0, 0], [0, 1], [1, 0], [1, 1]]).to(device)
# y = torch.FloatTensor([[0] , [1], [1], [0]]).to(device)

# cpu test code 
x = [[0, 0], [0, 1], [1, 0], [1, 1]]
y = [[0] , [1], [1], [0]]

x = torch.tensor(x , dtype = torch.float32)
y = torch.tensor(y , dtype = torch.float32)


# 이제 다층 퍼셉트론을 설계합니다. 아래는 입력층 , 은닉층1층 은닉층2 은닉층3 출력층 을 가지는 은닉층이 3개인 인공 신경망

# model = nn.Sequential(
#     nn.Linear(2, 10 , bias = True) # input_layer = 2 hidden_layer1 = 10 
#     nn.Sigmoid(),
#     nn.Linear(10, 10 , bias = True) # hidden_layer1 = 10 hidden_layer2 = 10 
#     nn.Sigmoid(),
#     nn.Linear(10, 10 , bias = True) # hidden_layer2 = 10 hidden_layer3 = 10
#     nn.Sigmoid(), 
#     nn.Linear(10, 1 , bias = True) # hidden_layer3 output_layer = 1
#     nn.Sigmoid()
# ).to(device)


model = nn.Sequential(
    nn.Linear(2, 10 , bias = True), # input_layer = 2 hidden_layer1 = 10 
    nn.Sigmoid(),
    nn.Linear(10, 10 , bias = True), # hidden_layer1 = 10 hidden_layer2 = 10 
    nn.Sigmoid(),
    nn.Linear(10, 10 , bias = True), # hidden_layer2 = 10 hidden_layer3 = 10
    nn.Sigmoid(), 
    nn.Linear(10, 1 , bias = True), # hidden_layer3 output_layer = 1
    nn.Sigmoid()
)

In [25]:
# BCELoss() 이진 분류에서 사용하는 크로스엔트로피 함수
# criterion = torch.nn.BCELoss().to(device)
criterion = torch.nn.BCELoss()
optimizer = torch.optim.SGD(model.parameters() , lr = 0.1 ) # modified learning rate from 0.1 to 1

In [26]:
# 10000번의 에포크를 수행합니다. 각 에포크 마다 역전파가 수행된다고 보시면됩니다. 

for epoch in tqdm(range(10001)) :
    # 설명 필요 
    optimizer.zero_grad()
    
    # forward 연산 
    hypothesis = model(x)
    
    # loss 
    loss = criterion(hypothesis, y)
    loss.backward()
    optimizer.step()
    
    # 100의 배수에 해댕되는 에포크 마다 loss print
    if epoch % 100 == 0 :
        # loss print test code
        print(epoch, loss.item())

HBox(children=(FloatProgress(value=0.0, max=10001.0), HTML(value='')))

0 0.00015645990788470954
100 0.00015607241948600858
200 0.00015571473340969533
300 0.00015537194849457592
400 0.00015498446009587497
500 0.00015464167518075556
600 0.0001542839891044423
700 0.00015394121874123812
800 0.00015355371579062194
900 0.00015321094542741776
1000 0.00015286816051229835
1100 0.00015252537559717894
1200 0.00015216768952086568
1300 0.0001518249191576615
1400 0.0001514821342425421
1500 0.0001511691662017256
1600 0.00015081148012541234
1700 0.00015046869521029294
1800 0.00015012591029517353
1900 0.0001497980410931632
2000 0.0001494254538556561
2100 0.0001491124858148396
2200 0.0001487697008997202
2300 0.00014844181714579463
2400 0.00014809904678259045
2500 0.00014777117758058012
2600 0.0001474581949878484
2700 0.00014713032578583807
2800 0.00014678755542263389
2900 0.00014644477050751448
3000 0.00014619140711147338
3100 0.00014586353790946305
3200 0.00014552076754625887
3300 0.0001451928837923333
3400 0.00014489481691271067
3500 0.00014458184887189418
3600 0.0001442

In [33]:
# 학습된 다층 퍼셉트론의 예측값 확인하기
with torch.no_grad() : 
    hypothesis = model(x)
    predicted = (hypothesis > 0.5).float()
    acc = (predicted == y ).float().mean()
    print('모델의 출력값 Hypothesis \n', hypothesis.detach().cpu().numpy())
    print('모델의 예측값 Predicted \n', predicted.detach().cpu().numpy())
    print('실제값(Y) \n', y.cpu().numpy())
    print('정확도(Accuracy) ', acc.item())
    
# 실제값은 0, 1, 1, 0이며 예측값은 0, 1, 1, 0으로 문제를 해결하는 모습을 보여줍니다.

모델의 출력값 Hypothesis 
 [[9.0391426e-05]
 [9.9986148e-01]
 [9.9987245e-01]
 [1.4961198e-04]]
모델의 예측값 Predicted 
 [[0.]
 [1.]
 [1.]
 [0.]]
실제값(Y) 
 [[0.]
 [1.]
 [1.]
 [0.]]
정확도(Accuracy)  1.0
