## 기본 Library 선언

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import tensorflow as tf

tf.random.set_seed(777)  

## AND, OR, XOR 데이터 구현

In [None]:
T = 1.0
F = 0.0
bias = 1.0

In [None]:
def get_AND_data():
    X = [
    [F, F, bias],
    [F, T, bias],
    [T, F, bias],
    [T, T, bias]
    ]
    
    Y = [
        [F],
        [F],
        [F],
        [T]
    ]
    
    return X, Y

In [None]:
def get_OR_data():
    X = [
    [F, F, bias],
    [F, T, bias],
    [T, F, bias],
    [T, T, bias]
    ]
    
    Y = [
        [F],
        [T],
        [T],
        [T]
    ]
    
    return X, Y

In [None]:
def get_XOR_data():
    X = [
    [F, F, bias],
    [F, T, bias],
    [T, F, bias],
    [T, T, bias]
    ]
    
    Y = [
        [F],
        [T],
        [T],
        [F]
    ]
    
    return X, Y

## 시각화

* X가 2차원 배열이기에 2차원 공간에 표현하여 x1과 x2를 기준으로 Y 0과 1로 구분하는 예제입니다
* 붉은색과 푸른색으로 0과 1을 표시해 보도록 하겠습니다.

### AND

In [None]:
X, Y = get_AND_data()

plt.scatter(X[0][0],X[0][1], c='blue' , marker='^')
plt.scatter(X[3][0],X[3][1], c='red' , marker='^')
plt.scatter(X[1][0],X[1][1], c='blue' , marker='^')
plt.scatter(X[2][0],X[2][1], c='blue' , marker='^')

plt.xlabel("x1")
plt.ylabel("x2")
plt.show()

### OR

In [None]:
X, Y = get_OR_data()

plt.scatter(X[0][0],X[0][1], c='blue' , marker='^')
plt.scatter(X[3][0],X[3][1], c='red' , marker='^')
plt.scatter(X[1][0],X[1][1], c='red' , marker='^')
plt.scatter(X[2][0],X[2][1], c='red' , marker='^')

plt.xlabel("x1")
plt.ylabel("x2")
plt.show()

### XOR

In [None]:
X, Y = get_XOR_data()

plt.scatter(X[0][0],X[0][1], c='blue' , marker='^')
plt.scatter(X[3][0],X[3][1], c='blue' , marker='^')
plt.scatter(X[1][0],X[1][1], c='red' , marker='^')
plt.scatter(X[2][0],X[2][1], c='red' , marker='^')

plt.xlabel("x1")
plt.ylabel("x2")
plt.show()

## 모델 생성 후 평가

### AND, OR

AND, OR 데이터를 분류하는 단일 신경망을 만들겠습니다.

1. 출력 뉴런 수(units)가 1, 입력층의 뉴런 수(input_dim)가 3, 활성화 함수가 sigmoid인 dense를 하나 추가하세요.

2. 이진 분류일 때 사용하는 loss를 입력하여 compile을 완성해주세요.

**실행하면 시간이 꽤 걸리니 나중에 해보시길 추천드립니다!**

In [None]:
X, Y = get_AND_data()
#X, Y = get_OR_data()

tf.model = tf.keras.Sequential()
'''1'''
tf.model.compile('''2''', optimizer=tf.optimizers.SGD(lr=0.01),  metrics=['accuracy'])
tf.model.summary()

history = tf.model.fit(X, Y, epochs=5000)

predictions = tf.model.predict(X)
print('Prediction: \n', predictions)

score = tf.model.evaluate(X, Y)
print('Accuracy: ', score[1])

### XOR

XOR 데이터를 분류하는 단일 신경망을 만들겠습니다.

신경망 모델은 위와 동일하게 만들겠습니다.

**실행하면 시간이 꽤 걸리니 나중에 해보시길 추천드립니다!**

In [None]:
X, Y = get_XOR_data()

'''
신경망 모델을 작성해 주세요.
'''
tf.model.summary()

history = tf.model.fit(X, Y, epochs=5000)

predictions = tf.model.predict(X)
print('Prediction: \n', predictions)

score = tf.model.evaluate(X, Y)
print('Accuracy: ', score[1])

분류가 잘 되지 않은 것을 확인하였습니다.

### XOR with MLP

신경망 층을 늘려 XOR 데이터를 분류하겠습니다. 

1. 첫 번째 dense는 출력 뉴런 수(units)가 10, 입력층의 뉴런 수(input_dim)가 3, 활성화 함수가 sigmoid로 만들겠습니다. 
2. 뉴런 수(units)가 10, 활성화 함수가 sigmoid인 dense를 3개 추가해주세요.
3. 마지막 dense는 출력 뉴런 수가 1, 활성화 함수 sigmoid로 만들어주세요.

In [None]:
tf.model = tf.keras.Sequential()
'''
신경망 모델을 작성해 주세요.
'''
tf.model.compile(loss='binary_crossentropy', optimizer=tf.optimizers.Adam(lr=0.1), metrics=['accuracy'])
tf.model.summary()

history = tf.model.fit(X, Y, epochs=5000)

predictions = tf.model.predict(X)
print('Prediction: \n', predictions)

score = tf.model.evaluate(X, Y)
print('Accuracy: ', score[1])

# pytorch 이용해서 MLP 구현

pytorch를 이용해서 MLP를 구현하고, Fashion-MNIST 데이터셋을 분류해보겠습니다!<br>
기본 실습코드는 2개의 perceptron을 이용한 MLP 모델이 구현되어 있습니다. <br>
<br>
하이퍼 파라미터와 레이어 개수 등을 조절하면서 정확도를 확인해보세요!!

## 1. 필요한 라이브러리 import

In [None]:
import torch
import os
import numpy as np
import time
import random
from PIL import Image
from torch.utils.data import Dataset
from torchvision import transforms
from torch.utils.data import DataLoader
import torch.nn.functional as F
import matplotlib.pyplot as plt
from torchvision.datasets import FashionMNIST
%matplotlib inline

랜덤 시드 지정 및 GPU 설정

In [None]:
RANDOM_SEED = 123
DEVICE = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

## 2. 데이터 셋 설명

Fashion-MNIST는 10개의 클래스로 이루어진 데이터셋입니다. <br>
28x28의 흑백 이미지로 60,000개의 학습 이미지와 10,000개의 테스트 이미지를 갖고 있으며, label은 다음과 같습니다. <br>
(https://github.com/zalandoresearch/fashion-mnist) <br>
<br>

| Label | Description |
| --- | --- |
| 0 | T-shirt/top |
| 1 | Trouser |
| 2 | Pullover |
| 3 | Dress |
| 4 | Coat |
| 5 | Sandal |
| 6 | Shirt |
| 7 | Sneaker |
| 8 | Bag |
| 9 | Ankle boot |




## 3. Dataset Loader

이미지 데이터 전처리를 위해서 transforms을 정의하고, DataLoader를 통해서 데이터를 불러오겠습니다. <br>
DataLoader는 학습 시 Dataset에 쉬운 접근을 위해, 데이터셋을 iterable한 형태로 만들어줍니다.   

Train transform

In [None]:
custom_train_transform = transforms.Compose([  
                                             transforms.ToTensor(), # 이미지나 ndarray를 tensor 형태로 변경 
                                             transforms.Normalize(mean=(0.5,), std=(0.5,)) # 정규화 
])

Test transform

In [None]:
custom_test_transform = transforms.Compose([
                                             transforms.ToTensor(),
                                             transforms.Normalize(mean=(0.5,), std=(0.5,))
])

In [None]:
# Batch size = 1 이면 online 학습 
# Batch size = 60000 이면 full batch 학습 
# 1 < Batch size < 60000 이면 mini batch 학습   
BATCH_SIZE = ''' BATCH_SIZE를 지정해주세요. '''

전처리하고, 데이터 로딩

In [None]:
train_dataset = FashionMNIST(".", train=True, download=True, transform=custom_train_transform)

train_loader = DataLoader(dataset=train_dataset,
                          batch_size=BATCH_SIZE,
                          shuffle=True,
                          drop_last=True,
                          num_workers=2)


test_dataset = FashionMNIST(".", train=False, download=True, transform=custom_test_transform)

test_loader = DataLoader(dataset=test_dataset,
                         batch_size=BATCH_SIZE,
                         shuffle=False,
                         num_workers=2)

데이터 셋이 잘 로딩되었는지 확인

In [None]:
num_epochs = 1
for epoch in range(num_epochs):

    for batch_idx, (x, y) in enumerate(train_loader):
        
        print('Epoch:', epoch+1, end='')
        print(' | Batch index:', batch_idx, end='')
        print(' | Batch size:', y.size()[0])
        
        x = x.to(DEVICE)
        y = y.to(DEVICE)
        print(f'Image data shape: \t {x.shape}')
        print(f'Label data shape: \t {y.shape}')
        print(y)
        break

## 4. MLP 모델 정의 

MLP 모델을 정의하겠습니다. <br>
기본적으로 작성되어 있는 코드는 1개의 은닉층을 갖는 2-layer perceptron 입니다.<br>
<br>
코드를 수정해서 hidden layer를 추가해주세요!  

In [None]:
class MLP(torch.nn.Module):

    def __init__(self, num_features, num_hidden_1, num_classes):
        super(MLP, self).__init__()
        
        self.num_classes = num_classes # 10 
        self.linear_1 = torch.nn.Linear(num_features, num_hidden_1)
        
        '''
        hidden layer를 추가해주세요.(추가한 layer에 맞춰서 생성자 메서드(__init__)의 파라미터도 바꿔주셔야 합니다!)
        '''
        
        self.linear_out = torch.nn.Linear(''' layer에 맞춰서 작성해주세요. ''', num_classes)
        
        # Multi-class classification 문제를 풀기 위해 Softmax 함수를 사용
        self.softmax = torch.nn.Softmax(dim=-1)
        
    def forward(self, x):
        
        ### activation 함수 변경 가능
        ### 레이어간의 연결 추가, 변경
        out = self.linear_1(x)
        out = torch.sigmoid(out)
    
        '''
        추가한 layer에 맞춰서 layer 간의 연결 및 활성 함수 코드를 작성해주세요. 
        '''

        logits = self.linear_out(out)
        
        # Multi-class classification 문제를 풀기 위해 Softmax 함수를 사용합니다.
        # 다만, 이후 사용할 F.cross_entropy() 함수 내부에 softmax가 이미 구현되어 있기 때문에
        # Loss function 계산 시에는 self.softmax()를 통과하기 전의 logits 값을 이용하게 됩니다.
        probas = self.softmax(logits)
        return logits, probas

random.seed(RANDOM_SEED)
torch.manual_seed(RANDOM_SEED)

## 5. Training

In [None]:
'''
앞서 MLP 클래스에서 정의한 내용에 맞춰서, 밑의 MLP 객체의 파라미터를 수정해주세요. (은닉층 추가 및 노드 개수 수정)
num_hidden_1과 num_hidden_2의 노드 개수도 변경 가능합니다! 
'''
model = MLP(num_features=28*28,
            num_hidden_1=40,
            num_hidden_2=40,
            ''' MLP class 정의 내용에 맞춰 수정''',
            num_classes=10)

model = model.to(DEVICE)

'''
학습률(lr)과 epoch(NUM_EPOCHS) 지정해주세요. 
'''
optimizer = torch.optim.SGD(model.parameters(), lr='''학습률''') # optimizer는 가중치 업데이트 방법을 바꾸어 성능을 향상 

NUM_EPOCHS = 5 # 변경 가능 (10 이상으로 설정하면 학습 시간이 너무 오래 걸릴 수 있습니다.)


def compute_accuracy_and_loss(model, data_loader, device):
    correct_pred, num_examples = 0, 0
    cross_entropy = 0.
    for i, (features, targets) in enumerate(data_loader):
            
        features = features.view(-1, 28*28).to(device)
        targets = targets.to(device)

        logits, probas = model(features)
        
        # Loss 계산 시에는 logits 이용
        cross_entropy += F.cross_entropy(logits, targets).item()
        
        # inference 시에는 probas 이용
        _, predicted_labels = torch.max(probas, 1)
        num_examples += targets.size(0)
        correct_pred += (predicted_labels == targets).sum()
    return correct_pred.cpu().float()/num_examples * 100, cross_entropy/num_examples
    

start_time = time.time()
train_acc_lst, test_acc_lst = [], []
train_loss_lst, test_loss_lst = [], []

for epoch in range(NUM_EPOCHS):
    
    model.train()
    
    for batch_idx, (features, targets) in enumerate(train_loader):
    
        ### PREPARE MINIBATCH
        features = features.view(-1, 28*28).to(DEVICE)
        targets = targets.to(DEVICE)
            
        ### FORWARD AND BACK PROP
        logits, probas = model(features)
        cost = F.cross_entropy(logits, targets)
        optimizer.zero_grad()
        
        cost.backward()
        
        ### UPDATE MODEL PARAMETERS
        optimizer.step()
        
        ### LOGGING
        if not batch_idx % 40:
            print (f'Epoch: {epoch+1:03d}/{NUM_EPOCHS:03d} | '
                   f'Batch {batch_idx:03d}/{len(train_loader):03d} |' 
                   f' Cost: {cost:.4f}')

    model.eval()
    with torch.set_grad_enabled(False):
        train_acc, train_loss = compute_accuracy_and_loss(model, train_loader, device=DEVICE)
        test_acc, test_loss = compute_accuracy_and_loss(model, test_loader, device=DEVICE)
        train_acc_lst.append(train_acc)
        test_acc_lst.append(test_acc)
        train_loss_lst.append(train_loss)
        test_loss_lst.append(test_loss)
        print(f'Epoch: {epoch+1:03d}/{NUM_EPOCHS:03d} Train Acc.: {train_acc:.2f}%'
              f' | Test Acc.: {test_acc:.2f}%')
        
    elapsed = (time.time() - start_time)/60
    print(f'Time elapsed: {elapsed:.2f} min')
  
elapsed = (time.time() - start_time)/60
print(f'Total Training Time: {elapsed:.2f} min')

## 6. 평가 

테스트 데이터와 학습 데이터의 loss와 Accuracy 변화를 확인해보겠습니다. 

Loss

In [None]:
plt.plot(range(1, NUM_EPOCHS+1), train_loss_lst, label='Training loss')
plt.plot(range(1, NUM_EPOCHS+1), test_loss_lst, label='Test loss')
plt.legend(loc='upper right')
plt.ylabel('Cross entropy')
plt.xlabel('Epoch')
plt.show()

Accuracy

In [None]:
plt.plot(range(1, NUM_EPOCHS+1), train_acc_lst, label='Training accuracy')
plt.plot(range(1, NUM_EPOCHS+1), test_acc_lst, label='Test accuracy')
plt.legend(loc='upper left')
plt.ylabel('Cross entropy')
plt.xlabel('Epoch')
plt.show()

Test 정확도

In [None]:
model.eval()
with torch.set_grad_enabled(False): # inference 중에 메모리 아끼기 위해 
    test_acc, test_loss = compute_accuracy_and_loss(model, test_loader, DEVICE)
    print(f'Test accuracy: {test_acc:.2f}%')