In [24]:
!pip install jupyterthemes





In [25]:
!jt -l

# !jt 원래 테마로 돌아옴
# https://bio-info.tistory.com/15

Available Themes: 
   chesterish
   grade3
   gruvboxd
   gruvboxl
   monokai
   oceans16
   onedork
   solarizedd
   solarizedl


In [26]:
!jt -h

usage: jt [-h] [-l] [-t THEME] [-f MONOFONT] [-fs MONOSIZE] [-nf NBFONT]
          [-nfs NBFONTSIZE] [-tf TCFONT] [-tfs TCFONTSIZE] [-dfs DFFONTSIZE]
          [-ofs OUTFONTSIZE] [-mathfs MATHFONTSIZE] [-m MARGINS]
          [-cursw CURSORWIDTH] [-cursc CURSORCOLOR] [-cellw CELLWIDTH]
          [-lineh LINEHEIGHT] [-altp] [-altmd] [-altout] [-P] [-T] [-N] [-kl]
          [-vim] [-r] [-dfonts]

optional arguments:
  -h, --help            show this help message and exit
  -l, --list            list available themes
  -t THEME, --theme THEME
                        theme name to install
  -f MONOFONT, --monofont MONOFONT
                        monospace code font
  -fs MONOSIZE, --monosize MONOSIZE
                        code font-size
  -nf NBFONT, --nbfont NBFONT
                        notebook font
  -nfs NBFONTSIZE, --nbfontsize NBFONTSIZE
                        notebook fontsize
  -tf TCFONT, --tcfont TCFONT
                        txtcell font
  -tfs TCFONTSIZE, --tcfontsize TCF

In [27]:
!jt -t chesterish -f bitstream -fs 12 -tf roboto -tfs 13 -nf opensans -nfs 12 -ofs 12 -dfs 12 -cellw 95% -lineh 170 -T -N

# Code

In [1]:
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

<div class="alert alert-block alert-success">
<b>Note: Conv2D part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>__init__ </b>: 클래스의 초기화 메서드입니다.
    <br><b><font color= blue>in_channels </b>: 입력 채널의 수.
    <br><b><font color= blue>out_channels </b>: 출력 채널의 수.
    <br><b><font color= blue>kernel_size </b>: 커널(필터)의 크기.
    <br><b><font color= blue>super(Conv2D, self).__init__() </b>: 부모 클래스인 nn.Module의 초기화 메서드를 호출하고, self.conv에 nn.Conv2d 객체를 생성하여 할당함.
    <br><b><font color= blue>forward </b>: 순전파(forward propagation)를 수행하는 메서드. x를 입력으로 받아 self.conv에 x를 전달하여 합성곱 연산을 수행한 결과를 반환함.
</div>

In [2]:
# 합성곱 계층 구현
class Conv2D(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size, stride, padding):
        super(Conv2D, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, kernel_size, stride=stride, padding=padding)
        
    def forward(self, x):
        return self.conv(x)

<div class="alert alert-block alert-success">
<b>Note: MaxPooling part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>__init__ </b>: 클래스의 초기화 메서드입니다.
    <br><b><font color= blue>pool_size </b>: 풀링 영역의 크기.
    <br><b><font color= blue>super(MaxPool2D, self).__init__() </b>: 부모 클래스인 nn.Module의 초기화 메서드를 호출함.그리고 self.pool에 nn.MaxPool2d 객체를 생성하여 할당함.
    <br><b><font color= blue>forward </b>: 순전파(forward propagation)를 수행하는 메서드. x를 입력으로 받아 self.pool에 x를 전달하여 최대 풀링 연산을 수행한 결과를 반환함.
</div>

In [3]:
# 풀링 계층 구현
class MaxPool2D(nn.Module):
    def __init__(self, pool_size):
        super(MaxPool2D, self).__init__()
        self.pool = nn.MaxPool2d(pool_size)
        
    def forward(self, x):
        return self.pool(x)

<div class="alert alert-block alert-success">
<b>Note: FullyConnect part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>__init__ </b>: 클래스의 초기화 메서드입니다.
    <br><b><font color= blue>in_features </b>: 입력 특성의 수.
    <br><b><font color= blue>out_features </b>: 출력 특성의 수.
    <br><b><font color= blue>nn.Linear </b>: 클래스를 사용하여 입력과 출력의 선형 변환을 수행하는 FC 레이어를 생성합니다. 이 때, in_features와 out_features를 인자로 전달하여 선형 변환의 크기를 설정합니다. self.fc는 이 FC 레이어를 나타내는 변수입니다.
    <br><b><font color= blue>forward </b>: 순전파(forward propagation)를 수행하는 메서드. 입력 텐서 x를 self.fc로 전달하여 선형 변환을 수행함. 이는 입력과 출력을 완전히 연결하는 가중치와 편향을 적용하는 것을 의미합니다.
</div>

In [4]:
# 완전 연결 계층 구현
class FullyConnected(nn.Module):
    def __init__(self, in_features, out_features):
        super(FullyConnected, self).__init__()
        self.fc = nn.Linear(in_features, out_features)
        
    def forward(self, x):
        return self.fc(x)

<div class="alert alert-block alert-success">
<b>Note: ReLU part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>torch.relu() </b>: ReLU 함수는 입력이 0보다 작으면 0으로, 0보다 크면 그대로 출력하는 함수.
</div>

In [26]:
# 활성화 함수 구현 (ReLU)
class ReLU(nn.Module):
    def forward(self, x):
        return torch.max(x, torch.tensor(0.0))
    
# # 활성화 함수 구현 (ReLU)
# class Ltanh(nn.Module):
#     def forward(self, x):
#         numerator = np.exp(x.detach().numpy()) - np.exp(-x.detach().numpy())
#         denominator = np.exp(x.detach().numpy()) + np.exp(-x.detach().numpy())
#         tanh = (numerator / denominator) * 0.99
#         x = torch.tensor(x.detach().numpy())
#         return np.maximum(x, tanh)

<div class="alert alert-block alert-success">
<b>Note: SoftMax part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>torch.softmax() </b>: 입력 텐서 x에 소프트맥스 함수를 적용함 -> 소프트맥스 함수는 입력 벡터의 각 요소를 0과 1 사이의 확률값으로 변환하는 함수.
    <br><b><font color= blue>dim=1 </b>: 소프트맥스 함수를 적용할 차원을 지정합니다. 여기서는 두 번째 차원을 의미하며, 주로 다중 분류 문제에서 사용됨.
</div>

In [6]:
# 소프트맥스 함수 구현
class Softmax(nn.Module):
    def forward(self, x):
        return torch.softmax(x, dim=1)

<div class="alert alert-block alert-success">
<b>Note: Load dataset part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>transforms.Compose([...]) </b>: 데이터 전처리를 위한 변환(transform)들을 하나로 묶어주는 역할.
    <br><b><font color= blue>transforms.ToTensor() </b>: PIL 이미지나 NumPy 배열을 텐서로 변환함.
    <br><b><font color= blue>transforms.Normalize((0.5,), (0.5,)) </b>: 텐서의 각 채널에 대해 평균과 표준편차를 사용하여 정규화를 수행함 대부분 모델이 더 잘 학습하도록 돕기 위함. 
    <br><b><font color= blue>trainset = torchvision.datasets.MNIST(...) </b>: 훈련데이터로 가져오고, 다운로드하고, transform은 위에서 정의한 transform 적용함. 
    <br><b><font color= blue>trainloader = torch.utils.data.DataLoader(...) </b>: 데이터셋을 미니배치로 나누고 데이터를 섞어주는 데이터로더(DataLoader)를 생성함. 
</div>

In [7]:
# 데이터셋 불러오기
def load_dataset():
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])

    trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
    trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size, shuffle=True)
    testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
    testloader = torch.utils.data.DataLoader(testset, batch_size=batch_size, shuffle=False)

    return trainloader, testloader

<div class="alert alert-block alert-success">
<b>Note: Find the Optimize value of mean and std</b> 
</div>

In [8]:
import torchvision.datasets as datasets

# MNIST 데이터셋 불러오기
trainset = datasets.MNIST(root='./data', train=True, download=True)

# 데이터셋의 이미지 가져오기
images = trainset.data

# 이미지의 평균과 표준편차 계산
mean = images.float().mean() / 255
std = images.float().std() / 255

print("Mean:", mean)
print("Standard Deviation:", std)

Mean: tensor(0.1307)
Standard Deviation: tensor(0.3081)


<div class="alert alert-block alert-success">
<b>Note: training part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>nn.CrossEntropyLoss() </b>: 손실 함수를 사용하여 예측값과 실제 레이블(labels) 사이의 손실을 계산합니다.
    <br><b><font color= blue>optimizer.zero_grad() </b>: 옵티마이저의 그래디언트를 0으로 초기화함.
    <br><b><font color= blue>loss.backward(),optimizer.step() </b>: 역전파를 통해 그래디언트를 계산하고, 옵티마이저를 사용하여 모델의 가중치를 업데이트함.    
    <br><b><font color= blue>running_loss </b>: 현재까지 미니배치의 손실 합계. 
    <br><b><font color= blue>loss.item() </b>: 현재 미니배치에 대한 손실. 
</div>

In [9]:
# 학습 함수
def train(model, trainloader, learning_rate, num_epochs):
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=learning_rate)
    train_loss = []
    for epoch in range(num_epochs):
        running_loss = 0.0
        for i, (inputs, labels) in enumerate(trainloader):
            # Forward 계산
            outputs = model(inputs)

            # 손실 계산
            loss = criterion(outputs, labels)

            # Backward 계산 및 가중치 업데이트
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()

            running_loss += loss.item()
            train_loss.append(loss.item())
            
            if i % 100 == 99:
                print(f'[Epoch {epoch+1}, Batch {i+1}] Loss: {running_loss / 100:.3f}')
                running_loss = 0.0

    print('Training finished')
    return train_loss

<div class="alert alert-block alert-success">
<b>Note: testing part</b> 
</div>

<div class="alert alert-block alert-info">
<b>Demonstrate:</b>
    <br><b><font color= blue>torch.no_grad() </b>: 그래디언트 계산을 비활성화함. 테스트 단계는 불 필요하기에, 메모리 절약 및 속도 향샹을 위해 비활성화함.
    <br><b><font color= blue>torch.max(outputs.data, 1) </b>: 각 테스트 샘플에 대해 가장 큰 확률 값, 두번째 열.
    <br><b><font color= blue>loss.backward(),optimizer.step() </b>: 역전파를 통해 그래디언트를 계산하고, 옵티마이저를 사용하여 모델의 가중치를 업데이트함.    
    <br><b><font color= blue>running_loss </b>: 현재까지 미니배치의 손실 합계. 
    <br><b><font color= blue>loss.item() </b>: 현재 미니배치에 대한 손실. 
</div>

In [10]:
# 테스트 함수
def test(model, testloader):
    correct = 0
    total = 0
    test_score = []
    with torch.no_grad():
        for inputs, labels in testloader:
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
            sub = correct / total * 100
            test_score.append(sub)
    accuracy = correct / total * 100
    print(f'Accuracy on test dataset: {accuracy:.2f}%')
    return test_score

<div class="alert alert-block alert-success">
<b>Note: save model part</b> 
</div>

In [11]:
# 모델 저장 함수
def save_model(model, filepath):
    torch.save(model.state_dict(), filepath)
    print(f"Model saved at {filepath}")


In [27]:
# 모델 생성
class CNNModel(nn.Module):
    def __init__(self):
        super(CNNModel, self).__init__()
        self.model = nn.Sequential(
            Conv2D(in_channels=1, out_channels=16, kernel_size=5, stride=1, padding=0),
            Ltanh(),
            MaxPool2D(pool_size=2),
            Conv2D(in_channels=16, out_channels=32, kernel_size=5, stride=1, padding=0),
            Ltanh(),
            MaxPool2D(pool_size=2),
        )
        self.fc1 = FullyConnected(in_features=32*4*4, out_features=10)
#         self.relu = ReLU()
#         self.fc2 = FullyConnected(in_features=128, out_features=10)
#         self.softmax = Softmax()
#         softmax(x_i) = exp(x_i) / sum(exp(x_j))    
    def forward(self, x):
        x = self.model(x)
        x = x.view(x.size(0), -1)  # Flatten
        x = self.fc1(x)
#         x = self.relu(x)
#         x = self.fc2(x)
#         x = self.softmax(x)
        return x

In [28]:
model = CNNModel()

# 하이퍼파라미터 설정
learning_rate = 0.01
num_epochs = 21
batch_size = 128
trainloader, testloader = load_dataset()
print(int(10000 / len(trainloader)))

# 데이터셋 로드
trainloader, testloader = load_dataset()

# 학습
training_loss = train(model, trainloader, learning_rate, num_epochs)

# 테스트
test_accuracy = test(model, testloader)

# 모델 저장
save_model(model, 'model.pt')
# relu [Epoch 21, Batch 400] Loss: 0.053 Accuracy on test dataset: 97.87%
# tck [Epoch 21, Batch 400] Loss: 0.080 Accuracy on test dataset: 96.93% 0.99안곱한거
# Ltanh [Epoch 21, Batch 400] Loss: 0.069 Accuracy on test dataset: 97.15%

21
[Epoch 1, Batch 100] Loss: 0.463
[Epoch 1, Batch 200] Loss: 0.246
[Epoch 1, Batch 300] Loss: 0.196
[Epoch 1, Batch 400] Loss: 0.169
[Epoch 2, Batch 100] Loss: 0.146
[Epoch 2, Batch 200] Loss: 0.129
[Epoch 2, Batch 300] Loss: 0.129
[Epoch 2, Batch 400] Loss: 0.134
[Epoch 3, Batch 100] Loss: 0.126
[Epoch 3, Batch 200] Loss: 0.113
[Epoch 3, Batch 300] Loss: 0.113
[Epoch 3, Batch 400] Loss: 0.112
[Epoch 4, Batch 100] Loss: 0.109
[Epoch 4, Batch 200] Loss: 0.107
[Epoch 4, Batch 300] Loss: 0.094
[Epoch 4, Batch 400] Loss: 0.101
[Epoch 5, Batch 100] Loss: 0.099
[Epoch 5, Batch 200] Loss: 0.094
[Epoch 5, Batch 300] Loss: 0.102
[Epoch 5, Batch 400] Loss: 0.092
[Epoch 6, Batch 100] Loss: 0.088
[Epoch 6, Batch 200] Loss: 0.084
[Epoch 6, Batch 300] Loss: 0.092
[Epoch 6, Batch 400] Loss: 0.096
[Epoch 7, Batch 100] Loss: 0.086
[Epoch 7, Batch 200] Loss: 0.091
[Epoch 7, Batch 300] Loss: 0.085
[Epoch 7, Batch 400] Loss: 0.091
[Epoch 8, Batch 100] Loss: 0.075
[Epoch 8, Batch 200] Loss: 0.084
[Epoch 

In [None]:
import matplotlib.pyplot as plt

# visualization
plt.plot(range(num_epochs), training_loss, 'b-', label='Training_loss')
plt.title('Training loss')
plt.xlabel('Number of epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

In [None]:
plt.plot(range(num_epochs), test_accuracy, 'b-', label='Training_accuracy')
plt.title('Testing accuracy')
plt.xlabel('Number of epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()