In [3]:
import torch  # PyTorch 라이브러리를 임포트합니다.
import torch.nn as nn  # 신경망 모듈을 nn이라는 이름으로 임포트합니다.
import torch.optim as optim  # 최적화 알고리즘 모듈을 optim이라는 이름으로 임포트합니다.
import torchvision  # 컴퓨터 비전용 데이터셋, 모델, 변환 등을 포함하는 torchvision 라이브러리를 임포트합니다.
import torchvision.transforms as transforms  # 이미지 변환을 위한 모듈을 transforms라는 이름으로 임포트합니다.

# 데이터셋 로드 및 전처리
transform = transforms.Compose([transforms.ToTensor(),  # 이미지를 텐서로 변환합니다.
                                transforms.Normalize((0.5,), (0.5,))])  # 이미지를 정규화합니다.

trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)  # MNIST 훈련 데이터셋을 다운로드합니다.
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)  # 훈련 데이터셋을 로드합니다.

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)  # MNIST 테스트 데이터셋을 다운로드합니다.
testloader = torch.utils.data.DataLoader(testset, batch_size=32, shuffle=False)  # 테스트 데이터셋을 로드합니다.

# 신경망 정의
class Net(nn.Module):  # nn.Module을 상속받아 신경망 클래스를 정의합니다.
    def __init__(self):
        super(Net, self).__init__()  # 부모 클래스의 생성자를 호출합니다.
        self.fc1 = nn.Linear(28 * 28, 128)  # 첫 번째 완전 연결층을 정의합니다.
        self.fc2 = nn.Linear(128, 64)  # 두 번째 완전 연결층을 정의합니다.
        self.fc3 = nn.Linear(64, 10)  # 세 번째 완전 연결층을 정의합니다.

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 입력 이미지를 일렬로 펼칩니다.
        x = torch.relu(self.fc1(x))  # 첫 번째 층을 통과한 후 ReLU 활성화 함수를 적용합니다.
        x = torch.relu(self.fc2(x))  # 두 번째 층을 통과한 후 ReLU 활성화 함수를 적용합니다.
        x = self.fc3(x)  # 세 번째 층을 통과합니다.
        return x

net = Net()  # 신경망 객체를 생성합니다.

# 손실 함수와 최적화 알고리즘 정의
criterion = nn.CrossEntropyLoss()  # 교차 엔트로피 손실 함수를 정의합니다.
optimizer = optim.SGD(net.parameters(), lr=0.01, momentum=0.9)  # SGD 최적화 알고리즘을 정의합니다.

# 신경망 학습
for epoch in range(5):  # 5번의 에포크 동안 학습합니다.
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data  # 입력 데이터와 레이블을 가져옵니다.

        optimizer.zero_grad()  # 이전의 기울기를 초기화합니다.

        outputs = net(inputs)  # 신경망을 통해 예측값을 계산합니다.
        loss = criterion(outputs, labels)  # 손실을 계산합니다.
        loss.backward()  # 역전파를 통해 기울기를 계산합니다.
        optimizer.step()  # 최적화 알고리즘을 통해 가중치를 업데이트합니다.

        running_loss += loss.item()
        if i % 100 == 99:  # 매 100 미니배치마다 손실을 출력합니다.
            print(f"[{epoch + 1}, {i + 1}] loss: {running_loss / 100:.3f}")
            running_loss = 0.0

print("Finished Training")  # 학습이 완료되었음을 출력합니다.

# 신경망 테스트
correct = 0
total = 0
with torch.no_grad():  # 기울기 계산을 비활성화합니다.
    for data in testloader:
        images, labels = data  # 입력 이미지와 레이블을 가져옵니다.
        outputs = net(images)  # 신경망을 통해 예측값을 계산합니다.
        _, predicted = torch.max(outputs.data, 1)  # 가장 높은 값을 가진 클래스 인덱스를 가져옵니다.
        total += labels.size(0)  # 전체 레이블 수를 증가시킵니다.
        correct += (predicted == labels).sum().item()  # 올바르게 예측한 수를 증가시킵니다.

print(f"Accuracy of the network on the 10000 test images: {100 * correct / total:.2f}%")  # 테스트 데이터셋에 대한 정확도를 출력합니다.

[1, 100] loss: 1.382
[1, 200] loss: 0.542
[1, 300] loss: 0.447
[1, 400] loss: 0.397
[1, 500] loss: 0.369
[1, 600] loss: 0.338
[1, 700] loss: 0.313
[1, 800] loss: 0.287
[1, 900] loss: 0.263
[1, 1000] loss: 0.252
[1, 1100] loss: 0.257
[1, 1200] loss: 0.233
[1, 1300] loss: 0.257
[1, 1400] loss: 0.226
[1, 1500] loss: 0.227
[1, 1600] loss: 0.220
[1, 1700] loss: 0.222
[1, 1800] loss: 0.213
[2, 100] loss: 0.181
[2, 200] loss: 0.168
[2, 300] loss: 0.178
[2, 400] loss: 0.154
[2, 500] loss: 0.159
[2, 600] loss: 0.165
[2, 700] loss: 0.172
[2, 800] loss: 0.154
[2, 900] loss: 0.172
[2, 1000] loss: 0.154
[2, 1100] loss: 0.158
[2, 1200] loss: 0.150
[2, 1300] loss: 0.139
[2, 1400] loss: 0.149
[2, 1500] loss: 0.149
[2, 1600] loss: 0.140
[2, 1700] loss: 0.131
[2, 1800] loss: 0.122
[3, 100] loss: 0.117
[3, 200] loss: 0.125
[3, 300] loss: 0.131
[3, 400] loss: 0.120
[3, 500] loss: 0.116
[3, 600] loss: 0.113
[3, 700] loss: 0.115
[3, 800] loss: 0.114
[3, 900] loss: 0.131
[3, 1000] loss: 0.114
[3, 1100] loss:

In [7]:
# 데이터셋 전처리
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-images-idx3-ubyte.gz to ./data/MNIST/raw/train-images-idx3-ubyte.gz


100%|██████████| 9.91M/9.91M [00:06<00:00, 1.61MB/s]


Extracting ./data/MNIST/raw/train-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/train-labels-idx1-ubyte.gz to ./data/MNIST/raw/train-labels-idx1-ubyte.gz


100%|██████████| 28.9k/28.9k [00:00<00:00, 144kB/s]


Extracting ./data/MNIST/raw/train-labels-idx1-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw/t10k-images-idx3-ubyte.gz


100%|██████████| 1.65M/1.65M [00:01<00:00, 1.22MB/s]


Extracting ./data/MNIST/raw/t10k-images-idx3-ubyte.gz to ./data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Failed to download (trying next):
HTTP Error 403: Forbidden

Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz
Downloading https://ossci-datasets.s3.amazonaws.com/mnist/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz


100%|██████████| 4.54k/4.54k [00:00<00:00, 3.69MB/s]

Extracting ./data/MNIST/raw/t10k-labels-idx1-ubyte.gz to ./data/MNIST/raw






In [8]:
class SimpleANN(nn.Module):
    def __init__(self):
        super(SimpleANN, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)  # 입력층에서 은닉층으로
        self.fc2 = nn.Linear(128, 64)       # 은닉층에서 은닉층으로
        self.fc3 = nn.Linear(64, 10)        # 은닉층에서 출력층으로

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 입력 이미지를 1차원 벡터로 변환
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

In [9]:
# 모델 초기화
model = SimpleANN()

# 손실 함수와 최적화 알고리즘 정의
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

# 모델 학습
for epoch in range(10):  # 10 에포크 동안 학습
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data

        # 기울기 초기화
        optimizer.zero_grad()

        # 순전파 + 역전파 + 최적화
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # 손실 출력
        running_loss += loss.item()
        if i % 100 == 99:  # 매 100 미니배치마다 출력
            print(f'[Epoch {epoch + 1}, Batch {i + 1}] loss: {running_loss / 100:.3f}')
            running_loss = 0.0

print('Finished Training')

[Epoch 1, Batch 100] loss: 1.297
[Epoch 1, Batch 200] loss: 0.484
[Epoch 1, Batch 300] loss: 0.395
[Epoch 1, Batch 400] loss: 0.348
[Epoch 1, Batch 500] loss: 0.322
[Epoch 1, Batch 600] loss: 0.270
[Epoch 1, Batch 700] loss: 0.248
[Epoch 1, Batch 800] loss: 0.223
[Epoch 1, Batch 900] loss: 0.224
[Epoch 2, Batch 100] loss: 0.196
[Epoch 2, Batch 200] loss: 0.195
[Epoch 2, Batch 300] loss: 0.193
[Epoch 2, Batch 400] loss: 0.172
[Epoch 2, Batch 500] loss: 0.178
[Epoch 2, Batch 600] loss: 0.164
[Epoch 2, Batch 700] loss: 0.166
[Epoch 2, Batch 800] loss: 0.163
[Epoch 2, Batch 900] loss: 0.151
[Epoch 3, Batch 100] loss: 0.120
[Epoch 3, Batch 200] loss: 0.129
[Epoch 3, Batch 300] loss: 0.146
[Epoch 3, Batch 400] loss: 0.133
[Epoch 3, Batch 500] loss: 0.133
[Epoch 3, Batch 600] loss: 0.129
[Epoch 3, Batch 700] loss: 0.126
[Epoch 3, Batch 800] loss: 0.118
[Epoch 3, Batch 900] loss: 0.110
[Epoch 4, Batch 100] loss: 0.110
[Epoch 4, Batch 200] loss: 0.099
[Epoch 4, Batch 300] loss: 0.105
[Epoch 4, 

In [None]:
correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy of the network on the 10000 test images: {100 * correct / total:.2f}%') 


Accuracy of the network on the 10000 test images: 97.57%
