In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

![스크린샷 2024-11-06 오후 2.26.19.png](attachment:90409452-4cbe-4b55-a201-e52b0319dc02.png)

![스크린샷 2024-11-06 오후 2.26.52.png](attachment:829a9d0e-ea4d-430b-b2ac-8c74a624451f.png)

![스크린샷 2024-11-06 오후 2.28.39.png](attachment:ece12d1c-8626-40eb-affa-3205a3534b90.png)

In [6]:
# 데이터셋 전처리
transform = transforms.Compose([
#트랜스폼은 여러변환을 순차적으로
#totensor = 텐서로 정보 변환 
#노멀라이즈 정규화해줌
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# MNIST 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

In [3]:
class SimpleANN(nn.Module):
    def __init__(self):
        super(SimpleANN, self).__init__()
        self.fc1 = nn.Linear(28 * 28, 128)  # 입력층에서 은닉층으로
        self.fc2 = nn.Linear(128, 64)       # 은닉층에서 은닉층으로
        self.fc3 = nn.Linear(64, 10)        # 은닉층에서 출력층으로

    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 입력 이미지를 1차원 벡터로 변환
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

![스크린샷 2024-11-06 오후 3.03.58.png](attachment:ff58419b-bdf7-485e-b3c2-a6f834bb0279.png)

In [4]:
# 모델 초기화
model = SimpleANN()

correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        #왜 맥스함수를 사용할까?
        # 
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy of the network on the 10000 test images: {100 * correct / total:.2f}%')

'''
강의보면서 다 주석 달꺼임~~~
'''

# 손실 함수와 최적화 알고리즘 정의
criterion = nn.CrossEntropyLoss()
#크로스 엔트로피: 손실함수 : 데이터가 특정 함수에 속할 확룰을 구함
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.9)
# SGD: 확률적 경사하강법 /Momentum SGD:이전 그래디언트 정보를 활용, 지역 최소값을 벗어날 수 있고 수렴이 빠름
# 
# 모델 학습
for epoch in range(10):  # 10 에포크 동안 학습
    # 에폭은 전체 데이터를 반복해서 몇번볼꺼냐?
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data

        # 기울기 초기화
        optimizer.zero_grad()
        # 기울기 정보가 계속 남아있어서 초기화 하는거임
        
        # 순전파 + 역전파 + 최적화
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        #뒤로전달해서 각각의 로스가 어떻게 반응 되여야하는지 알려줌
        #로스의 백워드가 기울기를 찾는 거임
        optimizer.step()
        # 기울기를 바탕으로 가중치 업데이트
        # 가중치가 어떤방향으로 업데이트 되는지 찾는것
        #기울기를 찾으면 가중치를 업데이트 할수있음
        
        # 손실 출력
        running_loss += loss.item()
        if i % 100 == 99:  # 매 100 미니배치마다 출력
            print(f'[Epoch {epoch + 1}, Batch {i + 1}] loss: {running_loss / 100:.3f}')
            running_loss = 0.0

print('Finished Training')

[Epoch 1, Batch 100] loss: 1.289
[Epoch 1, Batch 200] loss: 0.462
[Epoch 1, Batch 300] loss: 0.398
[Epoch 1, Batch 400] loss: 0.337
[Epoch 1, Batch 500] loss: 0.320
[Epoch 1, Batch 600] loss: 0.320
[Epoch 1, Batch 700] loss: 0.266
[Epoch 1, Batch 800] loss: 0.268
[Epoch 1, Batch 900] loss: 0.233
[Epoch 2, Batch 100] loss: 0.196
[Epoch 2, Batch 200] loss: 0.189
[Epoch 2, Batch 300] loss: 0.203
[Epoch 2, Batch 400] loss: 0.187
[Epoch 2, Batch 500] loss: 0.168
[Epoch 2, Batch 600] loss: 0.173
[Epoch 2, Batch 700] loss: 0.150
[Epoch 2, Batch 800] loss: 0.148
[Epoch 2, Batch 900] loss: 0.163
[Epoch 3, Batch 100] loss: 0.144
[Epoch 3, Batch 200] loss: 0.146
[Epoch 3, Batch 300] loss: 0.127
[Epoch 3, Batch 400] loss: 0.136
[Epoch 3, Batch 500] loss: 0.131
[Epoch 3, Batch 600] loss: 0.136
[Epoch 3, Batch 700] loss: 0.122
[Epoch 3, Batch 800] loss: 0.119
[Epoch 3, Batch 900] loss: 0.119
[Epoch 4, Batch 100] loss: 0.110
[Epoch 4, Batch 200] loss: 0.114
[Epoch 4, Batch 300] loss: 0.099
[Epoch 4, 

In [5]:
correct = 0
total = 0
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = model(images)
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'Accuracy of the network on the 10000 test images: {100 * correct / total:.2f}%')


Accuracy of the network on the 10000 test images: 97.50%
