In [24]:

import gzip
import numpy as np

def load_mnist_images(filename):
    with gzip.open(filename, 'rb') as f:
        # 매직 넘버 읽기
        magic = int.from_bytes(f.read(4), 'big')
        if magic != 2051:
            raise ValueError("Invalid magic number in MNIST image file: {}".format(magic))
        
        # 이미지 수, 행, 열 읽기
        num_images = int.from_bytes(f.read(4), 'big')
        num_rows = int.from_bytes(f.read(4), 'big')
        num_cols = int.from_bytes(f.read(4), 'big')
        
        # 이미지 데이터 읽기
        images = np.frombuffer(f.read(), dtype=np.uint8)
        images = images.reshape((num_images, num_rows, num_cols))
        
        return images

def load_mnist_labels(filename):
    with gzip.open(filename, 'rb') as f:
        # 매직 넘버 읽기
        magic = int.from_bytes(f.read(4), 'big')
        if magic != 2049:
            raise ValueError("Invalid magic number in MNIST label file: {}".format(magic))
        
        # 레이블 수 읽기
        num_labels = int.from_bytes(f.read(4), 'big')
        
        # 레이블 데이터 읽기
        labels = np.frombuffer(f.read(), dtype=np.uint8)
        
        return labels

# 파일 경로 설정
images_path = 't10k-images-idx3-ubyte.gz'
labels_path = 't10k-labels-idx1-ubyte.gz'

# MNIST 이미지와 레이블 로드
images = load_mnist_images(images_path)
labels = load_mnist_labels(labels_path)

# 데이터 확인
print("이미지 shape:", images.shape)
print("레이블 shape:", labels.shape)

이미지 shape: (10000, 28, 28)
레이블 shape: (10000,)


In [62]:
# 학습 데이터와 테스트 데이터 분리

num_test_samples = 3000

train_images = images[:-num_test_samples]
test_images = images[-num_test_samples:]
train_labels = labels[:-num_test_samples]
test_labels = labels[-num_test_samples:]

# 데이터 형태 확인
print("학습 이미지 shape:", train_images.shape)
print("테스트 이미지 shape:", test_images.shape)
print("학습 레이블 shape:", train_labels.shape)
print("테스트 레이블 shape:", test_labels.shape)

학습 이미지 shape: (7000, 28, 28)
테스트 이미지 shape: (3000, 28, 28)
학습 레이블 shape: (7000,)
테스트 레이블 shape: (3000,)


In [26]:
# 이미지 스케일링 (0에서 255 사이의 값을 0에서 1 사이로 스케일링)
train_images = train_images.astype('float32') / 255.0
test_images = test_images.astype('float32') / 255.0

# 레이블 형 변환 (정수형에서 부동 소수점으로 변환)
train_labels = train_labels.astype('float32')
test_labels = test_labels.astype('float32')

In [61]:
# 학습 레이블과 테스트 레이블을 원핫 인코딩합니다.
num_classes = 10  # MNIST 데이터셋은 숫자 0부터 9까지 총 10개의 클래스가 있습니다.

train_labels_onehot = np.eye(num_classes)[train_labels.astype('int')]
test_labels_onehot = np.eye(num_classes)[test_labels.astype('int')]

# 결과 확인
print("학습 레이블의 원핫 인코딩 결과:", train_labels_onehot.shape)
print("테스트 레이블의 원핫 인코딩 결과:", test_labels_onehot.shape)

학습 레이블의 원핫 인코딩 결과: (7000, 10)
테스트 레이블의 원핫 인코딩 결과: (3000, 10)


In [28]:
# 학습 데이터를 더 작은 학습 데이터와 검증 데이터로 분리합니다.
validation_ratio = 0.2  # 검증 데이터의 비율

num_train_samples = len(train_images)
num_validation_samples = int(num_train_samples * validation_ratio)

# 학습 데이터와 검증 데이터 분리
validation_images = train_images[-num_validation_samples:]
validation_labels = train_labels_onehot[-num_validation_samples:]
train_images = train_images[:-num_validation_samples]
train_labels_onehot = train_labels_onehot[:-num_validation_samples]

# 데이터 확인
print("학습 이미지 shape:", train_images.shape)
print("학습 레이블 shape:", train_labels_onehot.shape)
print("검증 이미지 shape:", validation_images.shape)
print("검증 레이블 shape:", validation_labels.shape)

학습 이미지 shape: (5600, 28, 28)
학습 레이블 shape: (5600, 10)
검증 이미지 shape: (1400, 28, 28)
검증 레이블 shape: (1400, 10)


In [60]:
# 데이터셋을 학습, 검증, 테스트 데이터셋으로 분리합니다.
def split_dataset(images, labels, validation_ratio=0.1, test_ratio=0.1): # 검증 데이터의 비율
    num_samples = len(images)
    num_validation_samples = int(num_samples * validation_ratio)
    num_test_samples = int(num_samples * test_ratio)

    # 데이터를 랜덤하게 섞습니다.
    np.random.seed(42)
    shuffle_indices = np.random.permutation(num_samples)
    images_shuffled = images[shuffle_indices]
    labels_shuffled = labels[shuffle_indices]

    # 학습, 검증, 테스트 데이터셋으로 분리합니다.
    validation_images = images_shuffled[:num_validation_samples]
    validation_labels = labels_shuffled[:num_validation_samples]
    test_images = images_shuffled[num_validation_samples:num_validation_samples + num_test_samples]
    test_labels = labels_shuffled[num_validation_samples:num_validation_samples + num_test_samples]
    train_images = images_shuffled[num_validation_samples + num_test_samples:]
    train_labels = labels_shuffled[num_validation_samples + num_test_samples:]

    return train_images, train_labels, validation_images, validation_labels, test_images, test_labels

# 학습, 검증, 테스트 데이터셋 생성
train_images, train_labels_onehot, validation_images, validation_labels_onehot, test_images, test_labels_onehot = split_dataset(images, labels, validation_ratio=0.1, test_ratio=0.1)

# 데이터셋 형태 확인
print("학습 이미지 shape:", train_images.shape)
print("학습 레이블 shape:", train_labels_onehot.shape)
print("검증 이미지 shape:", validation_images.shape)
print("검증 레이블 shape:", validation_labels_onehot.shape)
print("테스트 이미지 shape:", test_images.shape)
print("테스트 레이블 shape:", test_labels_onehot.shape)

학습 이미지 shape: (8000, 28, 28)
학습 레이블 shape: (8000,)
검증 이미지 shape: (1000, 28, 28)
검증 레이블 shape: (1000,)
테스트 이미지 shape: (1000, 28, 28)
테스트 레이블 shape: (1000,)


In [59]:
%pip install torchvision
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms

Note: you may need to restart the kernel to use updated packages.


In [58]:
class SimpleCNN(nn.Module):
    def __init__(self):
        super(SimpleCNN, self).__init__()
        self.conv1 = nn.Conv2d(1, 16, kernel_size=3, stride=1, padding=1)
        self.pool = nn.MaxPool2d(kernel_size=2, stride=2, padding=0)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.fc1 = nn.Linear(32 * 7 * 7, 128)
        self.fc2 = nn.Linear(128, 10)
        
    def forward(self, x):
        x = torch.relu(self.conv1(x))
        x = self.pool(x)
        x = torch.relu(self.conv2(x))
        x = self.pool(x)
        x = x.view(-1, 32 * 7 * 7)
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 모델 생성
model = SimpleCNN()

In [57]:
# 전처리
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# 데이터셋 로드
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)

testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)

In [56]:
# 손실 함수 선택
criterion = nn.CrossEntropyLoss()

# 최적화 알고리즘 선택
optimizer = optim.Adam(model.parameters(), lr=0.001)

In [55]:
def train(model, trainloader, criterion, optimizer, epochs=5):
    for epoch in range(epochs):
        running_loss = 0.0
        correct = 0
        total = 0
        for i, data in enumerate(trainloader, 0):
            inputs, labels = data
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()
            
            running_loss += loss.item()
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
            
            if i % 100 == 99:
                print('[%d, %5d] loss: %.3f, accuracy: %.2f %%' % 
                      (epoch + 1, i + 1, running_loss / 100, 100 * correct / total))
                running_loss = 0.0
                correct = 0
                total = 0

# 모델 훈련
train(model, trainloader, criterion, optimizer, epochs=5)

[1,   100] loss: 0.017, accuracy: 99.48 %
[1,   200] loss: 0.015, accuracy: 99.62 %
[1,   300] loss: 0.017, accuracy: 99.39 %
[1,   400] loss: 0.019, accuracy: 99.39 %
[1,   500] loss: 0.017, accuracy: 99.34 %
[1,   600] loss: 0.018, accuracy: 99.39 %
[1,   700] loss: 0.018, accuracy: 99.36 %
[1,   800] loss: 0.020, accuracy: 99.34 %
[1,   900] loss: 0.023, accuracy: 99.27 %
[2,   100] loss: 0.014, accuracy: 99.50 %
[2,   200] loss: 0.011, accuracy: 99.58 %
[2,   300] loss: 0.014, accuracy: 99.56 %
[2,   400] loss: 0.012, accuracy: 99.58 %
[2,   500] loss: 0.019, accuracy: 99.33 %
[2,   600] loss: 0.018, accuracy: 99.41 %
[2,   700] loss: 0.014, accuracy: 99.56 %
[2,   800] loss: 0.016, accuracy: 99.55 %
[2,   900] loss: 0.013, accuracy: 99.59 %
[3,   100] loss: 0.006, accuracy: 99.78 %
[3,   200] loss: 0.011, accuracy: 99.72 %
[3,   300] loss: 0.010, accuracy: 99.62 %
[3,   400] loss: 0.014, accuracy: 99.58 %
[3,   500] loss: 0.013, accuracy: 99.62 %
[3,   600] loss: 0.011, accuracy: 

In [54]:
def test(model, testloader):
    correct = 0
    total = 0
    with torch.no_grad():
        for data in testloader:
            images, labels = data
            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    print('테스트 세트 정확도: %.2f %%' % (100 * correct / total))

# 모델 테스트
test(model, testloader)

테스트 세트 정확도: 98.69 %
