In [19]:
import gzip
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Model
def load_mnist_images(filename):
    with gzip.open(filename, 'rb') as f:
        data = np.frombuffer(f.read(), np.uint8, offset=16)
    data = data.reshape(-1, 28, 28) / 255.0  # 이미지를 0~1 범위로 스케일 조정
    return data

def load_mnist_labels(filename):
    with gzip.open(filename, 'rb') as f:
        labels = np.frombuffer(f.read(), np.uint8, offset=8)
    return labels
# 이미지와 레이블 파일을 로드합니다.
images = load_mnist_images('t10k-images-idx3-ubyte.gz')
labels = load_mnist_labels('t10k-labels-idx1-ubyte.gz')


In [8]:
# 데이터의 모양과 타입을 확인합니다.
print("이미지 데이터 shape:", images.shape)
print("레이블 데이터 shape:", labels.shape)

이미지 데이터 shape: (10000, 28, 28)
레이블 데이터 shape: (10000,)


In [9]:
# 데이터를 학습 및 테스트 데이터로 분할합니다.
train_images, test_images, train_labels, test_labels = train_test_split(images, labels, test_size=0.16666, random_state=42)

# 데이터의 모양과 타입을 확인합니다.
print("학습 이미지 데이터 shape:", train_images.shape)
print("학습 레이블 데이터 shape:", train_labels.shape)
print("테스트 이미지 데이터 shape:", test_images.shape)
print("테스트 레이블 데이터 shape:", test_labels.shape)


학습 이미지 데이터 shape: (8333, 28, 28)
학습 레이블 데이터 shape: (8333,)
테스트 이미지 데이터 shape: (1667, 28, 28)
테스트 레이블 데이터 shape: (1667,)


In [10]:
def get_preprocessed_data(images, labels):
    # 학습과 테스트 이미지 array를 0~1 사이값으로 scale 및 float32 형 변형. 
    images = np.array(images/255.0, dtype=np.float32)
    labels = np.array(labels, dtype=np.float32)
    
    return images, labels

def get_preprocessed_ohe(images, labels):
    images, labels = get_preprocessed_data(images, labels)
    # OHE 적용 
    oh_labels = to_categorical(labels)
    return images, oh_labels


# 데이터를 전처리합니다.
images, oh_labels = get_preprocessed_ohe(images, labels)

# 데이터의 모양과 타입을 확인합니다.
print("이미지 데이터 shape:", images.shape)
print("원핫 인코딩된 레이블 데이터 shape:", oh_labels.shape)


이미지 데이터 shape: (10000, 28, 28)
원핫 인코딩된 레이블 데이터 shape: (10000, 10)


In [11]:
def get_train_valid_test_set(train_images, train_labels, test_images, test_labels, valid_size=0.15, random_state=2021):
    # 학습 및 테스트 데이터 세트를  0 ~ 1사이값 float32로 변경 및 OHE 적용. 
    train_images, train_oh_labels = get_preprocessed_ohe(train_images, train_labels)
    test_images, test_oh_labels = get_preprocessed_ohe(test_images, test_labels)
    
    # 학습 데이터를 검증 데이터 세트로 다시 분리
    tr_images, val_images, tr_oh_labels, val_oh_labels = train_test_split(train_images, train_oh_labels, test_size=valid_size, random_state=random_state)
    
    return (tr_images, tr_oh_labels), (val_images, val_oh_labels), (test_images, test_oh_labels)

# 이미지와 레이블 파일을 로드합니다.
train_images = load_mnist_images('t10k-images-idx3-ubyte.gz')
train_labels = load_mnist_labels('t10k-labels-idx1-ubyte.gz')
test_images = load_mnist_images('t10k-images-idx3-ubyte.gz')
test_labels = load_mnist_labels('t10k-labels-idx1-ubyte.gz')

# 학습/검증/테스트 데이터 세트로 전처리 및 분할합니다.
(train_images, train_labels), (val_images, val_labels), (test_images, test_labels) = get_train_valid_test_set(train_images, train_labels, test_images, test_labels)

# 데이터의 모양과 타입을 확인합니다.
print("학습 이미지 데이터 shape:", train_images.shape)
print("학습 레이블 데이터 shape:", train_labels.shape)
print("검증 이미지 데이터 shape:", val_images.shape)
print("검증 레이블 데이터 shape:", val_labels.shape)
print("테스트 이미지 데이터 shape:", test_images.shape)
print("테스트 레이블 데이터 shape:", test_labels.shape)

학습 이미지 데이터 shape: (8500, 28, 28)
학습 레이블 데이터 shape: (8500, 10)
검증 이미지 데이터 shape: (1500, 28, 28)
검증 레이블 데이터 shape: (1500, 10)
테스트 이미지 데이터 shape: (10000, 28, 28)
테스트 레이블 데이터 shape: (10000, 10)


In [17]:
# 모델 정의
input_tensor = Input(shape=(28, 28, 1))
x = Conv2D(filters=32, kernel_size=3, strides=1, padding='same', activation='relu')(input_tensor)
x = Conv2D(filters=64, kernel_size=3, activation='relu')(x)
x = MaxPooling2D(2)(x)
x = Flatten()(x)
x = Dense(100, activation='relu')(x)
output = Dense(10, activation='softmax')(x)
model = Model(inputs=input_tensor, outputs=output)


In [20]:
# 모델 요약 정보 출력
model.summary()