In [1]:
print("hello World")

hello World


In [None]:
import torch
from torchvision import datasets, transforms


# PyTorch 기반 MNIST 데이터셋을 로드하는 함수
# tensor로 인해 자동 normalize가 되므로 알아서 전처리 해야됨
def load_mnist_torch(normalize=True, flatten=True, one_hot_label=False):
    """
    PyTorch 기반 MNIST 데이터셋을 (x_train, y_train), (x_test, y_test) 형태로 반환

    Parameters
    ----------
    normalize : True이면 0~1 정규화
    flatten : True이면 (N, 784), False이면 (N, 1, 28, 28)
    one_hot_label : True이면 라벨을 one-hot 인코딩으로 반환

    Returns
    -------
    (x_train, y_train), (x_test, y_test)
    """

    transform_list = []
    transform_list.append(transforms.ToTensor())  # 0~1 정규화 포함됨 (기본)
    transform = transforms.Compose(transform_list)

    train_dataset = datasets.MNIST(
        root="./data", train=True, download=True, transform=transform
    )
    test_dataset = datasets.MNIST(
        root="./data", train=False, download=True, transform=transform
    )

    x_train = torch.stack([data[0] for data in train_dataset])  # [60000, 1, 28, 28]
    y_train = torch.tensor([data[1] for data in train_dataset])  # [60000]

    x_test = torch.stack([data[0] for data in test_dataset])  # [10000, 1, 28, 28]
    y_test = torch.tensor([data[1] for data in test_dataset])  # [10000]

    if flatten:
        x_train = x_train.view(-1, 28 * 28)  # [60000, 784]
        x_test = x_test.view(-1, 28 * 28)  # [10000, 784]

    if one_hot_label:
        y_train = torch.nn.functional.one_hot(y_train, num_classes=10).float()
        y_test = torch.nn.functional.one_hot(y_test, num_classes=10).float()

    return (x_train, y_train), (x_test, y_test)

In [19]:
(x_train, y_train), (x_test, y_test) = load_mnist_torch(
    normalize=False, flatten=True, one_hot_label=False
)
print("x_train shape:", x_train.shape)
print("y_train shape:", y_train.shape)
print("x_test shape:", x_test.shape)
print("y_test shape:", y_test.shape)

x_train shape: torch.Size([60000, 784])
y_train shape: torch.Size([60000])
x_test shape: torch.Size([10000, 784])
y_test shape: torch.Size([10000])


In [28]:
# 이미지 시각화
from PIL import Image
import numpy as np


def img_show(img):
    pil_img = Image.fromarray(np.uint8(img))
    pil_img.show()


img = x_train[5]
label = y_train[5]
print("Label:", label)

print("Image shape:", img.shape)
img = img.numpy()  # torch → numpy
img = img.reshape(28, 28)  # flatten된 경우
img = img * 255  # 0~1 → 0~255 범위로 복원
img = img.astype(np.uint8)  # PIL 호환을 위한 uint8 변환

print("img shape:", img.shape)
img_show(img)  # numpy array로 변환하여 시각화

Label: tensor(2)
Image shape: torch.Size([784])
img shape: (28, 28)


### 신경망 추론 시작!
mnist 데이터셋을 이용한 추론 신경망 구성하기

입력층 뉴런: 784개
- 이미지 크기가 28 * 28 = 784이기 때문


출력층 뉴런: 10개
- 0~9까지 이미지의 숫자를 구분하기 때문


은닉층 뉴런: 총 2층
- 1층 뉴런: 50개
- 2층 뉴런: 100개

-> 임의로 정함

In [None]:
def sigmoid(x):
    """
    시그모이드 함수
    :param x: 입력값
    :return: 시그모이드 함수 적용 결과
    """
    return 1 / (1 + np.exp(-x))


def softmax(a):
    """
    소프트맥스 함수
    :param a: 입력값
    :return: 소프트맥스 함수 적용 결과
    """
    c = np.max(a)  # 최대값을 구함
    exp_a = np.exp(a - c)  # 최대값을 빼줌
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y


def get_test_data():
    """
    테스트 데이터셋을 반환
    """
    (x_train, y_train), (x_test, y_test) = load_mnist_torch(
        normalize=False, flatten=True, one_hot_label=False
    )
    return x_test, y_test


def init_network():
    """
    네트워크 초기화 함수.
    sample_weight.pkl 파일에서 네트워크 가중치를 로드하여 초기화
    :return: 초기화된 네트워크 딕셔너리
    """
    with open("sample_weight.pkl", "rb") as f:
        import pickle

        network = pickle.load(f)
    return network


def predict(network, x):
    """
    네트워크를 이용하여 입력 x에 대한 예측을 수행
    :param network: 초기화된 네트워크
    :param x: 입력 데이터
    :return: 예측 결과
    """
    W1, W2, W3 = network["W1"], network["W2"], network["W3"]
    b1, b2, b3 = network["b1"], network["b2"], network["b3"]
    a1 = np.dot(x, W1) + b1
    z1 = sigmoid(a1)
    a2 = np.dot(z1, W2) + b2
    z2 = sigmoid(a2)
    a3 = np.dot(z2, W3) + b3
    y = softmax(a3)
    return y

In [30]:
x, t = get_test_data()
network = init_network()

accuracy_cnt = 0
for i in range(len(x)):
    y = predict(network, x[i])
    p = np.argmax(y)  # 확률이 가장 높은 인덱스 반장
    if p == t[i]:  # 정답과 비교
        accuracy_cnt += 1

print("Accuracy:", float(accuracy_cnt / len(x)))  # 정확도 출력

  a1 = np.dot(x, W1) + b1


Accuracy: 0.9352
