In [None]:
import os, sys
print(os.getcwd())  # 현재 작업 디렉토리 출력

# 현재 경로를 올바르게 설정 (절대 경로 사용)
current_dir = os.path.dirname(os.path.abspath("C:\\projects\\jupyterProjects\\DeepLearning-MS-AI\\DL3_20241006\\common"))
print(current_dir)  # 경로 출력
os.chdir(current_dir)  # 경로 이동

# sys.path에 common 경로 추가 (import를 위해 필수)
sys.path.append(current_dir)

# 나머지 코드
import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist
from common.optimizer import SGD
from common.multi_layer_net import MultiLayerNet  # 대소문자가 다른지 확인 필요

# MNIST 데이터셋 로드
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True)
x_train = x_train[:300]
t_train = t_train[:300]

# weight decay(가중치 감쇠) 설정 ===================
weight_decay_lambda = 0.1

# 신경망 설정
network = MultiLayerNet(input_size=784, hidden_size_list=[100, 100, 100, 100, 100], output_size=10,
                        weight_decay_lambda=weight_decay_lambda)  # 가중치 감쇠 사용
optimizer = SGD(lr=0.01)  # 학습률 0.01의 SGD

# 학습 설정
max_epochs = 201
train_size = x_train.shape[0]
batch_size = 100
iter_per_epoch = max(train_size / batch_size, 1)
epoch_cnt = 0

train_loss_list = []
train_acc_list = []
test_acc_list = []

# 학습 시작
for i in range(1000000000):
    batch_mask = np.random.choice(train_size, batch_size)
    x_batch = x_train[batch_mask]
    t_batch = t_train[batch_mask]

    # 기울기 계산 및 매개변수 갱신
    grads = network.gradient(x_batch, t_batch)
    optimizer.update(network.params, grads)

    # 1 에포크 당 정확도 계산 및 출력
    if i % iter_per_epoch == 0:
        train_acc = network.accuracy(x_train, t_train)
        test_acc = network.accuracy(x_test, t_test)
        train_acc_list.append(train_acc)
        test_acc_list.append(test_acc)

        print("epoch:" + str(epoch_cnt) + ", train acc:" + str(train_acc) + ", test acc:" + str(test_acc))

        epoch_cnt += 1
        if epoch_cnt >= max_epochs:
            break

# 그래프 그리기 ==================
markers = {'train': 'o', 'test': 's'}
x = np.arange(max_epochs)
plt.plot(x, train_acc_list, marker='o', label='train', markevery=10)
plt.plot(x, test_acc_list, marker='s', label='test', markevery=10)
plt.xlabel("epochs")
plt.ylabel("accuracy")
plt.ylim(0, 1.0)
plt.legend(loc='lower right')
plt.show()


c:\projects\jupyterProjects\DeepLearning-MS-AI\DL3_20241006\ch05
C:\projects\jupyterProjects\DeepLearning-MS-AI\DL3_20241006
epoch:0, train acc:0.10333333333333333, test acc:0.0995
epoch:1, train acc:0.12333333333333334, test acc:0.101
epoch:2, train acc:0.14333333333333334, test acc:0.1116
epoch:3, train acc:0.15333333333333332, test acc:0.1172
epoch:4, train acc:0.18666666666666668, test acc:0.1295
epoch:5, train acc:0.19666666666666666, test acc:0.1382
epoch:6, train acc:0.20666666666666667, test acc:0.1509
epoch:7, train acc:0.2, test acc:0.1574
epoch:8, train acc:0.20666666666666667, test acc:0.1647
epoch:9, train acc:0.22666666666666666, test acc:0.1788
epoch:10, train acc:0.22666666666666666, test acc:0.1859
epoch:11, train acc:0.24666666666666667, test acc:0.1964
epoch:12, train acc:0.2733333333333333, test acc:0.2048
epoch:13, train acc:0.28, test acc:0.21
epoch:14, train acc:0.31666666666666665, test acc:0.2245
epoch:15, train acc:0.35, test acc:0.2332
epoch:16, train acc:0.3