In [1]:
##############################
import os, sys
print(os.getcwd())  # 현재 작업 디렉토리 출력

# __file__ 대신 os.getcwd()를 사용해 현재 작업 디렉토리로 경로 설정
# 주피터 노트북에서는 __file__ 대신 os.getcwd()를 사용
current_dir = os.getcwd()
parent_dir = os.path.dirname(current_dir)
sys.path.append(parent_dir)  # dataset 폴더의 상위 경로를 sys.path에 추가
sys.path.append(os.path.join(os.getcwd(), '..', 'common'))  # common 폴더 경로를 추가
##############################
# Import 부분이 올바른지 확인
from common.multi_layer_net_extend import MultiLayerNetExtend  # 확장된 다층 신경망

import numpy as np
import matplotlib.pyplot as plt
from dataset.mnist import load_mnist  # MNIST 데이터셋 로드
from common.trainer import Trainer  # 학습을 관리할 Trainer 클래스

# MNIST 데이터셋 불러오기
(x_train, t_train), (x_test, t_test) = load_mnist(normalize=True)

# 오버피팅을 방지하기 위해 학습 데이터 일부만 사용
x_train = x_train[:300]  # 훈련 데이터의 첫 300개만 사용
t_train = t_train[:300]  # 레이블 데이터의 첫 300개만 사용

# 드롭아웃 사용 여부와 비율 설정
use_dropout = True  # 드롭아웃을 사용할 경우 True, 사용하지 않을 경우 False
dropout_ratio = 0.2  # 드롭아웃 비율을 20%로 설정

# 신경망 생성: Dropout 옵션 설정
network = MultiLayerNetExtend(input_size=784, hidden_size_list=[100, 100, 100, 100, 100, 100], 
                              output_size=10, use_dropout=use_dropout, dropout_ration=dropout_ratio)  # 'dropout_ratio'를 'dropout_ration'으로 변경

# 학습을 담당할 Trainer 생성
trainer = Trainer(network, x_train, t_train, x_test, t_test, 
                  epochs=301, mini_batch_size=100,  # 301 에포크 동안 미니배치 크기 100으로 학습
                  optimizer='sgd', optimizer_param={'lr': 0.01}, verbose=True)  # SGD Optimizer 사용, 학습률 0.01

trainer.train()  # 학습 시작

# 학습된 결과를 저장
train_acc_list, test_acc_list = trainer.train_acc_list, trainer.test_acc_list  # 학습 정확도와 테스트 정확도 리스트

# 그래프 그리기 =================
markers = {'train': 'o', 'test': 's'}
x = np.arange(len(train_acc_list))  # 에포크 수만큼의 x축 데이터 생성
plt.plot(x, train_acc_list, marker='o', label='train', markevery=10)  # 학습 데이터의 정확도를 그래프로 표시
plt.plot(x, test_acc_list, marker='s', label='test', markevery=10)  # 테스트 데이터의 정확도를 그래프로 표시
plt.xlabel("epochs")  # x축 레이블
plt.ylabel("accuracy")  # y축 레이블
plt.ylim(0, 1.0)  # y축 범위 설정
plt.legend(loc='lower right')  # 범례 설정
plt.show()  # 그래프 출력


c:\projects\jupyterProjects\DeepLearning-MS-AI\DL3_20241006\ch05
train loss:2.308031819201466
=== epoch:1, train acc:0.10333333333333333, test acc:0.0849 ===
train loss:2.3020037329632346
train loss:2.295998305359361
train loss:2.3034190269762886
=== epoch:2, train acc:0.10333333333333333, test acc:0.0807 ===
train loss:2.3031328633123476
train loss:2.302185644584748
train loss:2.3008105379788444
=== epoch:3, train acc:0.1, test acc:0.079 ===
train loss:2.2979234172906184
train loss:2.3003588354024234
train loss:2.29469615309134
=== epoch:4, train acc:0.09666666666666666, test acc:0.0822 ===
train loss:2.3017249355358023
train loss:2.2993632398850035
train loss:2.304395164727212
=== epoch:5, train acc:0.09666666666666666, test acc:0.0826 ===
train loss:2.293053252167203
train loss:2.296637916876661
train loss:2.2969315453838113
=== epoch:6, train acc:0.11, test acc:0.0832 ===
train loss:2.2993943485442565
train loss:2.302717740968206
train loss:2.299102973237575
=== epoch:7, train acc:

KeyboardInterrupt: 