In [4]:
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

# 실행시 동일한 결과를 얻기 위해 설정
tf.keras.utils.set_random_seed(42)

# 패션 데이터 읽어들이기
(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()

# 데이터 형태 확인
print("훈련데이터 : ", train_input.shape, train_target.shape)
print("테스트데이터 : ", test_input.shape, test_target.shape)

훈련데이터 :  (60000, 28, 28) (60000,)
테스트데이터 :  (10000, 28, 28) (10000,)


In [5]:
# 데이터 정규화
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1,28*28)
train_scaled.shape

(60000, 784)

In [6]:
# 훈련 및 테 스트 검증 셋으로 분리
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)

print(train_scaled.shape,train_target.shape)
print(val_scaled.shape,val_target.shape)

(48000, 784) (48000,)
(12000, 784) (12000,)


In [8]:
# 인공신경망 모델에 신경망층 추가하는 방법(3가지)

# 1. 층을 먼저 만들고, 신경망 모델 생성 시 추가하기
# input_shape가 있으면 입력계층(훈련에 기여)
dense1 = keras.layers.Dense(100, activation="sigmoid", input_shape=(784, ))
# 마지막 softmax층은 출력계층(훈련에 기여)
dense2 = keras.layers.Dense(10, activation="softmax")
print(dense1, dense2)

<keras.layers.core.dense.Dense object at 0x000001F9B353B310> <keras.layers.core.dense.Dense object at 0x000001F9B353B580>


In [9]:
# 인공신경망(심층신경망) 생성
# 훈련모델 생성
model = keras.Sequential([dense1,dense2])
model

<keras.engine.sequential.Sequential at 0x1f9b30502e0>

In [11]:
# 모델 구조 확인
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [14]:
# 2. 심층신경망 모델 생성시 → 신경망층을 함께 만들기
model = keras.Sequential([
    keras.layers.Dense(100, activation="sigmoid", input_shape=(784, ), name="hidden"),
    keras.layers.Dense(10, activation="softmax", name="output")
], name="패션 MNIST 심층신경망 모델")
model.summary()

Model: "패션 MNIST 심층신경망 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [15]:
# 3. 심층신경망 모델 생성 후 → 신경망층 추가하기(add함수)
# 가장 많이 사용되는 방식

# 모델생성
model = keras.Sequential()
# 신경망층 추가
model.add(keras.layers.Dense(100, activation="sigmoid", input_shape=(784, )))
model.add(keras.layers.Dense(10, activation="softmax"))

# 모델 구조 확인
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_3 (Dense)             (None, 100)               78500     
                                                                 
 dense_4 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [16]:
# 모델 설정하기 : 설정함수 compile
# 정수값을 이용한 분류 및 정확도 확인할 수 있도록 설정
model.compile(loss="sparse_categorical_crossentropy", metrics="accuracy")
model

# loss : 손실함수 
# 손실함수는 실제값과 예측값의 차이를 수치화해주는 함수
# 이 두 값의 차이, 즉 오차가 클수록 손실함수의 값은 크고 오차가 작을수록 손실함수의 값은 작아짐
# 회귀 문제에서는 평균제곱오자(MSE)사용
# 분류 문제에서는 xxx crossentropy사용
# 딥러닝의 학습과정 : 손실함수의 값을 최소화하는 두 개의 매개변수인 가중치와 편향의 값을 찾는것이 목적
# 손실함수의 개념 기억

<keras.engine.sequential.Sequential at 0x1f9cb35ddc0>

In [17]:
# 모델 훈련시키기
model.fit(train_scaled, train_target, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1f9cb37d430>

In [26]:
# 훈련모델 평가하기
# 검증데이터로 평가
model.evaluate(val_scaled,val_target)



[0.3359447121620178, 0.8813333511352539]

In [29]:
# 전처리 계층 사용
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 패션데이터 읽어들이기
(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 정규화하기
train_scaled = train_input / 255.0
# 차원축소 하지 않기 : 전처리 계층 사용
# 훈련 및 검증 데이터셋으로 분류하기(8:2)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)

print(train_scaled.shape,train_target.shape)
print(val_scaled.shape,val_target.shape)

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)


In [30]:
# 훈련모델 생성
model = keras.Sequential()
model

<keras.engine.sequential.Sequential at 0x1f9b3053610>

In [31]:
# 신경망층 추가 : 전처리 계층 추가
# Flatten : 차원 축소 계층(2차원을 1차원으로)
# 훈련시 적용
# 훈련의 성능에 기여하지 않으며, 데이터 전처리에만 사용되는 계층
model.add(keras.layers.Flatten(input_shape=(28,28)))

In [33]:
# 성능에 기여하는 계층  : 은닉층(hidden layer) 
model.add(keras.layers.Dense(100,activation="relu"))

In [35]:
# 출력층 추가하기
# 가장 하단의 위치하는 신경망층
# 훈련성능에 기여
model.add(keras.layers.Dense(10,activation="softmax"))

In [37]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_5 (Dense)             (None, 100)               78500     
                                                                 
 dense_6 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [38]:
# 훈련모델 설정
model.compile(loss="sparse_categorical_crossentropy", metrics="accuracy")
model

<keras.engine.sequential.Sequential at 0x1f9b3053610>

In [40]:
# 훈련시키기
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x1f9c3e1fee0>

In [41]:
# 훈련모델 평가하기
# 검증데이터로 평가
model .evaluate(val_scaled,val_target)



[0.4191235303878784, 0.8823333382606506]

In [42]:
# 옵티마이저 설정 방법 - 1
# 최초에 훈련 정확도만 확인하고자 할 때
model.compile(optimizer="sgd", loss="sparse_categorical_crossentropy", metrics="accuracy")

In [43]:
# 옵티마이저 설정 방법 - 2
# 옵티마이저 클래스 튜닝시 사용
sgd = keras.optimizers.SGD()
model.compile(optimizer=sgd, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [44]:
# 옵티마이저 튜닝
# [learning rate(학습률)]
# 훈련모델의 성능을 향상시키는 방법 중 한가지로 가장 loss가 적은 local minimum(경사하강 종착지)까지 
# 걸어간다고 생각 할 때 학습률은 걸음의 보폭이라 할 수 있다
# 학습률이 너무 크면 minimum을 지나칠 수 있다
# 반대로 학습률이 너무 작으면 local minimum까지 도달 할 수 있어도 시간이 매우 오래 걸림
# 기본 학습률은 0.01
sgd = keras.optimizers.SGD(learning_rate=0.1)
model.compile(optimizer=sgd, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [45]:
# [momentum(모멘텀)]
# 경사하강법의 최적화 알고리즘
# 물리학에서 쓰이는 용어로 운동향, 동력을 뜻함
# 물리학의 개념을 훈련에 적용한 알고리즘
# 관성과 가속도를 넣어서 이동하던 한 벙형으로 좀 더 이동할 수 있도록 하기위한 개념
# 일반적으로 딥러닝의 경사하강법은 지그재그로 이동하면서 하강
# 지그재그로 이동하는 방식을 관성과 가속도를 적용해서 최대한 이동하는 방향을 유지하면서 지그재그로 이동할 수 있도록 처리
# <모멘텀의 중요 개념>
# 현재이동하는 방향과는 별개로 과거에 이동을 했던 방향을 기억함
# 과거의 방향으로 일정량을 추가하여 이동
# 과거의 행동을 저장하여 사용
# 즉, 누적된 과거 데이터를 현재 데이터에 보정하려는 방식
# 메모리 사용량이 많다는 단점

# [nesterov]
# 모멘텀 최적화 알고리즘의 변종 알고리즘
# 현재 위치가 아닌, 모멘텀의 방향으로 조금 앞서서 경사를 계산
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True, learning_rate=0.1)
model.compile(optimizer=sgd, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [46]:
# Adagrad
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [49]:
# RMSprop
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [48]:
# Adam 
adam = keras.optimizers.Adam()
model.compile(optimizer=adam, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [51]:
# 모델생성
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 패션데이터 읽어들이기
(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 정규화하기
train_scaled = train_input / 255.0
# 차원축소 하지 않기
# 훈련 및 검증 데이터셋으로 분류하기(8:2)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)

print(train_scaled.shape,train_target.shape)
print(val_scaled.shape,val_target.shape)

# 훈련모델 생성
model = keras.Sequential()
model

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)


<keras.engine.sequential.Sequential at 0x1f9c637bb20>

In [52]:
# 전처리 계층 추가하기 : 1차원으로 만들어주는 계층
# 신경망층 추가 : 전처리 계층 추가
# Flatten : 차원 축소 계층(2차원을 1차원으로)
# 훈련시 적용
# 훈련의 성능에 기여하지 않으며, 데이터 전처리에만 사용되는 계층
model.add(keras.layers.Flatten(input_shape=(28,28)))

In [53]:
# relu hidden layer 추가
# 성능에 기여하는 계층  : 은닉층(hidden layer) 
model.add(keras.layers.Dense(100,activation="relu"))

In [54]:
# 출력층 추가
# 가장 하단의 위치하는 신경망층
# 훈련성능에 기여
model.add(keras.layers.Dense(10,activation="softmax"))

In [55]:
# 모델생성하기 : 옵티마이저 adam사용
# Adam 
# 가장먼저 시도하면 좋은 알고리즘
# 방향과 학습률을 모두 적절하게 성능개선을 해주는 알고리즘
adam = keras.optimizers.Adam()
model.compile(optimizer=adam, loss="sparse_categorical_crossentropy", metrics="accuracy")

In [56]:
# 훈련 : 반복10회
# 훈련시키기
model.fit(train_scaled, train_target, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1f9c6370670>

In [57]:
# 성능평가
# 훈련모델 평가하기
# 검증데이터로 평가
model.evaluate(val_scaled,val_target)



[0.3417114317417145, 0.8778333067893982]

In [58]:
# 모델생성
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 패션데이터 읽어들이기
(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 정규화하기
train_scaled = train_input / 255.0
# 차원축소 하지 않기
# 훈련 및 검증 데이터셋으로 분류하기(8:2)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)

print(train_scaled.shape,train_target.shape)
print(val_scaled.shape,val_target.shape)

# 훈련모델 생성
model = keras.Sequential()

# 전처리 계층 추가하기 : 1차원으로 만들어주는 계층
# 신경망층 추가 : 전처리 계층 추가
# Flatten : 차원 축소 계층(2차원을 1차원으로)
# 훈련시 적용
# 훈련의 성능에 기여하지 않으며, 데이터 전처리에만 사용되는 계층
model.add(keras.layers.Flatten(input_shape=(28,28)))

# relu hidden layer 추가
# 성능에 기여하는 계층  : 은닉층(hidden layer) 
model.add(keras.layers.Dense(100,activation="relu"))

# 출력층 추가
# 가장 하단의 위치하는 신경망층
# 훈련성능에 기여
model.add(keras.layers.Dense(10,activation="softmax"))

# Adagrad
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss="sparse_categorical_crossentropy", metrics="accuracy")

# 훈련 : 반복10회
# 훈련시키기
model.fit(train_scaled, train_target, epochs=10)

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1f9c84bafa0>

In [59]:
# 성능평가
# 훈련모델 평가하기
# 검증데이터로 평가
model.evaluate(val_scaled,val_target)



[0.5593026876449585, 0.8146666884422302]

In [60]:
# 모델생성
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
# 패션데이터 읽어들이기
(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 정규화하기
train_scaled = train_input / 255.0
# 차원축소 하지 않기
# 훈련 및 검증 데이터셋으로 분류하기(8:2)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)

print(train_scaled.shape,train_target.shape)
print(val_scaled.shape,val_target.shape)

# 훈련모델 생성
model = keras.Sequential()

# 전처리 계층 추가하기 : 1차원으로 만들어주는 계층
# 신경망층 추가 : 전처리 계층 추가
# Flatten : 차원 축소 계층(2차원을 1차원으로)
# 훈련시 적용
# 훈련의 성능에 기여하지 않으며, 데이터 전처리에만 사용되는 계층
model.add(keras.layers.Flatten(input_shape=(28,28)))

# relu hidden layer 추가
# 성능에 기여하는 계층  : 은닉층(hidden layer) 
model.add(keras.layers.Dense(100,activation="relu"))

# 출력층 추가
# 가장 하단의 위치하는 신경망층
# 훈련성능에 기여
model.add(keras.layers.Dense(10,activation="softmax"))

# RMSprop
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss="sparse_categorical_crossentropy", metrics="accuracy")

# 훈련 : 반복10회
# 훈련시키기
model.fit(train_scaled, train_target, epochs=10)

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1f9c3e74b50>

In [64]:
# 성능평가
# 훈련모델 평가하기
# 검증데이터로 평가
model.evaluate(val_scaled,val_target)



0.39088213443756104

In [None]:
# Adagrad, RMSprop, Adam 중 성능평가 결과가 가장높은 옵티마이저를 선택할 수 있도록
# 한번에 처리하도록 하기
# Adagrad, RMSprop, Adam을 함수를 통해 최종출력결과는 가장 높은 옵티마이저 이름과 성능결과 출력
# 함수에 전달하는 값 : 옵티마이저 이름, 반복횟수

In [91]:
import tensorflow as tf
from tensorflow import keras
from sklearn.model_selection import train_test_split

def findOptimizer(opt, ep):
    (train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()
    train_scaled = train_input / 255.0
    train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,
                                                                      test_size=0.2,random_state=42)
    model = keras.Sequential()
    model.add(keras.layers.Flatten(input_shape=(28,28)))
    model.add(keras.layers.Dense(100,activation="relu"))
    model.add(keras.layers.Dense(10,activation="softmax"))
    findeva = []
    num = []
    for i in opt:
        op = i
        model.compile(optimizer=op, loss="sparse_categorical_crossentropy", metrics="accuracy")
        model.fit(train_scaled, train_target, epochs=10)
        findeva.append(model.evaluate(val_scaled,val_target)[1])
    print("-------------------------------")
    print("가장 성능이 우수한 옵티마이저 : ",opt[findeva.index(max(findeva))])
    print("성능결과 : ",max(findeva))
    print("-------------------------------")

In [92]:
a = keras.optimizers.Adagrad()
b = keras.optimizers.RMSprop()
c = keras.optimizers.Adam()
opt = [a,b,c]
findOptimizer(opt,10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
-------------------------------
가장 성능이 우수한 옵티마이저 :  <keras.optimizer_v2.adam.Adam object at 0x000001F9CED64820>
성능결과 :  0.8872500061988831
-------------------------------


In [93]:
def getBestEval(opt,epoch):
        ### 1. 모델 생성하기
    model=keras.Sequential()
    ### 2. 전처리 계층 추가하기 : 1차원으로 만들어주는 계층
    model.add(keras.layers.Flatten(input_shape=(28,28)))
    ### 3. relu hidden layer 추가
    model.add(keras.layers.Dense(100,activation="relu"))
    ### 4. 출력층(output layer) 추가
    model.add(keras.layers.Dense(10,activation="softmax"))
    # 모델 설정
    model.compile(optimizer=opt,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")
     ### 6. 훈련시키기 : 반복 10회
    model.fit(train_scaled,train_target,epochs=10)
    #
    rs_eval=model.evaluate(val_scaled,val_target)
    
    return rs_eval

optimizers=["adagrad","rmsprop","adam"]

best_eval=0.0 # 가장 높은 정확도
best_opt=""# 가장

best_loss=1.0 # 가장 낮은 손실율
best_loss_opt="" # 가장 낮은 손실율일때의 옵티마이저

for opt in optimizers :
    # 함수호출
    rs=getBestEval(opt,2)
    ## 가장 낮은 손실율과 이 때의 옵티마이저 처리하기
    if best_loss > rs[0]:
        best_loss=rs[0]
        best_loss_opt=opt
        
    ## 가장 높은 정확도와 이 때의 옵티마이저 처리하기
    if best_eval<rs[1]:
        best_eval=rs[1]
        best_opt=opt
    
print("best_opt=",best_opt, "|  best_eval=",best_eval)
print("best_loss_opt=",best_loss_opt,"|best_loss=",best_loss)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
best_opt= adam |  best_eval= 0.8794999718666077
best_loss_opt= adam |best_loss= 0.33862757682800293


In [None]:
# 옵티마이저 선택시 
# 성능이 높은쪽과 손실률이 낮은쪽 중 선택은 손실률 기준(차이가 많이 안나는 경우)