In [1]:
"""
[심층신경망]
- layer 층이 1개 이상인 경우
- 층이 여러개라는 의미로 심층이라는 개념이 있음 

"""

'\n[심층신경망]\n- layer 층이 1개 이상인 경우\n- 층이 여러개라는 의미로 심층이라는 개념이 있음 \n\n'

In [2]:
# 패션 데이터 읽어들이기 
# - 차원확인 
# train_input, train_target 
# test_input, test_target 

In [3]:
import tensorflow as tr
from tensorflow import keras

In [4]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [5]:
print("훈련데이터 : ",train_input.shape, train_target.shape)
print("테스트데이터:",test_input.shape, test_target.shape )

훈련데이터 :  (60000, 28, 28) (60000,)
테스트데이터: (10000, 28, 28) (10000,)


In [6]:
# 데이터 정규화 하기 
# 255의 의미? => 
train_scaled = train_input / 255.0
train_scaled.shape

(60000, 28, 28)

In [7]:
# 픽셀 데이터를 1차원으로 만들기 
# 3차원 데이터를 2차원 데이터로 변경 
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled.shape

(60000, 784)

In [8]:
# 훈련 및 검증 데이터셋으로 분리하기 
from sklearn.model_selection import train_test_split

train_scaled, val_scaled,train_target, val_target = \
train_test_split (train_scaled, train_target, test_size = 0.2, random_state = 42)

print(train_scaled.shape, train_target.shape)
print (val_scaled.shape, val_target.shape)

(48000, 784) (48000,)
(12000, 784) (12000,)


## 인공신경망 모델에 신경망층 추가하는 방법 (3가지)

In [9]:
# 1. 층을 먼저 만들고, 신경망 모델 생성 시 추가하기...

In [10]:
# input_shape 가 있으면 입력계층 (훈련에 가까움)
dense1 = keras.layers.Dense(100, activation="sigmoid", input_shape=(784,))
# 마지막에 softmax 층은 출력 계층 ( 훈련에 가까움) 
dense2 = keras.layers.Dense(10, activation="softmax")
print(dense1,dense2)

<keras.layers.core.dense.Dense object at 0x000001A16E36F1F0> <keras.layers.core.dense.Dense object at 0x000001A1755FFD60>


In [11]:
# 인공신경망 (심층신경망) 생성하기 
# - 훈련 모델 생성하기  
model = keras.Sequential([dense1, dense2])
model

<keras.engine.sequential.Sequential at 0x1a1756ac400>

In [12]:
# 모델 구조 확인하기 
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [13]:
# 2. 심층 신경망 모델 생성시 -> 신경망층을 함께 만들기 

In [14]:

model = keras.Sequential([
    keras.layers.Dense(100, activation="sigmoid", input_shape=(784, ), name ="hidden"),
    keras.layers.Dense(10, activation="softmax", name= "output")
], name="패션 MNIST 심층 신경망 모델")
model

<keras.engine.sequential.Sequential at 0x1a179fa4970>

In [15]:
model.summary()

Model: "패션 MNIST 심층 신경망 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [16]:
# 3. 심층 신경망 모델 생성 후 -> 신경망층 추가하기 (add 함수 사용)
# 가장 많이 사용되는 방식 

In [17]:
# 모델 생성하기 
model = keras.Sequential()

# 신경망층 추가하기 
model.add(keras.layers.Dense(100, activation="sigmoid", input_shape=(784, )))
model.add(keras.layers.Dense(10, activation="softmax"))

model

<keras.engine.sequential.Sequential at 0x1a179fb7f70>

In [18]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [19]:
# 모델 설정하기 : 설정함수  compile 
# - 정수값을 이용한 분류 진행, 정확도 확인할 수 있도록 설정하기

model.compile(loss="sparse_categorical_crossentropy",
             metrics="accuracy")
model 

# loss : 손실함수 
# 손실함수는 실제값과 예측값의 차이를 수치화해주는 함수 
# 이 두 값의 차이 즉, 오차가 클수록 손실함수의 값은 크고 
# 오차가 적을 수록 손실함수의 값은 작아짐 
# "회귀" 문제에서는 "평균제곱 오차(MSE) 가 사용"
# "분류" 문제에서는 "xxx crossentropy 가 사용"

# 딥러닝의 학습과정 : 손실함수의 값을 최소화하는 두 개의 매개변수인 
#                     가중치와 편향의 값을 찾는 것이 원칙
#                     손실함수 개념을 기억 

"""
[손실함수 정리]
<회귀 문제에 사용되는 손실함수>
* 평균제곱오차(MSE : Mean Squared Error)
    - 선형 회귀를 학습할 때와 유사 
    - 연속형 변수를 예측할 때 주로 사용됨 
    - compile 함수의 loss 속성에 "mse" 라고 작성하면 됨 
    - 딥러닝은 대부분 분류 문제에 집중되어 있기 때문에 
    회귀문제를 제외한 나머니 손실함수는 crossentropy를 사용 
"""
# 정확도가 높고 손실율이 낮는 모델을 정해야 한다 
# metrics : 훈련시 결과 확인(손실율과 정확도 확인)

'\n[손실함수 정리]\n<회귀 문제에 사용되는 손실함수>\n* 평균제곱오차(MSE : Mean Squared Error)\n    - 선형 회귀를 학습할 때와 유사 \n    - 연속형 변수를 예측할 때 주로 사용됨 \n    - compile 함수의 loss 속성에 "mse" 라고 작성하면 됨 \n    - 딥러닝은 대부분 분류 문제에 집중되어 있기 때문에 \n    회귀문제를 제외한 나머니 손실함수는 crossentropy를 사용 \n'

In [20]:
# 모델 훈련시키기 
model.fit(train_scaled, train_target, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1a179fbf460>

In [21]:
# 훈련모델 평가하기 (검증하기)
# 정확도 : 0.9 이면 좋은 모델 
# 정확도 : 0.85이상이면 괜찮은 모델
model.evaluate(val_scaled, val_target)



[0.33337822556495667, 0.8823333382606506]

## 전처리 계층 사용하기 

In [22]:
# 패션 데이터 읽어들이기 
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 정규화 하기 
train_scaled = train_input / 255.0
# 차원축소는 하지 않기 :전처리 계층 (layer) 사용 
# 훈련 및 검증 데이터 셋으로 분리하기 (8:2)
train_scaled, val_scaled,train_target, val_target = \
train_test_split (train_scaled, train_target, test_size = 0.2, random_state = 42)

# 분리된 데이터 확인 
print(train_scaled.shape, train_target.shape)
print (val_scaled.shape, val_target.shape)

(48000, 28, 28) (48000,)
(12000, 28, 28) (12000,)


In [23]:
# 훈련 모델 생성하기 
model = keras.Sequential()
model

<keras.engine.sequential.Sequential at 0x1a17a09cee0>

In [24]:
# 신경망층 추가하기 : 전처리 계층 추가 
# Flatten : 차원 축소 계층 (2차원을 1차원으로)
# 훈련(fit) 시에 적용됨 
# 훈련의 성능에 기여하지는 않으며, 데이터 전처리에만 사용되는 계층 
model.add(keras.layers.Flatten(input_shape=(28,28)))

In [25]:
# 성능에 기여하는 계층 : 은닉층(hidden layer) 이라고 칭함 => 뜰채 같은 역할 
"""
[relu]
- 층이 많은 심층 신경망에 주로 사용 됨 
- sigmoid 함수의 단점을 보완한 알고리즘 
    <sigmoid 단점>
    - 시그모이드 한수는 오른쪽 또는 왼쪽 끝으로 데이터가 분포할 수록 
    그래프가 누워있기 때문에 올바른 출력을 만드는데 신속하게 대응하기 어려움 
    그래프가 누어았다는 의미 : 데이터의 분포가 애매모호한 형태 
    심층 신경망에서는 학습을 어렵게하는 저해요인이 될수 있음 
    
- relu(렐루) 함수는 sigmoid 단점을 개선한 모델
    입력값이 "양수"일 경우에는 활성화 함수를 그냥 "통과"
    입력값이 "음수" 일 경우에는 무조건 0 으로 만들어서 "통과 못하게"
    이미지 처리에 좋은 성능을 나타냄
"""
model.add(keras.layers.Dense(100, activation="relu"))

In [26]:
# 출력층 (output layer) 추가하기 
# 가장 하단에 위치하는 신경망층 
# 훈련 성능에 기여함 
model.add(keras.layers.Dense(10, activation="softmax"))

In [27]:
# 사용되는 신경망층은 ? 
# 2개의 신경망층을 사용함 
# 전처리 계층은 신경망층으로 보지 않음 
# 학습을 수행하지 않는 층은 신경망층에서 제외함 


In [28]:
model.summary()
# Param 을 통해 훈련에 참여하는 계층 확인가능 -> 0 : 훈련에 참여 X

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [33]:
# 훈련 모델 설정하기 
model.compile(loss="sparse_categorical_crossentropy",
             metrics="accuracy")
model

<keras.engine.sequential.Sequential at 0x1a17a09cee0>

In [35]:
# 훈련 시키기 
model.fit(train_scaled, train_target, epochs=10)
# epochs 값을 찾는 것 : 하이퍼파리미터 튜닝 

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1a12ad5afd0>

In [36]:
# 성능평가하기 
model.evaluate(val_scaled,val_target)



[0.45386624336242676, 0.8731666803359985]

## 옵티마이저: 모델 설정시 사용되는 하이퍼파라메터

In [None]:
"""
- 딥러닝에서 빠르고 정확하게 학습하는 것을 목표로 설정함 
- 주로 Gradient Descent Alorithm을 기반으로 한 SGD에서 변형된 여러 종류 
-케라스에서 훈련시 사용할 다양한 경사하강법 알고리즘을 옵티마이저라고 칭함

"""

In [37]:
# SGD : 경사하강법 알고리즘 
# 옵티마이저 설정 방법 1 => 주로 해당 방식 사용
# 최초에 훈련 정확도만 확인하고자 할 때 사용 
model.compile(optimizer="sgd",
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")


In [39]:
# 설정 방법 2 => 튜닝 시 주로 사용
# 옵티마이저 클래스 튜닝시에는 방법2 사용 
# 튜닝할 값이 있는 경우 주로 사용 
sgd = keras.optimizers.SGD()
model.compile(optimizer=sgd,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [41]:
# 옵티마이저 튜닝 
"""
[learning_rate]
- 훈련 모델의 성능을 향상 시키는방법중하나로, 
가장 loss가 적은 local minimum(경사하강의 종착지)까지 걸어간다고 생각할때 
- 학습률(learning_rate)는 걸음의 보폭이라고 할 수 있음
- 학습률이 너무 크면 minimum이 지나칠 수 있음
- 반대로 학습률이 너무 적으면 local minimum까지 도달할 수 있어도 시간이 매우 오래 걸림 
- 기본 학습률 : 0.01
-보폭을 조절하다보면 최적의 정확도를 가지는 값이 나온다 
"""
sgd = keras.optimizers.SGD(learning_rate=0.1)
model.compile(optimizer=sgd,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [42]:
# momentum  : 가는 방향을 유지하는 정도?
# nesterov : 
"""
[momentum(모멘텀)]
경사하강법의 최적화 알고리즘 
물리학에서 쓰이는 용어로 운동향, 동력을 뜻함
- 물리학의 개념을 훈련에 적용한 알고리즘
- 관성과 가속도를 넣어서 이동하던 한 방향으로 좀 더 이동 할수 있도록 하기 위한 개념 
- 일반적으로 딥러닝의 경사하강번을 지그재그로 이동하면서 하강함 
- 지그재그로 이동하는 방식을 관성과 가속도를 적용해서 
  최대한 이동하는 방향을 유지하면서 지그재그로 이동할 수 있도록 처리함 
  
(모멘텀의 중요 개념)
 - 현재 이동하는 방향과는 별개로 과거에 이동을 했던 방향을 기억함 
 - 과거의 방향으로 일정량을 추가하여 이동을 하게 됨 
 - 과거의 행동을 저장하여 사용
   즉, 누적된 과거 데이터를 현재 데이터에 보장하려는 방식 
 - 메모리 사용량이 많다는 단점이 있음
 
[nestrov(네스테로프)]
- 모멘텀 최적화 알고리즘의 변종 알고리즘 
- 현재 위치가 아닌, 모멘텀의 방향으로 조금 앞서서 경사를 계산 

"""

sgd = keras.optimizers.SGD(learning_rate= 0.1 , momentum=0.9, nesterov=True)
model.compile(optimizer=sgd,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

## 적응적 학습률

In [None]:
# 적응적 학습률 : SGD 알고리즘에서 확장되어 개선된 학습률 알고리즘 
# 모델이 죄적점에 가까이 갈수록 학습률을 낮추게 되면 
# 일반적으로 최적점에 수렴할 가능성이 높아짐 
# 최적점에 가까이 갈수록 학습률을 낮출 수 있도록 케라스 모델이 자동으로 값을 조정 
# 옵티마이저의 기본값은 RMSprop
# 적응적 학습률의 기본 학습률은 0.01

# <적응적 학습을 적용한 대표적 옵티마이저>
# - Adagrad, RMSprop,Adam 3가지 모델이 일반적으로 사용됨 


In [43]:
# Adagrad()
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [64]:
# RMSprop()
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=adagrad,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [None]:
# Adam()
adam = keras.optimizers.Adam()
model.compile(optimizer=adam,
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [55]:
# 모델 생성하기 
model = keras.Sequential()

In [56]:
# 전처리 계층 추가하기 : 1차원으로 만들어 주는 계층 
model.add(keras.layers.Flatten(input_shape=(28,28)))

In [57]:
# relu hiddem layer 추가
# 100의 의미? => epoch 1번마다 레이어 하낙 통과되는데 이 중 확률이 가자 높은 100개 추림 
model.add(keras.layers.Dense(100, activation="relu"))

In [59]:
# 출력층 추가
# 추린 100 개 중에 확률이 가장 높은 10개의 출력 층을 추림 
model.add(keras.layers.Dense(10,activation="softmax"))

In [62]:
#모델 설정하기 : 옵티마이저 adam 사용
# 가장먼저 시도하면 좋은 알고리즘 
# 방향과 학습률을 모두 적절하게 성능개선을 해주는 알고리즘 

model.compile(optimizer="adam",
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten_1 (Flatten)         (None, 784)               0         
                                                                 
 dense_6 (Dense)             (None, 100)               78500     
                                                                 
 dense_7 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [61]:
# 훈련시키기 : 반복 10 회
model.fit(train_scaled,train_target,epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1a10034ddf0>

In [63]:
# 성능평가하기
model.evaluate(val_scaled,val_target)



[0.32597988843917847, 0.8827499747276306]

### RMSprop

In [65]:
# 모델생성하기 
model = keras.Sequential()

In [67]:
# 모델 전처리 계층 추가 
model.add(keras.layers.Flatten(input_shape= (28,28)))

In [68]:
# 모델 렐루 레이어 추가 
model.add(keras.layers.Dense(100, activation="relu"))

In [69]:
# 모델 출력층 추가 
model.add(keras.layers.Dense(10, activation="softmax"))

In [70]:
# 모델 설정하기 : RMSprop 
model.compile(optimizer="RMSprop",
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [71]:
# 훈련시키기 
model.fit(train_scaled,train_target, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1a1007d6a60>

In [72]:
# 성능 평가하기 
model.evaluate(val_scaled, val_target)



[0.383456289768219, 0.8808333277702332]

## Adagrad

In [73]:
# 모델 생성하기 
model = keras.Sequential()

In [74]:
# 모델 전처리 계층 추가 
model.add(keras.layers.Flatten(input_shape=(28,28)))

In [75]:
# 모델 렐루 계층 추가 
model.add(keras.layers.Dense(100, activation="relu"))

In [76]:
# 모델 출력층 추가 
model.add(keras.layers.Dense(10, activation="softmax"))

In [77]:
# 모델 설정하기 
model.compile(optimizer="Adagrad",
             loss="sparse_categorical_crossentropy",
             metrics="accuracy")

In [78]:
# 훈련시키기 
model.fit(train_scaled,train_target, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x1a101ca16d0>

In [80]:
# 성능 평가하기 
model.evaluate(val_scaled, val_target)



[0.5536308884620667, 0.815500020980835]

In [92]:
# Adagrad, RMSprop,Adam  중에 
# 성능 평가 결과가 가장 높은 옵티마이저를 선택 할 수 있도록 
# 한번에 처리가 가능하도록 처리해주세요 
# Adagrad, RMSprop,Adam 을 함수 또는 반복을 통해,
# 최종 출력결과는 성능값이 가장 높은 옵티마이저 이름과 성능 결과 출력
# 함수에 전달하는 값 : 옵티마이저 이름, 반볻횟수 

def CreateModel (O_name, time) :
    model = keras.Sequential()
    model.add(keras.layers.Flatten(input_shape=(28,28)))
    model.add(keras.layers.Dense(100, activation="relu"))
    model.add(keras.layers.Dense(10, activation="softmax"))
    model.compile(optimizer=O_name,
                  loss="sparse_categorical_crossentropy",
                  metrics="accuracy")
    model.fit(train_scaled,train_target, epochs=time)
    result =  model.evaluate(val_scaled, val_target)
    print(result)
    return result

In [97]:
list = ["Adagrad", "RMSprop","Adam" ]
model_result = {"Adagrad":[], "RMSprop":[],"Adam":[]}
best = 0.0
best_model = ""
for i in list :
    result = CreateModel(i,10)
    print(result)
    model_result[i] = result
    print(model_result[i][1])
    if best < model_result[i][1] :
        best_model = i 
        best = model_result[i][1]

print(best_model, best)

    

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.5438781976699829, 0.8207499980926514]
[0.5438781976699829, 0.8207499980926514]
0.8207499980926514
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.39908304810523987, 0.8772500157356262]
[0.39908304810523987, 0.8772500157356262]
0.8772500157356262
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.3231382369995117, 0.8849999904632568]
[0.3231382369995117, 0.8849999904632568]
0.8849999904632568
Adam 0.8849999904632568


In [107]:
def BestModel (O_list, time) :
    model_result = {"Adagrad":[], "RMSprop":[],"Adam":[]}
    best_score = 0.0
    best_model = ""
    best = []
    for i in O_list :
        model = keras.Sequential()
        model.add(keras.layers.Flatten(input_shape=(28,28)))
        model.add(keras.layers.Dense(100, activation="relu"))
        model.add(keras.layers.Dense(10, activation="softmax"))
        model.compile(optimizer=i,
                      loss="sparse_categorical_crossentropy",
                      metrics="accuracy")
        model.fit(train_scaled,train_target, epochs=time)
        result =  model.evaluate(val_scaled, val_target)
        print(result)
        model_result[i] = result
        print(model_result[i][1])
        if best_score < model_result[i][1] :
            best_model = i 
            best_score = model_result[i][1]
    best.append(best_model)
    best.append(best_score)
    return best

In [109]:
list = ["Adagrad", "RMSprop","Adam" ]
print(BestModel(list,10))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.5504960417747498, 0.8176666498184204]
0.8176666498184204
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.4117439389228821, 0.8742499947547913]
0.8742499947547913
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[0.31360718607902527, 0.89041668176651]
0.89041668176651
['Adam', 0.89041668176651]


In [115]:
# 강사님코드 
def getBestEval(opt,epoch) :
    model = keras.Sequential()
    model.add(keras.layers.Flatten(input_shape=(28,28)))
    model.add(keras.layers.Dense(100, activation="relu"))
    model.add(keras.layers.Dense(10, activation="softmax"))
    model.compile(optimizer=opt,
                  loss="sparse_categorical_crossentropy",
                  metrics="accuracy")
    model.fit(train_scaled,train_target, epochs=epoch)
    result =  model.evaluate(val_scaled, val_target)
    print(result)
    return result
    


In [117]:
optimizer = ["Adagrad", "RMSprop","Adam" ]

best_eval = 0.0 
best_opt = ""
best_loss= 1.0 # 가장 낮은 손실률 
best_loss_opt = "" # 가장 낮은 손실률일 때의 옵티마이저 

for opt in optimizer :
    # 함수호출
    rs = getBestEval(opt, 2)
    print("opt=" ,opt, "| rs =",rs)
    
    # 가장 낮은 손실률과 이 떼의 옵티마이저 처리하기 
    if best_loss > rs[0] :
        best_loss = rs[0]
        best_loss_opt = opt 
    
    # 가장 높은 정확도와 이 때의 옵티마이저 처리하기 
    if best_eval < rs[1] :
        best_eval = rs[1]
        best_opt = opt     
    
print("best_opt= ", best_opt, "| best_eval = ", best_eval )
print("best_loss_opt= ", best_loss_opt, "| best_loss = ", best_loss )   


Epoch 1/2
Epoch 2/2
[0.7361075282096863, 0.7546666860580444]
opt= Adagrad | rs = [0.7361075282096863, 0.7546666860580444]
Epoch 1/2
Epoch 2/2
[0.3915471136569977, 0.8621666431427002]
opt= RMSprop | rs = [0.3915471136569977, 0.8621666431427002]
Epoch 1/2
Epoch 2/2
[0.3973644971847534, 0.8489166498184204]
opt= Adam | rs = [0.3973644971847534, 0.8489166498184204]
best_opt=  RMSprop | best_eval =  0.8621666431427002
best_loss_opt=  RMSprop | best_loss =  0.3915471136569977


In [None]:
# 옵티마이저 선택시 
# - 성능이 높은 쪽과 손실률이 낮은 쪽 중에 
# - 선택은 손실률 기준으로 : 손실률이 낮은 것을 선택 (정확도가 차이가 많이 안나는 경우)
# 결국은 분석가 마음 : 성능 따지는 사람 -> 성능 좋은거 
# 이론적으로 접근 : 손실률 낮은거 고르기 