In [45]:
import warnings
warnings.filterwarnings('ignore')

In [46]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [47]:
# train과 valid 분리
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1,28*28)

# test_scaled = test_input / 255.0
# test_Scaled = test_scaled.reshape(-1,28*28)


train_scaled,val_scaled, train_target,val_target = train_test_split(
    train_scaled,train_target,test_size=0.2,random_state=42)

In [48]:
train_scaled.shape

(48000, 784)

In [49]:
# 히든층은 입력 컬럼이 많았을 떄 입력층보다는 노드가 적고,출력층 보다는 많아야함, 하이퍼파라미터임



In [50]:
### Layer를 추가하는 방법-1 
dense1 = keras.layers.Dense(100,activation = 'sigmoid',input_shape = (784,)) # 은닉층
dense2 = keras.layers.Dense(10,activation = 'softmax') # 출력층


In [51]:
# 전체 모델에 층을 추가 
model = keras.Sequential([dense1,dense2])

In [52]:
model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_8 (Dense)             (None, 100)               78500     
                                                                 
 dense_9 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


---
### Layer를 추가하는 방법 -2

In [53]:

model = keras.Sequential(
    [
        keras.layers.Dense(100,activation='sigmoid', input_shape = (784,),name = 'hidden'),
        keras.layers.Dense(10,activation='softmax',name = 'output')
    ], name = '패션 Mnist 모델'
)

In [54]:
# Summary
model.summary()

Model: "패션 Mnist 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


---
### Layer를 추가하는 방법 -3

In [55]:
# 주로 쓰는 방법 

model = keras.Sequential()
model.add(keras.layers.Dense(100,activation = 'sigmoid', input_shape = (784,)))
model.add(keras.layers.Dense(10,activation = 'softmax'))

model.summary()


Model: "sequential_5"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_10 (Dense)            (None, 100)               78500     
                                                                 
 dense_11 (Dense)            (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


---
### 모델 훈련

In [56]:
model.compile(loss='sparse_categorical_crossentropy', metrics = 'accuracy')
model.fit(train_scaled, train_target, epochs = 5)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7faadd71bd30>

In [58]:
type(train_scaled)

numpy.ndarray

In [57]:
import numpy as np
np.unique(train_target)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=uint8)

- Sigmoid 함수는 숫자가 무한대로 커지게 되면 데이터의 차이가 거의 없다는 단점이 있다.
- 이를 해결한 것이 Relu함수 인데 인공신경망에 기여한 바가 크며 음수는 모든 0으로 양수는 항상 최대값을 출력하는 함수

In [64]:
# 입력층을 단순하게 
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape = (28,28))) # 입력층을 2차원 원래대로 사용한다.
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10,activation='softmax'))

In [65]:
model.summary()

Model: "sequential_7"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_14 (Dense)            (None, 100)               78500     
                                                                 
 dense_15 (Dense)            (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


---
### Optimizer(최적화 알고리즘)
- 훈련시에 Optimizer를 사용하여 최적화 알고리즘을 구성한다.
- 보통 사용하는 것이 확률적 경사하강법 optimizer 이다.

# 적응형 학습률 옵티마이저


sgd -> 모멘텁 -> 네스트로브 모멘텀

모멘텀 -> Adam -> RNS PROP -> adagrad


LR 에 따라 optimizer를 다르게 기본적으로 adam
SGD  LR = 0.01  
모멘텀 LR >0  
adam,adagrad LR = 0.001   


In [67]:
# 적용방법 (확률적 경사 하강법) - 1
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy',metrics = 'accuracy')

In [68]:
# 적용방법 (확류적 경사 하강 방법) - 2
sgd = keras.optimizers.SGD()
model.compile(optimizer = sgd, loss='sparse_categorical_crossentropy',metrics = 'accuracy')

In [69]:
# 적용방법 (확률적 경사 하강법) + 학습률 변경 - 3 : SGD의 learning_rate의 기본값은 0.01
sgd = keras.optimizers.SGD(learning_rate=0.1) # 기본값 0.01 을 0.1로 정의
model.compile(optimizer = sgd, loss='sparse_categorical_crossentropy',metrics = 'accuracy')

In [70]:
# 적용방법 (Momentum)
sgd = keras.optimizers.SGD(momentum=0.9, nesterov = True)
model.compile(optimizer = sgd, loss='sparse_categorical_crossentropy',metrics = 'accuracy')
# 모멘텀을 팍팍내려가서 모두 내려간뒤 다시 옴 (sgd가 골이 2개일때 최소값이라고 착각하는 점을 개선)


In [71]:
# 적용방법 (Adagrad)
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer = adagrad, loss='sparse_categorical_crossentropy',metrics = 'accuracy')

In [72]:
# 적용방법 (RMSprop)
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer = rmsprop, loss='sparse_categorical_crossentropy',metrics = 'accuracy')
