In [1]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1,28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

# 은닉층과 출력층을 케라스의 Dense 클래스로 만들어보기
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)) # 처음 층을 이룰 때 input_shape를 반드시 써야함
dense2 = keras.layers.Dense(10, activation='softmax')
# 심층 신경망 만들기
model = keras.Sequential([dense1, dense2])
model.summary() # output shape = none,100  none,10  param = 78500 1010
# batch_size로 미니배치 경사 하강법의 크기를 바꿀 수 있다. 기본값은 32이다.

# 층을 추가하는 다른 방법
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name='패션 MNIST 모델') # name = 이름 지정, activation = 활성화함수 지정
model.summary()

model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))) # add()로 추가
model.add(keras.layers.Dense(10, activation='softmax'))
model.summary()

# 컴파일 방식 정하기
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

# 렐루 함수 : max(0,z) : z>0이면 z를, 음수면 0을 반환한다.
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28))) # reshape 대신 Flatten으로 평탄화시킬 수도 있다.
model.add(keras.layers.Dense(100, activation='relu')) # 렐루 함수 사용
model.add(keras.layers.Dense(10, activation='softmax'))
model.summary()
# Flatten은 모델 파라미터가 0개이다. output shape로 784개의 입력이 전달된다는게 보임. 입력 데이터에 대한 전처리 과정을 가능한 모델에 포함시킨다.

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)
model.evaluate(val_scaled, val_target) # 검증 세트의 성능 확인

# 옵티마이저 : 기본 경사 하강법 옵티마이저인 SGD(learning_rate=0.01) -> 모멘텀(momentum>0) -> 네스테로프 모멘텀(nesterov=True) ex) sgd = keras.optimizer.SGD(momentum=0.9, nesterov=True)
# 적응적 학습률 옵티마이저인 RMSprop(Learning_rate=0.001) -> Adam 등이 있다.
"""
딥러닝 학습시 최대한 틀리지 않는 방향으로 학습해야 한다,
얼마나 틀리는지(loss)를 알게 하는 함수가 loss function(손실함수)이다.
loss function 의 최솟값을 찾는 것을 학습 목표로 한다.
최소값을 찾아가는 것 최적화 = Optimization
이를 수행하는 알고리즘이 최적화 알고리즘 = Optimizer 이다.
"""
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy') # adam으로 설정해보기
model.fit(train_scaled, train_target, epochs=5)

model.evaluate(val_scaled, val_target) # 0.87

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
______________________________________________