2개의 층

In [1]:
# 케라스 API사용하여 패션 MNIST 데이터셋 불러오기
from tensorflow import keras
(train_input, train_target), (test_input, test_target) =\
keras.datasets.fashion_mnist.load_data()

In [2]:
# 훈련세트와 검증세트 나누기
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [3]:
# 은닉층(dense1)과 출력층(dense2)  만들기
dense1= keras.layers.Dense(100, activation = 'sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

심층 신경망 만들기

In [4]:
# Sequential 클래스의 객체를 만들때 여러개의 층을 추가하려면 리스트로 전달. 출력층은 가장 마지막에 두어야 함.
model = keras.Sequential([dense1, dense2])

In [5]:
# 층에 대한 정보 확인
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


층을 추가하는 다른 방법

In [7]:
# Sequential 클래스의 생성자 안에서 바로 Dense클래스의 객체 만들기
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,),name='hidden'),
    keras.layers.Dense(10, activation='softmax', name = 'output')], name='패션 MNIST 모델')

In [8]:
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [9]:
# 모델의  add() 메서드를 사용하여 Sequential 클래스에서 층 추가하기
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [10]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [12]:
# 모델 훈련
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x120fcc928e0>

렐루 함수
- 입력이 양수일 경우 마치 활성화 함수가 없는 것처럼 그냥 입력을 통과시키고 음수일 경우에는 0으로 만든다.

In [14]:
# Flatten층 추가_입력층 바로 뒤에 추가.
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [15]:
model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [16]:
# 모델 훈련
(train_input, train_target), (test_input, test_target) = \
keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)
    

In [18]:
# 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x120be236940>

In [19]:
# 검증세트에서의 성능 확인
model.evaluate(val_scaled, val_target)



[0.37162134051322937, 0.8771666884422302]

옵티마이저
- 신경망의 가중치와 절편을 학습하기 위한 알고리즘 또는 방법.
- 케라스의 다양한 경사 하강법 알고리즘 : 대표적으로 SGD, 네스테로프 모멘텀, RMSprop, Adam 등이 있다. 

In [20]:
# SGD 옵티마이저 사용
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy')

In [34]:
# SGD 클래스 객체를 만들어 사용하는 번거움을 피하고자 'sgd'라 지정하면 자동으로 SGD 클래스 객체를 만들어 준다. 
sgd=keras.optimizers.SGD()
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [22]:
# SGD 클래스의 학습률의 기본값 0.01을 바꾸고 싶다면 learning_rate 매개변수에 지정하여 사용
sgd = keras.optimizers.SGD(learning_rate=0.1)

In [23]:
# 네스테로프 모멘텀 최적화(nesterov momentum optization)_네스테로프 가속 경사  사용
sgd=keras.optimizers.SGD(momentum=0.9, nesterov=True)

In [32]:
# 적응적 학습률_Adagrad 클래스객체
adagrad=keras.optimizers.Adagrad()
model.compile(optimizer=adagrad , loss='sparse_categorical_crossentropy', metrics='accuracy')

In [35]:
# 적응적 학습률_RMSprop 클래스 객체
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x120d1bd78e0>

In [36]:
model.evaluate(val_scaled, val_target)



[0.36527276039123535, 0.8805000185966492]

In [37]:
# Adam 클래스(모멤텀 최적화와 RMSprop의 장점을 접목한 것.)의 매개변수 기본값을 사용하여 패션 MNIST 모델 훈련.
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [38]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x120be395eb0>

In [39]:
# 검증세트 성능확인
model.evaluate(val_scaled, val_target)



[0.3457081615924835, 0.8767499923706055]