### 2개의 층

In [2]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = \
keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


##### 이미지 픽셀값을 0~ 255 범위에서 0~1 사이로 변환하고
##### 28 * 28 크기의 2차원 배열을 784 크기의 1차원 배열로 펼친다
##### sklearn의 train_test_split()함수로 훈련세트와 검증세트로 나눈다

In [3]:
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size =0.2, random_state =42
)

In [4]:
# 시그모이드 활성화 함수를 사용한 은닉층 만들기
# 소프트 맥스 함수를 사용한 출력층 만들기
# 중요 : 케라스에서 신경망의 첫 번째 층은 input_shape 매개변수로 입력크기를 꼭 지정해 주어야 함
dense1 = keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,))
dense2 = keras.layers.Dense(10, activation = 'softmax')

### 심층 신경망 만들기

dense1 과 dense2 객체를 Sequential 클래스에 추가해서 심층 신경망 DNN 만들기


In [5]:
model = keras.Sequential([dense1,dense2])

---
## 참고
##### 케라스는 모델의 summary를 호출하면 정보를 볼 수 있다

In [6]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


##### 층을 추가하는 다른 방법

Sequential 클래스에 층을 추가하는 다른방법
##### 이전의 방식은 : Dense 클래스의 객체 dense1, dense2를 만들어 Sequential 클래스에 전달

##### 이번 방식은 Sequential 클래스 생성자 안에서 바로 Dense 클래스의 객체를 만듬 -> 층을 한눈에 알아보기 쉬움, 그러나 조건에 따라 층을 추가할 수 없음

In [7]:
model = keras.Sequential([
    keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,),
                       name = 'hidden'),
    keras.layers.Dense(10, activation = 'softmax', name = 'output') # 층의 이름은 반드시 영문이어야 함
    ], name = '패션MNIST모델') # 모델 이름은 한글로 해도 되지만

In [8]:
model.summary()

Model: "패션MNIST모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


#### 층을 추가하는 방법 : add()

In [9]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation = 'sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation = 'softmax'))

In [10]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


---

### 모델 훈련 : compile(), fit()



In [11]:
model.compile(loss = 'sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f4600a0b6d0>

---

###ReLu 함수 : 이미지 분류 문제에서 높은 성능을 내는 활성화 함수

##### 층이 많은 심층 신경망일수록 좋음
#####입력 양수 : 활성화 함수가 없는 것처럼 그냥 입력을 통과
##### 입력 음수 : 0으로 만든다.

### max(0,z)  
#####0보다 크면 z 를 출력
#####0보다 작으면 0을 출력



--- 

케라스의 Flatten 층 : 1차원 배열을 일렬로 펼치는 역할을 함
##### 성능에 기여하는 바는 없으나, 입력층과 은닉층 사이에 추가하기 때문에 층이라고 부름

In [12]:
#층 만들기
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [12]:
model.summary()

In [14]:
# 데이터 준비
(train_input, train_target), (test_input, test_target) =\
  keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state = 42
)

In [16]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f460073e650>

시그모이드 함수보다 아주 조금 성능이 향상

In [17]:
# 검증 세트도 성능 확인
model.evaluate(val_scaled, val_target)



[0.351073682308197, 0.8795833587646484]

---

##### 옵티마이저

: 케라스는 여러종류의 경사하강법 알고리즘 제공
#####  ex) SGD(미니배치 경사 하강법)

##### 하이퍼 파라미터
#####: 뉴런개수, 활성화함수, 층의 종류,batch_size, epochs


---

In [18]:
###  SGD 옵티마이저
model.compile(optimizer = 'sgd', loss='sparse_categorical_crossentropy', metrics = 'accuracy')

In [20]:
### SGD 옵티마이저 (원래방법)
sgd = keras.optimizers.SGD() # 객체 생성해줘야하지만 걍 opimizer =sgd하면 객체 자동 생성됨
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics = 'accuracy')
sgd = keras.optimizers.SGD(learning_rate = 0.1) # SGD 의 학습률 변경하는 방법 default 0.01

---
## 다양한 옵티마이저
### 기본 경사 하강법 옵티마이저
##### SGD : learning rate = 0.01 
##### 모멘텀 : momentum > 0
##### 네스테로프 모멘텀 : nesterov = True ( 모멘텀 최적화를 2번 반복)

### 적응적 학습률 옵티마이저
##### RMSprop : learning_rate = 0.001 
##### Adam
##### Adagrad

In [21]:
### 네스테로프 모멘텀
sgd = keras.optimizers.SGD(momentum=0.9, nesterov = True)

In [24]:
### adagrad 
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer = adagrad, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy')

In [26]:
### RMSprop
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer = rmsprop, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy')

In [31]:
### adam 아담으로 훈련할 거임
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation= 'softmax'))

In [32]:
### 에포크 5로 설정후 훈련
model.compile(optimizer = 'adam', loss='sparse_categorical_crossentropy',
              metrics='accuracy')
model.fit(train_scaled, train_target, epochs =5)
### RMSprop을 사용했을 떄와 거의 같은 성능을 보임

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f460033ec50>

In [33]:
# 검증세트에서의 성능도 확인
model.evaluate(val_scaled, val_target)



[0.34641897678375244, 0.8762500286102295]