# 심층 신경망

## 1. 2개의 층 생성

In [1]:
# 데이터셋 불러오기
from tensorflow import keras

# 훈련데이터 테스트 데이터 
(train_input, train_target), (test_input, test_target) = \
        keras.datasets.fashion_mnist.load_data()
print(train_input.shape, train_target.shape)

(60000, 28, 28) (60000,)


In [2]:
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

### 시그모이드 활성화 함수를 사용한 은닉층과 소프트맥스 함수를 사용한 출력층을 케라스의 Dense클래스에 등록

In [3]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


## 2. 심층 심경망 만들기

#### 앞에서 만든 dense1, dense2 객체를 Sequential 클래스에 추가해서 심층 신경망 작성

In [4]:
model = keras.Sequential([dense1, dense2])

#### 층에 대한 정보 얻기 

In [7]:
model.summary()

## 3. 층을 추가하는 다른 방법

### (1) dense1 과 dense2 객체를 따로 사용할 일이 없으므로 Sequential 클래스 안에 바로 작성

In [5]:
model = keras.Sequential(
       [keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
        keras.layers.Dense(10, activation='softmax', name='output')],
        name='패션 MNIST 모델'
)

In [7]:
model.summary()

### (2) add() 메소드 사용

In [8]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [9]:
model.summary()

### (4) 모델 훈련

In [10]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.7480 - loss: 0.7802
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8456 - loss: 0.4276
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8597 - loss: 0.3816
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8671 - loss: 0.3601
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8789 - loss: 0.3368


<keras.src.callbacks.history.History at 0x2a0e15c6b50>

#### 훈련세트에 대한 성능을 보면 층이 추가되어 성능이 향상되었음.

## 4. ReLu 함수

#### 시그모이드 함수의 단점 - 함수의 오른쪽 끝과 왼쪽 끝으로 갈수록 그래프가 누워있음.
#### 올바른 출력을 만드는데 신속하게 대응하지 못함. => 개선 방안 : ReLu 함수 사용
#### ReLu - 입력이 양수일 경우 활성화함수가 없는 것처럼 입력 그대로 사용, 음수일 경우 0으로 만듬.

In [11]:
# ReLu 함수를 적용한 모델 생성
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28))) # 입력 데이터를 받아 1차원 배열로 변환해줌 
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

  super().__init__(**kwargs)


In [12]:
model.summary()

In [13]:
(train_input, train_target), (test_input, test_target) = \
        keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [14]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.7637 - loss: 0.6737
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8576 - loss: 0.3984
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8729 - loss: 0.3570
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8805 - loss: 0.3327
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8855 - loss: 0.3153


<keras.src.callbacks.history.History at 0x2a0e19e6b50>

#### 시그모이드 함수를 사용했을 때 보다 성능이 조금 향상됨.

In [15]:
# 검증세트 확인
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 960us/step - accuracy: 0.8823 - loss: 0.3425


[0.3476799428462982, 0.8810833096504211]

## 5. 옵티마이저

#### 케라스에서는 기본적으로 미니배치 경사하강법을 사용한다. (미니배치 갯수 : 기본32)
#### 케라스에서는 다양한 종류의 경사하강법 알고리즘을 제공함 -> 옵티마이저(optimizer)
#### optimizer : compile() 함수의 속성

In [20]:
# 옵티마이저로 경사하강법 알고리즘을 사용하기 위해 'sgd' 값으로 설정
model.compile(optimizer = 'sgd', loss='sparse_categorical_crossentropy',metrics=['accuracy'])

In [21]:
# 위와 동일한 코드
sgd = keras.optimizers.SGD()
model.compile(optimizer =sgd, loss='sparse_categorical_crossentropy',metrics=['accuracy'])

In [22]:
# SGD 클래스의 학습률의 기본값 0.01 learning_rate 속성값 지정할 수 있음.
sgd = keras.optimizers.SGD(learning_rate=0.1)

#### 기타 경사하강법 옵티마이저

In [24]:
# momentum은 0.9이상 지정함.
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)

#### 적응적 학습률 : Adagrad()

In [27]:
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy',metrics=['accuracy'])

#### Optimizer의  속성 : 'adam'
#### 모멘텀 최적화, 적응률 학습


In [28]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy',metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8898 - loss: 0.3024
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8983 - loss: 0.2768
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.9005 - loss: 0.2671
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.9063 - loss: 0.2540
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.9070 - loss: 0.2489


<keras.src.callbacks.history.History at 0x2a0e23c6b50>

#### 적응적 학습률을 적용하여 모델 학습

In [29]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation = 'relu'))
model.add(keras.layers.Dense(10, activation = 'softmax'))

In [31]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.7701 - loss: 0.6667
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8544 - loss: 0.4015
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8675 - loss: 0.3576
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8814 - loss: 0.3315
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8855 - loss: 0.3119


<keras.src.callbacks.history.History at 0x2a0935cd4d0>

In [32]:
# 검증세트 확인
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8672 - loss: 0.3679


[0.3713618218898773, 0.8646666407585144]