# 심층 신경망

## 1. 2개의 층 생성

In [2]:
# 데이터셋 불러오기
from tensorflow import keras

# 훈련데이터 테스트 데이터 
(train_input, train_target), (test_input, test_target) = \
        keras.datasets.fashion_mnist.load_data()
print(train_input.shape, train_target.shape)

(60000, 28, 28) (60000,)


In [3]:
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

### 시그모이드 활성화 함수를 사용한 은닉층과 소프트맥스 함수를 사용한 출력층을 케라스의 Dense클래스에 등록

In [4]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


## 2. 심층 심경망 만들기

#### 앞에서 만든 dense1, dense2 객체를 Sequential 클래스에 추가해서 심층 신경망 작성

In [6]:
model = keras.Sequential([dense1, dense2])

#### 층에 대한 정보 얻기 

In [7]:
model.summary()

## 3. 층을 추가하는 다른 방법

### (1) dense1 과 dense2 객체를 따로 사용할 일이 없으므로 Sequential 클래스 안에 바로 작성

In [9]:
model = keras.Sequential(
       [keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
        keras.layers.Dense(10, activation='softmax', name='output')],
        name='패션 MNIST 모델'
)

In [10]:
model.summary()

### (2) add() 메소드 사용

In [11]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [12]:
model.summary()

### (4) 모델 훈련

In [13]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.7560 - loss: 0.7692
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8497 - loss: 0.4187
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8619 - loss: 0.3823
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8691 - loss: 0.3613
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8764 - loss: 0.3370


<keras.src.callbacks.history.History at 0x2498c773ed0>

#### 훈련세트에 대한 성능을 보면 층이 추가되어 성능이 향상되었음.

## 4. ReLu 함수

#### 시그모이드 함수의 단점 - 함수의 오른쪽 끝과 왼쪽 끝으로 갈수록 그래프가 누워있음.
#### 올바른 출력을 만드는데 신속하게 대응하지 못함. => 개선 방안 : ReLu 함수 사용
#### ReLu - 입력이 양수일 경우 활성화함수가 없는 것처럼 입력 그대로 사용, 음수일 경우 0으로 만듬.

In [18]:
# ReLu 함수를 적용한 모델 생성
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28))) # 입력 데이터를 받아 1차원 배열로 변환해줌 
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [19]:
model.summary()

In [20]:
(train_input, train_target), (test_input, test_target) = \
        keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [23]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.7593 - loss: 0.6843
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8517 - loss: 0.4078
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 1ms/step - accuracy: 0.8733 - loss: 0.3526
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.8775 - loss: 0.3363
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8862 - loss: 0.3124


<keras.src.callbacks.history.History at 0x2498db05d90>

#### 시그모이드 함수를 사용했을 때 보다 성능이 조금 향상됨.

In [24]:
# 검증세트 확인
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 885us/step - accuracy: 0.8761 - loss: 0.3598


[0.35804682970046997, 0.8744166493415833]

## 5. 옵티마이저

#### 케라스에서는 기본적으로 미니배치 경사하강법을 사용한다. (미니배치 갯수 : 기본32)
#### 케라스에서는 다양한 종류의 경사하강법 알고리즘을 제공함 -> 옵티마이저(optimizer)
#### optimizer : compile() 함수의 속성