# 심층 신경망

<table align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/rickiepark/hg-mldl/blob/master/7-2.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />구글 코랩에서 실행하기</a>
  </td>
</table>

## 2개의 층

In [1]:
from tensorflow import keras
# keras import
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 패션 MNIST 데이터셋 다운로드

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [2]:
from sklearn.model_selection import train_test_split

train_scaled = train_input / 255.0
# 255로 나눠서 정규화 과정을 거침
train_scaled = train_scaled.reshape(-1, 28*28)
# 2차원 배영을 1차원 배열로 변경

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)
# train_tst_split()을 통해 훈련 세트와 검증 세트를 나눔

In [3]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
# 신경망의 첫번째 층은 input_shape의 매개변수로 반드시 입력해야 함
# 노드는 100, 활성화 함수는 시그모이드, 입력의 크기는 (784,)로 지정

dense2 = keras.layers.Dense(10, activation='softmax')
# 신경망의 출력층으로 10개의 클래스를 분류하므로 10개의 노드를 설정
# 활성화 함수로는 softmax를 설정

## 심층 신경망 만들기

In [4]:
model = keras.Sequential([dense1, dense2])
# dense1과 dense2 객체를 Sequenctial 클래스에 추가하여 심층 신경망을 만듦

In [5]:
model.summary()
# 모델의 summary() 메서드를 호출하여 층에 대한 유용한 정보를 출력

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


## 층을 추가하는 다른 방법

In [6]:
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name='패션 MNIST 모델')
# Sequential 클래스의 생성자 안에서 바로 Dense 클래스의 객체를 만듦

In [7]:
model.summary()
# 모델의 summary() 메서드를 호출하여 층에 대한 유용한 정보를 출력
# name 매개변수로 모델의 이름을 지정
# 모델의 이름과 달리 층의 이름은 반드시 영문으로 작성

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [8]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))
# Sequential 클래스에서 층을 추가할 때 가장 널리 사용하는 방법인 add() 메서드
# Sequential 객체를 만들고 객체에 add() 메서드를 호출해서 층을 추가함

In [9]:
model.summary()
# 모델의 summary() 메서드를 호출하여 층에 대한 유용한 정보를 출력

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [10]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
# compile() 메서드 설정, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy로 설정

model.fit(train_scaled, train_target, epochs=5)
# 모델을 5번의 에포크 동안 훈련

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7839e4117970>

## 렐루 활성화 함수

In [11]:
model = keras.Sequential()
# Sequential() 클래스 객체 model을 생성
model.add(keras.layers.Flatten(input_shape=(28, 28)))
# Flatten()에 input_shape=(28,28)의 값을 전달하여 입력 차원을 모두 일렬로 펼치는 작업
model.add(keras.layers.Dense(100, activation='relu'))
# 은닉층으로 노드가 100, 활성화 함수를 relu로 설정
model.add(keras.layers.Dense(10, activation='softmax'))
# 출력층으로 노드가 10, 활성화 함수를 softmax로 설정

In [12]:
model.summary()
# 모델의 summary() 메서드를 호출하여 층에 대한 유용한 정보를 출력

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [13]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
# 패션 MNIST 데이터셋 다운로드
train_scaled = train_input / 255.0
# 255로 나눠서 정규화
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)
# 훈련 세트와 검증 세트를 나눔

In [14]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
# compile() 메서드 설정, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy'로 설정

model.fit(train_scaled, train_target, epochs=5)
# 모델을 5번의 에포크 동안 훈련

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7839d96aa770>

In [15]:
model.evaluate(val_scaled, val_target)
# 검증 세트에서의 성능 확인



[0.3787917494773865, 0.8707500100135803]

## 옵티마이저

In [16]:
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy')
# 하이퍼 파라미터를 optimizer = 'sgd', loss = 'sparse_categorical_crossentropy', metrics = 'accuracy'로 설정

In [17]:
sgd = keras.optimizers.SGD()
# SGD 클래스의 객체를 만듦
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')
# 하이퍼 파라미터를 optimizer에 SGD 객체 sgd, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy'로 설정
# 위 코드와 일치

In [18]:
sgd = keras.optimizers.SGD(learning_rate=0.1)
# 학습률을 0.1로 설정

In [19]:
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)
# momentum을 0.9로 설정, nesterov=True로 하여 네스테로프 모멘텀 최적화를 사용

In [20]:
adagrad = keras.optimizers.Adagrad()
# Adagrad 클래스 객체를 만듦
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy')
# 하이퍼 파라미터를 optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy'로 설정

In [21]:
rmsprop = keras.optimizers.RMSprop()
# RMSprop 클래스 객체를 만듦
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')
# 하이퍼 파라미터를 optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy'로 설정

In [22]:
model = keras.Sequential()
# Sequential 클래스 객체 생성
model.add(keras.layers.Flatten(input_shape=(28, 28)))
# Flatten()에 input_shape(28,28)의 값을 전달하여 입력 차원을 모두 일렬로 펼치는 작업
model.add(keras.layers.Dense(100, activation='relu'))
# 은닉층으로 노드가 100, 활성화 함수를 relu로 설정
model.add(keras.layers.Dense(10, activation='softmax'))
# 출력층으로 노드가 10, 활성화 함수를 softmax로 설정

In [23]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy')
# compile() 메서드 설정. optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy'로 설정

model.fit(train_scaled, train_target, epochs=5)
# 모델을 5번의 에포크 동안 훈련

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7839dffb0d60>

In [24]:
model.evaluate(val_scaled, val_target)
# 검증 세트에서의 성능 확인



[0.3447032570838928, 0.875083327293396]