## 🕹️ 머신러닝 기초학습
---
#### 다음 내용은 '혼자 공부하는 머신러닝'에 대한 내용입니다.
&nbsp;
##### [프로그램 분석]
- 심층망에 대한 설명입니다.

In [39]:
# 텐서플로를 불러오죠.
from tensorflow import keras
import warnings
warnings.filterwarnings('ignore')

In [40]:
# 앞에서 했던 패션 데이터를 불러와줍니다.
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [41]:
# 정규화를 진행할게요.
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
train_scaled = train_input.reshape(-1, 28*28)
test_scaled = test_input.reshape(-1, 28*28)

In [42]:
# 아직 정규화 진행 중..
ss = StandardScaler()
train_scaled = ss.fit_transform(train_scaled)
test_scaled = ss.transform(test_scaled)

In [43]:
# 훈련데이터와 검증데이터로 데이터를 나눌게요.
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,
                                                                      train_target,
                                                                      test_size=0.2,
                                                                      random_state=42)

In [44]:
# 이전 장에서는 층이 한개였죠? 이번 장에서는 층을 한개 추가해볼게요.
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(28*28, ))
dense2 = keras.layers.Dense(10, activation='softmax')

In [49]:
# 2개의 층을 가진 모델로 구축해봅시다.
model = keras.Sequential([dense1, dense2])

In [50]:
# summary 함수는 해당 모델이 어떤 모델인지를 요약해준다고 생각하면 됩니다.
model.summary()

In [51]:
# 첫번째 dense를 볼게요.
# outpu이 None, 100인데 None은 배치 크기를 정하지 않았으므로 None으로 되어있고, 이럴 경우 기본값(32)으로 진행합니다.
# 100개의 뉴런이 784(28*28)개의 특성과 곱해지니, 78400개의 데이터가 될테고, 여기에 100개의 뉴런 각각에 절편이 있을테니 78500개의 파라미터가 있겠군요.
# 이와 마찬가지로 결과층에서도 10개의 출력층에서 전의 층에서 100개의 뉴런이 있으니, 1000개의 파라미터가 되겠고, 10개 각각의 절편이 있으므로 1010개의 파라미터가 될겁니다.
# 따라서 사용되는 총 파라미터는 79510개가 되는거죠.

In [53]:
# 일반적으로 각 층을 dense = 과 같이 변수를 사용해서 넣는 경우는 적습니다.
# Sequential에 층을 바로 집어넣거나,
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(28*28,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name='패션 MNIST 모델')

In [54]:
model.summary()

In [55]:
# add 함수를 사용해 각 층들을 더해나가는 방식을 자주 사용합니다.
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(28*28,), name='hidden'))
model.add(keras.layers.Dense(10, activation='softmax', name='output'))

In [56]:
model.summary()

In [57]:
# 이제 구축한 모델을 훈련시켜볼까요?
# 확실이 이전 장에서 사용했던 단층신경망 보다는 좋은 성능을 보여주네요.
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 754us/step - accuracy: 0.7988 - loss: 0.5962
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 763us/step - accuracy: 0.8691 - loss: 0.3634
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 765us/step - accuracy: 0.8864 - loss: 0.3179
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 753us/step - accuracy: 0.8977 - loss: 0.2884
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 770us/step - accuracy: 0.9010 - loss: 0.2743


<keras.src.callbacks.history.History at 0x300cb3550>

In [58]:
# Dense에 사진 데이터를 넣어주기 위해서 3차원 배열을 2차원 배열로 변경했잖아요?
# 하지만 flatten을 사용하면 따로 2차원 배열로 변경하지 않고도 모델을 훈련할 수 있습니다.
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu', name='hidden'))
model.add(keras.layers.Dense(10, activation='softmax', name='output'))

In [59]:
model.summary()

In [60]:
# train_input과 test_input을 255로 나누는 이유는 그림 하나의 픽셀이 0(검정)부터 255(흰색)까지 중 하나겠죠?
# 이 값들을 0과 1사이의 값으로 바꾸어주기 위함입니다.
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
test_scaled = test_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,
                                                                      train_target,
                                                                      test_size=0.2,
                                                                      random_state=42)

In [61]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 778us/step - accuracy: 0.7654 - loss: 0.6682
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 803us/step - accuracy: 0.8545 - loss: 0.4042
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 820us/step - accuracy: 0.8705 - loss: 0.3574
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 729us/step - accuracy: 0.8779 - loss: 0.3363
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 737us/step - accuracy: 0.8862 - loss: 0.3143


<keras.src.callbacks.history.History at 0x300f18040>

In [62]:
# 검증데이터의 점수도 나쁘지는 않네요.
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 528us/step - accuracy: 0.8817 - loss: 0.3445


[0.346750408411026, 0.8794999718666077]

In [63]:
# 확률적 경사하강법을 optimizer로 지정할 수 있구요.
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [64]:
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 717us/step - accuracy: 0.8949 - loss: 0.2899
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 750us/step - accuracy: 0.8993 - loss: 0.2755
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 696us/step - accuracy: 0.9072 - loss: 0.2547
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 699us/step - accuracy: 0.9072 - loss: 0.2493
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 701us/step - accuracy: 0.9112 - loss: 0.2438


<keras.src.callbacks.history.History at 0x300f21910>

In [65]:
# 다른 다양한 옵티마이저를 사용할 수도 있어요.
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [66]:
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 756us/step - accuracy: 0.9182 - loss: 0.2199
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 781us/step - accuracy: 0.9229 - loss: 0.2109
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 777us/step - accuracy: 0.9263 - loss: 0.2021
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 746us/step - accuracy: 0.9256 - loss: 0.2040
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 780us/step - accuracy: 0.9260 - loss: 0.2037


<keras.src.callbacks.history.History at 0x300f34c40>

In [67]:
# rmsprop 옵티마이저
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [68]:
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 771us/step - accuracy: 0.9057 - loss: 0.2603
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 788us/step - accuracy: 0.9080 - loss: 0.2519
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 749us/step - accuracy: 0.9084 - loss: 0.2535
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 760us/step - accuracy: 0.9095 - loss: 0.2494
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 825us/step - accuracy: 0.9130 - loss: 0.2414


<keras.src.callbacks.history.History at 0x30ae74490>

In [35]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [69]:
# adam 옵티마이저
adam = keras.optimizers.Adam()
model.compile(optimizer=adam, loss='sparse_categorical_crossentropy', metrics=['accuracy'])

In [70]:
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 837us/step - accuracy: 0.9113 - loss: 0.2470
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 831us/step - accuracy: 0.9173 - loss: 0.2205
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 836us/step - accuracy: 0.9193 - loss: 0.2216
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 866us/step - accuracy: 0.9219 - loss: 0.2118
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 851us/step - accuracy: 0.9224 - loss: 0.2083


<keras.src.callbacks.history.History at 0x30ab9eb20>

In [71]:
# 이렇게 검증 데이터까지 모두 마쳤습니다.
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 536us/step - accuracy: 0.8853 - loss: 0.3481


[0.35771501064300537, 0.8867499828338623]

In [72]:
# 다양한 옵티마이저의 정보, 상세 활용에 대해서는 추후 올리도록 하겠습니다.