# 02. 의류 아이템 인식하기

## 코드부터 작성하기

구현 모델: 28x28 흑백 이미지를 입력받아 셔츠, 바지, 드레스 등의 종류 구별

In [None]:
import tensorflow as tf

In [None]:
data = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = data.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
training_images = training_images / 255.0
test_images = test_images / 255.0

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
model.fit(training_images, training_labels, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


## 코드 분석하기

### 모듈 불러오기

In [None]:
import tensorflow as tf

## 데이터 준비하기


*   입력 데이터 = images
*   출력 데이터 = labels

In [None]:
data = tf.keras.datasets.fashion_mnist
(training_images, training_labels), (test_images, test_labels) = data.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
training_images[0]

In [None]:
training_labels[0:5]

array([9, 0, 0, 3, 0], dtype=uint8)

## 데이터 정규화하기

0-255 값의 데이터를 0-1의 범위로 정규화

In [None]:
training_images = training_images / 255.0
test_images = test_images / 255.0

In [None]:
training_images[0]

array([[0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        ],
       [0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.        , 0.        , 0.        , 0.        ,
        0.        , 0.    

### 모델 구성하기

입력(28x28) </br>
-> Flatten(입력된 2차원 데이터를 1차원 배열로 재구성), 784 </br>
-> Dense(입력된 784 길이의 배열을 연산 후 128 길이의 배열로 출력) + Relu, 128 </br>
-> Dense(입력된 128길이의 배열을 연산 후 softmax를 통해 10개의 확률로 출력) + SoftMax, 10 </br>
-> 출력(10)


*   **옵티마이저(optimizer)**: Adam(Adaptive Moment Estimation)
*   **손실함수(loss, Loss Function)**: sparse_categorical_crossentropy(0,1,2,3 등의 정수 값의 라벨에 대한 다중 분류 손실함수)

In [None]:
model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

### 모델 학습하기
tf.keras.Model.fit(x, y)


*   Input = training_images
*   ouput = training_labels
*   epochs = 학습의 반복 수



In [None]:
model.fit(training_images, training_labels, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7b949e9421d0>

### 예측하기

In [None]:
model.evaluate(test_images, test_labels)



[0.37151914834976196, 0.8633000254631042]


* loss(error, 손실) = 0.37
* accuracy(정확도) = 0.86

## 모델 출력 살펴보기

In [None]:
classifications = model.predict(test_images)
print(classifications[0])
print(test_labels[0])

[5.9600575e-06 1.0351787e-07 2.6862290e-06 3.9447536e-07 2.4955700e-05
 6.7921299e-03 1.3235795e-05 4.8533618e-01 1.6399517e-03 5.0618428e-01]
9


모델은 라벨 0-9 에대한 확률을 출력한다. 라벨 9의 확률이 0.506으로 가장 높아 실제 정답인 9와 일치한다.

## Overfitting (과대적합)

epoch를 50번으로 늘려 과대적합 현상을 알아보자.

In [None]:
model.fit(training_images, training_labels, epochs=50)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.src.callbacks.History at 0x7b949e7dd1b0>

In [None]:
model.evaluate(test_images, test_labels)



[0.5398319363594055, 0.8902000188827515]

정확도가 0.89였던 훈련데이터에 대해서는 0.96으로 크게 올랐지만 테스트 데이터의 정확도는 0.86에서 0.89로 소폭 성장하였다. 따라서 학습 epoch에 비해 낮은 성능을 보이고 있다.

## Callback으로 과학습 방지하기

텐서플로우의 Callback 함수를 이용하여 학습 도중 95% 이상의 정확도를 보이면 학습을 중지하도록 설계한다.

In [None]:
class myCallback(tf.keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs={}):
    if(logs.get('accuracy')>0.95):
      print("\n 정확도 95%에 도달하여 훈련을 중지합니다.")
      self.model.stop_training = True

model2 = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation=tf.nn.relu),
    tf.keras.layers.Dense(10, activation=tf.nn.softmax)
])

model2.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

callbacks = myCallback()
model2.fit(training_images, training_labels, epochs=50, callbacks=[callbacks])

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
 정확도 95%에 도달하여 훈련을 중지합니다.


<keras.src.callbacks.History at 0x7b947c12d450>