# 5차시: 텐서플로우 이미지 분류

## 2023. 06. 21. 14:10 ~ 16:00 (50분×2)
1. 딥러닝 기초
1. MNIST Fashion 데이터 셋
1. 텐서플로우 실습

### 참고자료
- [파이썬 3 표준 문서](https://docs.python.org/3/index.html)
- [텐서플로우 이미지 분류](https://www.tensorflow.org/tutorials/keras/classification)

### 1. 도구 불러오기 및 버전 확인

In [None]:
# 도구 준비
import os
import shutil

import tensorflow as tf # 텐서플로우
import matplotlib.pyplot as plt # 시각화 도구
%matplotlib inline
import numpy as np

In [None]:
print(f'Tensorflow 버전을 확인합니다: {tf.__version__}')

### 2. 학습 데이터 다운로드: MNIST Fashion

In [None]:
# 데이터 다운로드
# dataset_path = 'C:\Users\<your_username>\.keras\datasets' # Windows
# dataset_path = os.path.abspath(os.path.expanduser('~/.keras/datasets/')) # Linux
# if os.path.exists(dataset_path):
#     shutil.rmtree(dataset_path)
(_train_images, train_labels), (_test_images, test_labels) = tf.keras.datasets.fashion_mnist.load_data()

In [None]:
print(f'학습에 사용할 이미지는 {len(_train_images)}개 입니다.')
print(f'학습한 후 테스트(검증)에 사용할 이미지는 {len(_test_images)}개 입니다.')

In [None]:
# https://www.tensorflow.org/api_docs/python/tf/keras/datasets 
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
print(f'데이터의 레이블은 {len(class_names)}개 이며, 데이터셋에 포함되어 있지 않으므로 설명서에서 확인해야 합니다.')
print('레이블 번호와 레이블: ')
for i in range(0, len(class_names)):
    print(f'{i}: {class_names[i]}')

### 3. 학습 데이터 살펴보기: 차원, 미리보기

In [None]:
print(f'학습 이미지 형태: {_train_images.shape}')
print(f'학습 레이블 형태: {train_labels.shape}')

In [None]:
print(f'테스트 이미지 형태: {_test_images.shape}')
print(f'테스트 레이블 형태: {test_labels.shape}')

In [None]:
fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot()
axm = ax.imshow(_train_images[0])
fig.colorbar(axm)
fig.suptitle('Example of train image', fontsize=24)
ax.set_title(f'Label: {class_names[train_labels[0]]}', fontsize=16)
ax.grid(False)

### 4. 학습 데이터 전처리 (정규화)

In [None]:
print('인공 신경망은 주로 -1.0 ~ 1.0 사이의 값을 받습니다.')
print('따라서 이미지를 255로 나누어줍니다.')
train_images = _train_images / 255.0
test_images = _test_images / 255.0

In [None]:
fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot()
axm = ax.imshow(train_images[0])
fig.colorbar(axm)
fig.suptitle('Regulated example of train image', fontsize=24)
ax.set_title(f'Label: {class_names[train_labels[0]]}', fontsize=16)
ax.grid(False)

In [None]:
fig = plt.figure(figsize=(12, 12))
fig.set_facecolor('white')
for i in range(25):
    ax = fig.add_subplot(5, 5, i+1)
    ax.imshow(train_images[i], cmap=plt.cm.binary)
    ax.set_xticks([])
    ax.set_yticks([])
    ax.set_title(class_names[train_labels[i]])

In [None]:
fig = plt.figure(figsize=(12, 12/5*2))
fig.set_facecolor('white')
for i in range(10):
    ax = fig.add_subplot(2, 5, i+1)
    for j in range(len(train_images)//10, len(train_images)):
        if train_labels[j] == i:
            break
    ax.imshow(train_images[j], cmap=plt.cm.binary)
    ax.set_xticks([])
    ax.set_yticks([])
    ax.set_title(f'[{train_labels[j]}] {class_names[train_labels[j]]}', fontsize=12)

### 5. 학습 모델 준비

In [None]:
print('모델 생성')
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(train_images.shape[1:])),
    tf.keras.layers.Dense(10)
])
model.summary()

In [None]:
print('모델 컴파일')
model.compile(optimizer=tf.keras.optimizers.Adam(),
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

### 6. 학습

In [None]:
epochs = 10
model.fit(train_images, train_labels, 
          epochs=epochs)

### 7. 학습 결과 테스트

In [None]:
print(f'{len(test_images)}개 이미지로 테스트합니다.')
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)
print()
print(f'테스트 이미지 정확도: {test_acc}')

In [None]:
print(f'테스트 이미지 0번 예측:\n{model.predict(test_images[0:1])}')
print(f'실제 레이블: {test_labels[0]}')

In [None]:
fig = plt.figure(figsize=(6, 6))
ax = fig.add_subplot()
axm = ax.imshow(test_images[0])
fig.colorbar(axm)
fig.suptitle('Test image', fontsize=24)
ax.set_title(f'Label: {class_names[test_labels[0]]}', fontsize=16)
ax.grid(False)