# 가위바위보 분류기를 만들자

### 라이브러리 버전 확인

In [1]:
import tensorflow as tf
import numpy as np

print(tf.__version__)
print(np.__version__)

2.6.0
1.21.4


### 데이터 불러오기 + Resize 하기

In [2]:
from PIL import Image
import glob
import os

print("PIL 라이브러리 import 완료!")

PIL 라이브러리 import 완료!


### 이미지의 크기를 28 x 28로 만든다

In [3]:
def resize_images(img_path):
    images=glob.glob(img_path + "/*.jpg")  
    
    print(len(images), " images to be resized.")

    # 파일마다 모두 28x28 사이즈로 바꾸어 저장합니다.
    target_size=(28,28)
    for img in images:
        old_img=Image.open(img)
        new_img=old_img.resize(target_size,Image.ANTIALIAS)
        new_img.save(img, "JPEG")
    
    print(len(images), " images resized.")

# 가위 이미지가 저장된 디렉토리 아래의 모든 jpg 파일을 읽어들여서
image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/scissor"
resize_images(image_dir_path)
print("가위 이미지 resize 완료!")

# 바위 이미지가 저장된 디렉토리 아래의 모든 jpg 파일을 읽어들여서
image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/rock"
resize_images(image_dir_path)
print("바위 이미지 resize 완료!")

# 보 이미지가 저장된 디렉토리 아래의 모든 jpg 파일을 읽어들여서
image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/paper"
resize_images(image_dir_path)
print("보 이미지 resize 완료!")

500  images to be resized.
500  images resized.
가위 이미지 resize 완료!
500  images to be resized.
500  images resized.
바위 이미지 resize 완료!
500  images to be resized.
500  images resized.
보 이미지 resize 완료!


### load_data() 함수 만들기

In [4]:
# 가위바위보 데이터를 읽을 수 있는 load_data() 함수 만들기
import numpy as np

def load_data(img_path, number_of_data=1503):  # 가위바위보 이미지 개수 총합: 1503
    # 가위 : 0, 바위 : 1, 보 : 2
    img_size=28
    color=3
    #이미지 데이터와 라벨(가위 : 0, 바위 : 1, 보 : 2) 데이터를 담을 행렬(matrix) 영역을 생성합니다.
    imgs=np.zeros(number_of_data*img_size*img_size*color,dtype=np.int32).reshape(number_of_data,img_size,img_size,color)
    labels=np.zeros(number_of_data,dtype=np.int32)

    idx=0
    for file in glob.iglob(img_path+'/scissor/*.jpg'):
        img = np.array(Image.open(file),dtype=np.int32)
        imgs[idx,:,:,:]=img    # 데이터 영역에 이미지 행렬을 복사
        labels[idx]=0   # 가위 : 0
        idx=idx+1

    for file in glob.iglob(img_path+'/rock/*.jpg'):
        img = np.array(Image.open(file),dtype=np.int32)
        imgs[idx,:,:,:]=img    # 데이터 영역에 이미지 행렬을 복사
        labels[idx]=1   # 바위 : 1
        idx=idx+1  
    
    for file in glob.iglob(img_path+'/paper/*.jpg'):
        img = np.array(Image.open(file),dtype=np.int32)
        imgs[idx,:,:,:]=img    # 데이터 영역에 이미지 행렬을 복사
        labels[idx]=2   # 보 : 2
        idx=idx+1
        
    print("학습데이터(x_train)의 이미지 개수는", idx,"입니다.")
    return imgs, labels

image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper"
(x_train, y_train)=load_data(image_dir_path)
x_train_norm = x_train/255.0   # 입력은 0~1 사이의 값으로 정규화

print("x_train shape: {}".format(x_train.shape))
print("y_train shape: {}".format(y_train.shape))

학습데이터(x_train)의 이미지 개수는 1500 입니다.
x_train shape: (1503, 28, 28, 3)
y_train shape: (1503,)


### 딥러닝 네트워크 설계하기

In [5]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

# 모델 만들기
# 텐서플로우(TensorFlow)의 표준 API인 tf.keras의 Sequential API를 이용
n_channel_1=16  # 얼마나 다양한 이미지의 특징을 살펴볼 것인가?
n_channel_2=32
n_dense=38    # 분류기 알고리즘을 얼마나 복잡하게 할 것인가? (복잡한 문제일수록 늘릴 것)
n_train_epoch=3    # 가위바위보의 분류기 값이므로 3으로 맞춰준다(가위, 바위, 보)

model=keras.models.Sequential()
model.add(keras.layers.Conv2D(n_channel_1, (3,3), activation='relu', input_shape=(28,28,3)))    # RGB 색상이므로 28,28,'3'
model.add(keras.layers.MaxPool2D(2,2))
model.add(keras.layers.Conv2D(n_channel_2, (3,3), activation='relu'))
model.add(keras.layers.MaxPooling2D((2,2)))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(n_dense, activation='relu'))
model.add(keras.layers.Dense(n_train_epoch, activation='softmax'))

print('Model에 추가된 Layer 개수: ', len(model.layers)) 

model.summary()

Model에 추가된 Layer 개수:  7
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 26, 26, 16)        448       
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 13, 13, 16)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 11, 11, 32)        4640      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 5, 5, 32)          0         
_________________________________________________________________
flatten (Flatten)            (None, 800)               0         
_________________________________________________________________
dense (Dense)                (None, 38)                30438     
_________________________________________________________________
dense_1 (Dense)              (No

### 딥러닝 네트워크 학습시키기

In [6]:
model.compile(optimizer='adam',
             loss='sparse_categorical_crossentropy',
             metrics=['accuracy'])

model.fit(x_train, y_train, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7fa6e5a17bb0>

### 얼마나 잘 만들었는지 확인하기(테스트)

In [7]:
image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/test/scissor"
resize_images(image_dir_path)
# 테스트 가위 이미지 resize 완료

image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/test/rock"
resize_images(image_dir_path)
# 테스트 바위 이미지 resize 완료

image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/test/paper"
resize_images(image_dir_path)
# 테스트 보 이미지 resize 완료

image_dir_path = os.getenv("HOME") + "/aiffel/rock_scissor_paper/test"
(x_test, y_test)=load_data(image_dir_path)
x_test_norm = x_test/255.0   # 입력은 0~1 사이의 값으로 정규화

print("x_test shape: {}".format(x_test.shape))
print("y_test shape: {}".format(y_test.shape))

201  images to be resized.
201  images resized.
199  images to be resized.
199  images resized.
200  images to be resized.
200  images resized.
학습데이터(x_train)의 이미지 개수는 600 입니다.
x_test shape: (1503, 28, 28, 3)
y_test shape: (1503,)


In [8]:
# loss, accuracy 체크

test_loss, test_accuracy = model.evaluate(x_test,y_test, verbose=2)
print(f"test_loss: {test_loss}")
print(f"test_accuracy: {test_accuracy}") 

47/47 - 0s - loss: 0.4854 - accuracy: 0.8144
test_loss: 0.4853745400905609
test_accuracy: 0.8143712282180786


<회고> <br>
가위바위보 분류기를 만드는 실습을 해보았는데,<br> 
텐서플로우를 활용해서 모델 학습을 할 수 있다는 게 참 편리하다는 생각이 들었다.<br>

- 데이터 불러와서 resize 하기
- load_data() 함수 만들기
- 딥러닝 네트워크 설계: (tensowflow의 표준 API인 tf.keras의 Sequential API를 이용)
- 딥러닝 네트워크 학습시키기: model.compile, model.fit
- 테스트하기: 테스트 데이터 불러와서 resize, 정규화
- loss, accuracy 확인
<br>
<br>
위 순서로 진행된다는 흐름을 알 수 있었다.

<br>
분류기 사용에 앞서서, 해당 노드에서 300장의 사진 데이터를 이용해보라는 권유가 있었는데<br>
데이터량이 많을 수록 accuracy가 높아지지 않을까 싶어, <br>
조원들과 함께 가위바위보 손 사진을 찍어 해당 사진 데이터로 분류기 작업을 진행하였다. <br>
총 2100장의 사진을 가지고, train에는 약 1500개, test에는 약 600개의 사진을 할당하여 분류 작업을 진행하였다.<br>

accuracy를 높이기 위해 dense 값을 약간 늘려주었더니,
- 최종 test accuracy : 81.43%에 도달할 수 있었다.