In [1]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [2]:
# !unzip -qq /content/drive/MyDrive/alphabet.zip -d /content/drive/MyDrive/datasets

In [2]:
# !pip install -q tensorflow-gpu==2.0.0-rc1
# !pip install -q tensorflow-gpu==2.8.0-rc1
import tensorflow as tf

from tensorflow.keras import datasets, layers, models

In [3]:
import pathlib
import os

data_dir = "/content/drive/MyDrive/datasets/"
# data_dir = pathlib.Path(data_dir)

# train_dir = os.path.join(data_dir, 'train')
# test_dir = os.path.join(data_dir, 'test')

train_dir = "/content/drive/MyDrive/datasets/train/"
test_dir = "/content/drive/MyDrive/datasets/test/"
val_dir = "/content/drive/MyDrive/datasets/validation"

# image_count = len(list(data_dir.glob('A/*.png')))
# print(image_count)
# image_count = len(list(data_dir.glob('lower_a/*.png')))
# print(image_count)

In [4]:
# 이미지 데이터 전처리
from tensorflow.keras.preprocessing import image
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Image augmentation
# train셋에만 적용
train_datagen = ImageDataGenerator(rescale = 1./255, # 모든 이미지 원소값들을 255로 나누기
                                   rotation_range=25, # 0~25도 사이에서 임의의 각도로 원본이미지를 회전
                                   width_shift_range=0.1, # 0.05범위 내에서 임의의 값만큼 임의의 방향으로 좌우 이동
                                   height_shift_range=0.1, # 0.05범위 내에서 임의의 값만큼 임의의 방향으로 상하 이동
                                   zoom_range=0.2, # (1-0.2)~(1+0.2) => 0.8~1.2 사이에서 임의의 수치만큼 확대/축소
                                   horizontal_flip=True, # 좌우로 뒤집기                                   
                                   vertical_flip=True,
                                   fill_mode='nearest'
                                  ) 
# validation 및 test 이미지는 augmentation을 적용하지 않는다;
# 모델 성능을 평가할 때에는 이미지 원본을 사용 (rescale만 진행)
# train_datagen = ImageDataGenerator(rescale = 1./255)
validation_datagen = ImageDataGenerator(rescale = 1./255)
test_datagen = ImageDataGenerator(rescale = 1./255)

In [36]:
# flow_from_directory() 메서드를 이용해서 훈련과 테스트에 사용될 이미지 데이터를 만들기
# 변환된 이미지 데이터 생성
train_generator = train_datagen.flow_from_directory(
                                                    # data_dir,
                                                    # "/content/drive/MyDrive/dataset/",
                                                    train_dir, 
                                                    batch_size=250, # 한번에 변환된 이미지 16개씩 만들어라 라는 것
                                                    color_mode='grayscale', # 흑백 이미지 처리
                                                    # class_mode='binary', 
                                                    class_mode='categorical',
                                                    target_size=(150,150)) # target_size에 맞춰서 이미지의 크기가 조절된다

validation_generator = validation_datagen.flow_from_directory(
                                                              # data_dir,
                                                              val_dir,
                                                              # "/content/drive/MyDrive/dataset/",
                                                              batch_size=128, 
                                                              color_mode='grayscale',
                                                              # class_mode='binary', 
                                                              class_mode='categorical',
                                                              target_size=(150,150))

test_generator = test_datagen.flow_from_directory(test_dir,
                                                  batch_size=128,
                                                  color_mode='grayscale',
                                                  # class_mode='binary',
                                                  class_mode='categorical',
                                                  target_size=(150,150))
# 참고로, generator 생성시 batch_size x steps_per_epoch (model fit에서) <= 훈련 샘플 수 보다 작거나 같아야 한다.

Found 78052 images belonging to 52 classes.
Found 19552 images belonging to 52 classes.
Found 47134 images belonging to 52 classes.


In [37]:
# class 확인
train_generator.class_indices

{'A': 0,
 'B': 1,
 'C': 2,
 'D': 3,
 'E': 4,
 'F': 5,
 'G': 6,
 'H': 7,
 'I': 8,
 'J': 9,
 'K': 10,
 'L': 11,
 'M': 12,
 'N': 13,
 'O': 14,
 'P': 15,
 'Q': 16,
 'R': 17,
 'S': 18,
 'T': 19,
 'U': 20,
 'V': 21,
 'W': 22,
 'X': 23,
 'Y': 24,
 'Z': 25,
 'small_a': 26,
 'small_b': 27,
 'small_c': 28,
 'small_d': 29,
 'small_e': 30,
 'small_f': 31,
 'small_g': 32,
 'small_h': 33,
 'small_i': 34,
 'small_j': 35,
 'small_k': 36,
 'small_l': 37,
 'small_m': 38,
 'small_n': 39,
 'small_o': 40,
 'small_p': 41,
 'small_q': 42,
 'small_r': 43,
 'small_s': 44,
 'small_t': 45,
 'small_u': 46,
 'small_v': 47,
 'small_w': 48,
 'small_x': 49,
 'small_y': 50,
 'small_z': 51}

In [8]:
# # 합성곱 신경망 모델 구성하기
# import tensorflow as tf

# model = tf.keras.models.Sequential([
#     tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(150, 150, 1)),
#     tf.keras.layers.MaxPooling2D(2,2),
#     tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
#     tf.keras.layers.MaxPooling2D(2,2),
#     tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
#     tf.keras.layers.MaxPooling2D(2,2),
#     tf.keras.layers.Flatten(),
#     tf.keras.layers.Dense(512, activation='relu'),
#     # tf.keras.layers.Dense(1, activation='sigmoid')
#     tf.keras.layers.Dense(52, activation='softmax')
# ])
# model.summary() # 신경망의 구조 확인

In [38]:
# 합성곱 신경망 모델 구성하기
import tensorflow as tf

model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(16, (3,3), activation='relu', input_shape=(150, 150, 1)),
    tf.keras.layers.Conv2D(16, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(32, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    # tf.keras.layers.MaxPooling2D(2,2),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dropout(0.2),
    # tf.keras.layers.Dense(1, activation='sigmoid')
    tf.keras.layers.Dense(52, activation='softmax')
])
model.summary() # 신경망의 구조 확인

Model: "sequential_8"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_55 (Conv2D)          (None, 148, 148, 16)      160       
                                                                 
 conv2d_56 (Conv2D)          (None, 146, 146, 16)      2320      
                                                                 
 max_pooling2d_39 (MaxPoolin  (None, 73, 73, 16)       0         
 g2D)                                                            
                                                                 
 conv2d_57 (Conv2D)          (None, 71, 71, 32)        4640      
                                                                 
 max_pooling2d_40 (MaxPoolin  (None, 35, 35, 32)       0         
 g2D)                                                            
                                                                 
 conv2d_58 (Conv2D)          (None, 33, 33, 32)       

In [39]:
from tensorflow.keras.optimizers import Adam

# compile() 메서드를 이용해서 손실 함수 (loss function)와 옵티마이저 (optimizer)를 지정
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics= ['accuracy'])

In [None]:
# 모델 훈련
history = model.fit_generator(train_generator, # train_generator안에 X값, y값 다 있으니 generator만 주면 된다
                              validation_data=validation_generator, # validatino_generator안에도 검증용 X,y데이터들이 다 있으니 generator로 주면 됨
                              steps_per_epoch=10, # 한 번의 에포크(epoch)에서 훈련에 사용할 배치(batch)의 개수 지정; generator를 4번 부르겠다
                              epochs=100, # 데이터셋을 한 번 훈련하는 과정; epoch은 100 이상은 줘야한다
                              # validation_steps=39, # 한 번의 에포크가 끝날 때, 검증에 사용되는 배치(batch)의 개수를 지정; validation_generator를 4번 불러서 나온 이미지들로 작업을 해라
                              validation_steps=6,
                              verbose=1)#0 출력 없음. 1 진행바 2 한줄씩
# 참고: validation_steps는 보통 내가 원하는 이미지 수에 flow할 때 지정한 batchsize로 나눈 값을 validation_steps로 지정

  


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100


In [None]:
# 모델 성능 평가
model.evaluate(train_generator)

In [None]:
model.evaluate(validation_generator)