In [1]:
from __future__ import absolute_import, division, print_function, unicode_literals
import os
import numpy as np
import matplotlib.pyplot as plt

try:
  %tensorflow_version 2.x
except Exception:
  pass
import tensorflow as tf

keras = tf.keras

print("tensorflow version",tf.__version__)

ModuleNotFoundError: No module named 'tensorflow'

## 1. 파라미터 설정

In [11]:
IMG_SIZE = 224 ## 이미지 사이즈를 244 x 244로 설정
EPOCHS = 3
BATCH_SIZE = 128
learning_rate = 0.0001

## 2. 데이터 다운 및 탐색

In [12]:
from keras.datasets import cifar10
from keras.utils import np_utils
import tensorflow_datasets as tfds

# cifar10은 답을 포함함 

## progress bar disable 
tfds.disable_progress_bar()

#분류할 클래스 개수 
num_classes=10 # Cifar10의 클래스 개수

# 훈련 데이터 (90%) , 검증 데이터 (10%) , 테스트 데이터 슬라이싱
(raw_train, raw_validation, raw_test), metadata = tfds.load(
    'cifar10',
    split=['train[:90%]', 'train[90%:]', 'test'],
    with_info=True,   # 메타 데이터도 불러옴
    as_supervised=True, # 데이터셋을 (input, target) 형태로 로드하도록 지정 
                        # (이미지, 레이블) 쌍으로 데이터셋이 반환
)

print("Train data 개수:",len(raw_train))
print("Val data 개수:",len(raw_validation))
print("Test data 개수:",len(raw_test))

Train data 개수: 45000
Val data 개수: 5000
Test data 개수: 10000


## 3. 이미지셋 전처리

In [13]:
# 전처리 함수 format_example 함수 정의 
# -> row_train, raw_validation, raw_test에 적용함 

# 정규화 과정의 필요성 ([-1, 1]): 신경망 모델의 학습 속도, 그래디언트 안정성, 모델의 일반화 능력 향상

def format_example(image, label): 
  image = tf.cast(image, tf.float32) # 이미지 값 -> 실수형으로 표현
  image = (image/127.5) - 1 # 이미지의 값 범위를 [-1, 1]로 정규화
  image = tf.image.resize(image, (IMG_SIZE, IMG_SIZE)) # 지정된 크기로 동일하게 변환
  return image, label
  
##map 함수를 사용하여 데이터셋의 각 항목에 데이터 포맷 함수를 적용
train = raw_train.map(format_example)
validation = raw_validation.map(format_example)
test = raw_test.map(format_example)

## 4. 데이터셋 만들기
 - 1. 데이터셋을 셔플함 ( 편향 방지, 일반화 능력향상, 학습 다양성 증진 )
 - 2. 배치로 나눈다. ( 위에서 배치 사이즈를 지정, 학습/검증/테스트 데이터셋 모두에 적용 )


In [14]:
#배치 단위로 데이터를 처리하면
# GPU 또는 TPU와 같은 가속기를 효과적으로 활용하여 모델의 학습과 평가 속도를 향상시킬 수 있다.

SHUFFLE_BUFFER_SIZE = 1000
train_batches = train.shuffle(SHUFFLE_BUFFER_SIZE).batch(BATCH_SIZE)
validation_batches = validation.batch(BATCH_SIZE)
test_batches = test.batch(BATCH_SIZE)

## train set 개수 / 배치사이즈 = len(train_batches)
## 45000/ 128 = 352 

## 5. VGG16 모델 불러오기
 - 참고 
 - 'Imagent' : ImageNet 데이터셋에서 사전 훈련된 가중치는 ImageNet Challenge라고 불리는 대규모 이미지 분류 대회에서 훈련된 모델의 학습 가중치. ImageNet은 약 1,000개의 다양한 클래스에 대해 약 1,000만 개의 이미지로 구성된 대규모 데이터셋
 
 - Sequential 모델의 마지막에 Dense 레이어를 추가함. num_classes는 분류하려는 클래스의 개수를 나타내며, activation='softmax'로 설정하여 클래스별 확률 값을 출력 -> 모델의 최종 출력이 클래스에 대한 확률 분포로 나타남

In [15]:
# 이미지 형태정의 /  (이미지 크기, 이미지 크기, 채널 수) 여기서는 3채널 컬러 이미지를 사용하므로 3으로 설정

IMG_SHAPE = (IMG_SIZE, IMG_SIZE, 3)

#CNN 모델 변경하려면 여기서 변경
#ImageNet으로 사전 훈련된 모델 불러오기 
base_model = tf.keras.applications.VGG16(input_shape=IMG_SHAPE,
                                                ## 분류하는 부분까지 추출
                                               include_top=True,
                                                 ##  VGG16 모델의 완전 연결 레이어를 포함
                                                classes=1000,
                                                ## 이미지넷에서 사용한 가중치 적용
                                                ## 사전 훈련된 가중치 
                                               weights='imagenet')


model = tf.keras.Sequential()

# VGG16 모델의 마지막 레이어 전까지의 레이어를 Sequential 모델에 추가
for layer in base_model.layers[:-1]: # go through until last layer
    model.add(layer)
    
    
#마지막 layer의 최종 분류 개수를 클래스 개수와 맞게 설정
## 활성함수로는 softmax를 사용
model.add(keras.layers.Dense(num_classes, activation='softmax',name='predictions'))

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg16/vgg16_weights_tf_dim_ordering_tf_kernels.h5


## 6. model_ summary
 - VGG16 모델은 일반적으로 3x3 크기의 필터, 스트라이드 1, 패딩 'same'을 사용하여 구성 활성화 함수로는 주로 ReLU(Rectified Linear Unit) 함수가 사용됨

In [17]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0         
                                                                 
 block3_conv1 (Conv2D)       (None, 56, 56, 256)       2

## 7. 모델 컴파일

In [21]:
model.compile(optimizer=tf.keras.optimizers.legacy.Adam(learning_rate=0.001),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## 8. 모델 training

In [None]:
model.fit(train_batches,
                    epochs=EPOCHS,
                    validation_data=validation_batches,
                    batch_size=BATCH_SIZE)

## 9. test 데이터로 모델 정확도 확인


In [None]:
loss_and_metrics = model.evaluate(test_batches, batch_size=64)
print("테스트 성능 : {}%".format(round(loss_and_metrics[1]*100,4)))