In [1]:
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten, Conv2D,MaxPooling2D
from keras.optimizers import Adam
from keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.preprocessing.image import img_to_array
import numpy as np
import matplotlib.pyplot as plt

In [2]:
tf.keras.__version__

'2.9.0'

In [3]:
# 학습 데이터 경로
TRAIN_DIR = 'mask_dataset/train'
# 테스트 데이터 경로
TEST_DIR = 'mask_dataset/test'

In [4]:
# image 가로/세로 크기
IMG_HEIGHT = 224
IMG_WIDTH = 224

In [5]:
# 학습에 사용될 이미지 데이터를 읽어오는 객체
# 옵션을 통해 같은 이미지에 변형을 줄 수 있다.
#  -> 적은 양의 데이터로 많은 양의 데이터 효과를 준다.
datagen = ImageDataGenerator(
		rotation_range=180,				# 회전 최대 180도
		width_shift_range=0.2,			# 좌우 이동 최대 이미지 가로사이즈 20%
		height_shift_range=0.2,			# 상하 이동 최대 이미지  세로사이즈 20%
		horizontal_flip=True,			# 좌우 반전 실행
		vertical_flip=True,				# 상하 반전 실행 
		rescale=1 / 255.0,				# 이미지를 255로 나눠서 0 ~ 1 사이값으로 변환
		brightness_range=[0.5, 1.2],	# 이미지 밝기 조정 -> 0 : 완전 어두운 이미지  1: 원본 밝기
										#  					0.5: 원본 50% 밝기 1.2 : 원본보다 20% 밝은 이미지
		zoom_range=[0.8, 1.2])			# 이미지 확대 0.8: 원본 80% 확대  1.2 : 원본 120% 확대

In [6]:
train_generator = datagen.flow_from_directory(
		TRAIN_DIR,								# 데이터셋 경로 -> 이미지 경로
		target_size=(IMG_HEIGHT, IMG_WIDTH),	# 이미지의 크기
		batch_size=64,							# 한 번이 반환할 이미지의 개수 설정
		class_mode='categorical',				# 분류 방법 ->  categorical : 다중분류(onehot), binary : 이진분류
												#			   sparse : 다중분류(레이블 encoding)
		shuffle=True)							# 데이터를 섞는다

Found 1659 images belonging to 3 classes.


In [7]:
test_datagen = ImageDataGenerator(rescale=1 / 255.0)

In [8]:
test_generator = test_datagen.flow_from_directory(
        TEST_DIR,
        target_size=(IMG_HEIGHT, IMG_WIDTH),
        batch_size=64,
        class_mode='categorical',
        shuffle=False)

Found 419 images belonging to 3 classes.


In [9]:
# 학습데이터의 전체 갯수 조회
train_generator.n

1659

In [10]:
# 테스트 데이터의 전체 갯수 조회
test_generator.n

419

In [11]:
# image, label을 batch_size만큼 뽑아서 대입
img, label = train_generator.next()

In [None]:
# 커널이 죽는 구간 why? version이 호환이 안되서 그렇다는데 정확한건 ㅁ?ㄹ
model = Sequential()

: 

: 

In [None]:
# label_num = np.argmax(label, 1)

In [None]:
# img = img / 255.0

In [None]:
# 데이터셋이 준비되었는지 시각화해서 확인
# fig = plt.figure(figsize=(30, 20))

# for i in range(30):
#     subplot = fig.add_subplot(6, 5, i + 1)
#     subplot.set_xticks([])
#     subplot.set_yticks([])
    
#     #이미지의 label (종류 조회)
#     # 0 : incorrect_mask
#     # 1 : with_mask
#     # 2 : without_mask
#     subplot.set_title('label: %d' % label_num[i])
#     subplot.imshow(img[i].reshape((IMG_HEIGHT, IMG_WIDTH,3)))
	
# plt.show()

In [None]:
plt.figure(figsize=(20, 10))
plt.imshow(img.reshape((IMG_HEIGHT, IMG_WIDTH, 3)) / 255)
plt.show()

In [None]:
index = 0
all_generate_img = []

# datagen.flow(img) : img를 회전, 수평이동, 수직이동, 좌우반전, 상하 반전등으로 증강 시켜서 리턴
# generate_img : 증강 시킨 데이터가 저장됨
for generate_img in datagen.flow(img): 
    all_generate_img.append(generate_img) # generate_img 증강시킨 이미지를 all_generate_img 에 추가
    index += 1
    if index > 20:
        break  

In [None]:
fig = plt.figure(figsize=(20, 10))

for i in range(20):
    subplot = fig.add_subplot(4, 5, i + 1)
    subplot.set_xticks([])
    subplot.set_yticks([])   
    subplot.imshow(all_generate_img[i][0] / 255)
plt.show()