In [1]:
# 프로젝트 폴더에 'data'폴더를 저장
# data밑에 test_set, training_set 폴더 저장 
# 그 밑에 각각 cats, dogs 폴더 저장 후 그 안에 사진파일들이 있어야함
import os
from tqdm import tqdm
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.preprocessing import image
from tensorflow.keras.preprocessing.image import load_img, img_to_array
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Input
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.optimizers import RMSprop
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau


base_dir = './cat/images/'

In [2]:
# 데이터셋에서 이미지 로드 및 확인
def check_images(directory):
    total_files = sum([len(files) for r, d, files in os.walk(directory)])
    with tqdm(total=total_files, desc="Checking images") as pbar:
        for root, dirs, files in os.walk(directory):
            for file in files:
                if file.endswith(('jpg', 'jpeg', 'png')):
                    img_path = os.path.join(root, file)
                    try:
                        img = load_img(img_path, target_size=(224, 224))  # 이미지 로드 및 크기 조정
                        img_array = img_to_array(img)  # 배열로 변환
                        img_array = img_array / 255.0  # 정규화
                        if img_array.shape != (224, 224, 3): # 이미지 배열의 형태를 검사
                            raise ValueError(f"Unexpected image shape: {img_array.shape}")
                    except Exception as e:
                        print(f"Error loading image {img_path}: {e}")
                    pbar.update(1)

# 이미지 체크
check_images(base_dir)

Checking images: 100%|██████████| 120887/120887 [01:48<00:00, 1115.57it/s]


In [3]:
# 데이터 전처리 (이미지 개수가 충분하므로 증강까지는 안함)
datagen = ImageDataGenerator(
    rescale=1./255,
    validation_split = 0.2 # 훈련과 검증용으로 쪼개기
)

train_generator = datagen.flow_from_directory(
    base_dir,
    target_size=(224, 224),
    batch_size=64,
    class_mode='categorical',
    subset='training',
    interpolation='nearest'
)

validation_generator = datagen.flow_from_directory(
    base_dir,
    target_size=(224, 224),
    batch_size=64,
    class_mode='categorical',
    subset='validation',
    interpolation='nearest'
)

Found 96727 images belonging to 46 classes.
Found 24160 images belonging to 46 classes.


In [4]:
# InceptionResNetV2 모델을 로드하고, include_top=False로 설정하여 FC 레이어를 포함하지 않음
input_tensor = Input(shape=(224, 224, 3))
base_model = MobileNetV2(include_top=False, weights='imagenet', input_tensor=input_tensor)

# 베이스 모델의 일부 층을 동결
for layer in base_model.layers[:100]:  # 상위 100개 층을 동결
    layer.trainable = False

# 베이스 모델의 출력에 GlobalAveragePooling2D 레이어 추가
x = base_model.output
x = GlobalAveragePooling2D()(x)

# 새로운 출력 레이어 추가
num_classes = train_generator.num_classes # 클래스 수 자동 감지
output_tensor = Dense(num_classes, activation='softmax')(x)

# 모델 정의
model = Model(inputs=base_model.input, outputs=output_tensor)

# 모델 요약 출력
model.summary()

  base_model = MobileNetV2(include_top=False, weights='imagenet', input_tensor=input_tensor)


In [5]:
model.compile(
    optimizer=RMSprop(learning_rate=0.001),
    loss='categorical_crossentropy', 
    metrics=['accuracy'],
)

In [6]:
# 콜백 정의
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)
reduce_lr = ReduceLROnPlateau(monitor='val_loss', factor=0.2, patience=3, min_lr=0.0001)

In [7]:
epochs = 30
model.fit(
    train_generator,
    validation_data=validation_generator,
    validation_steps=validation_generator.samples // validation_generator.batch_size,
    epochs=epochs,
    callbacks=[early_stopping, reduce_lr]
)

Epoch 1/30


  self._warn_if_super_not_called()


[1m  35/1512[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m7:28[0m 304ms/step - accuracy: 0.3464 - loss: 2.8695

KeyboardInterrupt: 

In [6]:
model.save('cat_breeds.keras')