## 드라이브 불러오기

In [None]:
from google.colab import drive

drive.mount("/content/drive")

## 이미지 나누기 (train, val, test)

In [None]:
!pip install split-folders

In [None]:
import splitfolders   # 입력된 비율을 기준으로 데이터셋을 분할하는 함수
input_folder = "/content/drive/MyDrive/Capstone/모델링/이미지"
output = "/content/drive/MyDrive/Capstone/모델링/splited_image_LEE" # where you want the split datasets saved. one will be created if it does not exist or none is set

splitfolders.ratio(input_folder, output=output, seed=777, ratio=(.8, .1, .1)) # train,test를 8:2 split 후, train,val을 9:1로 split

## 이미지 파일이 아닌 경우 삭제 (오류 방지)

In [None]:
import os
from PIL import Image

dir_path = "/content/drive/MyDrive/Capstone/모델링/splited_image_LEE"

# 모든 하위 폴더의 파일 탐색
for root, dirs, files in os.walk(dir_path):
    for file in files:
        try:
            # 이미지 파일인 경우에만 처리
            if file.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.gif')):
                # 이미지 열기
                image_path = os.path.join(root, file)
                img = Image.open(image_path)
                img.verify()
        except (IOError, SyntaxError) as e:
            # 손상된 이미지 파일 삭제
            print(f"Removing corrupted file: {image_path}")
            os.remove(image_path)

## 모델링 (CNN-sequential)

In [None]:
import os
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.models import Sequential

# 데이터 경로 설정
file_path = "/content/drive/MyDrive/Capstone/모델링/splited_image_LEE"
train_dir = os.path.join(file_path, 'train')
val_dir = os.path.join(file_path, 'val')
test_dir = os.path.join(file_path, 'test')

# 이미지 데이터 전처리
train_datagen = ImageDataGenerator(rescale=1./255, 
                                   rotation_range=20, 
                                   width_shift_range=0.1, 
                                   height_shift_range=0.1, 
                                   shear_range=0.1, 
                                   zoom_range=0.1, 
                                   horizontal_flip=True, 
                                   vertical_flip=True)
val_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(train_dir, 
                                                    target_size=(224, 224), 
                                                    batch_size=32, 
                                                    class_mode='categorical')
val_generator = val_datagen.flow_from_directory(val_dir, 
                                                target_size=(224, 224), 
                                                batch_size=32, 
                                                class_mode='categorical')
test_generator = test_datagen.flow_from_directory(test_dir, 
                                                   target_size=(224, 224), 
                                                   batch_size=32, 
                                                   class_mode='categorical')

# 간단한 CNN 모델 구성하기
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(256, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Dense(train_generator.num_classes, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 모델 학습
history = model.fit(train_generator, 
                    epochs=10, 
                    validation_data=val_generator)

# 모델 평가
loss, accuracy = model.evaluate(test_generator)
print("Test accuracy:", accuracy)

## 예측

In [None]:
img_path = '/content/drive/MyDrive/Capstone/모델링/LEE_one/predict/만리장성2.jpg' # 예측하고자 하는 이미지 경로
target_size = (224, 224) # 모델이 학습시킨 이미지 사이즈와 동일하게 설정

# 이미지 전처리
img = load_img(img_path, target_size=target_size)
x = img_to_array(img)
x = np.expand_dims(x, axis=0)
x = x / 255.0 # 이미지 스케일링

# 예측
preds = model.predict(x)

# 클래스별 확률 값 출력
class_indices = train_generator.class_indices
class_names = list(class_indices.keys())

for i in range(len(class_names)):
  print(f"{class_names[i]}: {round(preds[0][i]*100, 2)}%")