### 6개키워드 중 하나만 나오게 하는 샘플모델링

## ./crawled_img/(분위기키워드 폴더명)
 - joyful(활발한)
 - adventure(모험적인)
 - cultural(문화적인)
 - tradition(전통적인)
 - nature(자연)
 - art(예술적인)

### CNN 사용한 샘플모델링(데이터 증강X) - 200장

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import img_to_array, load_img
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 이미지 크기 설정
img_size = (224, 224)

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    for img_path in image_paths:
        img = load_img(img_path, target_size=img_size)
        img_array = img_to_array(img)

        # 이미지 명도와 채도 높이기
        if brightness:
            img_array = cv2.convertScaleAbs(img_array, alpha=1.2, beta=30)

        img_array = img_array.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 이미지 데이터 로드 및 전처리
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)[:200]]  # 처음 200개 이미지만 선택

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 모델 학습
model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x20d4aca4b20>

#### 결과
- **훈련 데이터는 높은 정확도를 보임, 하지만 검증 데이터는 정확도가 낮은 양상을 보임**
- **즉, 과적합이 발생**
    - 모델이 훈련데이터에 맞춰져있어 새로운 데이터를 일반화시키지 못함
- **epoch = 20, batch_size = 32, test_size=0.2**
- **코드 수정 방안**
    - 데이터 증강
        - 증강을 너무 많이 쓰면 훈련속도 느려지고, 과도한 증강추가는 효과적이지 않을수있음
    - 모델 복잡도 조정
    - dropout
    - 하이퍼파라미터 조정
    - 에포크 수 조정
    - 더 많은 데이터로 학습시키기
    - 다양한 최적화 알고리즘 사용 : SGD, RMSprop
    - 데이터 제너레이터

## _______________________________________________________

### CNN 사용한 샘플모델링(데이터 증강) - 이미지 200장

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 데이터 증강을 적용하여 모델 훈련
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen.fit(X_train)
model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=20, validation_data=(X_test, y_test))


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x20d4bd580a0>

### CNN 사용한 샘플모델링(데이터 증강, 알고리즘 sgd) - 이미지 200장

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model_sgd = Sequential()
model_sgd.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model_sgd.add(MaxPooling2D((2, 2)))
model_sgd.add(Conv2D(64, (3, 3), activation='relu'))
model_sgd.add(MaxPooling2D((2, 2)))
model_sgd.add(Conv2D(128, (3, 3), activation='relu'))
model_sgd.add(MaxPooling2D((2, 2)))
model_sgd.add(Flatten())
model_sgd.add(Dense(128, activation='relu'))
model_sgd.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일 - 'sgd' 옵티마이저
model_sgd.compile(optimizer='sgd', loss='categorical_crossentropy', metrics=['accuracy'])

# 데이터 증강을 적용하여 모델 훈련 - 'sgd' 모델
datagen_sgd = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen_sgd.fit(X_train)
model_sgd.fit(datagen_sgd.flow(X_train, y_train, batch_size=32), epochs=20, validation_data=(X_test, y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x16c54ee8f40>

### CNN 사용한 샘플모델링(데이터 증강, 알고리즘 rmsprop) - 이미지 200장

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성 - 'rmsprop' 옵티마이저
model_rmsprop = Sequential()
model_rmsprop.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model_rmsprop.add(MaxPooling2D((2, 2)))
model_rmsprop.add(Conv2D(64, (3, 3), activation='relu'))
model_rmsprop.add(MaxPooling2D((2, 2)))
model_rmsprop.add(Conv2D(128, (3, 3), activation='relu'))
model_rmsprop.add(MaxPooling2D((2, 2)))
model_rmsprop.add(Flatten())
model_rmsprop.add(Dense(128, activation='relu'))
model_rmsprop.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일 - 'rmsprop' 옵티마이저
model_rmsprop.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

# 데이터 증강을 적용하여 모델 훈련 - 'rmsprop' 모델
datagen_rmsprop = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen_rmsprop.fit(X_train)
model_rmsprop.fit(datagen_rmsprop.flow(X_train, y_train, batch_size=32), epochs=20, validation_data=(X_test, y_test))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.History at 0x16c5529f790>

## 데이터 증강 이미지 200 에포크 40

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 데이터 증강을 적용하여 모델 훈련
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen.fit(X_train)
model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=40, validation_data=(X_test, y_test))


Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.callbacks.History at 0x2129e305d80>

In [None]:
# 모델 평가
test_loss, test_accuracy = model.evaluate(X_test, y_test)
print(f"테스트 손실: {test_loss}")
print(f"테스트 정확도: {test_accuracy}")

테스트 손실: 1.4168516397476196
테스트 정확도: 0.5708333253860474


### 데이터 증강 이미지 200 에포크 40 얼리스타핑

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.callbacks import EarlyStopping

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# EarlyStopping 콜백 정의
early_stopping = EarlyStopping(monitor='val_accuracy',  # 모니터링할 지표
                               patience=15,             # 지정된 epochs 동안 개선이 없을 경우 학습 중지
                               restore_best_weights=True)  # 가장 좋은 가중치로 복원

# 데이터 증강을 적용하여 모델 훈련
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen.fit(X_train)
history = model.fit(datagen.flow(X_train, y_train, batch_size=32),
                    epochs=40,
                    validation_data=(X_test, y_test),
                    callbacks=[early_stopping])


Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40


In [None]:
# 테스트 데이터에서 모델 평가
test_loss, test_accuracy = model.evaluate(X_test, y_test)
print(f"Test Accuracy: {test_accuracy:.4f}")
print(f"Test Loss: {test_loss:.4f}")

Test Accuracy: 0.6750
Test Loss: 0.8578


In [None]:
from tensorflow.keras.models import save_model, load_model

# 전체 모델 저장
model.save("keyword_image.h5")

# 전체 모델 불러오기
loaded_model = load_model("keyword_image.h5")

### 데이터 증강, 이미지 200, 에포크 60

In [None]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense
from tensorflow.keras.callbacks import EarlyStopping

# 이미지 크기 설정
img_size = (224, 224)
max_images_per_category = 200

# 데이터 로드 및 전처리 함수
def load_and_preprocess_data(image_paths, label, brightness=True):
    data = []
    labels = []

    # 처음부터 200장만 선택
    selected_images = image_paths[:max_images_per_category]

    for img_path in selected_images:
        img = cv2.imread(img_path)

        # 이미지가 비어 있는지 확인
        if img is None:
            print(f"이미지 로딩 중 오류 발생: {img_path}")
            continue

        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = cv2.resize(img, img_size)

        # 이미지 명도와 채도 높이기
        if brightness:
            img = cv2.convertScaleAbs(img, alpha=1.2, beta=30)

        img_array = img.astype('float32') / 255.0  # 이미지를 0과 1 사이 값으로 정규화

        data.append(img_array)
        labels.append(label)

    return np.array(data), np.array(labels)

# 카테고리 리스트
categories = ["joyful", "adventure", "tradition", "nature", "cultural", "art"]
num_classes = len(categories)

# 데이터 로드 및 전처리 함수를 이용하여 데이터 읽기
all_data = []
all_labels = []

for i, category in enumerate(categories):
    category_path = os.path.join("crawled_img", category)
    category_images = [os.path.join(category_path, img) for img in os.listdir(category_path)]

    data, labels = load_and_preprocess_data(category_images, label=i)
    all_data.extend(data)
    all_labels.extend(labels)

# 데이터 합치기 및 레이블 변환
X = np.array(all_data)
y = to_categorical(np.array(all_labels), num_classes=num_classes)

# 학습 및 테스트 데이터로 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# CNN 모델 생성
model1 = Sequential()
model1.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))
model1.add(MaxPooling2D((2, 2)))
model1.add(Conv2D(64, (3, 3), activation='relu'))
model1.add(MaxPooling2D((2, 2)))
model1.add(Conv2D(128, (3, 3), activation='relu'))
model1.add(MaxPooling2D((2, 2)))
model1.add(Flatten())
model1.add(Dense(128, activation='relu'))
model1.add(Dense(num_classes, activation='softmax'))

# 모델 컴파일
model1.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# EarlyStopping 콜백 정의
early_stopping = EarlyStopping(monitor='val_accuracy',  # 모니터링할 지표
                               patience=15,             # 지정된 epochs 동안 개선이 없을 경우 학습 중지
                               restore_best_weights=True)  # 가장 좋은 가중치로 복원

# 데이터 증강을 적용하여 모델 훈련
datagen = ImageDataGenerator(
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,
    fill_mode='nearest'
)

datagen.fit(X_train)
history = model1.fit(datagen.flow(X_train, y_train, batch_size=32),
                    epochs=60,
                    validation_data=(X_test, y_test),
                    callbacks=[early_stopping])


Epoch 1/60
Epoch 2/60
Epoch 3/60
Epoch 4/60
Epoch 5/60
Epoch 6/60
Epoch 7/60
Epoch 8/60
Epoch 9/60
Epoch 10/60
Epoch 11/60
Epoch 12/60
Epoch 13/60
Epoch 14/60
Epoch 15/60
Epoch 16/60
Epoch 17/60
Epoch 18/60
Epoch 19/60
Epoch 20/60
Epoch 21/60
Epoch 22/60
Epoch 23/60
Epoch 24/60
Epoch 25/60
Epoch 26/60
Epoch 27/60
Epoch 28/60
Epoch 29/60
Epoch 30/60
Epoch 31/60
Epoch 32/60
Epoch 33/60
Epoch 34/60
Epoch 35/60
Epoch 36/60
Epoch 37/60
Epoch 38/60
Epoch 39/60
Epoch 40/60
Epoch 41/60
Epoch 42/60
Epoch 43/60
Epoch 44/60
Epoch 45/60
Epoch 46/60
Epoch 47/60
Epoch 48/60
Epoch 49/60
Epoch 50/60
Epoch 51/60
Epoch 52/60
Epoch 53/60
Epoch 54/60
Epoch 55/60


- epoch 수를 늘리수록 train_loss랑 train_accuracy는 수치가 좋아짐
- val_loss는 평균 0.5~0.6 수치를 보임