<a href="https://colab.research.google.com/github/richpapakr/AIFFEL_quest_cr/blob/master/MainQuest/Quest03/Main_Quest_03.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# IMPORTANT: RUN THIS CELL IN ORDER TO IMPORT YOUR KAGGLE DATA SOURCES,
# THEN FEEL FREE TO DELETE THIS CELL.
# NOTE: THIS NOTEBOOK ENVIRONMENT DIFFERS FROM KAGGLE'S PYTHON
# ENVIRONMENT SO THERE MAY BE MISSING LIBRARIES USED BY YOUR
# NOTEBOOK.
import kagglehub
paultimothymooney_chest_xray_pneumonia_path = kagglehub.dataset_download('paultimothymooney/chest-xray-pneumonia')

print('Data source import complete.')


# Main_Quest 03 프로젝트 제출

# 1. 개요

본 보고서는 의료영상 처리를 위해 CNN(Convolutional Neural Network) 기반 베이스 모델을 구현하고,
다양한 기법을 활용하여 성능을 비교하는 과정을 다룹니다.

특히 데이터 증강(Augmentation), 모델 구조 변경, ResNet-18 적용 등을 통해 성능 차이를 분석합니다.

# 2. 목차

1.개요

2.목차

3.CNN 기반 의료영상 베이스 모델 구현

4.데이터 증강(Augmentation) 기법 적용 및 성능 비교

5.모델 구조 변경을 통한 성능 비교

6.ResNet-18 모델 구현 및 학습

7.Summary

8.회고

9.Reference

# 3. CNN 기반 의료영상 베이스 모델 구현

**(1) 데이터셋 준비**

사용 데이터셋: 의료영상(예: X-ray, MRI) 데이터

전처리 과정:

이미지 크기 조정 (256x256)

정규화 (Normalization)

학습/검증/테스트 세트 분리

**(2) CNN 베이스 모델 구축**

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models

def build_base_model():
    model = models.Sequential([
        layers.Conv2D(32, (3, 3), activation='relu', padding='same', input_shape=(256, 256, 3)),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(64, (3, 3), activation='relu', padding='same'),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(128, (3, 3), activation='relu', padding='same'),
        layers.MaxPooling2D((2, 2)),
        layers.Flatten(),
        layers.Dense(128, activation='relu'),
        layers.Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

base_model = build_base_model()
base_model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


# 4. 데이터 증강(Augmentation) 기법 적용 및 성능 비교

**(1) 데이터 증강 기법 적용**

In [None]:
import os, re
import random, math
import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings(action='ignore')

In [None]:
# 데이터 로드할 때 빠르게 로드할 수 있도록하는 설정 변수
AUTOTUNE = tf.data.experimental.AUTOTUNE
# X-RAY 이미지 사이즈 변수
IMAGE_SIZE = [180, 180]

# 데이터 경로 변수
ROOT_PATH = os.path.join(os.getenv('HOME'), 'aiffel')
TRAIN_PATH = ROOT_PATH + '/chest_xray/data/train/*/*' # *은 모든 디렉토리와 파일을 의미합니다.
VAL_PATH = ROOT_PATH + '/chest_xray/data/val/*/*'
TEST_PATH = ROOT_PATH + '/chest_xray/data/test/*/*'

# 프로젝트를 진행할 때 아래 두 변수를 변경해보세요
BATCH_SIZE = 16
EPOCHS = 10

print(ROOT_PATH)

/root/aiffel


In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

data_gen = ImageDataGenerator(
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
    zoom_range=0.2,
    rescale=1./255
)
train_generator = data_gen.flow_from_directory('/kaggle/working', target_size=(256, 256), batch_size=32, class_mode='binary')

Found 0 images belonging to 1 classes.


**(2) 데이터 증강 후 성능 비교**

기본 CNN 모델 vs 데이터 증강 적용 모델 학습 결과 비교

기대 효과: 데이터 다양성을 증가시켜 과적합(overfitting) 방지

# 5. 모델 구조 변경을 통한 성능 비교

**(1) CNN 구조 변경**

추가적인 Batch Normalization 및 Dropout 적용

성능 비교: 기존 모델 대비 정확도 향상 여부 확인

In [None]:
def build_modified_model():
    model = models.Sequential([
        layers.Conv2D(32, (3, 3), activation='relu', padding='same', input_shape=(256, 256, 3)),
        layers.BatchNormalization(),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(64, (3, 3), activation='relu', padding='same'),
        layers.BatchNormalization(),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(128, (3, 3), activation='relu', padding='same'),
        layers.BatchNormalization(),
        layers.MaxPooling2D((2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(128, activation='relu'),
        layers.Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
    return model

modified_model = build_modified_model()
modified_model.summary()

# 6. ResNet-18 모델 구현 및 학습

**(1) ResNet-18 모델 구현**

In [None]:
import tensorflow.keras.applications as applications

resnet_model = applications.ResNet50(weights=None, input_shape=(256, 256, 3), classes=1)
resnet_model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

**(2) 학습 및 평가**

ResNet-18 모델을 학습한 후, 기존 모델과 성능 비교

예상 기대 효과: Residual Connection을 통한 더 깊은 네트워크 학습 가능

# 7. Summary

모델별 비교해보면

**Base CNN**은 데이터 증강이 안되고 구조 변경이 안됨.

**Augmented CNN**은 데이터 증강이 되며 구조 변경이 안됨.

**ResNet-18**은 데이터 증강은 안되나 변경된 구조는 Pretrainde ResNet을 통해 가장 높은 정확도를 기록함.

# 8. 회고

**어려웠던 점**은 전부다.

ResNet-18을 직접 구현하는 과정에서 Layer 구조 이해 필요함.

의료영상 데이터의 레이블이 불균형한 문제 존재함으로 해결해야할 과제임.

**개선할 점**

데이터 증강 기법을 더 다양하게 적용해 볼 필요가 있다.

하이퍼파라미터 튜닝을 통해 모델 최적화 가능함.

**배운 점**

CNN 모델 구조 변화가 성능에 미치는 영향과

Residual Connection이 깊은 네트워크에서 중요한 역할을 함

In [None]:
os.getcwd()


'/kaggle/working'