# 전이 학습(Transfer Learning) : COVID-19를 흉부 X-ray로 탐지하기

## 🎯 학습 목표
- 전이학습의 개념과 원리를 이해한다
- 사전 훈련된 ResNet18 모델을 활용하여 COVID-19 X-ray 이미지를 분류한다
- 전이학습의 장점과 실제 적용 방법을 체험한다

## 📋 실습 개요
- **작업**: 흉부 X-ray 이미지 3클래스 분류 (Normal, Viral Pneumonia, COVID-19)
- **모델**: 사전 훈련된 ResNet18 + 커스텀 분류기
- **데이터셋**: Kaggle COVID-19 Radiography Dataset
- **데이터 규모**: COVID-19 양성 3,616장, 정상 10,192장, 바이러스성 폐렴 1,345장

## 🔄 전이학습이란?
전이학습(Transfer Learning)은 한 도메인에서 학습된 지식을 다른 도메인에 적용하는 기법입니다.

### 전이학습의 장점:
1. **적은 데이터로도 높은 성능**: 새로운 작업에 맞는 데이터가 적어도 사전 훈련된 모델의 지식을 활용
2. **빠른 훈련 시간**: 처음부터 학습하는 것보다 훨씬 빠름
3. **높은 성능**: ImageNet과 같은 대규모 데이터셋에서 학습된 특징 추출 능력 활용

### 전이학습 전략:
1. **Feature Extraction**: 사전 훈련된 가중치를 고정하고 분류기만 학습
2. **Fine-tuning**: 전체 모델을 낮은 학습률로 미세 조정

In [None]:
# 데이터셋 다운로드 (Google Colab에서 실행)
# Kaggle COVID-19 Radiography Dataset을 사용합니다

In [None]:
# 압축 파일 해제

In [None]:
# 데이터셋 구조 확인
# 각 클래스별 이미지 수 확인

## 📊 데이터셋 구조 설명

### 클래스 구성:
- **Normal**: 정상적인 흉부 X-ray 이미지
- **Viral**: 바이러스성 폐렴 X-ray 이미지  
- **COVID**: COVID-19 감염 X-ray 이미지

### 데이터 분할:
- **Train**: 모델 학습용 데이터
- **Test**: 모델 성능 평가용 데이터

### 특징:
- 의료 영상 데이터로 전문적인 해석이 필요
- 클래스 간 시각적 차이가 미묘할 수 있음
- 전이학습이 특히 효과적인 도메인

In [None]:
# 데이터 전처리 설정
# 학습용 데이터 변환 설정
# 테스트용 데이터 변환 설정

In [None]:
# datasets.ImageFolder를 사용하여 데이터셋 로드
# 이 함수는 주어진 디렉토리 경로에서 이미지 파일들을 자동으로 찾아서 레이블을 할당

In [None]:
# 학습 데이터 로더 생성
# 테스트 데이터 로더 생성
# 학습 및 테스트 배치 수 출력

## 데이터 시각화

In [None]:
# 클래스 이름 가져오기 (정상, 바이러스성 폐렴, COVID-19)

In [None]:
# 이미지를 보여주는 함수 정의
def show_images(images, labels, preds):
    # 각 이미지를 순회하며 표시
        # 정규화 해제를 위한 평균 및 표준편차 설정
        # 예측이 틀린 경우 레이블 색상을 빨간색으로 설정
        # 실제 클래스 레이블과 예측 클래스 레이블 표시

In [None]:
# 학습 데이터 로더에서 첫 번째 배치의 이미지와 레이블을 가져옴
# 이미지와 실제 레이블을 사용하여 이미지 표시 함수 호출 (예측 값은 실제 레이블로 설정)

## Model 생성

In [None]:
# 사전 훈련된 ResNet18 모델 로드
# 모델 파라미터 수 확인

In [None]:
# 🔧 전이학습을 위한 모델 수정
# ResNet18의 마지막 FC 레이어를 3클래스 분류에 맞게 수정
# 모델을 GPU로 이동
# 손실 함수와 옵티마이저 설정
# 수정된 모델의 파라미터 수 확인

In [None]:
# 예측 결과를 시각화하는 함수 정의
def show_preds():
# 예측 결과 시각화 함수 호출

## Model 학습

In [None]:
# 🚀 모델 학습 시작
# 학습 과정 추적을 위한 리스트
    # 훈련 단계
        # 순전파
        # 역전파
        # 훈련 정확도 계산
        # 진행 상황 출력
    # 훈련 결과 계산
    # 검증 단계
    # 검증 결과 계산
    # 에포크 결과 출력
    # 예측 결과 시각화

In [None]:
# 📊 학습 결과 분석 및 시각화
# 학습 곡선 시각화
# 상세 성능 분석

In [None]:
# 🔍 혼동 행렬(Confusion Matrix) 분석
def evaluate_model_detailed(model, test_loader):
# 모델 평가
# 혼동 행렬 생성
# 혼동 행렬 시각화
# 분류 보고서 출력
# 클래스별 정확도 분석