#  **DETR - Detection Transformer** - 커스텀 데이터셋 미세 조정

- **참조 노트북:** [DETR 커스텀 데이터셋 미세 조정 튜토리얼 (balloon)](https://github.com/NielsRogge/Transformers-Tutorials/blob/master/DETR/Fine_tuning_DetrForObjectDetection_on_custom_dataset_(balloon).ipynb)  

- **원본 DETR 논문:** [End-to-End Object Detection with Transformers (2020)](https://arxiv.org/abs/2005.12872)  

- **원본 DETR 저장소:** [Facebook Research DETR GitHub Repository](https://github.com/facebookresearch/detr)  

---

**설명:**  
- DETR는 Facebook AI Research(FAIR)에서 개발한 **객체 감지(Object Detection)**를 위한 **트랜스포머(Transformer)** 기반 모델입니다.  
- 이 모델은 기존 객체 감지 모델(예: Faster R-CNN, YOLO)과 달리, **Region Proposal Network (RPN)**과 같은 중간 단계를 제거하고 **End-to-End 학습**을 지원합니다.  
- 커스텀 데이터셋에 DETR을 미세 조정(Fine-tuning)하여 객체 감지 성능을 최적화할 수 있습니다.  


In [None]:
# Python 패키지 및 라이브러리 설치
# 객체 감지 및 추적을 위한 Python 라이브러리
# 트랜스포머(Transformer) 모델을 사용하기 위한 라이브러리 (예: BERT, GPT, DETR)
# pytorch-lightning 라이브러리 설치
# PyTorch용 이미지 분류 모델 라이브러리 (EfficientNet, ResNet 등)
# cython 설치
# Python의 C 확장을 지원하여 코드 실행 속도를 높이는 라이브러리
# COCO(Common Objects in Context) 데이터셋을 처리하기 위한 라이브러리
# roboflow 설치

## **COCO 데이터 로더 생성**

### **데이터셋 정보**

- **클래스 수:** **4개**  
- **클래스 목록:**  
   1. **angle (각도)**  
   2. **fracture (균열)**  
   3. **line (선)**  
   4. **messed_up_angle (비뚤어진 각도)**  

---

**설명:**  
- 이 데이터셋은 COCO 포맷을 따르며, 총 **4개의 클래스**로 구성되어 있습니다.  
- 각 클래스는 이미지 내 특정 객체나 패턴을 나타냅니다.  

이제 COCO 데이터셋을 불러오기 위한 데이터 로더를 구성할 준비가 되었습니다!

<img src="https://i.imgur.com/M0VVwIY.png" width=400 />

<img src="https://i.imgur.com/el1lmEJ.png"  width=400/>

Roboflow에서 제공하는 데이터셋 다운로드 (COCO 포맷)
https://universe.roboflow.com/roboflow-100/bone-fracture-7fylg/dataset/2

In [None]:
# 압축 파일 풀기

In [None]:
# 시각화 및 객체 탐지 후처리를 위한 유틸리티 라이브러리
# 컴퓨터 비전용 데이터셋 및 모델 제공
# DETR 모델을 위한 이미지 전처리기
# 'facebook/detr-resnet-50' 사전 학습된 모델의 이미지 전처리기 로드
# 데이터셋 경로 설정
# COCO 포맷 어노테이션 파일 이름
# 학습, 검증, 테스트 데이터 경로 설정
# 사용자 정의 COCO 데이터셋 클래스 생성
class CocoDetection(torchvision.datasets.CocoDetection):
    def __init__(
        # 어노테이션 파일 경로 생성
        # COCO 데이터셋 초기화
    def __getitem__(self, idx):
        # 부모 클래스의 __getitem__ 호출하여 이미지와 어노테이션 불러오기
        # 이미지와 어노테이션을 모델 입력 형태로 변환
# 학습, 검증, 테스트 데이터셋 초기화
# 데이터셋 크기 출력

In [None]:
# 데이터셋이 올바르게 로드되었는지 시각화
# 무작위 이미지 선택
#  이미지 및 어노테이션 불러오기
# COCO 어노테이션을 Detections 객체로 변환
# 클래스 ID를 레이블로 매핑
# 어노테이션 레이블 생성
# 바운딩 박스 어노테이션
# 바운딩 박스 시각화 도구 초기화
# 이미지에 바운딩 박스와 레이블 추가
# 시각화

In [None]:
# 데이터 배치 처리(collate function) 정의
def collate_fn(batch):
    # 배치에서 이미지(pixel_values) 추출
    # 이미지 데이터를 패딩하여 동일한 크기로 맞춤
    # 배치에서 라벨(labels) 추출
    # 패딩된 이미지, 마스크 및 라벨 반환
# 학습 데이터 로더 설정
# 검증 데이터 로더 설정
# 테스트 데이터 로더 설정

# **PyTorch Lightning으로 모델 학습하기**

**DETR 모델**은 **Hugging Face Transformers** 라이브러리를 사용하여 불러옵니다.

In [None]:
# PyTorch Lightning 라이브러리
 # DETR 객체 감지 모델
# DETR 모델 클래스 정의
class Detr(pl.LightningModule):
    def __init__(self, lr, lr_backbone, weight_decay):
        # 사전 학습된 DETR 모델 불러오기
        # 하이퍼파라미터 저장
    def forward(self, pixel_values, pixel_mask):
    def common_step(self, batch, batch_idx):
        # 모델 예측 및 손실 계산
    def training_step(self, batch, batch_idx):
        # 손실 로그 기록
    def validation_step(self, batch, batch_idx):
        # 손실 로그 기록
    def configure_optimizers(self):
        # DETR는 백본과 다른 부분에 서로 다른 학습률을 적용
        # AdamW 옵티마이저 사용
    def train_dataloader(self):
    def val_dataloader(self):

In [None]:
# DETR 모델 인스턴스 생성 및 예측 테스트
# Detr 모델 초기화
# TRAIN_DATALOADER에서 첫 번째 배치를 가져옵니다.
# 배치에는 'pixel_values', 'pixel_mask', 'labels'가 포함됩니다.
# 모델 예측 수행

10 EPOCH 에 약 20분 소요

In [None]:
# PyTorch Lightning Trainer를 사용한 모델 학습
# MAX_EPOCHS = 200  # 최대 학습 에폭 수
#  Trainer 인스턴스 생성
 # Trainer를 사용하여 모델 학습 수행

# Save and load model

In [None]:
# 모델 저장: 학습된 DETR 모델을 HuggingFace 포맷으로 저장
# 모델 불러오기: 저장된 DETR 모델을 다시 로드
# 모델을 실행할 장치로 이동 (예: GPU 또는 CPU)

# **테스트 데이터셋에서 추론 수행**

**DETR 모델**의 예측 결과를 **검증 데이터셋**의 첫 번째 이미지에서 시각화해 봅시다.

In [None]:
# 유틸리티 설정

In [None]:
# 무작위 이미지 선택
# 이미지 및 어노테이션 불러오기

In [None]:
# 실제 어노테이션(Ground Truth) 시각화
# COCO 어노테이션을 Detections 객체로 변환

In [None]:
# 클래스 ID를 이름으로 변환하여 레이블 생성

In [None]:
# 이미지에 실제 어노테이션(바운딩 박스) 그리기
# 추론(Detection) 수행
    # 이미지 전처리 및 입력 텐서 생성
    # 모델 예측 수행
    # 결과 후처리(Post-process)
    # DETR 모델의 예측 결과 변환
    # 예측 결과 이미지에 시각화
# 실제 어노테이션 vs 예측 결과 비교 시각화
# 실제 어노테이션 시각화
# 모델 예측 결과 시각화
# 이미지 표시