## **Custom Dataset로 Yolov8 재학습하여 객체 감지 예측하기**

**< 진행 절차 >**
1. Data 준비하기 : Custom Dataset Dataset으로 Yolov8 재학습(Fine Tuning)하는 경우에는 Image / Annotation 으로 이루어진 Dataset 준비
    - Roboflow에서 제공하는 Training Dataset을 이용하거나 Labeling Tool 을 이용하여 개발자가 직접 Labeling 시킨 Image / Annotation으로 이루어진 Training Dataset을 구축해야함
    - Custom Dataset 구축시 이미지 데이터와 정답데이터는 확장자를 제외한 파일 이름은 동일해야하며 Yolov8에서 annotation 파일 즉 정답 파일의 확장자는 반드시 .txt 여야 함         

- 1) Roboflow 에서 Aquarium Dataset (custom data) 다운로드
    - Colab 으로 데이터셋 업로드 : Roboflow(https://public.roboflow.com/)에서 제공하는 Dataset 로드하기
- 2) yaml 파일 설정** (데이터셋 위치 알려주는 config file)
    - 2-1) roboflow 에서 제공되는 data.yaml 파일 확인
    - 2-2) custom data에 대한 yaml 파일 만들기
    Yolov8으로 Custom Data를 학습하기 위해서는 YAML 파일이 반드시 필요. YAML 파일에는 다음 정보를 포함해야함
        - 이미지와 정답이 저장되어 있는 디렉토리 정보
        - 인식하고 싶은 클래스 종류와 대응대는 각각의 이름
        - 형식 : 클래스번호 | x의 center 좌표|y의 center좌표| 너비 |높이  
            - 전체 이미지의 width 와 height 값으로 나눈 비율값임

2. ultralytics 패키지 설치하기
```python
pip install ultralytics
```
3. 모델 객체 선언하고 학습하기
```python
from ultralytics import YOLO
model = YOLO('yolov8n-seg.pt')  #  model = YOLO('yolov8n-seg.pt')
model.train(data='mydata.yaml', epochs=10)
```
4. 객체 검출하기
```python
results = model.predict(source='/content/test/')
```
5. 결과 확인하기
6. 결과 다운로드하기
7. 학습된 모델 내보내기
8. 웹캠에서 모델 사용하여 객체 검출하기

## **1. 데이터 준비하기(Custom Data 구축)**
- Roboflow에서 제공하는 Training Dataset을 이용

### 1) Roboflow 에서 Aquarium Dataset (custom data) 다운로드
- Public Dataset : https://public.roboflow.com/object-detection/aquarium/2
- Download Dataset > Export - Select Format : Yolov8, show download code 선택 후  continue 버튼 클릭 > Your Download Code - Raw URL 탭에서 주조 복사하기

In [1]:
# Roboflow 에서 직접 다운로드

!wget -O TACO_Data1.zip https://universe.roboflow.com/ds/xXC7BINMyr?key=mUADdMGHFn

--2024-05-10 04:12:17--  https://universe.roboflow.com/ds/xXC7BINMyr?key=mUADdMGHFn
Resolving universe.roboflow.com (universe.roboflow.com)... 151.101.1.195, 151.101.65.195, 2620:0:890::100
Connecting to universe.roboflow.com (universe.roboflow.com)|151.101.1.195|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://storage.googleapis.com/roboflow-platform-regional-exports/arRagmpkRzqLfrKDYQ18/C81DPW344cTH8hw4toez/16/yolov8.zip?X-Goog-Algorithm=GOOG4-RSA-SHA256&X-Goog-Credential=481589474394-compute%40developer.gserviceaccount.com%2F20240510%2Fauto%2Fstorage%2Fgoog4_request&X-Goog-Date=20240510T041218Z&X-Goog-Expires=900&X-Goog-SignedHeaders=host&X-Goog-Signature=1739d27673ad7bb7b86dc16b41efe3e892f1ee953a78d5b42b5c29577c0a8656a0d9bd8c49c75000239b513857f29061b5e5d6d7407aed6c40e5214be3c1a3a086b99bede70f6f6c175c42c31ee32163e507b5c677d60483553f924457e05306224c444a5828344cdea6a364e24f93386b169822c76b02d7d5c4e6c34d09407eda00e757e8b24da207185d73752b2c5fdf8370f

- 압축파일 해제하기

In [2]:
import zipfile

with zipfile.ZipFile('/content/TACO_Data1.zip') as target_file:
    target_file.extractall('/content/TACO_Data/')

## **2) yaml 파일 설정** (데이터셋 위치 알려주는 config file)
- YAML : 데이터 표현 양식의 한 종류
- 기본적으로 들여쓰기(indent)를 원칙으로하며 데이터는 Map(key-value)형식으로 작성

### 2-1) roboflow 에서 제공되는 data.yaml 파일 확인

In [3]:
!cat /content/TACO_Data/data.yaml

train: ../train/images
val: ../valid/images
test: ../test/images

nc: 1
names: ['trash']

roboflow:
  workspace: mohamed-traore-2ekkp
  project: taco-trash-annotations-in-context
  version: 16
  license: CC BY 4.0
  url: https://universe.roboflow.com/mohamed-traore-2ekkp/taco-trash-annotations-in-context/dataset/16

### 2-2) custom data에 대한 yaml 파일 만들기

In [4]:
# 파이썬에서 YAML 파일을 사용하기 위해 PyYAML 라이브러리 설치
!pip install PyYAML



In [19]:
# yaml 파일을 학습이 가능하도록 경로 설정.
# key-value 데이터인 dict 데이터타입으로 data['train'], data['val'], data['nc'], data['names'] 에 넣어주는데,
# 가장 중요한 부분은 데이터 경로 설정임.

import yaml
# 디렉토리 정보, 클래스 이름(names), 클래스 수(nc) 지정하기
import yaml
with open('/content/TACO_Data/data.yaml') as f:
    data = yaml.full_load(f)

print(data)
data['train'] = '/content/TACO_Data/train/'
data['val'] = '/content/TACO_Data/val/'

# 데이터 경로와 클래스 정보를 저장하고 있는 딕셔너리 객체 data를 YOLOv8 학습에 필요한 새로운 이름으로 저장
with open('/content/TACO_Data/data.yaml', 'w') as f:
    yaml.dump(data, f)

# Aquarium_Data.yaml 읽어서 화면에 출력
with open('/content/TACO_Data/data.yaml', 'r') as f:
  aquarium_yaml = yaml.safe_load(f)
  display(aquarium_yaml)

{'names': ['trash'], 'nc': 1, 'roboflow': {'license': 'CC BY 4.0', 'project': 'taco-trash-annotations-in-context', 'url': 'https://universe.roboflow.com/mohamed-traore-2ekkp/taco-trash-annotations-in-context/dataset/16', 'version': 16, 'workspace': 'mohamed-traore-2ekkp'}, 'test': '../test/images', 'train': '/content/TACO_Data/train.txt', 'val': '/content/TACO_Data/val.txt'}


{'names': ['trash'],
 'nc': 1,
 'roboflow': {'license': 'CC BY 4.0',
  'project': 'taco-trash-annotations-in-context',
  'url': 'https://universe.roboflow.com/mohamed-traore-2ekkp/taco-trash-annotations-in-context/dataset/16',
  'version': 16,
  'workspace': 'mohamed-traore-2ekkp'},
 'test': '../test/images',
 'train': '/content/TACO_Data/train/',
 'val': '/content/TACO_Data/val/'}

In [20]:
!cat /content/TACO_Data/data.yaml

names:
- trash
nc: 1
roboflow:
  license: CC BY 4.0
  project: taco-trash-annotations-in-context
  url: https://universe.roboflow.com/mohamed-traore-2ekkp/taco-trash-annotations-in-context/dataset/16
  version: 16
  workspace: mohamed-traore-2ekkp
test: ../test/images
train: /content/TACO_Data/train/
val: /content/TACO_Data/val/


## **2. yolov8 사용을 위한 패키지 설치 및 가져오기**
- https://github.com/ultralytics/ultralytics

In [21]:
# PyTorch window 에 설치
#- https://pytorch.org/get-started/locally/
# !pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

# 위 실행해서 안되면 아래 명령 실행
#!conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=12.1 -c pytorch -c nvidia

In [22]:
# 패키지 설치하기
!pip install -q ultralytics

In [23]:
# 패키지 버전 확인하기
import ultralytics

ultralytics.checks()

Ultralytics YOLOv8.2.11 🚀 Python-3.10.12 torch-2.2.1+cu121 CUDA:0 (Tesla T4, 15102MiB)
Setup complete ✅ (2 CPUs, 12.7 GB RAM, 30.5/78.2 GB disk)


In [24]:
import torch
torch.cuda.get_device_name(0)
torch.cuda.is_available()
print(torch.__version__)

# GPU가 사용 가능한지 확인하고, 사용 가능하면 CUDA를 사용하도록 설정
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

2.2.1+cu121
Using device: cuda


## **3.모델 객체 선언하고 학습하기**

### 1) 모델 객체 선언하기

In [25]:
# YOLO 라이브러리 가져오기
from ultralytics import YOLO   # ... code here

# 'yolov8n-seg.pt' 모델 선언하기 - 사전학습된 YOLOv8n detection model 로드하기
model = YOLO('yolov8n-seg.pt')     # ... code here

In [26]:
# Yolov8은 MS COCO 데이터 사전학습되어있어 MS COCO Dataset에 정의된 클래스 개수오 ㅏ종류 확인할 수 있음(0~79)
print(type(model.names), len(model.names))

print(model.names)

<class 'dict'> 80
{0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck', 8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench', 14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear', 22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase', 29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat', 35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle', 40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple', 48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut', 55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet', 62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell p

### 2) 모델 학습하기 (자신의 만든 yaml파일 지정)

In [27]:
# 모델 학습하기 (자신의 만든 yaml파일 지정)
model.train(data='/content/TACO_Data/data.yaml', epochs=50, patience=30, batch=32, imgsz=416)

Ultralytics YOLOv8.2.11 🚀 Python-3.10.12 torch-2.2.1+cu121 CUDA:0 (Tesla T4, 15102MiB)
[34m[1mengine/trainer: [0mtask=segment, mode=train, model=yolov8n-seg.pt, data=/content/TACO_Data/data.yaml, epochs=50, time=None, patience=30, batch=32, imgsz=416, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train4, exist_ok=False, pretrained=True, optimizer=auto, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False, embed=None, show=False, save_frames=False, save_txt=False, save_conf=False, save_crop=False, show_labels=True, s

RuntimeError: Dataset '/content/TACO_Data/data.yaml' error ❌ 
Dataset '/content/TACO_Data/data.yaml' images not found ⚠️, missing path '/content/TACO_Data/val'
Note dataset download directory is '/content/datasets'. You can update this in '/root/.config/Ultralytics/settings.yaml'

In [16]:
# 커스텀 데이터로 학습하였기 때문에 클래수 수의 변경됨을 확인할 수 있음
print(type(model.names), len(model.names))

print(model.names)

<class 'dict'> 80
{0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck', 8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench', 14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear', 22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase', 29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat', 35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle', 40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple', 48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut', 55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet', 62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell p

### ▲ train 과정중에 loss, accuracy 등의 graph 데이터는 runs/detect/train/ 에 있는 results.csv 와 results.png 통해서 확인가능함

### 3) 테스트 이미지 데이터 생성 및 확인

In [None]:
# 테스트 이미지
from glob import glob

test_image_list = glob('/content/TACO_Data/test/images/*')
test_image_list.sort()

for i in range(len(test_image_list)):
    print('i = ',i, test_image_list[i])

## **4.객체 검출 (Inference or predict)**

In [None]:
results =  model.predict(source=test_image_list, save=True)    # ... code here

## **5. 결과 확인하기**

In [None]:
print(type(results), len(results))

In [None]:
import numpy as np

for result in results:
    uniq, cnt = np.unique(result.boxes.cls.cpu().numpy(), return_counts=True)  # Torch.Tensor -> numpy
    uniq_cnt_dict = dict(zip(uniq, cnt))

    print('\n{class num : counts} =', uniq_cnt_dict,'\n')

    for i, c in enumerate(result.boxes.cls):
        class_id = int(c)
        class_name = result.names[class_id]
        confidence_score = result.boxes.conf[i]  # 예측 확률
        print(f'class num: {class_id:>2} , class name: {class_name :<13}, confidence: {confidence_score:.2f}')

In [None]:
# 테스트 이미지 모두 예측 결과 이미지로 나타내기
from PIL import Image
from IPython.display import display
import os

# 이미지가 저장된 폴더 경로
image_dir = "runs/segment/predict"    # ... code here

# 폴더 내의 모든 파일을 순회
for file_name in os.listdir(image_dir):
    file_path = os.path.join(image_dir, file_name)
    # 파일 확장자가 .jpg인 경우에만 처리
    if file_path.endswith('.jpg'):
        with Image.open(file_path) as img:
            display(img)

## **6. 결과 다운로드**

In [None]:
import glob

detetced_image_list = glob.glob(('/content/runs/segment/predict/*'))
detected_image_nums = len(detetced_image_list)

print(detected_image_nums)
print(detetced_image_list)

In [None]:
# 다운로드를 위한 inference image 압축

import zipfile
import os

if not os.path.exists('/content/detected_result/'):
    os.mkdir('/content/detected_result/')
    print('detected_result dir is created !!!')

with zipfile.ZipFile('/content/detected_result/detected_images.zip', 'w') as detected_images:

    for idx in range(detected_image_nums):
        detected_images.write(detetced_image_list[idx])

## **CVAT** 을 사용하여 Object Detection을 위한 사용자 데이터셋 정의하기
- CVAT : nnotation Platform
- https://www.cvat.ai/ : Open Data


## **7.학습된 모델 내보내기**

In [None]:
# 모델을 내보내기
model.save('trained_yolov8n.pt')

# 내보낸 모델을 로드하여 사용
model = YOLO('trained_yolov8n.pt')

## 8. 테스트 이미지로 테스트 또는 웹캠 이용해 실시간 추론하기

In [None]:
# 이미지에 대한 추론 수행
results = model('test_image.jpg')
print(results.pandas().xyxy[0])  # 추론 결과 출력

In [None]:
# 학습된 모델을 로드합니다.
model = YOLO('trained_yolov8n.pt')

# 웹캠 초기화
cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # 모델을 사용하여 프레임에서 객체 감지
    results = model(frame)

    # 결과를 프레임에 그리기
    annotated_frame = results.render()[0]

    # 화면에 표시
    cv2.imshow("YOLOv8 Real-Time Detection", annotated_frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()