# [YOLOv8](https://docs.ultralytics.com/)

## 설치

1. 파이토치 설치
2. YOLOv8 설치
    - `pip install ultralytics`
3. 주피터노트북에서 실행할 경우 프로그래스바를 실행하기 위해서 다음을 설치한다. (필수는 아님)
    - `conda install -y -c conda-forge ipywidgets`

## 사용
- CLI (command line interface)에서 터미널 명령어로 추론/평가/학습을 진행할 수 있다.
- Python lib 를 이용해 코드상에 원하는 추론/평가/학습을 진행할 수 있다.

# CLI 기본 명령어 구조

- 구문
    - <span style='font-size:1.3em'>**yolo**  **task**=detect|classify|segment  **mode**=train|val|predict  **model**=yolov8n.yaml|yolov8n.pt|..  **args**</span>
    - <b style='font-size:1.2em'>task:</b> \[detect, classify, segment\] 중 하나를 지정한다. \[optional\]로 생략하면 model을 보고 추측해서 task를 정한다.
        - **detect:** Object detection
        - **classify:** Image classification
        - **segment:** Instance segmentation
    - <b style='font-size:1.2em'>mode:</b> \[train, val, predict, export\] 중 하나를 지정한다. \[필수\]로 입력해야 한다.
        - **train:** custom dataset을 train 시킨다.
        - **val:** 모델 성능을 평가한다.
        - **predict:** 입력 이미지에 대한 추론을 한다.
        - **export:** 모델을 다른 형식으로 변환한다.
    - <b style='font-size:1.2em'>model:</b> **pretrained 모델**이나 **모델 설정 yaml 파일**의 경로를 설정한다. \[필수\]로 입력해야 한다.
        - pretrained 모델 파일경로
            - task에 맞는 pretrained 모델파일의 저장 경로를 지정한다.
            - transfer learnging을 하거나 fine tuning 시 방법
        - 모델 구조 설정 yaml 파일 경로
            - task에 맞는 pretrained 모델 설정파일(yaml파일)의 경로를 지정한다.
            - train mode에서 지정하며 모델을 새로 생성해서 처음부터 학습 시킬 경우 지정한다.
        - Ultralytics에서 제공하는 Pretrained 모델
            - 모델 크기에 따라 5개의 모델을 제공하며 큰 모델은 작은 모델에 비해 추론 성능이 좋은대신 속도는 느리다.
            - 모델은 처음 추론또는 학습할때 local 컴퓨터에 없으면 download 받는다.
            - https://github.com/ultralytics/ultralytics#models
            - ### 제공 모델
            
            | **task\모델크기**           | **nano** | **small_** | **medium** | **large** | **xlarge** |
            |:--------------------|----------|-------------|------------|-----------|----------|
            | **detection**      | yolov8n  | yolov8s     | yolov8m    | yolov8l   | yolov8x    |
            | **segmentation**   | yolov8n-seg  | yolov8s-seg     | yolov8m-seg    | yolov8l-seg   | yolov8x-seg    |
            | **classification** | yolov8n-cls  | yolov8s-cls     | yolov8m-cls    | yolov8l-cls   | yolov8x-cls    |         
            | **pose estimation** | yolov8n-pose  | yolov8s-pose     | yolov8m-pose    | yolov8l-pose   | yolov8x-pose    |
            
            - 확장자가 `pt`이면 pretrained 된 모델을, `yaml`이면 모델 구조 설정파일을 download하여 실행한다.
                - pretrained model은 fine tuning이나 추론할 때, yaml설정파일은 처음부터 학습할 경우 설정하여 받는다.
    - <b style='font-size:1.2em'>args:</b> task와 mode과 관련한 추가 설정값들을 지정한다.
        - https://docs.ultralytics.com/cfg/

# [Object Detection](https://docs.ultralytics.com/tasks/detection/)

##  Predict (추론)

### 모델로딩
- Ultralytics에서 제공하는 Pretrained Model이나 직접 학습시킨 모델을 이용해 추론한다.
- Ultralytics는 Object Detection을 위한 [Pretrained 모델](#제공-모델)을 제공한다.
    - Object Detection 모델은 COCO dataset으로 학습되었다.
    - 모델 명을 지정하면 자동으로 다운로드를 받는다.

### CLI
`yolo task=detect mode=predict model=model_path source=추론할_image_path`
- 추가 설정 (configuration)
    - https://docs.ultralytics.com/cfg
    

In [None]:
!pip install ultralytics --upgrade

In [None]:
!yolo  task=detect  mode=predict   model=models/yolov8s.pt   source=test_image/3.jpg  save=True  save_txt=True  line_width=1

### Python

In [None]:
from ultralytics import YOLO

In [None]:
model = YOLO("models/yolov8m.pt")  # YOLO 클래스 객체 생성하면서 사용할 pretrained model의 경로를 지정.

In [None]:
image_path = 'test_image/2.jpg'
result_list = model(image_path, save=True, save_txt=True, line_width=1)

In [None]:
type(result_list), len(result_list)
# 리스트에 추론한 결과를 추론한 이미지별로 저장해서 반환.

In [None]:
type(result_list[0])

### 한번에 여러장 추론
- 추론할 파일경로를 리스트로 묶어서 추론한다.

In [None]:
from glob import glob
file_path = glob('test_image/*.jpg')
file_path

In [None]:
model = YOLO('models/yolov8m.pt')
result_list = model(file_path, save=True, save_txt=True, line_width=1)

In [None]:
len(result_list), type(result_list[0])

### web 상의 이미지 추론

In [None]:
result_list = model("https://ultralytics.com/images/bus.jpg", save=True)

In [None]:
result_list = model('https://storage3.ilyo.co.kr/contents/article/images/2015/0601/1433148424953500.jpg', save=True)

## 추론결과

### ultralytics.yolo.engine.results.Results
- 모델의 추론 결과는 list에 이미지별 예측결과를 Results에 담아 반환한다.
- **Results** : 한개 이미지에 대한 추론결과를 담는 객체
- 추론 종류에 따라 다음 속성을 이용해 결과를 조회한다.
    - Detection: `result.boxes` - Boxes type
    - Segmentation: `result.masks` - Masks type
    - Classification: `result.probs` - torch.Tensor type
    - Pose: `result.keypoints` - Keypoints type
- 추가 정보
    - Results.orig_img: 추론한 원본 이미지
    - Results.orig_shape: 추론한 원본 이미지의 크기 (height, width)
    - Results.path: 추론한 원본이미지의 경로

In [None]:
from ultralytics import YOLO

model = YOLO('models/yolov8m.pt')
result_list = model('bus.jpg', save=True)

In [None]:
type(result_list), len(result_list), type(result_list[0])

In [None]:
# 추론한 원본 이미지에 대한 정보
result = result_list[0]
print('원본 이미지 경로:', result.path)
print('원본 이미지 크기:', result.orig_shape)
print('원본 이미지:', result.orig_img.shape)

### Object Detection 결과값 조회

- ultralytics.yolo.engine.results.**Boxes**에 추론 결과를 담아 반환
    - Results.boxes로 조회
- 주요 속성
    - shape: 결과 shape. (찾은 물체개수, 6)
    - boxes
        - 6: 좌상단 x, 좌상단 y, 우하단 x, 우하단 y, confidence score, label
    - xyxy
        - bounding box의 `좌상단 x, 좌상단 y, 우하단 x, 우하단 y` 좌표 반환
    - xyxyn
        - xyxy를 이미지 대비 비율로 반환
    - xywh
        - bounding box의 `center x, center y, 너비, 높이` 를 반환
    - xywhn
        - xywh를 이미지 대비 비율로 반환
    - cls: 찾은 물체의 label
    - conf: cls에 대한 confidence score (그 물체일 확률)
    - boxes
        - `x, y, x, y, conf, cls` tensor를 반환

In [None]:
boxes = result.boxes  # detection한 결과를 조회 (Boxes 객체)
print(type(boxes))

In [None]:
boxes.shape
# [n, 6] : n-찾은 bbox(object) 개수,  6-x y x y label conf  (x y x y : 좌상단 우하단 좌표)

In [None]:
# 찾은 bbox들에 대한 classification 정보
print(boxes.cls)  # 찾은 n개 bbox에 대한 class 들을 반환.
print(boxes.conf) # 찾은 n개 bbox에대한 confidence score(확률) 들을 반환

In [None]:
# bbox의 위치정보
print(boxes.xyxy)  # 좌상단 우하단 x/y좌표
print(boxes.xyxyn) #이미지크기 대비 비율

In [None]:
print(boxes.xywh)  # center x, y좌표, bbox width, height
print(boxes.xywhn)  # center x, y좌표, bbox width, height 이미지크기 대비 비율

In [None]:
from module import util

print(util.get_color(0))
print(util.get_coco80_classname(0))
print(util.get_imagenet_classname(1))

In [None]:
idx = boxes.cls[0]

util.get_coco80_classname(int(idx.item()))

In [None]:
# 원본 이미지에 추론 결과를 출력
import cv2
from ultralytics import YOLO

model = YOLO('models/yolov8m.pt')
path = 'bus.jpg'
path = 'test_image/1.jpg'
result_list = model(path, save=True)
result = result_list[0]

org_img = result.orig_img  #BGR
img = org_img.copy()

boxes = result.boxes
xyxy_list = boxes.xyxy  #좌상단/우하단 좌표
cls_list = boxes.cls    #label
conf_list = boxes.conf  #label  확률.
for xyxy, cls, conf in zip(xyxy_list, cls_list, conf_list):
#     print(xyxy, conf, cls)
    xyxy_arr = xyxy.to('cpu').numpy().astype('int32')
    pt1 = xyxy_arr[:2]
    pt2 = xyxy_arr[2:]
    
    label_name = util.get_coco80_classname(int(cls.item()))
    txt = f"{label_name}-{conf.item()*100:.2f}"
    
    color = util.get_color(int(cls.item()) % 10)
    # bbox
    cv2.rectangle(img, pt1=pt1, pt2=pt2, color=color, thickness=2)
    # label
    cv2.putText(img, text=txt, org=pt1-5, fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=0.5, 
                color=color, thickness=1, lineType=cv2.LINE_AA)


In [None]:
cv2.imshow('frame', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 실시간 Detection


In [None]:
import cv2
from module import util
from ultralytics import YOLO

# 웹캠 연동
cap = cv2.VideoCapture(0)
# 모델 생성
model = YOLO('models/yolov8n.pt')
while True:
    # 한 Frame 읽기
    success, frame = cap.read()
    if not success:
        print('프레임을 읽지 못함')
        break
        
    frame = cv2.cvtColor(cv2.flip(frame, 1), cv2.COLOR_BGR2RGB)
    
    result = model(frame)[0]
    xyxy_list = result.boxes.xyxy.to('cpu').numpy().astype('int32')
    cls_list = result.boxes.cls.to('cpu').numpy().astype('int32')
    conf_list = result.boxes.conf.to('cpu').numpy()
    
    for xyxy, cls, conf in zip(xyxy_list, cls_list, conf_list):
        pt1, pt2 = xyxy[:2], xyxy[2:]
        txt = f"{util.get_coco80_classname(cls)}-{conf*100:.2f}%"
        color = util.get_color(cls % 10)
        cv2.rectangle(frame, pt1, pt2, color=color)
        cv2.putText(frame, txt, org=pt1, fontFace=cv2.FONT_HERSHEY_SIMPLEX, fontScale=1,
                    color=color, thickness=2, lineType=cv2.LINE_AA)
        
    # 화면에 출력
    cv2.imshow('frame', cv2.cvtColor(frame, cv2.COLOR_BGR2RGB))
    if cv2.waitKey(1) == 27: # esc 
        break
        
cv2.destroyAllWindows()
cap.release()