# [YOLOv8](https://docs.ultralytics.com/)

## 설치

- `pip install ultralytics`
- 주피터노트북에서 실행할 경우 프로그래스바를 실행하기 위해서 다음을 설치한다. (필수는 아님)
    - `pip install ipywidgets` or `conda install -y -c conda-forge ipywidgets`

## 실행 방법
- CLI (command line interface)에서 터미널 명령어로 추론/평가/학습을 진행할 수 있다.
    - 모델이 처리한 결과를 최종결과로 사용할 경우 이 방법으로 처리한다.
- Python lib 를 이용해 코드상에 원하는 추론/평가/학습을 진행할 수 있다.
    - 모델이 처리한 결과를 받아서 추가 작업이 필요한 경우 이 방법으로 처리한다.

# CLI 기본 명령어 구조

- 구문
    - <span style='font-size:1.3em'>**yolo**  **task**=detect|classify|segment|pose  **mode**=train|val|predict  **model**=yolov8n.yaml|yolov8n.pt|..  **args**</span>
    - <b style='font-size:1.2em'>task:</b> \[detect, classify, segment, pose\] 중 하나를 지정한다. \[optional\]로 생략하면 모델을 보고 추측해서 task를 정한다.
        - **detect:** Object detection
        - **classify:** Image classification
        - **segment:** Instance segmentation
        - **pose:** pose estimation
    - <b style='font-size:1.2em'>mode:</b> \[train, val, predict, export\] 중 하나를 지정한다. \[필수\]로 입력해야 한다.
        - **train:** custom dataset을 train 시킨다.
        - **val:** 모델 성능을 평가한다.
        - **predict:** 입력 이미지에 대한 추론을 한다.
        - **export:** 모델을 다른 형식으로 변환한다.
    - <b style='font-size:1.2em'>model:</b> **pretrained 모델**이나 **모델 설정 yaml 파일**의 경로를 설정한다. \[필수\]로 입력해야 한다.
        - pretrained 모델 파일경로
            - task에 맞는 pretrained 모델파일의 저장 경로를 지정한다.
            - transfer learnging을 하거나 fine tuning 시 방법
        - 모델 구조 설정 yaml 파일 경로
            - task에 맞는 pretrained 모델 설정파일(yaml파일)의 경로를 지정한다.
            - train mode에서 지정하며 모델을 새로 생성해서 처음부터 학습 시킬 경우 지정한다.
        - Ultralytics에서 제공하는 Pretrained 모델
            - 모델 크기에 따라 5개의 모델을 제공하며 큰 모델은 작은 모델에 비해 추론 성능이 좋은대신 속도는 느리다.
            - 모델은 처음 추론또는 학습할때 local 컴퓨터에 없으면 download 받는다.
            - https://github.com/ultralytics/ultralytics#models
            - ### 제공 모델
            
            | **task\\모델크기**  | **nano**   | **small** | **medium** | **large** | **xlarge** |
            |:--------------------|------------|-------------|------------|-----------|----------|
            | **object detection**| yolov8n    | yolov8s     | yolov8m    | yolov8l   | yolov8x    |
            | **segmentation**   | yolov8n-seg  | yolov8s-seg     | yolov8m-seg    | yolov8l-seg   | yolov8x-seg    |
            | **classification** | yolov8n-cls  | yolov8s-cls     | yolov8m-cls    | yolov8l-cls   | yolov8x-cls    |  
            | **pose estimation** | yolov8n-pose  | yolov8s-pose     | yolov8m-pose    | yolov8l-pose   | yolov8x-pose    | 
            
            
            - 확장자가 `pt`이면 pretrained 된 모델을, `yaml`이면 모델 구조 설정파일을 download하여 실행한다.
                - pretrained model은 fine tuning이나 추론할 때, yaml설정파일은 처음부터 학습할 경우 설정하여 받는다.
    - <b style='font-size:1.2em'>args:</b> task와 mode과 관련한 추가 설정값들을 지정한다.
        - https://docs.ultralytics.com/cfg/

# [Object Detection](https://docs.ultralytics.com/tasks/detection/)

##  Predict (추론)

### 모델로딩
- Ultralytics에서 제공하는 Pretrained Model이나 직접 학습시킨 모델을 이용해 추론한다.
- Ultralytics는 Object Detection을 위한 [Pretrained 모델](#제공-모델)을 제공한다.
    - Object Detection 모델은 COCO dataset으로 학습되었다.
    - 모델 명을 지정하면 자동으로 다운로드를 받는다.

### CLI
`yolo task=detect mode=predict model=model_path source=추론할_image_path`
- 추가 설정 (configuration)
    - https://docs.ultralytics.com/usage/cfg/#predict
    

> - argument 설정은 `name=value` 형식으로 한다. (`--name value`나 `name value` 는 안된다.)

> ### 추론 할 Source 타입
> - https://docs.ultralytics.com/modes/predict/#inference-sources
> - **Image:** 이미지파일경로, URL, PIL.Image, np.ndarray, torch.Tensor
> - **동영상:** 동영상파일경로, 웹캠 ID, 유튜브 URL
> - **여러개의 영상처리:** 디렉토리 경로 또는 경로들을 원소로 가지는 리스트.

### Python

### 한번에 여러장 추론
- 추론한 이미지들이 **같은 경로(Path)에** 있을 경우 **그 디렉토리의 경로를 문자열로 전달한다.**
- **wild card 문자** 를 이용해 특정 확장자의 파일이나 특정 문자열을 포함한 파일들을 추론할 수있다.
    - \*: 파일명에 지정하며 n 글자를 표현한다.
    - \*\*: 디렉토리에 지정하면 모든 하위 디렉토리를 표현한다.
- 추론할 이미지들이 **서로 다른 경로에** 있을 경우 **리스트에 경로들을 모아서 전달한다.**

## 동영상
- source에 동영상 파일 경로를 지정한다.
    - frame 단위로 추론한다.

## 추론결과

### ultralytics.yolo.engine.results.Results
- 모델의 추론 결과는 list에 이미지별 예측결과를 Results에 담아 반환한다.
- **Results** : 한개 이미지에 대한 추론결과를 담는 객체
- 추론 종류에 따라 다음 속성을 이용해 결과를 조회한다.
    - Detection: **`result.boxes`** - Boxes type
    - Segmentation: **`result.masks`** - Masks type
    - Classification: **`result.probs`** - Probs type
    - Pose estimator: **`result.keypoints`** - Keypoints  type
- **Boxes, Masks, Keypoints 는 모두 iteratble 타입으로 for in 문으로 찾은 개별 물체에 대한 결과를 같은 타입의 instance로 조회할 수 있다.**    
- 추가 정보
    - **Results.orig_img:** 추론한 원본 이미지
    - **Results.orig_shape:** 추론한 원본 이미지의 크기 (height, width)
    - **Results.path:** 추론한 원본이미지의 경로
    - **Results.names:** class2classname 정의한 딕셔너리 (key: 클래스, name: 클래스 이름)
- 메소드
    - **Results.plot()**
        - 원본 이미지에 추론한 결과를 표시한 이미지를 반환한다.
        - OpenCV를 이용해 처리한 이미지가 반환되어 **BGR 색모드의 ndarray로 반환** 한다.

### Object Detection 결과값 조회

- ultralytics.yolo.engine.results.**Boxes**에 추론 결과를 담아 반환
    - Results.boxes로 조회
- 주요 속성
    - shape: 결과 shape. (찾은 물체개수, 6)
    - boxes
        - 6: 좌상단 x, 좌상단 y, 우하단 x, 우하단 y, confidence score, label
    - xyxy
        - bounding box의 `좌상단 x, 좌상단 y, 우하단 x, 우하단 y` 좌표 반환
    - xyxyn
        - xyxy를 이미지 대비 비율로 반환
    - xywh
        - bounding box의 `center x, center y, 너비, 높이` 를 반환
    - xywhn
        - xywh를 이미지 대비 비율로 반환
    - cls: 찾은 물체의 label
    - conf: cls에 대한 confidence score (그 물체일 확률)




> - 0차원 torch.Tensor 를 상수로 변환
>     - `tensor.item()`
> - N차원 torch.Tensor를 ndarray로 변환
>     - `tensor.numpy()`
>     - Tensor객체가 GPU메모리에 있을 경우 메인메모리(CPU)로 먼저 옮겨야 한다.
>         - `tensor.to('cpu')` or `tensor.cpu()`

# TODO
Web Cam으로 입력받은 frame에서 detect 한 결과에 bounding box + class name + 확률을 출력해서 실시간으로 보여준다.  
> `yolo task=detect mode=predict model=yolov8s.pt source=0` 한 결과와 같이 나오도록 한다.