### 학습목표
- 이미지 데이터 라벨링 (roboflow)
- YOLO7으로 라벨링된 데이터 학습
- 객체 탐지 및 인식

- 객체 탐지 (Object Detection)
  - 컴퓨터 비전과 이미지 처리기술을 이용해서 객체의 위치를 탐지하는 기술
  - 객체 탐지를 위해서는 라벨(annotation)된 데이터셋을 학습해야 함

- 객체 인식 (Object Recognition)
  - 탐지된 객체가 무엇인지 추정하는 기술
  - 학습된 모델을 활용

- 객체 탐지 기술
  - two-stage detector : 객체 탐지와 인식(분류)를 순차적으로 따로 수행하는 방법
    - 정확도는 높지만 속도가 느림
    - R-CNN, Fast R-CNN, Faster R-CNN, Mask R_CNN
  - one-stage detector : 객체 탐지와 인식(분류)를 동시에 수행하는 방법
    - two-stage detector에 비해 정확도는 낮지만 속도가 빠름
    - Yolo(You Only Look Once; 한번만 보고 처리한다)
      - YoloV9까지 출시, 최근 YoloV10도 출시

- 탐지된 객체 위치 표시 방법 (Bounding Box)
  - 객체의 위치를 사각형 영역으로 표시하는 방법
  - 사각형 영역을 표시하는 방법
    1. 좌상단 좌표, 우하단 좌표 (lx, ly, rx, ry)
    2. 좌상단 좌표, 너비, 높이 (lx, ly, w, h)
    3. 좌상단 좌표, 중앙점 좌표 (lx, ly, cx, cy) -> Yolo

    - 일반적으로 절대좌표보다는 비율을 사용해서 정규화하여 활용

### annotation 방법 : 라벨링 방법


  - bounding box : 객체의 영역을 사각형으로 표시하는 방법
    - 쉽고 빠르게 작업이 가능
    - 객체가 아닌 부분이 포함됨
    <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_bounding_box.png" width=50%> </center>  

- polygon : 객체의 경계면을 따라서 점으로 표시하는 방법
  - 작업 속도가 약간 느림
  - 실제 객체의 영역만을 표시할 수 있음
  - 객체가 겹쳐있는 경우 정확한 인식이 어려움
  <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_polygon.png" width=50%> </center>   

- polyline : 객체의 경계면을 따라서 선으로 표시하는 방법
  - 경계면이 복잡하거나 큰 객체에서는 polygon을 사용
  <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_polyline.PNG" width=50%> </center>      

- point : 객체의 중심점을 표시하는 방법
  - 객체의 위치만 표시
  <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_point.PNG" width=50%> </center>   

- cuboid : 육면체 형태 3D로 객체의 위치를 표시하는 방법
  - 주로 로봇에 사용
  - 시간이 많이 걸림
  <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_cuboid.PNG" width=50%> </center>

- Sementic segmentation : 객체의 영역들을 색상으로 채색하여 표시하는 방법
  - 가장 정확도가 높은 방법
  - 작업 시간이 많이 걸림
  <center><img src="https://arome1004.cafe24.com/images/cv_project/lecture_image/106_segmentation.PNG" width=30%> </center>  

### roboflow를 이용한 라벨링
- 개/고양이 이미지 100개씩 총 200개를 라벨링
- https://roboflow.com 에 접속하고 로그인
- 라벨링 작업

- 구글 드라이브 연동

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [2]:
%cd /content/drive/MyDrive/Colab Notebooks/딥러닝

/content/drive/MyDrive/Colab Notebooks/딥러닝


- roboflow에서 라벨링한 데이터를 가져오기

In [3]:
!pip install roboflow

Collecting roboflow
  Downloading roboflow-1.1.34-py3-none-any.whl (76 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/76.2 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.2/76.2 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
Collecting chardet==4.0.0 (from roboflow)
  Downloading chardet-4.0.0-py2.py3-none-any.whl (178 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m178.7/178.7 kB[0m [31m7.7 MB/s[0m eta [36m0:00:00[0m
Collecting python-dotenv (from roboflow)
  Downloading python_dotenv-1.0.1-py3-none-any.whl (19 kB)
Collecting requests-toolbelt (from roboflow)
  Downloading requests_toolbelt-1.0.0-py2.py3-none-any.whl (54 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m54.5/54.5 kB[0m [31m6.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting python-magic (from roboflow)
  Downloading python_magic-0.4.27-py2.py3-none-any.whl (13 kB)
Installing collected package

In [4]:
from roboflow import Roboflow

# API Key 공개하면 안 됨! -> 블로그에 있음
rf = Roboflow(api_key="")                # API Key
project = rf.workspace("513").project("smhrd_animal_detect") # 작업병, 프로젝트명
version = project.version(1)                                 # 가져올 버전
dataset = version.download("yolov7")                         # 대상 모델 가져오기

loading Roboflow workspace...
loading Roboflow project...


- YoloV7 다운로드

In [6]:
import os.path

if not os.path.exists("./yolov7"):
  !git clone https://github.com/WongKinYiu/yolov7.git

Cloning into 'yolov7'...
remote: Enumerating objects: 1197, done.[K
remote: Total 1197 (delta 0), reused 0 (delta 0), pack-reused 1197[K
Receiving objects: 100% (1197/1197), 74.23 MiB | 18.03 MiB/s, done.
Resolving deltas: 100% (520/520), done.
Updating files: 100% (108/108), done.


In [3]:
%cd yolov7

/content/drive/MyDrive/Colab Notebooks/딥러닝/yolov7


- 관련 라이브러리 설치

In [4]:
!pip install -r requirements.txt



- 이전에 훈련된 모델을 다운로드 (전이학습)

In [6]:
# 필요한 모델 사용 (s, m, l, ...)
# -> 큰 모델을 사용하면 정확도는 우수하지만 속도가 느리고 메모리도 많이 차지함
!wget https://github.com/WongKinYiu/yolov7/releases/download/v0.1/yolov7_training.pt

--2024-07-10 03:27:04--  https://github.com/WongKinYiu/yolov7/releases/download/v0.1/yolov7_training.pt
Resolving github.com (github.com)... 140.82.116.4
Connecting to github.com (github.com)|140.82.116.4|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/511187726/13e046d1-f7f0-43ab-910b-480613181b1f?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20240710%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20240710T032704Z&X-Amz-Expires=300&X-Amz-Signature=c58c500f19a566c583870903e0c3875b7f4beb66a44c77c23dc0172acc896230&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=511187726&response-content-disposition=attachment%3B%20filename%3Dyolov7_training.pt&response-content-type=application%2Foctet-stream [following]
--2024-07-10 03:27:04--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/511187726/13e046d1-f7f0-43ab-910b-480613181b1f?X

- 훈련

In [17]:
!pwd

/content/drive/MyDrive/Colab Notebooks/딥러닝


In [8]:
%cd ..

/content/drive/MyDrive/Colab Notebooks/딥러닝


- device : GPU 번호
- data : 사용할 데이터 (yaml 파일명)
- weights : 사용할 학습된 yolo 모델명
- 출력 결과
  - last.pt : 가장 마지막에 학습된 모델
  - best.pt : 가장 성능이 우수한 모델

In [20]:
!python ./yolov7/train.py --batch 16 --epochs 20 --device 0 --data ./smhrd_animal_detect-1/data.yaml --weights ./yolov7/yolov7_training.pt

2024-07-10 03:42:12.658036: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-07-10 03:42:12.658112: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-07-10 03:42:12.791764: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
2024-07-10 03:42:12.952943: I tensorflow/core/platform/cpu_feature_guard.cc:182] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.
YOLOR 🚀 2024-7-10 torch 2.3.0+cu121 CUDA:0 (Tesla T4,