In [1]:
from ultralytics import YOLO
import ultralytics

ultralytics.checks()

# YOLO 모델 사용시에 속도 향상을 위해서 pytorch cuda 이용가능한 버전 설치
# cudatoolkit과 cudnn 설치

Ultralytics YOLOv8.2.52  Python-3.9.7 torch-1.13.1+cu116 CUDA:0 (NVIDIA GeForce RTX 4080 SUPER, 16375MiB)
Setup complete  (16 CPUs, 31.9 GB RAM, 470.6/930.8 GB disk)


In [2]:
model = YOLO('yolov9s.pt')
# 다양한 모델존재, 예시로는 'yolov9s' 이용

Downloading https://github.com/ultralytics/assets/releases/download/v8.2.0/yolov9s.pt to 'yolov9s.pt'...


  0%|          | 0.00/14.7M [00:00<?, ?B/s]

In [3]:
# 학습할 데이터의 yaml 파일 설정 확인하기
import yaml

with open('data.yaml', 'r') as file:
    data = yaml.safe_load(file)
    
print(data)

{'names': ['man', 'woman'], 'nc': 2, 'test': '../test/images', 'train': '../train/images', 'val': '../valid/images'}


In [4]:
print(model.names) # 현재는 ms 데이터셋 상태

{0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck', 8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench', 14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear', 22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase', 29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat', 35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle', 40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple', 48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut', 55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet', 62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell phone', 68: 'microw

In [5]:
# settings.yaml의 datasets_dir 수정하기
import yaml

# settings.yaml 파일의 절대 경로
settings_path = 'C:/Users/ryun1/AppData/Roaming/Ultralytics/settings.yaml'

# YAML 파일 읽기
with open(settings_path, 'r') as file:
    config = yaml.safe_load(file)
    
# print(config)

# 수정할 내용 적용하기
config['datasets_dir'] = 'C:\Users\ryun1\ds\final_project\20240718_data4\ingredients.v1i.yolov9_3(1)'

# 수정된 내용 저장하기
with open(settings_path, 'w') as file:
    yaml.dump(config, file)

{'settings_version': '0.0.4',
 'datasets_dir': 'C:\\Users\\ryun1\\ds\\final_project\\20240718_data4\\ingredients.v1i.yolov9_3(1)',
 'weights_dir': 'weights',
 'runs_dir': 'runs',
 'uuid': '10e8f398a588ea9aea5a264c6a847d9bc0cc14b554b52cdd1cf2415a7456cdb3',
 'sync': True,
 'api_key': '',
 'openai_api_key': '',
 'clearml': True,
 'comet': True,
 'dvc': True,
 'hub': True,
 'mlflow': True,
 'neptune': True,
 'raytune': True,
 'tensorboard': True,
 'wandb': True}

In [None]:
# 모델학습
model.train(data='data/data.yaml', epochs=100, patience=30, batch=16, imgsz=416)

In [6]:
# epochs : 반복 횟수
# patience : 30번동안 향상 x -> 조기 종료
# batch : 한번에 훈련하는 데이터의 수
# imgsz : 훈련에 사용할 이미지 사이즈(일반적으로 32의 배수 사용(다운샘플링 매커니즘))

In [None]:
# epoch : 전체 데이터셋이 모두 사용된 횟수
# GPU_mem : gpu 메모리 사용량
# box_loss : 예측된 바운딩 박스와 실제 바운딩 박스 간의 차이를 측정하는 손실 함수 값, 낮을 수록 정확하게 예측
# cls_loss : 예측된 클래스와 실제 클래스 간의 차이를 측정하는 손실 함수 값, 낮을수록 정확하게 예측
# dfl_loss : (Distribution Focal Loss) 클래스 불균형 문제 해결을 위해 사용되는 손실 함수, 낮을수록 불균형 문제 잘 처리
# Instances : 현재 에폭에서 처리된 인스턴스(이미지)의 수
# Size : 입력 이미지의 크기

In [7]:
# metrics/precision(B) : 정밀도, True로 예측한 것중 실제 True 비율
# metrics/recall(B): 재현율, 실제 True로 예측한 것중 모델이 True로 예측한 비율
# metrics/mAP50(B): 평균 정밀도, IoU(Intersection over Union) 임계값이 0.5일 때의 평균 정밀도, 1에가까울 수록 예측 정확
# metrics/mAP50-95(B): IoU 임계값이 0.5에서 0.95까지 변할 때의 평균 정밀도. 값이 1에 가까울수록 모델의 예측이 정확
# fitness:모델의 적합도, 모델 성능 종합 평가, 값이 낮을수록 모델 성능이 좋음

In [None]:
# test 이미지를 통해 모델확인
result = model.predict(source='data/test/images', save=True)

In [None]:
# 성능 테스트
model.val()

In [8]:
# model.predict를 통해서 얻은 이미지 확인해보기
from PIL import Image
from IPython.display import Image

image1 = Image(filename='runs/detect/train52/0001_jpg.rf.9fbe01a9c0214edbb8eca2fe0bbca214.jpg')
display(image1)

In [None]:
# 모델학습 후 생긴 train(숫자) 폴더의 파인튜닝된 best.pt, last.pt 를 사용할 수 있으며
# 시각적 확인이 용이한 결과물들 확인 가능