# 학습 관련 준비

## Google Drive 마운트
- 학습 데이터 사용
- 모델링 관련 파일 사용을 위함

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# 폴더 이동 model_trainning으로
%cd /content/drive/MyDrive/gdgline-AI/model_training

/content/drive/MyDrive/gdgline-AI/model_training


In [None]:
# 현재 폴더 확인
%pwd

'/content/drive/MyDrive/gdgline-AI/model_training'

In [None]:
# 환경 의존성 설치
!pip install -e .

Obtaining file:///content/drive/MyDrive/gdgline-AI/model_training
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting ultralytics-thop>=2.0.0 (from model_training==0.1)
  Downloading ultralytics_thop-2.0.11-py3-none-any.whl.metadata (9.4 kB)
Downloading ultralytics_thop-2.0.11-py3-none-any.whl (26 kB)
Installing collected packages: ultralytics-thop, model_training
  Running setup.py develop for model_training
Successfully installed model_training-0.1 ultralytics-thop-2.0.11


In [None]:
# parser args를 사용하여 변수할당 해줄 것임
import argparse
parser = argparse.ArgumentParser()

args, unknown = parser.parse_known_args()

# 세팅 환경 확인

In [None]:
args.mode = 'settings'
args.model = 'yolo11m' # yolo 아무 버전의 모델 혹은 크기 관계없음

In [None]:
# 실행
!python main.py --mode {args.mode} --model {args.model}

Creating new Ultralytics Settings v0.0.6 file ✅ 
View Ultralytics Settings with 'yolo settings' or at '/root/.config/Ultralytics/settings.json'
Update Settings with 'yolo settings key=value', i.e. 'yolo settings runs_dir=path/to/dir'. For help see https://docs.ultralytics.com/quickstart/#ultralytics-settings.
YOLO Settings:
JSONDict("/root/.config/Ultralytics/settings.json"):
{
  "settings_version": "0.0.6",
  "datasets_dir": "datasets",
  "weights_dir": "weights",
  "runs_dir": "runs",
  "uuid": "569f3ba64b326db489132663f79cd37279811de477381b83ac131e6cdd129cbb",
  "sync": true,
  "api_key": "",
  "openai_api_key": "",
  "clearml": true,
  "comet": true,
  "dvc": true,
  "hub": true,
  "mlflow": true,
  "neptune": true,
  "raytune": true,
  "tensorboard": true,
  "wandb": false,
  "vscode_msg": true
}


In [None]:
import torch

# 사용 가능한 디바이스 확인
if torch.cuda.is_available():
    num_gpus = torch.cuda.device_count()
    print(f"사용 가능한 GPU 수: {num_gpus}")

    # 각 GPU에 대한 정보 출력
    for i in range(num_gpus):
        print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
        print(f"메모리 용량: {torch.cuda.get_device_properties(i).total_memory / 1024 ** 3:.2f} GB")
else:
    print("GPU를 사용할 수 없습니다. CPU를 사용합니다.")

사용 가능한 GPU 수: 1
GPU 0: NVIDIA A100-SXM4-40GB
메모리 용량: 39.56 GB


# 모델 학습

In [None]:
  args.mode = 'train'
  args.model = 'yolo11m'  # 모델 경로
  args.data = 'datasets/data.yaml'  # 데이터셋 설정 파일 경로
  args.imgsz = 640  # 이미지 크기
  args.epochs = 100  # 학습 에포크 수
  args.batch = 0.85 # 배치 크기
  args.optimizer = 'AdamW'  # 최적화 알고리즘
  args.patience = 20  # 조기 종료 기준
  args.cos_lr = True  # 코사인 학습률 스케줄러 사용
  args.verbose = True  # 상세 출력 모드

In [None]:
# train 모드 실행
!python main.py --mode {args.mode} --model {args.model} --data {args.data} --imgsz {args.imgsz} \
--epochs {args.epochs} --batch {args.batch} --optimizer {args.optimizer} --patience {args.patience} \
--cos_lr {args.cos_lr} --verbose {args.verbose}

New https://pypi.org/project/ultralytics/8.3.31 available 😃 Update with 'pip install -U ultralytics'
Ultralytics 8.3.29 🚀 Python-3.10.12 torch-2.5.0+cu121 CUDA:0 (NVIDIA A100-SXM4-40GB, 40514MiB)
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=yolo11m.pt, data=datasets/data.yaml, epochs=100, time=None, patience=20, batch=0.85, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train11, exist_ok=False, pretrained=True, optimizer=AdamW, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=True, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False, embed=None, sh

# 모델 이어서 학습하기
- 중간에 얘기치 못하게 종료되었을때

In [None]:
args.mode = 'resume'
args.model = 'yolo11m'  # 모델 경로

# resume 모드 실행
!python main.py --mode {args.mode} --model {args.model}

In [None]:
# resume 모드 실행
!python main.py --mode {args.mode} --model {args.model}

# 모델 추가 학습하기

In [None]:
args.mode = 'continue'
args.model = 'last.pt'  # 모델 경로 (참고로 추가학습할때는 best.pt 말고 last.pt 사용)
args.data = 'datasets/data.yaml'  # 데이터셋 설정 파일 경로
args.additional_epochs = 50  # 추가 학습 에포크 수
args.batch = 34  # 배치 크기
args.optimizer = 'AdamW'  # 최적화 알고리즘
args.patience = 20  # 조기 종료 기준
args.cos_lr = True  # 코사인 학습률 스케줄러 사용
args.verbose = True  # 상세 출력 모드

In [None]:
# continue 모드 실행
!python main.py --mode {args.mode} --model {args.model} --data {args.data} \
--additional_epochs {args.additional_epochs} --batch {args.batch} --optimizer {args.optimizer} \
--patience {args.patience}

New https://pypi.org/project/ultralytics/8.3.31 available 😃 Update with 'pip install -U ultralytics'
Ultralytics 8.3.29 🚀 Python-3.10.12 torch-2.5.0+cu121 CUDA:0 (NVIDIA A100-SXM4-40GB, 40514MiB)
[34m[1mengine/trainer: [0mtask=detect, mode=train, model=last.pt, data=datasets/data.yaml, epochs=50, time=None, patience=20, batch=34, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=train3, exist_ok=False, pretrained=True, optimizer=AdamW, verbose=False, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, amp=True, fraction=1.0, profile=False, freeze=None, multi_scale=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, vid_stride=1, stream_buffer=False, visualize=False, augment=False, agnostic_nms=False, classes=None, retina_masks=False, embed=None, show=Fa

# 모델 검증

In [None]:
args.mode = 'evaluate'
args.model = 'best.pt'
args.data = 'datasets/data.yaml'

In [None]:
# valid 모드 실행
!python main.py --mode {args.mode} --model {args.model} --data {args.data}

Ultralytics 8.3.29 🚀 Python-3.10.12 torch-2.5.0+cu121 CUDA:0 (NVIDIA A100-SXM4-40GB, 40514MiB)
YOLO11m summary (fused): 303 layers, 20,040,826 parameters, 0 gradients, 67.7 GFLOPs
[34m[1mval: [0mScanning /content/drive/MyDrive/gdgline-AI/model_training/datasets/test/labels... 774 images, 8 backgrounds, 0 corrupt: 100% 774/774 [00:38<00:00, 19.99it/s]
[34m[1mval: [0mNew cache created: /content/drive/MyDrive/gdgline-AI/model_training/datasets/test/labels.cache
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100% 49/49 [00:06<00:00,  7.62it/s]
                   all        774       1378      0.799      0.786      0.836      0.606
       African_manatee         30         39      0.693      0.744      0.848      0.653
               Arowana         21         26      0.699      0.846       0.84      0.624
        Black_stingray         22         45      0.643       0.44      0.526      0.271
   Blacktip_reef_shark         60         71     

# 모델 예측

In [None]:
args.mode = 'predict'
args.model = 'best.pt'
args.source = 'datasets/test/images/20241111_100059_133_jpg.rf.c9926247f21f71292fe502b56f74dde1.jpg'  # 예측할 이미지 소스 경로

In [None]:
# predict 모드 실행
!python main.py --mode {args.mode} --model {args.model} --source {args.source}


image 1/1 /content/drive/MyDrive/gdgline-AI/model_training/datasets/test/images/20241111_100059_133_jpg.rf.c9926247f21f71292fe502b56f74dde1.jpg: 640x640 1 Napoleon_wrasse, 14.5ms
Speed: 7.4ms preprocess, 14.5ms inference, 758.8ms postprocess per image at shape (1, 3, 640, 640)
Prediction Results: [ultralytics.engine.results.Results object with attributes:

boxes: ultralytics.engine.results.Boxes object
keypoints: None
masks: None
names: {0: 'African_manatee', 1: 'Arowana', 2: 'Black_stingray', 3: 'Blacktip_reef_shark', 4: 'California_sea_lion', 5: 'Clownfish', 6: 'Garden_eel', 7: 'Giant_grouper', 8: 'Humboldt_penguin', 9: 'Leatherback_sea_turtle', 10: 'Napoleon_wrasse', 11: 'Piranha', 12: 'Small_clawed_otter', 13: 'Zebra_shark'}
obb: None
orig_img: array([[[178, 156, 138],
        [185, 165, 147],
        [186, 165, 150],
        ...,
        [172, 118,  55],
        [170, 114,  49],
        [169, 114,  47]],

       [[180, 158, 140],
        [183, 163, 145],
        [185, 165, 148],


# 모델 내보내기

In [None]:
args.mode = 'export'
args.model = 'best.pt'
args.format = 'torchscript'  # 내보낼 형식 (torchscript, onnx 등)

In [None]:
# export 모드 실행
!python main.py --mode {args.mode} --model {args.model} --format {args.format}

Ultralytics 8.3.29 🚀 Python-3.10.12 torch-2.5.0+cu121 CPU (Intel Xeon 2.20GHz)
YOLO11m summary (fused): 303 layers, 20,040,826 parameters, 0 gradients, 67.7 GFLOPs

[34m[1mPyTorch:[0m starting from 'best.pt' with input shape (1, 3, 640, 640) BCHW and output shape(s) (1, 18, 8400) (38.7 MB)

[34m[1mTorchScript:[0m starting export with torch 2.5.0+cu121...
[34m[1mTorchScript:[0m export success ✅ 3.7s, saved as 'best.torchscript' (77.1 MB)

Export complete (6.4s)
Results saved to [1m/content/drive/MyDrive/gdgline-AI/model_training[0m
Predict:         yolo predict task=detect model=best.torchscript imgsz=640  
Validate:        yolo val task=detect model=best.torchscript imgsz=640 data=datasets/data.yaml  
Visualize:       https://netron.app
Model exported as torchscript format for deployment
