-xmin, ymin, xmax, ymax:

탐지된 객체의 경계 상자를 나타내는 좌표입니다.  
(xmin, ymin)은 상자의 왼쪽 위 모서리 좌표이며,  
(xmax, ymax)은 상자의 오른쪽 아래 모서리 좌표입니다.  
이 값들은 이미지의 픽셀 단위로 표현됩니다.

# YOLOv8

In [13]:
import os
import cv2
import matplotlib.pyplot as plt
from ultralytics import YOLO

# YOLOv8 모델 로드
model = YOLO('yolov8s.pt')

# 이미지가 있는 폴더 경로
folder_path = '/home/elicer/FIshing_vessel-1/imgdata'

# 폴더 내의 모든 이미지 파일 목록 가져오기
image_paths = [os.path.join(folder_path, file) for file in os.listdir(folder_path) if file.endswith(('.jpg', '.png', '.jpeg'))]

# 이미지 경계 상자와 클래스 시각화
for image_path in image_paths:
    # 이미지 로드
    img = cv2.imread(image_path)
    if img is None:
        print(f"이미지를 불러올 수 없습니다: {image_path}")
        continue
    
    # 모델로 예측 수행
    results = model.predict(img)
    
    # 탐지된 객체가 있는지 확인
    result = results[0]  # 첫 번째 결과만 사용
    if len(result.boxes) == 0:
        print(f"탐지된 객체가 없습니다: {image_path}")
        continue

    # # 탐지된 객체들에 대해 경계 상자 그리기
    # for box in result.boxes:
    #     xyxy = box.xyxy[0].cpu().numpy().astype(int)
    #     conf = box.conf.item()
    #     cls = int(box.cls.item())

    #     # 경계 상자 그리기
    #     cv2.rectangle(img, (xyxy[0], xyxy[1]), (xyxy[2], xyxy[3]), (0, 255, 0), 2)
        
    #     # 클래스 라벨과 신뢰도 표시
    #     label = f'{model.names[cls]} {conf:.2f}'
    #     cv2.putText(img, label, (xyxy[0], xyxy[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)

    # # 이미지 시각화 (RGB로 변환 후 표시)
    # plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    # plt.title(f'Results for {image_path}')
    # plt.axis('off')
    # plt.show()



0: 512x640 1 train, 43.1ms
Speed: 2.5ms preprocess, 43.1ms inference, 1.2ms postprocess per image at shape (1, 3, 512, 640)

0: 512x640 1 person, 2 boats, 5.5ms
Speed: 1.6ms preprocess, 5.5ms inference, 1.0ms postprocess per image at shape (1, 3, 512, 640)

0: 416x640 (no detections), 43.5ms
Speed: 1.5ms preprocess, 43.5ms inference, 0.4ms postprocess per image at shape (1, 3, 416, 640)
탐지된 객체가 없습니다: /home/elicer/FIshing_vessel-1/imgdata/1. 낚시어선 표류.jpg

0: 448x640 1 boat, 1 tv, 41.2ms
Speed: 1.4ms preprocess, 41.2ms inference, 1.0ms postprocess per image at shape (1, 3, 448, 640)

0: 544x640 1 boat, 42.9ms
Speed: 1.8ms preprocess, 42.9ms inference, 2.2ms postprocess per image at shape (1, 3, 544, 640)

0: 480x640 1 boat, 41.8ms
Speed: 1.9ms preprocess, 41.8ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 3 boats, 5.7ms
Speed: 1.5ms preprocess, 5.7ms inference, 1.0ms postprocess per image at shape (1, 3, 480, 640)

0: 480x640 (no detections), 5.5ms
Speed:

KeyboardInterrupt: 

주요 단계 요약
1. 이미지 로드 및 전처리: 지정된 폴더에서 모든 이미지를 불러오고, 크기를 조정하며 정규화합니다.
2. YOLO 모델로 객체 탐지: 사전 학습된 YOLO 모델을 사용하여 각 이미지에서 객체를 탐지합니다.
3. YOLO 어노테이션 파일 생성: 탐지된 객체의 정보를 YOLO 형식으로 변환하여 각 이미지에 대응하는 .txt 파일로 저장합니다.
4. YAML 파일 생성: YOLO 학습에 필요한 data.yaml 파일을 생성합니다.

## 이미지 사이즈 조정

In [30]:
import os
import cv2

# 이미지가 저장된 폴더 경로
image_folder_path = '/home/elicer/FIshing_vessel-1/imgdata'  # 실제 이미지 폴더 경로로 변경

# 전처리 후 이미지 크기
target_size = (256, 256)

# 이미지 파일 목록 가져오기 (jpg와 png 확장자만)
image_files = [file for file in os.listdir(image_folder_path) if file.lower().endswith(('.jpg', '.png'))]

# 이미지 크기 조정 및 저장
for image_file in image_files:
    image_path = os.path.join(image_folder_path, image_file)
    
    # 이미지 읽기
    img = cv2.imread(image_path)
    if img is None:
        print(f"이미지를 불러올 수 없습니다: {image_file}")
        continue
    
    # 이미지 크기 조정
    resized_img = cv2.resize(img, target_size)

    # 같은 파일명으로 저장 (덮어쓰기)
    cv2.imwrite(image_path, resized_img)

    print(f"{image_file} 크기 조정 완료")


1. 낚시어선 이동.jpg 크기 조정 완료
1. 낚시어선 조업.jpg 크기 조정 완료
1. 낚시어선 표류.jpg 크기 조정 완료
1. 등광조망 이동.jpg 크기 조정 완료
1. 등광조망 표류.jpg 크기 조정 완료
1. 범장망 이동.jpg 크기 조정 완료
1. 범장망 조업.jpg 크기 조정 완료
1. 범장망 표류.jpg 크기 조정 완료
1. 안강망 이동.jpg 크기 조정 완료
1. 안강망 조업.jpg 크기 조정 완료
1. 안강망 표류.jpg 크기 조정 완료
1. 연승 이동.jpg 크기 조정 완료
1. 연승 조업.JPG 크기 조정 완료
1. 연승 표류.jpg 크기 조정 완료
1. 유망 이동.jpg 크기 조정 완료
1. 유망 조업.jpg 크기 조정 완료
1. 유망 표류.jpg 크기 조정 완료
1. 저인망 이동.jpg 크기 조정 완료
1. 저인망 조업.jpg 크기 조정 완료
1. 저인망 표류.jpg 크기 조정 완료
1. 채낚기  표류.jpg 크기 조정 완료
1. 채낚기 이동.jpg 크기 조정 완료
1. 채낚기 조업.jpg 크기 조정 완료
1. 타망 이동.jpg 크기 조정 완료
1. 타망 조업.jpg 크기 조정 완료
1. 타망 표류.jpg 크기 조정 완료
1. 통발 이동.jpg 크기 조정 완료
1. 통발 조업.jpg 크기 조정 완료
1. 통발 표류.jpg 크기 조정 완료
1.등광조망 조업.jpg 크기 조정 완료
10. 낚시어선 이동.jpg 크기 조정 완료
10. 낚시어선 조업.jpg 크기 조정 완료
10. 낚시어선 표류.jpg 크기 조정 완료
10. 등광조망 이동.jpg 크기 조정 완료
10. 등광조망 조업.jpg 크기 조정 완료
10. 등광조망 표류.jpg 크기 조정 완료
10. 범장망 이동.jpg 크기 조정 완료
10. 범장망 조업.jpg 크기 조정 완료
10. 범장망 표류.jpg 크기 조정 완료
10. 안강망 이동.jpg 크기 조정 완료
10. 안강망 조업.jpg 크기 조정 완료
10. 안강망 표류.jpg 크기 조정 완료
10. 연승 이동.jpg 크기 조정 완료

## YOLO 어노테이션 파일 생성 코드

In [32]:
import os

# 이미지 파일이 저장된 폴더 경로
image_folder_path = '/home/elicer/FIshing_vessel-1/imgdata'  # 실제 이미지 폴더 경로로 변경하세요
annotation_folder_path = '/home/elicer/FIshing_vessel-1/imgdata'  # 어노테이션 파일을 저장할 폴더 경로로 변경하세요

# 클래스 라벨 집합 및 매핑 딕셔너리 생성
class_labels = set()
label_mapping = {}

# 이미지 파일 목록 가져오기
for filename in os.listdir(image_folder_path):
    if filename.endswith(('.jpg', '.png')):
        # 파일명에서 숫자와 점을 제거하고 클래스 이름 추출
        # 예: '1. 낚시어선 이동.jpg' -> '낚시어선'
        parts = filename.split('. ')
        if len(parts) > 1:
            label = parts[1].strip().split()[0]
            class_labels.add(label)

# 클래스 라벨들을 리스트로 변환하여 클래스 ID 매핑 생성
class_labels = list(class_labels)
for idx, label in enumerate(class_labels):
    label_mapping[label] = idx

# 어노테이션 파일 생성
for filename in os.listdir(image_folder_path):
    if filename.endswith(('.jpg', '.png')):
        # 파일명에서 숫자와 점을 제거하고 클래스 이름 추출
        parts = filename.split('. ')
        if len(parts) > 1:
            label = parts[1].strip().split()[0]

            # 매핑된 클래스 ID 가져오기
            class_id = label_mapping[label]

            # 어노테이션 파일 이름 설정 (이미지 파일 이름과 동일하게)
            annotation_filename = os.path.splitext(filename)[0] + '.txt'
            annotation_path = os.path.join(annotation_folder_path, annotation_filename)

            # 어노테이션 파일 생성 (임의의 좌표 값으로 작성)
            with open(annotation_path, 'w') as f:
                # 예시로 임의의 경계 상자 좌표 생성 (중심 좌표 x, y 및 너비와 높이)
                # 여기서는 모든 객체가 이미지의 중앙에 있다고 가정하고 작성함 (0.5, 0.5, 0.2, 0.2)
                f.write(f"{class_id} 0.5 0.5 0.2 0.2\n")

print("어노테이션 파일 생성 완료!")


어노테이션 파일 생성 완료!


## YAML파일 생성코드

In [33]:
import os
import yaml

# YAML 파일을 저장할 경로
yaml_file_path = '/home/elicer/FIshing_vessel-1/img_yaml.yaml'  # 생성할 yaml 파일 경로

# 훈련 및 검증 이미지 경로
images_path = '//home/elicer/FIshing_vessel-1/imgdata'  # 학습 및 검증에 사용할 이미지 경로

# 클래스 이름 (필요에 따라 수정)
class_names =  ['낚시어선','저인망','채낚기','연승','통발','안강망','타망','유망','범장망','등광조망'] # 실제 클래스 이름 목록

# 클래스 개수
nc = len(class_names)

# YAML 파일에 저장할 내용 구성
data_yaml = {
    'train': images_path,  # 학습용 이미지 경로
    'val': images_path,    # 검증용 이미지 경로 (동일한 경로)
    'nc': nc,              # 클래스 개수
    'names': class_names   # 클래스 이름 목록
}

# YAML 파일 생성
with open(yaml_file_path, 'w', encoding='utf-8') as file:
    yaml.dump(data_yaml, file, sort_keys=False)

print(f"data.yaml 파일이 생성되었습니다: {yaml_file_path}")


data.yaml 파일이 생성되었습니다: /home/elicer/FIshing_vessel-1/img_yaml.yaml


## YOLO 모델로 학습하기

In [34]:
from ultralytics import YOLO

# 1. YOLOv8 모델 로드 (사전 학습된 모델 사용)
model = YOLO('yolov8s.pt')  # 또는 'yolov8m.pt', 'yolov8l.pt' 등

# 2. 모델 학습 시작
model.train(data='/home/elicer/FIshing_vessel-1/img_yaml.yaml',  # 생성한 yaml 파일 경로
            epochs=50,             # 학습할 에폭 수 (200으로 통일)
            imgsz=256,              # 이미지 크기
            batch=16,               # 배치 크기
            name='yolo_fishing_vessel')  # 학습 결과 저장 폴더 이름

# 3. 학습 완료 후 검증
results = model.val(d)

# 4. 모델 저장
model.save('fishing_vessel_model.pt')  # 모델 저장


New https://pypi.org/project/ultralytics/8.3.18 available 😃 Update with 'pip install -U ultralytics'
Ultralytics 8.3.13 🚀 Python-3.10.13 torch-2.4.1+cu121 CUDA:0 (NVIDIA A100 80GB PCIe MIG 3g.40gb, 40448MiB)


RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1
Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.


In [None]:
fishing_vessel_model.pt
/home/elicer/FIshing_vessel-1/img_yaml.yaml  

In [16]:
from ultralytics import YOLO

# 1. 학습된 모델 로드
model = YOLO('fishing_vessel_model.pt')  # 학습된 모델 경로

# 2. 모델 검증 (사용자 정의 데이터셋)
results = model.val(data='/home/elicer/FIshing_vessel-1/img_yaml.yaml')  # 사용자 정의 데이터셋 경로

# 3. 성능 지표 출력
metrics = results.results_dict  # 검증 결과 딕셔너리

print(f"mAP_50 (mean Average Precision at IoU=0.5): {metrics['metrics/mAP_0.5']:.4f}")
print(f"Precision (정밀도): {metrics['metrics/precision']:.4f}")
print(f"Recall (재현율): {metrics['metrics/recall']:.4f}")


Ultralytics 8.3.13 🚀 Python-3.10.13 torch-2.4.1+cu121 CUDA:0 (NVIDIA A100 80GB PCIe MIG 3g.40gb, 40448MiB)


[34m[1mval: [0mScanning /home/elicer/FIshing_vessel-1/imgdata.cache... 1596 images, 473 backgrounds, 106 corrupt: 100%|██████████| 1596/1596 [00:00<?, ?it/s]




                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 94/94 [00:07<00:00, 12.30it/s]
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  fig.savefig(save_dir, dpi=250)
  f

                   all       1490       1368      0.191     0.0886     0.0919     0.0601
                  낚시어선        109        134     0.0385      0.112     0.0232      0.011
                   저인망          3          3          0          0          0          0
                   채낚기          1          1          0          0          0          0
                    연승          1          1          1          0      0.332      0.298
                    통발         50         58      0.375      0.121      0.146     0.0776
                   안강망          8          8          0          0          0          0
                    타망         74         74     0.0636      0.122      0.025     0.0113
                    유망          8          8          0          0          0          0
                   범장망        848       1068        0.4      0.455      0.386      0.198
                  등광조망         13         13     0.0285     0.0769     0.0067    0.00503


  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_fname, dpi=250)
  fig.savefig(plot_f

Speed: 0.1ms preprocess, 2.3ms inference, 0.0ms loss, 0.9ms postprocess per image
Results saved to [1mruns/detect/val8[0m


KeyError: 'metrics/mAP_0.5'