학습을 위한 준비 사항 (환경 설정)
YOLOv5 깃허브 클론
필수 라이브러리 설치

In [1]:
import os
import sys

# YOLOv5 클론 및 설치
!git clone https://github.com/ultralytics/yolov5
os.chdir('yolov5')
%pip install -r requirements.txt

# YOLOv5 디렉토리를 sys.path에 추가
sys.path.append(os.getcwd())

fatal: destination path 'yolov5' already exists and is not an empty directory.


Note: you may need to restart the kernel to use updated packages.


데이터셋 준비

In [6]:
import os
import random
import shutil
import cv2

# 원본 데이터 경로 설정
data_path = r'.\face_mask'

# 학습, 검증, 테스트 데이터셋 경로 설정
train_path = os.path.join(data_path, 'train')
val_path = os.path.join(data_path, 'val')
test_path = os.path.join(data_path, 'test')

# 각 폴더가 존재하는지 확인하고, 없으면 생성
for path in [train_path, val_path, test_path]:
    images_path = os.path.join(path, 'images')
    labels_path = os.path.join(path, 'labels')
    if not os.path.exists(images_path):
        os.makedirs(images_path)
    if not os.path.exists(labels_path):
        os.makedirs(labels_path)

# 원본 데이터 경로 확인
print(f"Data path exists: {os.path.exists(data_path)}")
print(f"Data path contents: {os.listdir(data_path)}")

# 데이터 파일 리스트 가져오기 (이미지와 레이블 파일을 별도로 가져오기)
image_files = [f for f in os.listdir(data_path) if f.endswith('.png')]
label_files = [f.replace('.png', '.txt') for f in image_files]

# 데이터 섞기
data = list(zip(image_files, label_files))
random.shuffle(data)

# 데이터 분할 비율 설정
train_ratio = 0.6
val_ratio = 0.2
test_ratio = 0.2

# 데이터 분할
train_data = data[:int(train_ratio * len(data))]
val_data = data[int(train_ratio * len(data)):int((train_ratio + val_ratio) * len(data))]
test_data = data[int((train_ratio + val_ratio) * len(data)):]

# 파일 복사 함수
def copy_files(data, data_type):
    for img, lbl in data:
        shutil.copy(os.path.join(data_path, img), os.path.join(data_path, data_type, 'images', img))
        shutil.copy(os.path.join(data_path, lbl), os.path.join(data_path, data_type, 'labels', lbl))

# 파일 복사
copy_files(train_data, 'train')
copy_files(val_data, 'val')
copy_files(test_data, 'test')

# 폴더 구조 확인
print(f"Train path exists: {os.path.exists(train_path)}")
print(f"Val path exists: {os.path.exists(val_path)}")
print(f"Test path exists: {os.path.exists(test_path)}")

# 각 폴더 내 파일 확인
print(f"Train images: {os.listdir(os.path.join(train_path, 'images'))[:5]}")
print(f"Train labels: {os.listdir(os.path.join(train_path, 'labels'))[:5]}")
print(f"Val images: {os.listdir(os.path.join(val_path, 'images'))[:5]}")
print(f"Val labels: {os.listdir(os.path.join(val_path, 'labels'))[:5]}")
print(f"Test images: {os.listdir(os.path.join(test_path, 'images'))[:5]}")
print(f"Test labels: {os.listdir(os.path.join(test_path, 'labels'))[:5]}")

print('Dataset preparation complete.')

# 이미지 전처리 함수
def preprocess_image(image_path, output_path):
    image = cv2.imread(image_path)
    # 전처리 과정 예시: 리사이즈
    image = cv2.resize(image, (416, 416))
    cv2.imwrite(output_path, image)

# train 이미지 전처리
train_images = os.listdir(os.path.join(train_path, 'images'))
for img in train_images:
    preprocess_image(os.path.join(train_path, 'images', img),
                     os.path.join(train_path, 'images', img))

print('Image preprocessing complete.')


Data path exists: True
Data path contents: ['face_mask', 'test', 'train', 'val']
Train path exists: True
Val path exists: True
Test path exists: True
Train images: []
Train labels: []
Val images: []
Val labels: []
Test images: []
Test labels: []
Dataset preparation complete.
Image preprocessing complete.


YOLOv5 모델 학습

In [None]:
import torch
from yolov5.train import run

# 하이퍼파라미터 설정
epochs = 100
batch_size = 16
learning_rate = 0.001

# 모델 학습
run(data=r'C:\Users\82102\Desktop\Artificial Intelligence Final Exam Alternative Project\data.yaml', 
    epochs=epochs, 
    batch_size=batch_size, 
    lr0=learning_rate)