In [9]:
import os
import shutil
from tqdm import tqdm
import json
import pandas as pd
import cv2
from sklearn.model_selection import train_test_split
import numpy as np

# GrayScaling

In [5]:
# 경로 설정
input_dir = 'C:/GitHub/yolov5m/datasets_640/images'
output_dir = 'C:/GitHub/yolov5m/datasets_640_black/images'

# 폴더명 설정
folders = ['train', 'val', 'test']

# 폴더 생성
for folder in folders:
    output_folder = os.path.join(output_dir, folder)
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    input_folder = os.path.join(input_dir, folder)
    files = os.listdir(input_folder)

    # 이미지 파일 전처리
    for file in tqdm(files, desc=f'Processing {folder}'):
        img_path = os.path.join(input_folder, file)
        output_path = os.path.join(output_folder, file)

        # 이미지 로드
        image = cv2.imread(img_path)

        # Grayscale 전처리
        grayscale_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

        # 이미지 저장
        cv2.imwrite(output_path, grayscale_image)

print("전처리 완료!")

Processing train: 100%|██████████| 21336/21336 [04:48<00:00, 73.94it/s]
Processing val: 100%|██████████| 4001/4001 [00:55<00:00, 72.57it/s]
Processing test: 100%|██████████| 1334/1334 [00:18<00:00, 72.78it/s]

전처리 완료!





# Embossing

In [10]:
# 경로 설정
input_dir = 'C:/GitHub/yolov5m/datasets_640/images'
output_dir = 'C:\GitHub\yolov5m\datasets_640_embossed\images'

# 폴더명 설정
folders = ['train', 'val', 'test']

# 폴더 생성
for folder in folders:
    output_folder = os.path.join(output_dir, folder)
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    input_folder = os.path.join(input_dir, folder)
    files = os.listdir(input_folder)

    # 이미지 파일 전처리
    for file in tqdm(files, desc=f'Processing {folder}'):
        img_path = os.path.join(input_folder, file)
        output_path = os.path.join(output_folder, file)

        # 이미지 로드
        image = cv2.imread(img_path)

        # 엠보싱 전처리
        kernel_embossing = np.array([[0, -1, -1],
                                     [1, 0, -1],
                                     [1, 1, 0]])
        embossed_image = cv2.filter2D(image, -1, kernel_embossing)

        # 이미지 저장
        cv2.imwrite(output_path, embossed_image)

print("전처리 완료!")

Processing train: 100%|██████████| 21336/21336 [06:31<00:00, 54.53it/s]
Processing val: 100%|██████████| 4001/4001 [01:11<00:00, 55.67it/s]
Processing test: 100%|██████████| 1334/1334 [00:28<00:00, 47.24it/s]

전처리 완료!





# Flip

In [6]:
# 경로 설정
input_dir = 'C:/GitHub/yolov5m/datasets_640/images'
output_dir = 'C:/GitHub/yolov5m/datasets_640_flip/images'

# 폴더명 설정
folders = ['train', 'val', 'test']

# 폴더 생성
for folder in folders:
    output_folder = os.path.join(output_dir, folder)
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    input_folder = os.path.join(input_dir, folder)
    files = os.listdir(input_folder)

    # 이미지 파일 전처리
    for file in tqdm(files, desc=f'Processing {folder}'):
        img_path = os.path.join(input_folder, file)
        output_path = os.path.join(output_folder, file)

        # 이미지 로드
        image = cv2.imread(img_path)

        # 좌우 반전 전처리
        flipped_image = cv2.flip(image, 1)

        # 이미지 저장
        cv2.imwrite(output_path, flipped_image)

print("전처리 완료!")

Processing train: 100%|██████████| 21336/21336 [05:52<00:00, 60.46it/s]
Processing val: 100%|██████████| 4001/4001 [01:05<00:00, 60.72it/s]
Processing test: 100%|██████████| 1334/1334 [00:21<00:00, 60.93it/s]

전처리 완료!





In [7]:
# 경로 설정
label_dir = 'C:/GitHub/yolov5m/datasets_640/labels'
output_label_dir = 'C:/GitHub/yolov5m/datasets_640_flip/labels'

# 폴더명 설정
folders = ['train', 'val', 'test']

# 폴더 생성
for folder in folders:
    output_label_folder = os.path.join(output_label_dir, folder)
    if not os.path.exists(output_label_folder):
        os.makedirs(output_label_folder)

    label_folder = os.path.join(label_dir, folder)
    label_files = os.listdir(label_folder)

    # 라벨 데이터 파일 전처리
    for label_file in tqdm(label_files, desc=f'Processing {folder}'):
        label_path = os.path.join(label_folder, label_file)
        output_label_path = os.path.join(output_label_folder, label_file)

        # 라벨 데이터 읽기
        with open(label_path, 'r') as f:
            label_data = f.read()

        # 라벨 데이터 좌우 반전 전처리
        flipped_label_data = ''
        labels = label_data.split('\n')
        for label in labels:
            if label:
                label_parts = label.split(' ')
                flipped_x = 1.0 - float(label_parts[1])  # x 좌표 반전
                flipped_label = f"{label_parts[0]} {flipped_x} {label_parts[2]} {label_parts[3]} {label_parts[4]}\n"
                flipped_label_data += flipped_label

        # 라벨 데이터 저장
        with open(output_label_path, 'w') as f:
            f.write(flipped_label_data)

print("전처리 완료!")

Processing train: 100%|██████████| 21336/21336 [00:15<00:00, 1353.38it/s]
Processing val: 100%|██████████| 4001/4001 [00:02<00:00, 1480.76it/s]
Processing test: 100%|██████████| 1334/1334 [00:00<00:00, 1522.83it/s]

전처리 완료!



