In [1]:
import json
import os
import shutil
from PIL import Image

# 디렉토리 경로 설정
label_directory = r'../aihub_data/라벨링데이터'
image_directory = r'../aihub_data/원천데이터'
modify_label_directory = r'../yolo_dataset/label'
modify_image_directory = r'../yolo_dataset/image'

# 저장할 디렉토리 만들기
clist = ['상의', '하의', '원피스','하의_상의']
for c in clist:
    lpath = os.path.join(modify_label_directory, c)
    ipath = os.path.join(modify_image_directory, c)
    if not os.path.exists(lpath):
        os.makedirs(lpath)
    if not os.path.exists(ipath):
        os.makedirs(ipath)

# object 목록
class_index = {0: '하의', 1: '원피스', 2: '상의', 3: '아우터'}
index_class = {'하의':0, '원피스':1, '상의':2, '아우터':3}

# json파일의 렉트좌표를 yolo label 형식으로 변경하는 함수
def bbox_ratio(data, idx):
    img_width = data['이미지 정보']['이미지 너비']
    img_height = data['이미지 정보']['이미지 높이']
    xy = data['데이터셋 정보']['데이터셋 상세설명'].get('렉트좌표', None)
    
    x1 = round((xy[idx][0]['X좌표'] + xy[idx][0]['가로'] / 2) / img_width, 5)
    y1 = round((xy[idx][0]['Y좌표'] + xy[idx][0]['세로'] / 2)/ img_height, 5)
    x2 = round(xy[idx][0]['가로'] / img_width, 5)
    y2 = round(xy[idx][0]['세로'] / img_height, 5)
    return x1, y1, x2, y2

## 파일 수정

In [2]:
import time

style_list = os.listdir(label_directory)

for style in style_list:
    start_time = time.time()
    label_path = os.path.join(label_directory, style)
    image_path = os.path.join(image_directory, style)
    # 라벨 파일들 확인
    file_list = os.listdir(label_path)
    for filename in file_list:
        filepath = os.path.join(label_path, filename)
        with open(filepath, 'r', encoding='utf-8') as f:
            data = json.load(f)
            num_file = filename.replace('.json', '')
            
            xy = data['데이터셋 정보']['데이터셋 상세설명'].get('렉트좌표', None)

            # 어떤 object가 있는지 확인
            class_list = [class_index[i] for i in range(3) if len(xy[class_index[i]][0]) > 0]
            class_name = '_'.join(class_list)
            
            if class_name in clist:
                name_file = num_file + '.txt'
                
                modify_file_path = os.path.join(modify_label_directory, class_name, name_file)
                with open(modify_file_path, 'w', encoding='utf-8') as fw:                    
                    for cls in class_list:
                        bbox = bbox_ratio(data, cls)
                        fw.write(str(index_class[cls]) + ' ')
                        for j in bbox:fw.write(str(j) + ' ')
                        fw.write("\n")
            
                ## 읽어올 이미지 경로
                img_file = num_file + '.jpg'
                img_dir = os.path.join(image_path, img_file)
                ## 저장할 이미지 경로
                modify_image_path = os.path.join(modify_image_directory, class_name, img_file)
                
                with Image.open(img_dir) as img:
                    img_resized = img.resize((640,640), Image.LANCZOS)
                    img_resized.save(modify_image_path)
    end_time = time.time()
    print("####", style, "디렉토리 전처리 ####")
    print(" 데이터 개수: ", len(file_list))
    print(" 걸린 시간:   ", round((end_time - start_time), 1))
print("라벨파일 수정완료")

#### 기타 디렉토리 전처리 ####
 데이터 개수:  546
 걸린 시간:    1.4
#### 레트로 디렉토리 전처리 ####
 데이터 개수:  845
 걸린 시간:    11.2
#### 로맨틱 디렉토리 전처리 ####
 데이터 개수:  9130
 걸린 시간:    114.5
#### 리조트 디렉토리 전처리 ####
 데이터 개수:  10434
 걸린 시간:    130.0
#### 매니시 디렉토리 전처리 ####
 데이터 개수:  1091
 걸린 시간:    11.3
#### 모던 디렉토리 전처리 ####
 데이터 개수:  9997
 걸린 시간:    119.5
#### 밀리터리 디렉토리 전처리 ####
 데이터 개수:  449
 걸린 시간:    2.9
#### 섹시 디렉토리 전처리 ####
 데이터 개수:  794
 걸린 시간:    9.9
#### 소피스트케이티드 디렉토리 전처리 ####
 데이터 개수:  4049
 걸린 시간:    47.8
#### 스트리트 디렉토리 전처리 ####
 데이터 개수:  56138
 걸린 시간:    683.3
#### 스포티 디렉토리 전처리 ####
 데이터 개수:  1831
 걸린 시간:    22.2
#### 아방가르드 디렉토리 전처리 ####
 데이터 개수:  459
 걸린 시간:    5.5
#### 오리엔탈 디렉토리 전처리 ####
 데이터 개수:  512
 걸린 시간:    6.6
#### 웨스턴 디렉토리 전처리 ####
 데이터 개수:  220
 걸린 시간:    2.4
#### 젠더리스 디렉토리 전처리 ####
 데이터 개수:  1547
 걸린 시간:    15.5
#### 컨트리 디렉토리 전처리 ####
 데이터 개수:  4065
 걸린 시간:    46.6
#### 클래식 디렉토리 전처리 ####
 데이터 개수:  4931
 걸린 시간:    43.9
#### 키치 디렉토리 전처리 ####
 데이터 개수:  602
 걸린 시간:    7.6
#### 톰보이 디렉토리 전처리 ####
 데이터 개수