In [2]:
import json
import os
from glob import glob

def convert_to_coco_format(input_folder, output_file):
    # COCO 데이터셋 포맷에 맞게 초기 구조 설정
    coco_format = {
        "info": {},
        "licenses": [],
        "images": [],
        "annotations": [],
        "categories": []
    }
    
    # 이미지 ID와 애너테이션 ID 초기화
    image_id = 1
    annotation_id = 1
    
    # 입력 폴더 내의 모든 JSON 파일 처리
    for json_file in glob(os.path.join(input_folder, '*.json')):
        with open(json_file) as f:
            data = json.load(f)
        
        # COCO 'info'는 한 번만 추가합니다 (첫 번째 파일 기준).
        if not coco_format["info"]:
            coco_format["info"] = data.get("info", {})
            coco_format["licenses"] = data.get("license", [])
            coco_format["categories"] = data.get("categories", [])
        
        # 'images' 정보 추가
        for image in data.get("images", []):
            image["id"] = image_id
            coco_format["images"].append(image)
            image_id += 1
            
        # 'annotations' 정보 추가
        for annotation in data.get("annotations", []):
            annotation["id"] = annotation_id
            annotation["image_id"] = image["id"]
            coco_format["annotations"].append(annotation)
            annotation_id += 1
    
    # 결과를 JSON 파일로 저장
    with open(output_file, 'w') as f:
        json.dump(coco_format, f, indent=4)

In [5]:
input_folder = '/shared/home/sw_innovation01/junhan/tanso/data/training_data/training_data/labels'  # JSON 파일들이 있는 폴더 경로
output_file = '/shared/home/sw_innovation01/junhan/tanso/combined_coco_format.json'  # 결과를 저장할 파일 경로
convert_to_coco_format(input_folder, output_file)