In [None]:
import json
import os


def convert_to_yolo_format(bboxes, image_width, image_height):
    """
    절대 좌표를 YOLO 포맷으로 변환
    Args:
        bboxes: 리스트 형태의 절대 좌표 [(class_id, [x_min, y_min, x_max, y_max]), ...]
        image_width: 이미지 너비
        image_height: 이미지 높이
    Returns:
        yolo_bboxes: YOLO 포맷으로 변환된 리스트 [(class_id, x_center, y_center, width, height), ...]
    """
    yolo_bboxes = []
    for bbox in bboxes:
        class_id, coords = bbox[0], bbox[1]
        x_min, y_min, x_max, y_max = coords
        x_center = (x_min + x_max) / 2 / image_width
        y_center = (y_min + y_max) / 2 / image_height
        width = (x_max - x_min) / image_width
        height = (y_max - y_min) / image_height
        yolo_bboxes.append((class_id, x_center, y_center, width, height))
    return yolo_bboxes


# JSON 폴더 경로
input_folder = "C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/labels"
output_folder = "C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels"

# 결과 저장 폴더 생성
os.makedirs(output_folder, exist_ok=True)

# 이미지 크기 (고정값 또는 JSON 데이터에서 가져오기)
image_width = 600
image_height = 400

# 폴더 내 JSON 파일 순회
for file_name in os.listdir(input_folder):
    if file_name.endswith(".json"):
        input_file = os.path.join(input_folder, file_name)
        output_file = os.path.join(output_folder, file_name.replace(".json", ".txt"))

        # JSON 파일 읽기
        with open(input_file, "r", encoding="utf-8-sig") as json_file:
            data = json.load(json_file)

        # YOLO 포맷 변환
        absolute_bboxes = []
        for ocr in data.get("OCR_info", []):
            for bbox in ocr.get("question_bbox", []):
                bbox_coords = bbox.get("bbox", [])
                if bbox.get("type") in ["line", "paragraph"]:
                    absolute_bboxes.append(
                        (0, bbox_coords)
                    )  # class_id = 0 for line/paragraph
                elif bbox.get("type") == "image":
                    absolute_bboxes.append((1, bbox_coords))  # class_id = 1 for image

        # 절대 좌표를 YOLO 포맷으로 변환
        converted_bboxes = convert_to_yolo_format(
            absolute_bboxes, image_width, image_height
        )

        # txt 파일 작성
        with open(output_file, "w", encoding="utf-8") as file:
            for bbox in converted_bboxes:
                class_id, x_center, y_center, width, height = bbox
                file.write(
                    f"{class_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n"
                )

        print(
            f"{file_name} 파일을 YOLO v8 포맷으로 변환하여 {output_file} 파일로 저장했습니다."
        )

P3_1_01_21114_49495.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21114_49495.txt 파일로 저장했습니다.
P3_1_01_21114_49496.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21114_49496.txt 파일로 저장했습니다.
P3_1_01_21114_49497.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21114_49497.txt 파일로 저장했습니다.
P3_1_01_21114_49506.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21114_49506.txt 파일로 저장했습니다.
P3_1_01_21116_49499.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21116_49499.txt 파일로 저장했습니다.
P3_1_01_21116_49500.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\P3_1_01_21116_49500.txt 파일로 저장했습니다.
P3_1_01_21116_49501.json 파일을 YOLO v8 포맷으로 변환하여 C:/Users/user/Desktop/kst_pipeline/Model/Yolov8/data/yolo_labels\