In [2]:
import json
import cv2
import os
import numpy as np

# 경로 설정
image_dir = "/data/ephemeral/home/MCG/NewData/cord2_trans_data/images"
ufo_json_path = "/data/ephemeral/home/MCG/NewData/cord2_trans_data/cord2.json"
output_dir = "/data/ephemeral/home/MCG/NewData/annotated"

# 시각화된 이미지를 저장할 디렉터리 생성
os.makedirs(output_dir, exist_ok=True)

# UFO 파일 로드
with open(ufo_json_path, 'r', encoding='utf-8') as f:
    ufo_data = json.load(f)

# 각 이미지에 대해 텍스트 박스 시각화
for image_name, image_data in ufo_data['images'].items():
    # 이미지 경로와 JSON 파일에서 텍스트 영역 가져오기
    image_path = os.path.join(image_dir, image_name)
    
    # 이미지 로드
    image = cv2.imread(image_path)
    if image is None:
        print(f"이미지 {image_name}를 로드할 수 없습니다.")
        continue

    # 각 텍스트 박스에 대해 다각형 그리기
    for word_data in image_data['words'].values():
        points = word_data['points']  # [(x1, y1), (x2, y2), ...] 형식의 좌표
        
        # numpy array 형식으로 변환하여 OpenCV에서 사용
        points = np.array([(int(p[0]), int(p[1])) for p in points], dtype=np.int32)
        
        # 다각형 형태로 그리기
        cv2.polylines(image, [points], isClosed=True, color=(0, 255, 0), thickness=2)
        
        # 각 꼭짓점에 점 그리기
        for (x, y) in points:
            cv2.circle(image, (x, y), radius=3, color=(255, 0, 0), thickness=-1)  # 파란색 점으로 표시

    # 시각화된 이미지를 저장
    output_path = os.path.join(output_dir, image_name)
    cv2.imwrite(output_path, image)
    print(f"{image_name}에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.")


cord2_val_image_21.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_test_image_26.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_val_image_24.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_test_image_4.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train2_image_189.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train1_image_192.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train1_image_173.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train4_image_151.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train1_image_23.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train4_image_118.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train2_image_78.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train3_image_144.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train4_image_60.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train1_image_128.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train4_image_22.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_test_image_0.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train4_image_146.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_train3_image_33.jpg에 텍스트 박스와 꼭짓점이 시각화되어 저장되었습니다.
cord2_test_image

In [5]:
import json

# JSON 파일 경로
input_file_path = '/data/ephemeral/home/MCG/gen/ufo_format.json'
output_file_path = '/data/ephemeral/home/MCG/gen/ufoc_format.json'

def convert_to_target_format(input_file_path, output_file_path):
    with open(input_file_path, 'r', encoding='utf-8') as f:
        data = json.load(f)

    # 변환할 데이터 초기화
    converted_data = {"images": {}}

    # 이미지 이름과 속성 추출
    file_name = data["images"]["file_name"]
    height = data["images"]["height"]
    width = data["images"]["width"]

    # 새 형식에 이미지 이름 추가
    converted_data["images"][file_name] = {
        "paragraphs": {},
        "words": {}
    }

    # annotations의 각 항목을 words 구조로 변환
    for annotation_id, annotation_data in data["images"]["annotations"].items():
        # polygon 포맷에서 points를 변환
        points = [
            [point["x"], point["y"]]
            for point_id, point in annotation_data["polygon"]["points"].items()
        ]
        
        # 각 annotation을 words로 변환
        converted_data["images"][file_name]["words"][str(annotation_id).zfill(4)] = {
            "transcription": "",  # 빈 transcription 필드
            "points": points  # 변환된 points 필드
        }

    # 변환된 데이터를 새 JSON 파일로 저장
    with open(output_file_path, 'w', encoding='utf-8') as f:
        json.dump(converted_data, f, indent=4, ensure_ascii=False)

# 실행
convert_to_target_format(input_file_path, output_file_path)
