# coco Json file check and correction

In [1]:
import json

# ファイルを読み込む
file_path = 'ei-cuphop-train-y.json'  # 自身のCOCO JSONファイルのパスに置き換えてください
with open(file_path, 'r') as f:
    data = json.load(f)

def check_and_correct_json(data):
    # データが正しいかどうかのフラグ
    is_correct = True
    error_messages = []
    
    # 必要なセクションが存在するかチェック
    if not all(key in data for key in ['images', 'annotations', 'categories']):
        is_correct = False
        error_messages.append("必要なセクションが存在しません。")
        return is_correct, data, error_messages

    # 'images', 'annotations', 'categories'が想定通りの形式であることをチェック
    for img in data['images']:
        if not all(key in img for key in ['file_name', 'height', 'width', 'id']):
            is_correct = False
            error_messages.append(f"画像データに必要なキーが存在しません: {img}")
            
    for anno in data['annotations']:
        if not all(key in anno for key in ['segmentation', 'area', 'iscrowd', 'image_id', 'bbox', 'category_id', 'id']):
            is_correct = False
            error_messages.append(f"アノテーションに必要なキーが存在しません: {anno}")
            
    for cat in data['categories']:
        if not all(key in cat for key in ['id', 'name']):
            is_correct = False
            error_messages.append(f"カテゴリに必要なキーが存在しません: {cat}")

    # 'annotations'の各アノテーションが参照する'image_id'と'category_id'が存在することを確認
    image_ids = [img['id'] for img in data['images']]
    category_ids = [cat['id'] for cat in data['categories']]
    for anno in data['annotations']:
        if not anno['image_id'] in image_ids:
            is_correct = False
            error_messages.append(f"存在しない'image_id'を参照しています: {anno}")
        if not anno['category_id'] in category_ids:
            is_correct = False
            error_messages.append(f"存在しない'category_id'を参照しています: {anno}")
    
    return is_correct, data, error_messages

# チェックを実行
is_correct, data, error_messages = check_and_correct_json(data)

# 結果を表示
if is_correct:
    print("COCO JSONファイルは正しく構造化されています。")
else:
    print("COCO JSONファイルに以下の問題が見つかりました：")
    for message in error_messages:
        print(message)



COCO JSONファイルに以下の問題が見つかりました：
必要なセクションが存在しません。
