In [6]:

import os
import json
from collections import defaultdict

In [7]:
# 기본 디렉토리 경로 설정
base_dir = "./dataset/Training"
crop_names = ["고추", "무", "배추", "오이", "파"]  # 작물 종류

In [8]:
# 결과를 저장할 딕셔너리
disease_counts = defaultdict(lambda: defaultdict(int))

In [9]:
for crop in crop_names:
    # 라벨 디렉토리만 처리
    label_dirs = [d for d in os.listdir(base_dir) if d.startswith(f"[라벨]{crop}")]

    for label_dir in label_dirs:
        full_label_dir = os.path.join(base_dir, label_dir)
        
        if not os.path.isdir(full_label_dir):
            continue
        
        # 라벨 파일 리스트 가져오기
        label_files = [f for f in os.listdir(full_label_dir) if f.endswith(".json")]

        for label_file in label_files:
            label_path = os.path.join(full_label_dir, label_file)

            try:
                # 라벨 파일 읽기
                with open(label_path, "r", encoding="utf-8") as f:
                    data = json.load(f)

                # disease 값 가져오기
                disease_value = data.get("annotations", {}).get("disease", "Unknown")

                # 질병 개수 집계
                disease_counts[crop][disease_value] += 1

            except Exception as e:
                print(f"Error processing file {label_path}: {e}")

In [10]:
# 결과 출력
for crop, diseases in disease_counts.items():
    print(f"=== {crop} ===")
    for disease, count in diseases.items():
        print(f"  {disease}: {count}")

=== 고추 ===
  0: 7422
  1: 973
  2: 915
=== 무 ===
  0: 6936
  3: 470
  4: 227
=== 배추 ===
  0: 9318
  5: 802
  6: 458
=== 오이 ===
  0: 11455
  11: 392
  12: 389
=== 파 ===
  0: 10504
  16: 964
  17: 259
  18: 894
