## Openimagesv7+CTG

In [None]:
import os
from PIL import Image
import torch
import torch.nn as nn
import torch.nn.functional as F
import pandas as pd
import numpy as np
from tqdm import tqdm
from einops import rearrange
from gem import create_gem_model, get_gem_img_transform, get_tokenizer


# =====================================
# torch.load wrapper
# =====================================
_torch_load = torch.load
def torch_load_wrapper(*args, **kwargs):
    kwargs["weights_only"] = False
    return _torch_load(*args, **kwargs)
torch.load = torch_load_wrapper

  from .autonotebook import tqdm as notebook_tqdm


In [None]:
device = "cuda" if torch.cuda.is_available() else "cpu"

model_name = "ViT-B/16"
pretrained = "laion400m_e32"

gem_model = create_gem_model(model_name=model_name, pretrained=pretrained, device=device)
gem_model.eval()

gem_img_transform = get_gem_img_transform()
tokenizer = gem_model.tokenizer

In [None]:
class CTG(nn.Module):
    def __init__(self,
                 pos_ratio: float = 0.1,   # 상위 k% (양성 시드)
                 neg_ratio: float = 0.1,   # 하위 k% (음성 시드)
                 alpha: float = 0.5,       # 원로짓과 CTG 로짓 혼합 가중치
                 tau: float = 9.0,         # 유사도 스케일(temperature)
                 iters: int = 1):          # 반복 적용 횟수
        super().__init__()
        self.pos_ratio = pos_ratio
        self.neg_ratio = neg_ratio
        self.alpha = alpha
        self.tau = tau
        self.iters = max(1, iters)

    @torch.no_grad()
    def forward(self, feat_hwxd, logits_hwxc):
        """
        feat_hwxd  : [B, H, W, D]
        logits_hwxc: [B, H, W, C]
        """
        B, H, W, D = feat_hwxd.shape
        _, _, _, C = logits_hwxc.shape
        cur = logits_hwxc

        for _ in range(self.iters):
            scores = cur.permute(0, 3, 1, 2).reshape(B, C, H * W)

            k_pos = max(1, int(self.pos_ratio * H * W))
            k_neg = max(1, int(self.neg_ratio * H * W))

            feat = F.normalize(feat_hwxd.reshape(B, H * W, D), dim=-1)

            pos_proto = torch.zeros(B, C, D, device=feat.device)
            neg_proto = torch.zeros(B, C, D, device=feat.device)

            top_vals, top_idx = torch.topk(scores, k=k_pos, dim=-1, largest=True, sorted=False)
            bot_vals, bot_idx = torch.topk(scores, k=k_neg, dim=-1, largest=False, sorted=False)

            for b in range(B):
                for c in range(C):
                    pos_feats = feat[b, top_idx[b, c]]
                    neg_feats = feat[b, bot_idx[b, c]]
                    pos_proto[b, c] = F.normalize(pos_feats.mean(dim=0, keepdim=True), dim=-1)
                    neg_proto[b, c] = F.normalize(neg_feats.mean(dim=0, keepdim=True), dim=-1)

            sim_pos = torch.einsum("bnd,bcd->bnc", feat, pos_proto)
            sim_neg = torch.einsum("bnd,bcd->bnc", feat, neg_proto)
            ctg_score = self.tau * (sim_pos - sim_neg)

            ctg_score = ctg_score.reshape(B, H, W, C)
            cur = (1.0 - self.alpha) * cur + self.alpha * ctg_score

        return cur

class CTGWrapper(nn.Module):
    def __init__(self, patch_size=16, ctg_cfg=None):
        super().__init__()
        self.patch_size = patch_size
        self.ctg = CTG(**(ctg_cfg or {}))

    @torch.no_grad()
    def refine(self, feat_tokens_bnd, H, W, logits_bchw, mask_shape):
        """
        feat_tokens_bnd : [B, h*w, D]
        logits_bchw     : [B, C, h, w]
        mask_shape      : (H_out, W_out)
        """
        B, C, h, w = logits_bchw.shape
        feat_hwxd = feat_tokens_bnd.reshape(B, h, w, -1)

        logits_hwxc = logits_bchw.permute(0, 2, 3, 1).contiguous()
        refined_hwxc = self.ctg(feat_hwxd, logits_hwxc)

        refined_bchw = refined_hwxc.permute(0, 3, 1, 2).contiguous()
        refined_bchw = F.interpolate(refined_bchw, size=mask_shape, mode='bilinear')
        return refined_bchw

In [None]:
patch_size = 16
ctg_cfg = dict(pos_ratio=0.10, neg_ratio=0.10, alpha=0.3, tau=9.0, iters=1)
ctg_wrapper = CTGWrapper(patch_size=patch_size, ctg_cfg=ctg_cfg)

In [None]:
@torch.no_grad()
def gem_forward_with_ctg(image_bchw, texts):
    B, _, H, W = image_bchw.shape

    feat_gem, _ = gem_model.model.visual(image_bchw.to(device))
    feat_gem = F.normalize(feat_gem, dim=-1)

    h, w = H // patch_size, W // patch_size
    patch_tokens = feat_gem[:, 1:]

    tokenized = tokenizer(texts).to(device)
    text_emb = gem_model.model.encode_text(tokenized)
    text_emb = F.normalize(text_emb, dim=-1)
    text_emb = text_emb.unsqueeze(0).repeat(B, 1, 1)

    logits_init = 100.0 * torch.einsum("bnd,bcd->bnc", patch_tokens, text_emb)
    logits_init = rearrange(logits_init, "b (hh ww) c -> b c hh ww", hh=h, ww=w)

    logits_out = ctg_wrapper.refine(
        feat_tokens_bnd=patch_tokens,
        logits_bchw=logits_init,
        out_size_hw=(H, W)
    )

    return logits_out

In [None]:
def compute_point_miou_for_image(logits, points_df, image_w, image_h, class_list):

    logits = logits[0]
    C, H_out, W_out = logits.shape

    pred_masks = {}
    for idx, cls in enumerate(class_list):
        prob = torch.sigmoid(logits[idx])
        pred_masks[cls] = (prob > 0.5).cpu().numpy()

    intersection = np.zeros(C)
    union = np.zeros(C)

    class_to_idx = {cls: i for i, cls in enumerate(class_list)}

    for _, row in points_df.iterrows():

        label_id = row["LabelName"]
        if label_id not in label_to_name:
            continue

        gt_class = label_to_name[label_id]
        if gt_class not in class_to_idx:
            continue

        gx = int((row["X"] / image_w) * W_out)
        gy = int((row["Y"] / image_h) * H_out)

        gx = max(0, min(W_out - 1, gx))
        gy = max(0, min(H_out - 1, gy))

        for cls, idx in class_to_idx.items():
            pred_pos = pred_masks[cls][gy, gx]
            gt_pos = (cls == gt_class)

            if gt_pos or pred_pos:
                union[idx] += 1
            if gt_pos and pred_pos:
                intersection[idx] += 1

    valid = union > 0
    if valid.sum() == 0:
        return 0.0, intersection, union, class_to_idx

    miou = (intersection[valid] / (union[valid] + 1e-6)).mean()
    return miou, intersection, union, class_to_idx

In [None]:
image_root = r"C:\Users\Konyang\Desktop\open-vocab 데이터\openimagesv7\data"

class_csv = r"C:\Users\Konyang\Desktop\open-vocab 데이터\openimagesv7\oidv7-class-descriptions-points (1).csv"
anno_csv  = r"C:\Users\Konyang\Desktop\open-vocab 데이터\openimagesv7\oidv7-val-annotations-point-labels.csv"

class_df = pd.read_csv(class_csv)
anno_df_raw = pd.read_csv(anno_csv)

anno_df = anno_df_raw.rename(columns={
    "ImageId": "ImageID",
    "Label": "LabelName",
    "X": "X",
    "Y": "Y"
})

label_to_name = dict(zip(class_df["LabelName"], class_df["DisplayName"]))

In [None]:
# =====================================
# p-mIoU 전체 평가
# =====================================
all_image_ids = anno_df["ImageID"].unique()
total_images = len(all_image_ids)

CHUNK_SIZE = 500
SAVE_PATH = "pmIoU_results_ctg_openclip.npy"

if os.path.exists(SAVE_PATH):
    miou_results = list(np.load(SAVE_PATH, allow_pickle=True))
    start_index = len(miou_results)
    print(f"기존 진행 발견 → {start_index}개 완료됨. 이어서 진행.")
else:
    miou_results = []
    start_index = 0

class_intersection = {}
class_union = {}

print(f"총 평가 이미지 수: {total_images}")


for start in range(start_index, total_images, CHUNK_SIZE):

    end = min(start + CHUNK_SIZE, total_images)
    chunk_ids = all_image_ids[start:end]

    print(f"\n=== [{start} ~ {end}] {len(chunk_ids)}개 이미지 평가중... ===")

    for image_id in tqdm(chunk_ids, desc=f"Chunk {start}-{end}"):

        img_path = os.path.join(image_root, image_id + ".jpg")

        if not os.path.exists(img_path):
            miou_results.append(None)
            continue

        point_rows = anno_df[anno_df["ImageID"] == image_id]
        gt_label_ids = point_rows["LabelName"].unique()

        class_list = [label_to_name[l] for l in gt_label_ids if l in label_to_name]
        if len(class_list) == 0:
            miou_results.append(None)
            continue

        img_pil = Image.open(img_path).convert("RGB")
        W, H = img_pil.size

        img_tensor = gem_img_transform(img_pil).unsqueeze(0).to(device)

        with torch.no_grad():
            logits_ctg = gem_forward_with_ctg(img_tensor, class_list)

        miou, inter, union, class_to_idx = compute_point_miou_for_image(
            logits_ctg, point_rows, W, H, class_list
        )

        miou_results.append(miou)

        # 클래스별 누적
        for cls, idx in class_to_idx.items():
            if cls not in class_intersection:
                class_intersection[cls] = 0.0
                class_union[cls] = 0.0
            class_intersection[cls] += inter[idx]
            class_union[cls] += union[idx]

    # 청크 저장
    np.save(SAVE_PATH, np.array(miou_results, dtype=object))
    print(f"✓ 청크 저장 완료 ({len(miou_results)}개 완료됨)")


# =====================================
# 최종 결과 출력
# =====================================
valid_scores = [m for m in miou_results if m is not None]
final_miou = np.mean(valid_scores)

print("\n====================================")
print(f" Final Dataset p-mIoU (CTG) = {final_miou*100:.4f}")
print("====================================")

print("\n========== 클래스별 mIoU ==========")
for cls in sorted(class_intersection.keys()):
    if class_union[cls] > 0:
        score = class_intersection[cls] / (class_union[cls] + 1e-6)
        print(f"{cls:30s} : {score*100:.4f}")

총 평가 이미지 수: 36702

=== [0 ~ 500] 500개 이미지 평가중... ===


Chunk 0-500: 100%|███████████████████████████████████████████████████████████████████| 500/500 [01:41<00:00,  4.92it/s]


✓ 청크 저장 완료 (500개 완료됨)

=== [500 ~ 1000] 500개 이미지 평가중... ===


Chunk 500-1000: 100%|████████████████████████████████████████████████████████████████| 500/500 [01:39<00:00,  5.01it/s]


✓ 청크 저장 완료 (1000개 완료됨)

=== [1000 ~ 1500] 500개 이미지 평가중... ===


Chunk 1000-1500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:39<00:00,  5.05it/s]


✓ 청크 저장 완료 (1500개 완료됨)

=== [1500 ~ 2000] 500개 이미지 평가중... ===


Chunk 1500-2000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.09it/s]


✓ 청크 저장 완료 (2000개 완료됨)

=== [2000 ~ 2500] 500개 이미지 평가중... ===


Chunk 2000-2500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.10it/s]


✓ 청크 저장 완료 (2500개 완료됨)

=== [2500 ~ 3000] 500개 이미지 평가중... ===


Chunk 2500-3000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.12it/s]


✓ 청크 저장 완료 (3000개 완료됨)

=== [3000 ~ 3500] 500개 이미지 평가중... ===


Chunk 3000-3500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.10it/s]


✓ 청크 저장 완료 (3500개 완료됨)

=== [3500 ~ 4000] 500개 이미지 평가중... ===


Chunk 3500-4000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.07it/s]


✓ 청크 저장 완료 (4000개 완료됨)

=== [4000 ~ 4500] 500개 이미지 평가중... ===


Chunk 4000-4500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.11it/s]


✓ 청크 저장 완료 (4500개 완료됨)

=== [4500 ~ 5000] 500개 이미지 평가중... ===


Chunk 4500-5000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.07it/s]


✓ 청크 저장 완료 (5000개 완료됨)

=== [5000 ~ 5500] 500개 이미지 평가중... ===


Chunk 5000-5500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.10it/s]


✓ 청크 저장 완료 (5500개 완료됨)

=== [5500 ~ 6000] 500개 이미지 평가중... ===


Chunk 5500-6000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.08it/s]


✓ 청크 저장 완료 (6000개 완료됨)

=== [6000 ~ 6500] 500개 이미지 평가중... ===


Chunk 6000-6500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.07it/s]


✓ 청크 저장 완료 (6500개 완료됨)

=== [6500 ~ 7000] 500개 이미지 평가중... ===


Chunk 6500-7000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.13it/s]


✓ 청크 저장 완료 (7000개 완료됨)

=== [7000 ~ 7500] 500개 이미지 평가중... ===


Chunk 7000-7500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.08it/s]


✓ 청크 저장 완료 (7500개 완료됨)

=== [7500 ~ 8000] 500개 이미지 평가중... ===


Chunk 7500-8000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.10it/s]


✓ 청크 저장 완료 (8000개 완료됨)

=== [8000 ~ 8500] 500개 이미지 평가중... ===


Chunk 8000-8500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.10it/s]


✓ 청크 저장 완료 (8500개 완료됨)

=== [8500 ~ 9000] 500개 이미지 평가중... ===


Chunk 8500-9000: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.09it/s]


✓ 청크 저장 완료 (9000개 완료됨)

=== [9000 ~ 9500] 500개 이미지 평가중... ===


Chunk 9000-9500: 100%|███████████████████████████████████████████████████████████████| 500/500 [01:36<00:00,  5.16it/s]


✓ 청크 저장 완료 (9500개 완료됨)

=== [9500 ~ 10000] 500개 이미지 평가중... ===


Chunk 9500-10000: 100%|██████████████████████████████████████████████████████████████| 500/500 [01:36<00:00,  5.16it/s]


✓ 청크 저장 완료 (10000개 완료됨)

=== [10000 ~ 10500] 500개 이미지 평가중... ===


Chunk 10000-10500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.15it/s]


✓ 청크 저장 완료 (10500개 완료됨)

=== [10500 ~ 11000] 500개 이미지 평가중... ===


Chunk 10500-11000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.10it/s]


✓ 청크 저장 완료 (11000개 완료됨)

=== [11000 ~ 11500] 500개 이미지 평가중... ===


Chunk 11000-11500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.11it/s]


✓ 청크 저장 완료 (11500개 완료됨)

=== [11500 ~ 12000] 500개 이미지 평가중... ===


Chunk 11500-12000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.10it/s]


✓ 청크 저장 완료 (12000개 완료됨)

=== [12000 ~ 12500] 500개 이미지 평가중... ===


Chunk 12000-12500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.09it/s]


✓ 청크 저장 완료 (12500개 완료됨)

=== [12500 ~ 13000] 500개 이미지 평가중... ===


Chunk 12500-13000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.15it/s]


✓ 청크 저장 완료 (13000개 완료됨)

=== [13000 ~ 13500] 500개 이미지 평가중... ===


Chunk 13000-13500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.13it/s]


✓ 청크 저장 완료 (13500개 완료됨)

=== [13500 ~ 14000] 500개 이미지 평가중... ===


Chunk 13500-14000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.12it/s]


✓ 청크 저장 완료 (14000개 완료됨)

=== [14000 ~ 14500] 500개 이미지 평가중... ===


Chunk 14000-14500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.08it/s]


✓ 청크 저장 완료 (14500개 완료됨)

=== [14500 ~ 15000] 500개 이미지 평가중... ===


Chunk 14500-15000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.07it/s]


✓ 청크 저장 완료 (15000개 완료됨)

=== [15000 ~ 15500] 500개 이미지 평가중... ===


Chunk 15000-15500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.10it/s]


✓ 청크 저장 완료 (15500개 완료됨)

=== [15500 ~ 16000] 500개 이미지 평가중... ===


Chunk 15500-16000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.08it/s]


✓ 청크 저장 완료 (16000개 완료됨)

=== [16000 ~ 16500] 500개 이미지 평가중... ===


Chunk 16000-16500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.11it/s]


✓ 청크 저장 완료 (16500개 완료됨)

=== [16500 ~ 17000] 500개 이미지 평가중... ===


Chunk 16500-17000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:38<00:00,  5.08it/s]


✓ 청크 저장 완료 (17000개 완료됨)

=== [17000 ~ 17500] 500개 이미지 평가중... ===


Chunk 17000-17500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:39<00:00,  5.01it/s]


✓ 청크 저장 완료 (17500개 완료됨)

=== [17500 ~ 18000] 500개 이미지 평가중... ===


Chunk 17500-18000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.15it/s]


✓ 청크 저장 완료 (18000개 완료됨)

=== [18000 ~ 18500] 500개 이미지 평가중... ===


Chunk 18000-18500: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:36<00:00,  5.17it/s]


✓ 청크 저장 완료 (18500개 완료됨)

=== [18500 ~ 19000] 500개 이미지 평가중... ===


Chunk 18500-19000: 100%|█████████████████████████████████████████████████████████████| 500/500 [01:37<00:00,  5.13it/s]


✓ 청크 저장 완료 (19000개 완료됨)

=== [19000 ~ 19500] 500개 이미지 평가중... ===


Chunk 19000-19500: 100%|█████████████████████████████████████████████████████████████| 500/500 [00:55<00:00,  8.98it/s]


✓ 청크 저장 완료 (19500개 완료됨)

=== [19500 ~ 20000] 500개 이미지 평가중... ===


Chunk 19500-20000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10504.30it/s]


✓ 청크 저장 완료 (20000개 완료됨)

=== [20000 ~ 20500] 500개 이미지 평가중... ===


Chunk 20000-20500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10504.04it/s]


✓ 청크 저장 완료 (20500개 완료됨)

=== [20500 ~ 21000] 500개 이미지 평가중... ===


Chunk 20500-21000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15833.42it/s]


✓ 청크 저장 완료 (21000개 완료됨)

=== [21000 ~ 21500] 500개 이미지 평가중... ===


Chunk 21000-21500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10707.29it/s]


✓ 청크 저장 완료 (21500개 완료됨)

=== [21500 ~ 22000] 500개 이미지 평가중... ===


Chunk 21500-22000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10332.48it/s]


✓ 청크 저장 완료 (22000개 완료됨)

=== [22000 ~ 22500] 500개 이미지 평가중... ===


Chunk 22000-22500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15751.24it/s]


✓ 청크 저장 완료 (22500개 완료됨)

=== [22500 ~ 23000] 500개 이미지 평가중... ===


Chunk 22500-23000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 11130.61it/s]


✓ 청크 저장 완료 (23000개 완료됨)

=== [23000 ~ 23500] 500개 이미지 평가중... ===


Chunk 23000-23500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10594.25it/s]


✓ 청크 저장 완료 (23500개 완료됨)

=== [23500 ~ 24000] 500개 이미지 평가중... ===


Chunk 23500-24000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15901.13it/s]


✓ 청크 저장 완료 (24000개 완료됨)

=== [24000 ~ 24500] 500개 이미지 평가중... ===


Chunk 24000-24500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10875.09it/s]


✓ 청크 저장 완료 (24500개 완료됨)

=== [24500 ~ 25000] 500개 이미지 평가중... ===


Chunk 24500-25000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15645.25it/s]


✓ 청크 저장 완료 (25000개 완료됨)

=== [25000 ~ 25500] 500개 이미지 평가중... ===


Chunk 25000-25500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 17166.98it/s]


✓ 청크 저장 완료 (25500개 완료됨)

=== [25500 ~ 26000] 500개 이미지 평가중... ===


Chunk 25500-26000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10923.46it/s]


✓ 청크 저장 완료 (26000개 완료됨)

=== [26000 ~ 26500] 500개 이미지 평가중... ===


Chunk 26000-26500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 11945.23it/s]


✓ 청크 저장 완료 (26500개 완료됨)

=== [26500 ~ 27000] 500개 이미지 평가중... ===


Chunk 26500-27000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15792.52it/s]


✓ 청크 저장 완료 (27000개 완료됨)

=== [27000 ~ 27500] 500개 이미지 평가중... ===


Chunk 27000-27500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 16710.51it/s]


✓ 청크 저장 완료 (27500개 완료됨)

=== [27500 ~ 28000] 500개 이미지 평가중... ===


Chunk 27500-28000: 100%|███████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 9898.72it/s]


✓ 청크 저장 완료 (28000개 완료됨)

=== [28000 ~ 28500] 500개 이미지 평가중... ===


Chunk 28000-28500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15727.26it/s]


✓ 청크 저장 완료 (28500개 완료됨)

=== [28500 ~ 29000] 500개 이미지 평가중... ===


Chunk 28500-29000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 11070.62it/s]


✓ 청크 저장 완료 (29000개 완료됨)

=== [29000 ~ 29500] 500개 이미지 평가중... ===


Chunk 29000-29500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15799.30it/s]


✓ 청크 저장 완료 (29500개 완료됨)

=== [29500 ~ 30000] 500개 이미지 평가중... ===


Chunk 29500-30000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15779.09it/s]


✓ 청크 저장 완료 (30000개 완료됨)

=== [30000 ~ 30500] 500개 이미지 평가중... ===


Chunk 30000-30500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10882.03it/s]


✓ 청크 저장 완료 (30500개 완료됨)

=== [30500 ~ 31000] 500개 이미지 평가중... ===


Chunk 30500-31000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10578.96it/s]


✓ 청크 저장 완료 (31000개 완료됨)

=== [31000 ~ 31500] 500개 이미지 평가중... ===


Chunk 31000-31500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15839.28it/s]


✓ 청크 저장 완료 (31500개 완료됨)

=== [31500 ~ 32000] 500개 이미지 평가중... ===


Chunk 31500-32000: 100%|███████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 9268.89it/s]


✓ 청크 저장 완료 (32000개 완료됨)

=== [32000 ~ 32500] 500개 이미지 평가중... ===


Chunk 32000-32500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 14060.50it/s]


✓ 청크 저장 완료 (32500개 완료됨)

=== [32500 ~ 33000] 500개 이미지 평가중... ===


Chunk 32500-33000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15791.93it/s]


✓ 청크 저장 완료 (33000개 완료됨)

=== [33000 ~ 33500] 500개 이미지 평가중... ===


Chunk 33000-33500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 17074.03it/s]


✓ 청크 저장 완료 (33500개 완료됨)

=== [33500 ~ 34000] 500개 이미지 평가중... ===


Chunk 33500-34000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10607.16it/s]


✓ 청크 저장 완료 (34000개 완료됨)

=== [34000 ~ 34500] 500개 이미지 평가중... ===


Chunk 34000-34500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 15813.48it/s]


✓ 청크 저장 완료 (34500개 완료됨)

=== [34500 ~ 35000] 500개 이미지 평가중... ===


Chunk 34500-35000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 17836.41it/s]


✓ 청크 저장 완료 (35000개 완료됨)

=== [35000 ~ 35500] 500개 이미지 평가중... ===


Chunk 35000-35500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 10597.89it/s]


✓ 청크 저장 완료 (35500개 완료됨)

=== [35500 ~ 36000] 500개 이미지 평가중... ===


Chunk 35500-36000: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 13278.49it/s]


✓ 청크 저장 완료 (36000개 완료됨)

=== [36000 ~ 36500] 500개 이미지 평가중... ===


Chunk 36000-36500: 100%|██████████████████████████████████████████████████████████| 500/500 [00:00<00:00, 17144.66it/s]


✓ 청크 저장 완료 (36500개 완료됨)

=== [36500 ~ 36702] 202개 이미지 평가중... ===


Chunk 36500-36702: 100%|██████████████████████████████████████████████████████████| 202/202 [00:00<00:00, 12599.63it/s]

✓ 청크 저장 완료 (36702개 완료됨)

 Final Dataset p-mIoU (CTG) = 0.4738

Abdomen                        : 0.0417
Accordion                      : 0.2535
Acrylic paint                  : 0.2500
Action figure                  : 0.3235
Adapter (Electrical)           : 0.1172
Adhesive                       : 0.1194
Adhesive tape                  : 0.2258
Adult                          : 0.2143
Advertising                    : 0.1062
Agate                          : 0.0714
Agave                          : 0.5135
Agriculture                    : 0.2097
Airboat                        : 0.3514
Aircraft                       : 0.2048
Aircraft carrier               : 0.0192
Airline                        : 0.1818
Airplane                       : 0.1488
Airport                        : 0.1739
Airship                        : 0.3134
Alarm clock                    : 0.3933
Alcoholic beverage             : 0.1797
Algae                          : 0.4167
All-terrain vehicle            : 0.0625
Alligator        


