In [5]:
# ┌────────────────────────────────────────────────────────────────────────┐
# │ “Grate 표면 막힘 비율 계산 & 디버깅/튜닝 & 폴더 일괄 처리” 통합 스크립트 │
# │ → Jupyter Notebook 또는 일반 Python 스크립트(.py)로 사용 가능       │
# └────────────────────────────────────────────────────────────────────────┘

# ──────────────────────────────────────────────────────────────────────────
# 1) 필수 라이브러리 임포트
# ──────────────────────────────────────────────────────────────────────────

import cv2
import numpy as np
import os
import pandas as pd
from matplotlib import pyplot as plt


# ──────────────────────────────────────────────────────────────────────────
# 2) Helper 함수 정의
# ──────────────────────────────────────────────────────────────────────────

def order_points(pts):
    """
    cv2.boxPoints(minAreaRect) 로 얻은 4개 좌표를
    [top-left, top-right, bottom-right, bottom-left] 순서로 정렬합니다.
    """
    rect = np.zeros((4, 2), dtype="float32")
    s = pts.sum(axis=1)
    rect[0] = pts[np.argmin(s)]      # top-left
    rect[2] = pts[np.argmax(s)]      # bottom-right

    diff = np.diff(pts, axis=1)
    rect[1] = pts[np.argmin(diff)]   # top-right
    rect[3] = pts[np.argmax(diff)]   # bottom-left
    return rect


def detect_and_deskew_grate(image, min_area=2000, aspect_range=(0.3, 3.0)):
    """
    1) 그레이스케일 → AdaptiveThreshold → Contour 검출 → 가장 큰 Grate 후보를 minAreaRect로 뽑음
    2) 뽑힌 Box를 수평/수직 보정하여 Deskew된 ROI 이미지(컬러/그레이스케일) 반환

    Returns:
        warped_color (H×W×3 np.uint8): Deskew(원근 보정)된 Grate 영역(컬러)
        warped_gray  (H×W np.uint8): Deskew된 Grate 영역(그레이스케일)
        None, None (검출 실패 시)
    """
    gray_full = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # ① AdaptiveThreshold 이진화 (조명 변화에 강하도록)
    bw = cv2.adaptiveThreshold(
        gray_full, 255,
        cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
        cv2.THRESH_BINARY_INV,
        blockSize=51,
        C=5
    )

    # ② Contour 검출
    contours, _ = cv2.findContours(bw, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    h_full, w_full = bw.shape

    best_cnt = None
    best_area = 0

    for cnt in contours:
        area = cv2.contourArea(cnt)
        # 너무 작거나 전체의 90% 이상 크면 무시
        if area < min_area or area > (w_full * h_full * 0.9):
            continue

        x, y, cw, ch = cv2.boundingRect(cnt)
        ratio = cw / float(ch) if ch > 0 else 0
        # 너비/높이 비율이 Grate 형태 범위 내에 있으면 후보로 간주
        if aspect_range[0] < ratio < aspect_range[1]:
            if area > best_area:
                best_area = area
                best_cnt = cnt

    # Grate Contour를 못 찾은 경우
    if best_cnt is None:
        return None, None

    # ③ Contour → minAreaRect → boxPoints → order_points로 정렬
    rect = cv2.minAreaRect(best_cnt)
    box = cv2.boxPoints(rect).astype("float32")
    ordered_box = order_points(box)

    # ④ 원근 보정(Perspective Transform) → 정면 Grate ROI 획득
    (tl, tr, br, bl) = ordered_box
    widthA = np.linalg.norm(br - bl)
    widthB = np.linalg.norm(tr - tl)
    maxWidth = max(int(widthA), int(widthB))

    heightA = np.linalg.norm(tr - br)
    heightB = np.linalg.norm(tl - bl)
    maxHeight = max(int(heightA), int(heightB))

    dst = np.array([
        [0, 0],
        [maxWidth - 1, 0],
        [maxWidth - 1, maxHeight - 1],
        [0, maxHeight - 1]
    ], dtype="float32")

    M = cv2.getPerspectiveTransform(ordered_box, dst)
    warped_color = cv2.warpPerspective(image, M, (maxWidth, maxHeight))
    warped_gray  = cv2.cvtColor(warped_color, cv2.COLOR_BGR2GRAY)

    return warped_color, warped_gray


def compute_hole_block_ratio(warped_gray,
                             hole_thresh=80,
                             block_thresh=100):
    """
    Deskew된 Grate(그레이스케일)에서
    1) Hole Mask (구멍 영역) 생성 → gray < hole_thresh → “구멍”
    2) Block Mask (막힌 영역) 생성 → hole_mask 영역 내에서 gray >= block_thresh → “막힌 픽셀”
    3) 전체 구멍 픽셀 vs 막힌 픽셀 개수 계산 → ratio 반환

    Returns:
      total_hole_area  : 전체 구멍 픽셀 수 (int)
      blocked_area     : 구멍 중 막힌 픽셀 수 (int)
      ratio            : blocked_area / total_hole_area (float)
    """
    # 1) Hole Mask: 그레이스케일 값이 hole_thresh 미만이면 hole_mask=255
    _, hole_mask = cv2.threshold(warped_gray, hole_thresh, 255, cv2.THRESH_BINARY_INV)

    # 2) Block Mask: hole_mask == 255 영역 중에서 warped_gray >= block_thresh 인 픽셀만 “막힌 픽셀”
    block_mask = np.zeros_like(warped_gray)
    block_cond = (hole_mask == 255) & (warped_gray >= block_thresh)
    block_mask[block_cond] = 255

    # 3) 면적 계산
    total_hole_area = int(np.sum(hole_mask == 255))
    blocked_area     = int(np.sum(block_mask == 255))
    ratio = (blocked_area / total_hole_area) if total_hole_area > 0 else 0.0
    return total_hole_area, blocked_area, ratio


def classify_image_tuned(path, hole_thresh=80, block_thresh=100):
    """
    한 장 이미지를 받아서 Grate ROI 검출 → Deskew → 구멍/막힘 비율 계산 후
    ratio >= 0.5 → “Heavy”, ratio < 0.5 → “Not Heavy” 반환

    hole_thresh=80, block_thresh=100 으로 튜닝된 최종 분류 함수
    """
    img = cv2.imread(path)
    if img is None:
        raise FileNotFoundError(f"이미지를 불러올 수 없습니다: {path}")

    warped_color, warped_gray = detect_and_deskew_grate(
        img,
        min_area=2000,
        aspect_range=(0.3, 3.0)
    )

    # Grate ROI 검출 실패 시 “Heavy(no ROI)”로 간주
    if warped_gray is None:
        return None, None, None, "Heavy(no ROI)"

    total_hole_area, blocked_area, ratio = compute_hole_block_ratio(
        warped_gray,
        hole_thresh=hole_thresh,
        block_thresh=block_thresh
    )

    label = "Heavy" if ratio >= 0.5 else "Not Heavy"
    return total_hole_area, blocked_area, ratio, label


# ──────────────────────────────────────────────────────────────────────────
# 3) (선택) 디버깅/히스토그램 용도: IMG_4806 한 장 테스트
#    → threshold 조정 전, warped_gray와 masks 분포를 확인하고 싶을 때만 실행
# ──────────────────────────────────────────────────────────────────────────

def debug_single_image(path,
                       hole_thresh=80,
                       block_thresh_list=[140, 120, 100, 80, 60]):
    """
    - 단일 이미지에 대해:
      1) Grate ROI 검출 & Deskew
      2) warped_gray 전체와 hole_mask 영역 픽셀값 분포 히스토그램 확인
      3) 여러 block_thresh 값별로 block_mask 시각화 및 ratio 출력

    사용법:
        debug_single_image(".../IMG_4806.jpg", hole_thresh=80)
    """
    img = cv2.imread(path)
    if img is None:
        raise FileNotFoundError(f"이미지를 불러올 수 없습니다: {path}")

    warped_color, warped_gray = detect_and_deskew_grate(
        img, min_area=2000, aspect_range=(0.3, 3.0)
    )
    if warped_gray is None:
        print("⚠️ Grate ROI 검출에 실패했습니다. 파라미터를 조정하세요.")
        return

    # ① Deskewed 컬러/그레이 ROI 보기
    plt.figure(figsize=(5,5))
    plt.title("Deskewed Grate ROI (Color)")
    plt.imshow(cv2.cvtColor(warped_color, cv2.COLOR_BGR2RGB))
    plt.axis("off")
    plt.show()

    plt.figure(figsize=(5,5))
    plt.title("Deskewed Grate ROI (Gray)")
    plt.imshow(warped_gray, cmap="gray")
    plt.axis("off")
    plt.show()

    # ② warped_gray 전체 픽셀값 분포 히스토그램
    plt.figure(figsize=(6,3))
    plt.title("warped_gray 전체 픽셀값 분포")
    plt.hist(warped_gray.flatten(), bins=50, range=(0,255), color='lightgray')
    plt.xlabel("Gray 값")
    plt.ylabel("픽셀 개수")
    plt.show()

    # ③ hole_mask 생성 (hole_thresh 기준)
    _, hole_mask = cv2.threshold(warped_gray, hole_thresh, 255, cv2.THRESH_BINARY_INV)
    warped_gray_hole = warped_gray[hole_mask == 255]

    plt.figure(figsize=(5,5))
    plt.title(f"Hole Mask (gray < {hole_thresh})")
    plt.imshow(hole_mask, cmap="gray")
    plt.axis("off")
    plt.show()

    # ④ hole_mask 영역 히스토그램
    plt.figure(figsize=(6,3))
    plt.title(f"warped_gray (hole_mask==255) 분포 (hole_thresh={hole_thresh})")
    plt.hist(warped_gray_hole.flatten(), bins=50, range=(0,255), color='orange')
    plt.xlabel("Gray 값")
    plt.ylabel("픽셀 개수")
    plt.show()

    total_hole_area = int(np.sum(hole_mask == 255))
    print(f"총 구멍 면적 (hole_mask==255) : {total_hole_area} px")

    # ⑤ 여러 block_thresh 값별 block_mask 시각화 및 ratio 출력
    for bt in block_thresh_list:
        block_mask = np.zeros_like(warped_gray)
        block_cond = (hole_mask == 255) & (warped_gray >= bt)
        block_mask[block_cond] = 255

        blocked_area = int(np.sum(block_mask == 255))
        ratio = blocked_area / total_hole_area if total_hole_area > 0 else 0

        print(f"▶ block_thresh = {bt:3d} → 막힌 구멍 픽셀: {blocked_area:7d} px, 비율: {ratio:.3f}")

        plt.figure(figsize=(5,5))
        plt.title(f"Block Mask (>= {bt})")
        plt.imshow(block_mask, cmap="gray")
        plt.axis("off")
        plt.show()


# ──────────────────────────────────────────────────────────────────────────
# 4) 이미지 폴더 일괄 처리 → 결과를 DataFrame/CSV로 저장
# ──────────────────────────────────────────────────────────────────────────

def batch_process_folder(image_folder,
                         output_csv,
                         hole_thresh=80,
                         block_thresh=60):
    """
    지정된 폴더 내 모든 이미지를 일괄 처리하여
    'Heavy' / 'Not Heavy' 레이블과 비율을 CSV로 저장합니다.

    Parameters:
      - image_folder (str): 이미지들이 들어있는 폴더 경로
      - output_csv   (str): 결과를 저장할 CSV 파일 경로
      - hole_thresh  (int): 구멍(깊은 부분) 판별 임계값
      - block_thresh (int): 쓰레기(밝은 픽셀) 판별 임계값
    """
    valid_ext = (".jpg", ".jpeg", ".png", ".JPG", ".JPEG", ".PNG")
    image_files = sorted(
        [f for f in os.listdir(image_folder) if f.endswith(valid_ext)],
        key=lambda x: x.lower()
    )

    print(f"▶ 총 이미지 파일 수: {len(image_files)}")
    print(f"▶ 처리할 폴더: {image_folder}\n")

    results = []

    for idx, filename in enumerate(image_files, start=1):
        img_path = os.path.join(image_folder, filename)
        try:
            total, blocked, ratio, label = classify_image_tuned(
                img_path,
                hole_thresh=hole_thresh,
                block_thresh=block_thresh
            )
        except Exception as e:
            total, blocked, ratio, label = None, None, None, "Error"
            print(f"⚠️ 처리 오류: {filename} → {e}")

        # 콘솔 출력
        if total is None:
            print(f"[{idx}/{len(image_files)}] {filename} → Label: {label} (ROI 실패 또는 오류)")
        else:
            print(f"[{idx}/{len(image_files)}] {filename} → "
                  f"총 홀 면적: {total} px, 막힌 면적: {blocked} px, "
                  f"비율: {ratio:.2f}, 판정: {label}")

        results.append({
            "filename": filename,
            "total_hole_area": total,
            "blocked_area": blocked,
            "block_ratio": round(ratio, 3) if ratio is not None else None,
            "label": label
        })

    # DataFrame 및 CSV 저장
    df_results = pd.DataFrame(results)
    df_results.to_csv(output_csv, index=False, encoding="utf-8-sig")
    print(f"\n✅ 모든 이미지 처리 완료! 결과 CSV 저장 위치 → {output_csv}\n")
    return df_results


# ──────────────────────────────────────────────────────────────────────────
# 5) 실행 예시
# ──────────────────────────────────────────────────────────────────────────

if __name__ == "__main__":
    # (A) 디버깅 / 히스토그램 확인이 필요할 때:
    # debug_single_image("C:/Users/USER/Downloads/Picture_250531/NEW_OUTLIER/IMG_4806.jpg",
    #                    hole_thresh=80,
    #                    block_thresh_list=[140, 120, 100, 80, 60])

    # (B) 일괄 처리 실행: NEW_OUTLIER 폴더 내 모든 이미지 처리 → CSV 저장
    image_folder = r"C:\Users\USER\Downloads\Picture_250531\NEW_OUTLIER"
    output_csv   = r"C:\Users\USER\Downloads\Picture_250531\NEW_OUTLIER\results_surface_final.csv"

    # hole_thresh, block_thresh 값은 디버깅 결과에 따라 수정
    hole_thresh  = 100
    block_thresh =  60

    df = batch_process_folder(
        image_folder,
        output_csv,
        hole_thresh=hole_thresh,
        block_thresh=block_thresh
    )

    # Jupyter Notebook에서 바로 결과를 보고 싶으면:
    # from IPython.display import display
    # display(df)


▶ 총 이미지 파일 수: 3
▶ 처리할 폴더: C:\Users\USER\Downloads\Picture_250531\NEW_OUTLIER

[1/3] IMG_4805.jpg → 총 홀 면적: 9993883 px, 막힌 면적: 3143148 px, 비율: 0.31, 판정: Not Heavy
[2/3] IMG_4806.jpg → 총 홀 면적: 6851633 px, 막힌 면적: 1863084 px, 비율: 0.27, 판정: Not Heavy
[3/3] IMG_9006.jpg → 총 홀 면적: 4082975 px, 막힌 면적: 1602173 px, 비율: 0.39, 판정: Not Heavy

✅ 모든 이미지 처리 완료! 결과 CSV 저장 위치 → C:\Users\USER\Downloads\Picture_250531\NEW_OUTLIER\results_surface_final.csv

