## Raw Data -> Cropped Data


In [8]:
import os
import glob
from PIL import Image
import re

def split_image(input_path: str, output_dir: str, prefix: str, rows: int, cols: int):
    img = Image.open(input_path)
    W, H = img.size

    tile_w = W // cols
    tile_h = H // rows

    for row in range(rows):
        for col in range(cols):
            left   = col * tile_w
            upper  = row * tile_h
            right  = (col + 1) * tile_w if col < cols - 1 else W
            lower  = (row + 1) * tile_h if row < rows - 1 else H

            tile = img.crop((left, upper, right, lower))
            tile_filename = f"{prefix}_r{row}_c{col}.png"
            tile.save(os.path.join(output_dir, tile_filename))
    print(f"[✓] '{prefix}' 분할 완료: {rows*cols}개 타일")

def split_folder(input_folder: str, output_root: str):
    """
    input_folder 안의 .png/.jpg 파일을 모두 찾아,
    파일명 패턴에 따라 16분할 혹은 32분할을 수행하고
    모든 타일을 output_root에 바로 저장.
    """
    if not os.path.isdir(input_folder):
        raise ValueError(f"입력 폴더가 존재하지 않습니다: {input_folder}")

    patterns = ("*.png", "*.PNG", "*.jpg", "*.JPG", "*.jpeg", "*.JPEG")
    img_paths = []
    for pat in patterns:
        img_paths.extend(glob.glob(os.path.join(input_folder, pat)))
    if not img_paths:
        print("※ 입력 폴더에 처리할 이미지 파일이 없습니다.")
        return

    os.makedirs(output_root, exist_ok=True)

    for img_path in img_paths:
        fname = os.path.basename(img_path)
        basename, _ = os.path.splitext(fname)

        # 숫자-only → 4×8, 'Image' prefix → 4×4, 그 외 기본 4×4
        if re.fullmatch(r"\d+", basename):
            rows, cols = 4, 8
        else:
            rows, cols = 4, 4

        split_image(img_path, output_root, prefix=basename, rows=rows, cols=cols)


if __name__ == "__main__":
    input_folder = "/Users/chonakyung/Library/CloudStorage/GoogleDrive-whskrud1007@gmail.com/내 드라이브/blood/Data/Raw_data/Train"
    output_root  = "/Users/chonakyung/Library/CloudStorage/GoogleDrive-whskrud1007@gmail.com/내 드라이브/blood/Data/Cropped_Data/Train"
    split_folder(input_folder, output_root)


[✓] '60' 분할 완료: 32개 타일
[✓] '48' 분할 완료: 32개 타일
[✓] '49' 분할 완료: 32개 타일
[✓] '61' 분할 완료: 32개 타일
[✓] '59' 분할 완료: 32개 타일
[✓] '58' 분할 완료: 32개 타일
[✓] '8' 분할 완료: 32개 타일
[✓] '9' 분할 완료: 32개 타일
[✓] '14' 분할 완료: 32개 타일
[✓] '28' 분할 완료: 32개 타일
[✓] '29' 분할 완료: 32개 타일
[✓] '15' 분할 완료: 32개 타일
[✓] '17' 분할 완료: 32개 타일
[✓] '16' 분할 완료: 32개 타일
[✓] '12' 분할 완료: 32개 타일
[✓] '13' 분할 완료: 32개 타일
[✓] '39' 분할 완료: 32개 타일
[✓] '11' 분할 완료: 32개 타일
[✓] '10' 분할 완료: 32개 타일
[✓] '38' 분할 완료: 32개 타일
[✓] '35' 분할 완료: 32개 타일
[✓] '21' 분할 완료: 32개 타일
[✓] '20' 분할 완료: 32개 타일
[✓] '34' 분할 완료: 32개 타일
[✓] '22' 분할 완료: 32개 타일
[✓] '36' 분할 완료: 32개 타일
[✓] '37' 분할 완료: 32개 타일
[✓] '23' 분할 완료: 32개 타일
[✓] '27' 분할 완료: 32개 타일
[✓] '33' 분할 완료: 32개 타일
[✓] '32' 분할 완료: 32개 타일
[✓] '26' 분할 완료: 32개 타일
[✓] '18' 분할 완료: 32개 타일
[✓] '30' 분할 완료: 32개 타일
[✓] '24' 분할 완료: 32개 타일
[✓] '25' 분할 완료: 32개 타일
[✓] '31' 분할 완료: 32개 타일
[✓] '19' 분할 완료: 32개 타일
[✓] '4' 분할 완료: 32개 타일
[✓] '56' 분할 완료: 32개 타일
[✓] '42' 분할 완료: 32개 타일
[✓] '43' 분할 완료: 32개 타일
[✓] '5' 분할 완료: 32개 타일
[✓] '57' 분할 완료: