In [1]:
pip install opencv-python tqdm

Defaulting to user installation because normal site-packages is not writeable


## CLAHE 대비 개선

### MURA Valid

train도 동일하게 진행

In [2]:
import os
import cv2
from tqdm import tqdm

# 입력 및 출력 경로 설정
mura_input_dirs = [
    "/home/work/VisionAI/MURA-v1.1/valid/XR_ELBOW",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_FOREARM",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_FINGER",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_HAND",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_SHOULDER",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_HUMERUS",
    "/home/work/VisionAI/MURA-v1.1/valid/XR_WRIST",
]

mura_output_base_dir = "/home/work/VisionAI/CLAHE_train/MURA/valid/"

# 지원하는 이미지 형식
SUPPORTED_FORMATS = {".png", ".jpg", ".jpeg", ".bmp", ".tiff"}

# CLAHE 객체 생성 함수
def apply_clahe(image_path, clip_limit=2.0, tile_grid_size=(8, 8)):
    """
    이미지에 CLAHE 적용
    :param image_path: 입력 이미지 경로
    :param clip_limit: CLAHE의 대비 제한 값
    :param tile_grid_size: 타일 크기
    :return: CLAHE 처리된 이미지
    """
    try:
        # 이미지 읽기 (그레이스케일)
        image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
        if image is None:
            raise ValueError(f"Image not found or cannot be read: {image_path}")
        
        # CLAHE 객체 생성 및 적용
        clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=tile_grid_size)
        return clahe.apply(image)
    except Exception as e:
        print(f"Error applying CLAHE to {image_path}: {e}")
        return None  # 에러 발생 시 None 반환

# 처리 현황 초기화
total_files = 0
processed_files = 0
skipped_files = 0

# 데이터 처리 루프
for input_dir in mura_input_dirs:
    for root, _, files in os.walk(input_dir):
        with tqdm(total=len(files), desc=f"Processing {os.path.basename(root)}", unit="file") as pbar:
            for file in files:
                total_files += 1

                # 파일 확장자 확인
                file_ext = os.path.splitext(file)[-1].lower()
                if file_ext not in SUPPORTED_FORMATS:
                    skipped_files += 1
                    pbar.update(1)  # 진행 상태 업데이트
                    continue  # 지원하지 않는 형식은 건너뛰기

                input_file_path = os.path.join(root, file)
                
                # 출력 경로 계산
                relative_path = os.path.relpath(root, "/home/work/VisionAI/MURA-v1.1/valid")
                output_dir = os.path.join(mura_output_base_dir, relative_path)
                
                # 디렉토리 생성 (필요 시 한 번만 실행)
                os.makedirs(output_dir, exist_ok=True)
                
                output_file_path = os.path.join(output_dir, file)

                # CLAHE 적용 및 결과 저장
                clahe_image = apply_clahe(input_file_path)
                if clahe_image is not None:
                    try:
                        cv2.imwrite(output_file_path, clahe_image)
                        processed_files += 1
                    except Exception as e:
                        print(f"Error saving processed image {output_file_path}: {e}")
                
                # 진행 상태 업데이트
                pbar.update(1)

# 처리 통계 출력
print("\n--- Processing Summary ---")
print(f"Total files found: {total_files}")
print(f"Processed files: {processed_files}")
print(f"Skipped files (unsupported or errors): {skipped_files}")


Processing XR_ELBOW: 0file [00:00, ?file/s]
Processing patient11817: 0file [00:00, ?file/s]
Processing study1_positive: 100%|██████████| 5/5 [00:00<00:00, 85.00file/s]
Processing patient11860: 0file [00:00, ?file/s]
Processing study1_negative: 100%|██████████| 2/2 [00:00<00:00, 75.84file/s]
Processing patient11430: 0file [00:00, ?file/s]
Processing study1_positive: 100%|██████████| 5/5 [00:00<00:00, 97.82file/s]
Processing patient11204: 0file [00:00, ?file/s]
Processing study1_negative: 100%|██████████| 2/2 [00:00<00:00, 88.08file/s]
Processing patient11390: 0file [00:00, ?file/s]
Processing study1_positive: 100%|██████████| 5/5 [00:00<00:00, 110.69file/s]
Processing study2_negative: 100%|██████████| 3/3 [00:00<00:00, 100.96file/s]
Processing patient11408: 0file [00:00, ?file/s]
Processing study1_negative: 100%|██████████| 3/3 [00:00<00:00, 86.35file/s]
Processing patient11852: 0file [00:00, ?file/s]
Processing study1_negative: 100%|██████████| 2/2 [00:00<00:00, 64.54file/s]
Processing


--- Processing Summary ---
Total files found: 3197
Processed files: 3197
Skipped files (unsupported or errors): 0





### AIHUB Vaild
train도 동일하게 진행

In [2]:
import os
import cv2
from tqdm import tqdm

# 입력 및 출력 경로 설정
mura_input_dirs = [
    "/home/work/VisionAI/aihub/Validation/01.원천데이터/ChestPA_Abnormal",
     "/home/work/VisionAI/aihub/Validation/01.원천데이터/ChestPA_Normal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Facial_bone_Abnormal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Facial_bone_Normal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Foot_Abnormal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Foot_Normal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Mammography_Abnormal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/Mammography_Normal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/PNS_Abnormal",
      "/home/work/VisionAI/aihub/Validation/01.원천데이터/PNS_Normal",

]

mura_output_base_dir = "/home/work/VisionAI/CLAHE_valid/aihub/01.원천데이터"

# 지원하는 이미지 형식
SUPPORTED_FORMATS = {".png", ".jpg", ".jpeg", ".bmp", ".tiff"}

# CLAHE 객체 생성 함수
def apply_clahe(image_path, clip_limit=2.0, tile_grid_size=(8, 8)):
    """
    이미지에 CLAHE 적용
    :param image_path: 입력 이미지 경로
    :param clip_limit: CLAHE의 대비 제한 값
    :param tile_grid_size: 타일 크기
    :return: CLAHE 처리된 이미지
    """
    try:
        # 이미지 읽기 (그레이스케일)
        image = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)
        if image is None:
            raise ValueError(f"Image not found or cannot be read: {image_path}")
        
        # CLAHE 객체 생성 및 적용
        clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=tile_grid_size)
        return clahe.apply(image)
    except Exception as e:
        print(f"Error applying CLAHE to {image_path}: {e}")
        return None  # 에러 발생 시 None 반환

# 처리 현황 초기화
total_files = 0
processed_files = 0
skipped_files = 0

# 데이터 처리 루프
for input_dir in mura_input_dirs:
    for root, _, files in os.walk(input_dir):
        with tqdm(total=len(files), desc=f"Processing {os.path.basename(root)}", unit="file") as pbar:
            for file in files:
                total_files += 1

                # 파일 확장자 확인
                file_ext = os.path.splitext(file)[-1].lower()
                if file_ext not in SUPPORTED_FORMATS:
                    skipped_files += 1
                    pbar.update(1)  # 진행 상태 업데이트
                    continue  # 지원하지 않는 형식은 건너뛰기

                input_file_path = os.path.join(root, file)
                
                # 출력 경로 계산
                relative_path = os.path.relpath(root, "/home/work/VisionAI/aihub/Validation/01.원천데이터")
                output_dir = os.path.join(mura_output_base_dir, relative_path)
                
                # 디렉토리 생성 (필요 시 한 번만 실행)
                os.makedirs(output_dir, exist_ok=True)
                
                output_file_path = os.path.join(output_dir, file)

                # CLAHE 적용 및 결과 저장
                clahe_image = apply_clahe(input_file_path)
                if clahe_image is not None:
                    try:
                        cv2.imwrite(output_file_path, clahe_image)
                        processed_files += 1
                    except Exception as e:
                        print(f"Error saving processed image {output_file_path}: {e}")
                
                # 진행 상태 업데이트
                pbar.update(1)

# 처리 통계 출력
print("\n--- Processing Summary ---")
print(f"Total files found: {total_files}")
print(f"Processed files: {processed_files}")
print(f"Skipped files (unsupported or errors): {skipped_files}")


Processing ChestPA_Abnormal: 100%|██████████| 1501/1501 [00:58<00:00, 25.76file/s]


--- Processing Summary ---
Total files found: 1501
Processed files: 1500
Skipped files (unsupported or errors): 1





## 라벨 설정

### MURA 
train도 동일하게 진행

In [2]:
import pandas as pd

# 파일 경로 설정
train_image_paths_csv = "/home/work/VisionAI/CLAHE_valid/MURA/valid_image_paths.csv"
train_labeled_studies_csv = "/home/work/VisionAI/CLAHE_valid/MURA/valid_labeled_studies.csv"

# 경로 수정 함수
def modify_paths_in_place(file_path, old_substring, new_substring):
    # CSV 파일 읽기
    df = pd.read_csv(file_path, header=None)
    
    # 첫 번째 열의 경로 수정
    df[0] = df[0].str.replace(old_substring, new_substring, regex=False)
    
    # 수정된 내용을 동일한 파일에 저장
    df.to_csv(file_path, index=False, header=False)
    print(f"Modified paths saved to {file_path}")

# 경로 수정 실행
# train_image_paths.csv 수정
modify_paths_in_place(
    file_path=train_image_paths_csv,
    old_substring="MURA-v1.1/valid/",
    new_substring="CLAHE_valid/MURA/"
)

# train_labeled_studies.csv 수정
modify_paths_in_place(
    file_path=train_labeled_studies_csv,
    old_substring="MURA-v1.1/valid/",
    new_substring="CLAHE_valid/MURA/"
)


Modified paths saved to /home/work/VisionAI/CLAHE_valid/MURA/valid_image_paths.csv
Modified paths saved to /home/work/VisionAI/CLAHE_valid/MURA/valid_labeled_studies.csv


### AIHub 
train도 동일하게 진행

In [3]:
import os
import json

# 입력 및 출력 경로 설정
labeling_data_dirs = [
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/ChestPA_Abnormal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/ChestPA_Normal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Facial_bone_Abnormal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Facial_bone_Normal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Foot_Abnormal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Foot_Normal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Mammography_Abnormal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/Mammography_Normal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/PNS_Abnormal",
    "/home/work/VisionAI/aihub/Validation/02.라벨링데이터/PNS_Normal",
]

# 출력 경로 설정
output_base_dir = "/home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터"
filepath_base_dir = "/home/work/VisionAI/CLAHE_valid/aihub/01.원천데이터"

# 경로 수정 함수
def process_labeling_data(input_dir, output_dir, filepath_dir):
    """
    라벨링 데이터의 filepath를 수정하고 새로운 JSON 파일로 저장.
    :param input_dir: 입력 라벨링 데이터 디렉토리
    :param output_dir: 수정된 JSON 데이터를 저장할 디렉토리
    :param filepath_dir: filepath 수정 경로의 기본 디렉토리
    """
    # 폴더 이름 추출 (부위 카테고리)
    category = os.path.basename(input_dir)
    output_category_dir = os.path.join(output_dir, category)
    os.makedirs(output_category_dir, exist_ok=True)

    # 라벨링 데이터 파일 순회
    for filename in os.listdir(input_dir):
        if filename.endswith(".json"):
            input_filepath = os.path.join(input_dir, filename)

            # JSON 파일 읽기
            with open(input_filepath, "r") as f:
                data = json.load(f)

            # filepath 수정
            original_filepath = data.get("filepath")
            if original_filepath:
                new_filepath = os.path.join(filepath_dir, category)
                data["filepath"] = new_filepath

            # 새로운 JSON 파일 저장
            output_filepath = os.path.join(output_category_dir, filename)
            with open(output_filepath, "w", encoding="utf-8") as f:
                json.dump(data, f, indent=4, ensure_ascii=False)  # ensure_ascii=False 추가
            print(f"Modified and saved: {output_filepath}")

# 라벨링 데이터 수정 실행
for input_dir in labeling_data_dirs:
    process_labeling_data(input_dir, output_base_dir, filepath_base_dir)


Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012004.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012018.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012003.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012008.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012002.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012001.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012013.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/ChestPA_Abnormal/ChestPA_Abnormal_00012007.json
Modified and saved: /home/work/VisionAI/CLAHE_valid/aihub/02.라벨링데이터/Ches