### Create brain label

In [5]:
import os
import nibabel as nib
import numpy as np
from PIL import Image
from pathlib import Path

def find_nii_flair_files(root):
    flair_files = []
    for dirpath, _, filenames in os.walk(root):
        for fname in filenames:
            if fname.endswith(('.nii', '.nii.gz')) and 'flair' in fname.lower():
                flair_files.append(os.path.join(dirpath, fname))
    return flair_files

def ensure_dir(path):
    Path(path).mkdir(parents=True, exist_ok=True)

ROOT = "/home/nghiapd/medical_dataset/BraTS20" 
OUT_DIR = "MOTSA_classification/train/brain"
ensure_dir(OUT_DIR)

NUM_SLICES_AROUND_MID = 20
STEP_SLICE = 6  # bước nhảy giữa các slice (1: liền nhau, 2: cách 1, 3: cách 2, v.v.)

JPEG_QUALITY = 95

flair_files = find_nii_flair_files(ROOT)
print(f"Tìm thấy {len(flair_files)} file FLAIR")

global_slice_count = 0  # đếm thứ tự toàn bộ ảnh
volume_count = 0

for nii_path in flair_files:
    print(f"[{volume_count+1}/{len(flair_files)}] Processing: {os.path.basename(nii_path)}")
    
    try:
        # Load file NIfTI
        img = nib.load(nii_path)
        data = img.get_fdata()

        # Nếu là 4D, lấy volume đầu tiên
        if data.ndim == 4:
            data = data[..., 0]

        # Tính slice giữa
        nz = data.shape[2]
        mid_slice = nz // 2

        # Xác định range slice cần lấy
        start_slice = max(0, mid_slice - NUM_SLICES_AROUND_MID)
        end_slice = min(nz, mid_slice + NUM_SLICES_AROUND_MID + 1)

        # Tính min/max toàn volume để scale về 0-255 (đơn giản, không percentile)
        vmin = data.min()
        vmax = data.max()
        if vmax == vmin:
            vmax = vmin + 1e-8

        # Scale về 0-255 và chuyển uint8
        data_scaled = ((data - vmin) / (vmax - vmin) * 255).astype(np.uint8)

        # Export từng slice trong range, với bước nhảy
        saved_in_volume = 0
        for z in range(start_slice, end_slice, STEP_SLICE):
            slice_data = data_scaled[:, :, z].T  # transpose để đúng hướng axial (origin dưới)

            pil_img = Image.fromarray(slice_data, mode='L')  # grayscale
            slice_filename = os.path.join(OUT_DIR, f"img{global_slice_count + 1}.jpeg")
            pil_img.save(slice_filename, format='JPEG', quality=JPEG_QUALITY, optimize=True)
            
            global_slice_count += 1
            saved_in_volume += 1

        print(f"  → Đã lưu {saved_in_volume} ảnh (tổng toàn bộ: {global_slice_count})")
        volume_count += 1

    except Exception as e:
        print(f"Lỗi khi xử lý {nii_path}: {e}")

print(f"\nHoàn thành! Đã xử lý {volume_count} volume FLAIR.")
print(f"Tổng số ảnh lưu: {global_slice_count} (bước nhảy {STEP_SLICE}, quanh giữa ±{NUM_SLICES_AROUND_MID})")
print(f"Tất cả ảnh lưu tại folder duy nhất: {OUT_DIR}")

Tìm thấy 494 file FLAIR
[1/494] Processing: BraTS20_Training_116_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 7)
[2/494] Processing: BraTS20_Training_293_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 14)
[3/494] Processing: BraTS20_Training_107_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 21)
[4/494] Processing: BraTS20_Training_369_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 28)
[5/494] Processing: BraTS20_Training_109_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 35)
[6/494] Processing: BraTS20_Training_271_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 42)
[7/494] Processing: BraTS20_Training_314_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 49)
[8/494] Processing: BraTS20_Training_163_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 56)
[9/494] Processing: BraTS20_Training_137_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 63)
[10/494] Processing: BraTS20_Training_119_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 70)
[11/494] Processing: BraTS20_Training_367_flair.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 77)
[12/494] Processin

In [6]:
import os
import nibabel as nib
import numpy as np
from PIL import Image
from pathlib import Path

def find_nii_flair_files(root):
    flair_files = []
    for dirpath, _, filenames in os.walk(root):
        for fname in filenames:
            if fname.endswith(('.nii')):
                flair_files.append(os.path.join(dirpath, fname))
    return flair_files

def ensure_dir(path):
    Path(path).mkdir(parents=True, exist_ok=True)

ROOT = "/home/nghiapd/medical_dataset/Pancreas" 
OUT_DIR = "MOTSA_classification/train/pancreas"
ensure_dir(OUT_DIR)

NUM_SLICES_AROUND_MID = 20
STEP_SLICE = 6  # bước nhảy giữa các slice (1: liền nhau, 2: cách 1, 3: cách 2, v.v.)

JPEG_QUALITY = 95

flair_files = find_nii_flair_files(ROOT)
print(f"Tìm thấy {len(flair_files)} file FLAIR")

global_slice_count = 0  # đếm thứ tự toàn bộ ảnh
volume_count = 0

for nii_path in flair_files:
    print(f"[{volume_count+1}/{len(flair_files)}] Processing: {os.path.basename(nii_path)}")
    
    try:
        # Load file NIfTI
        img = nib.load(nii_path)
        data = img.get_fdata()

        # Nếu là 4D, lấy volume đầu tiên
        if data.ndim == 4:
            data = data[..., 0]

        # Tính slice giữa
        nz = data.shape[2]
        mid_slice = nz // 2

        # Xác định range slice cần lấy
        start_slice = max(0, mid_slice - NUM_SLICES_AROUND_MID)
        end_slice = min(nz, mid_slice + NUM_SLICES_AROUND_MID + 1)

        # Tính min/max toàn volume để scale về 0-255 (đơn giản, không percentile)
        vmin = data.min()
        vmax = data.max()
        if vmax == vmin:
            vmax = vmin + 1e-8

        # Scale về 0-255 và chuyển uint8
        data_scaled = ((data - vmin) / (vmax - vmin) * 255).astype(np.uint8)

        # Export từng slice trong range, với bước nhảy
        saved_in_volume = 0
        for z in range(start_slice, end_slice, STEP_SLICE):
            slice_data = data_scaled[:, :, z].T  # transpose để đúng hướng axial (origin dưới)

            pil_img = Image.fromarray(slice_data, mode='L')  # grayscale
            slice_filename = os.path.join(OUT_DIR, f"img{global_slice_count + 1}.jpeg")
            pil_img.save(slice_filename, format='JPEG', quality=JPEG_QUALITY, optimize=True)
            
            global_slice_count += 1
            saved_in_volume += 1

        print(f"  → Đã lưu {saved_in_volume} ảnh (tổng toàn bộ: {global_slice_count})")
        volume_count += 1

    except Exception as e:
        print(f"Lỗi khi xử lý {nii_path}: {e}")

print(f"\nHoàn thành! Đã xử lý {volume_count} volume FLAIR.")
print(f"Tổng số ảnh lưu: {global_slice_count} (bước nhảy {STEP_SLICE}, quanh giữa ±{NUM_SLICES_AROUND_MID})")
print(f"Tất cả ảnh lưu tại folder duy nhất: {OUT_DIR}")

Tìm thấy 701 file FLAIR
[1/701] Processing: pancreas_121.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 7)
[2/701] Processing: pancreas_151.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 14)
[3/701] Processing: pancreas_352.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 21)
[4/701] Processing: pancreas_144.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 28)
[5/701] Processing: pancreas_065.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 35)
[6/701] Processing: pancreas_397.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 42)
[7/701] Processing: pancreas_341.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 49)
[8/701] Processing: pancreas_097.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 56)
[9/701] Processing: pancreas_076.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 63)
[10/701] Processing: pancreas_184.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 70)
[11/701] Processing: pancreas_002.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 77)
[12/701] Processing: pancreas_057.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 84)
[13/701] Processing: pancreas_322.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 91)
[14/701] Processing: pan

In [7]:
import os
import nibabel as nib
import numpy as np
from PIL import Image
from pathlib import Path

def find_nii_flair_files(root):
    flair_files = []
    for dirpath, _, filenames in os.walk(root):
        for fname in filenames:
            if fname.endswith(('.nii')) and 'volume' in fname.lower():
                flair_files.append(os.path.join(dirpath, fname))
    return flair_files

def ensure_dir(path):
    Path(path).mkdir(parents=True, exist_ok=True)

ROOT = "/home/nghiapd/medical_dataset/LITS17" 
OUT_DIR = "MOTSA_classification/train/liver"
ensure_dir(OUT_DIR)

NUM_SLICES_AROUND_MID = 20
STEP_SLICE = 6  # bước nhảy giữa các slice (1: liền nhau, 2: cách 1, 3: cách 2, v.v.)

JPEG_QUALITY = 95

flair_files = find_nii_flair_files(ROOT)
print(f"Tìm thấy {len(flair_files)} file FLAIR")

global_slice_count = 0  # đếm thứ tự toàn bộ ảnh
volume_count = 0

for nii_path in flair_files:
    print(f"[{volume_count+1}/{len(flair_files)}] Processing: {os.path.basename(nii_path)}")
    
    try:
        # Load file NIfTI
        img = nib.load(nii_path)
        data = img.get_fdata()

        # Nếu là 4D, lấy volume đầu tiên
        if data.ndim == 4:
            data = data[..., 0]

        # Tính slice giữa
        nz = data.shape[2]
        mid_slice = nz // 2

        # Xác định range slice cần lấy
        start_slice = max(0, mid_slice - NUM_SLICES_AROUND_MID)
        end_slice = min(nz, mid_slice + NUM_SLICES_AROUND_MID + 1)

        # Tính min/max toàn volume để scale về 0-255 (đơn giản, không percentile)
        vmin = data.min()
        vmax = data.max()
        if vmax == vmin:
            vmax = vmin + 1e-8

        # Scale về 0-255 và chuyển uint8
        data_scaled = ((data - vmin) / (vmax - vmin) * 255).astype(np.uint8)

        # Export từng slice trong range, với bước nhảy
        saved_in_volume = 0
        for z in range(start_slice, end_slice, STEP_SLICE):
            slice_data = data_scaled[:, :, z].T  # transpose để đúng hướng axial (origin dưới)

            pil_img = Image.fromarray(slice_data, mode='L')  # grayscale
            slice_filename = os.path.join(OUT_DIR, f"img{global_slice_count + 1}.jpeg")
            pil_img.save(slice_filename, format='JPEG', quality=JPEG_QUALITY, optimize=True)
            
            global_slice_count += 1
            saved_in_volume += 1

        print(f"  → Đã lưu {saved_in_volume} ảnh (tổng toàn bộ: {global_slice_count})")
        volume_count += 1

    except Exception as e:
        print(f"Lỗi khi xử lý {nii_path}: {e}")

print(f"\nHoàn thành! Đã xử lý {volume_count} volume FLAIR.")
print(f"Tổng số ảnh lưu: {global_slice_count} (bước nhảy {STEP_SLICE}, quanh giữa ±{NUM_SLICES_AROUND_MID})")
print(f"Tất cả ảnh lưu tại folder duy nhất: {OUT_DIR}")

Tìm thấy 131 file FLAIR
[1/131] Processing: volume-13.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 7)
[2/131] Processing: volume-102.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 14)
[3/131] Processing: volume-100.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 21)
[4/131] Processing: volume-121.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 28)
[5/131] Processing: volume-1.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 35)
[6/131] Processing: volume-74.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 42)
[7/131] Processing: volume-78.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 49)
[8/131] Processing: volume-83.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 56)
[9/131] Processing: volume-41.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 63)
[10/131] Processing: volume-10.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 70)
[11/131] Processing: volume-112.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 77)
[12/131] Processing: volume-84.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 84)
[13/131] Processing: volume-48.nii
  → Đã lưu 7 ảnh (tổng toàn bộ: 91)
[14/131] Processing: volume-43.nii
  → Đã lưu 7 ảnh (tổng to

In [8]:
import os
import shutil
import random
from pathlib import Path

TRAIN_DIR = "/mnt/data/coden/Multi-Organ-Tumor-Segmentation-Application/data/MOTSA_classification/train"
TEST_DIR = "/mnt/data/coden/Multi-Organ-Tumor-Segmentation-Application/data/MOTSA_classification/test"
RATIO = 0.1  # 10%

def ensure_dir(path):
    Path(path).mkdir(parents=True, exist_ok=True)

for cls in os.listdir(TRAIN_DIR):
    src_folder = os.path.join(TRAIN_DIR, cls)
    dst_folder = os.path.join(TEST_DIR, cls)
    if not os.path.isdir(src_folder):
        continue
    ensure_dir(dst_folder)
    images = sorted([f for f in os.listdir(src_folder) if f.lower().endswith(('.jpg', '.jpeg', '.png'))])
    n_select = max(1, int(len(images) * RATIO))
    selected = sorted(random.sample(images, n_select))
    print(f"{cls}: {len(images)} ảnh, cut {n_select} sang test.")

    # Move và đổi tên ảnh sang test
    for idx, fname in enumerate(selected, 1):
        src_path = os.path.join(src_folder, fname)
        ext = os.path.splitext(fname)[1].lower()
        new_name = f"img{idx}{ext}"
        dst_path = os.path.join(dst_folder, new_name)
        shutil.move(src_path, dst_path)

    # Đổi tên tạm thời cho ảnh còn lại trong train để tránh trùng tên
    remain_images = sorted([f for f in os.listdir(src_folder) if f.lower().endswith(('.jpg', '.jpeg', '.png'))])
    for fname in remain_images:
        old_path = os.path.join(src_folder, fname)
        tmp_path = os.path.join(src_folder, fname + ".tmp")
        os.rename(old_path, tmp_path)

    # Đánh lại số thứ tự liên tục cho ảnh còn lại trong train
    tmp_images = sorted([f for f in os.listdir(src_folder) if f.endswith(".tmp")])
    for idx, fname in enumerate(tmp_images, 1):
        old_path = os.path.join(src_folder, fname)
        ext = os.path.splitext(fname[:-4])[1].lower()  # bỏ .tmp
        new_name = f"img{idx}{ext}"
        new_path = os.path.join(src_folder, new_name)
        os.rename(old_path, new_path)

pancreas: 4907 ảnh, cut 490 sang test.
brain: 3458 ảnh, cut 345 sang test.
liver: 917 ảnh, cut 91 sang test.
