In [1]:
from pathlib import Path

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

In [2]:
from pathlib import Path

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

def load_tif_as_float(path: str | Path, verbose: bool = True) -> tuple[np.ndarray, str]:
    """
    Загружает .tif как 2D numpy-массив float32 в [0,1].
    Возвращает (нормализованный массив, PIL mode).
    Если verbose=True, печатает информацию о формате и диапазонах.
    """
    path = Path(path)
    img = Image.open(path)

    mode = img.mode  # 'L', 'RGB', 'I;16', 'I', и т.д.

    # Приводим к grayscale, если вдруг не так
    if img.mode not in ("I;16", "I", "L"):
        img = img.convert("L")

    arr = np.array(img)

    raw_min, raw_max = float(arr.min()), float(arr.max())

    # Определим динамический диапазон
    if arr.dtype == np.uint8:
        arr_f = arr.astype(np.float32) / 255.0
    elif arr.dtype == np.uint16:
        arr_f = arr.astype(np.float32) / 65535.0
    else:
        arr = arr.astype(np.float32)
        max_val = arr.max() if arr.max() > 0 else 1.0
        arr_f = arr / max_val

    norm_min, norm_max = float(arr_f.min()), float(arr_f.max())

    if verbose:
        print(f"=== load_tif_as_float ===")
        print(f"Path     : {path}")
        print(f"Mode     : {mode}")
        print(f"Raw dtype: {arr.dtype}")
        print(f"Raw range: [{raw_min:.4f}, {raw_max:.4f}]")
        print(f"Norm range [0,1]: [{norm_min:.4f}, {norm_max:.4f}]")
        print(f"Shape    : {arr.shape}")
        print("=========================\n")

    return arr_f, mode  # [H, W], float32, [0,1]


def center_crop_square(
    img: np.ndarray,
    crop_side: int | None = None,
    patch_size: int | None = None,
) -> np.ndarray:
    """
    Делает квадратный center crop из 2D массива img.

    Параметры:
    - crop_side: желаемый размер стороны кропа (в пикселях).
        * Если None — берём min(H, W), при необходимости уменьшая до кратности patch_size.
        * Если задан, он будет:
            - ограничен сверху min(H, W),
            - при patch_size != None будет округлён вниз до ближайшего кратного patch_size.
    - patch_size: если задан, сторона кропа будет кратна patch_size.

    Возвращает:
    - cropped: [side, side], float32.
    """
    h, w = img.shape
    min_side = min(h, w)

    # 1) если пользователь не задал crop_side — берём максимум
    if crop_side is None:
        side = min_side
    else:
        side = min(crop_side, min_side)

    # 2) если важна кратность patch_size — подправляем
    if patch_size is not None:
        side = (side // patch_size) * patch_size

    if side <= 0:
        raise ValueError(
            f"Некорректный side={side}. "
            f"Изображение {h}x{w}, crop_side={crop_side}, patch_size={patch_size}"
        )

    top = (h - side) // 2
    left = (w - side) // 2

    cropped = img[top:top + side, left:left + side]
    return cropped



def split_into_patches(img: np.ndarray, patch_size: int) -> list[np.ndarray]:
    """
    Режет квадратный массив img на патчи patch_size x patch_size без перекрытий.
    Предполагается, что img.shape кратна patch_size.
    Возвращает список патчей [H, W].
    """
    h, w = img.shape
    assert h == w, "split_into_patches ожидает квадратный массив"
    assert h % patch_size == 0, "Размер стороны должен быть кратен patch_size"

    patches = []
    n = h // patch_size

    for i in range(n):
        for j in range(n):
            patch = img[
                i * patch_size:(i + 1) * patch_size,
                j * patch_size:(j + 1) * patch_size,
            ]
            patches.append(patch)

    return patches  # список [500x500]


def save_patch_as_png(patch: np.ndarray, path: str | Path) -> None:
    """
    Сохраняет патч (float32 [0,1]) как PNG (8-бит grayscale).
    """
    patch = np.clip(patch, 0.0, 1.0)
    arr8 = (patch * 255.0).round().astype(np.uint8)
    img = Image.fromarray(arr8, mode="L")
    img.save(path)

In [3]:
def show_image(img: np.ndarray, title: str = "", figsize=(5,5)):
    plt.figure(figsize=figsize)
    plt.imshow(img, cmap="gray", vmin=0.0, vmax=1.0)
    plt.title(title)
    plt.axis("off")
    plt.show()


def show_patches_grid(patches: list[np.ndarray], max_cols: int = 6, max_patches: int = 24):
    """
    Показывает первые max_patches патчей в виде сетки.
    """
    n = min(len(patches), max_patches)
    cols = min(max_cols, n)
    rows = (n + cols - 1) // cols

    plt.figure(figsize=(cols * 2.0, rows * 2.0))
    for idx in range(n):
        plt.subplot(rows, cols, idx + 1)
        plt.imshow(patches[idx], cmap="gray", vmin=0.0, vmax=1.0)
        plt.axis("off")
    plt.tight_layout()
    plt.show()

In [4]:
# === НАСТРОЙКИ ===
tif_dir = Path("C:/Users/Вячеслав/Documents/superresolution/beton_005")        # папка с исходными .tif бетона
out_root = Path("C:/Users/Вячеслав/Documents/superresolution/beton_005_processed_patches")   # корневая папка для патчей

out_root.mkdir(parents=True, exist_ok=True)

patch_size = 500
user_crop_side = 2000   # например, 2500 или None, чтобы брать максимум, кратный 500

tif_paths = sorted(tif_dir.glob("*.tif"))

for img_idx, tif_path in enumerate(tif_paths):
    # 1. загрузка (без вывода)
    img_float, mode = load_tif_as_float(tif_path, verbose=False)

    # 2. center crop
    cropped = center_crop_square(
        img_float,
        crop_side=user_crop_side,
        patch_size=patch_size,
    )

    # 3. разрез на патчи
    patches = split_into_patches(cropped, patch_size=patch_size)

    # 4. сохранение патчей в одну папку, имена: 00000_000.png
    for patch_idx, p in enumerate(patches):
        fname = f"{img_idx:05d}_{patch_idx:03d}.png"
        out_path = out_root / fname
        save_patch_as_png(p, out_path)

  img = Image.fromarray(arr8, mode="L")


In [5]:
from pathlib import Path
import random
from PIL import Image
import shutil

# ===== НАСТРОЙКИ =====

# Папка с HR-патчами бетона (500x500 PNG)
hr_src_dir = Path("beton_005_processed_patches")

# Куда складывать итоговые бетоновские папки
out_root = Path("beton_dataset")
out_root.mkdir(parents=True, exist_ok=True)

# Масштабы downscale
scale_x2 = 2
scale_x4 = 4

# Доля для valid и test
val_fraction = 1/8
test_fraction = 1/8

# Фиксируем сид для воспроизводимости
random_seed = 42
random.seed(random_seed)

# ===== СБОР СПИСКА HR-ФАЙЛОВ =====

hr_paths = sorted(hr_src_dir.glob("*.png"))
n_total = len(hr_paths)
print(f"Найдено HR-изображений: {n_total}")

if n_total == 0:
    raise RuntimeError(f"В папке {hr_src_dir} нет .png файлов")

# Размеры сплитов
n_val = int(n_total * val_fraction)
n_test = int(n_total * test_fraction)
# Остальное - train
n_train = n_total - n_val - n_test

print(f"Train: {n_train}, Valid: {n_val}, Test: {n_test}")

# Перемешиваем и делим
random.shuffle(hr_paths)

train_paths = hr_paths[:n_train]
val_paths   = hr_paths[n_train:n_train + n_val]
test_paths  = hr_paths[n_train + n_val:]

assert len(train_paths) == n_train
assert len(val_paths)   == n_val
assert len(test_paths)  == n_test

# ===== СОЗДАНИЕ ПАПОК =====

splits = ["train", "valid", "test"]
kinds = ["HR", "LR_default_X2", "LR_default_X4"]

split_dirs = {}

for split in splits:
    for kind in kinds:
        d = out_root / f"beton_{split}_{kind}"
        d.mkdir(parents=True, exist_ok=True)
        split_dirs[(split, kind)] = d

# ===== ФУНКЦИИ ДЛЯ СОЗДАНИЯ LR =====

def make_lr_image(hr_img: Image.Image, scale: int) -> Image.Image:
    """
    Делает downscale изображения hr_img в scale раз (bicubic).
    Предполагается, что размер кратен scale.
    """
    w, h = hr_img.size
    new_size = (w // scale, h // scale)
    return hr_img.resize(new_size, Image.BICUBIC)

def process_split(split_name: str, paths: list[Path]):
    """
    Обрабатывает один сплит (train/valid/test):
    - копирует HR
    - создаёт LR x2 и x4
    """
    hr_dir = split_dirs[(split_name, "HR")]
    lr2_dir = split_dirs[(split_name, "LR_default_X2")]
    lr4_dir = split_dirs[(split_name, "LR_default_X4")]

    for src_path in paths:
        # имя файла (например 00000_000.png)
        fname = src_path.name

        # 1) HR: просто копируем
        dst_hr = hr_dir / fname
        shutil.copy2(src_path, dst_hr)

        # 2) Загружаем HR-изображение
        hr_img = Image.open(src_path).convert("L")  # или без convert, если уверены в формате

        # 3) LR x2
        lr2_img = make_lr_image(hr_img, scale_x2)
        dst_lr2 = lr2_dir / fname
        lr2_img.save(dst_lr2)

        # 4) LR x4
        lr4_img = make_lr_image(hr_img, scale_x4)
        dst_lr4 = lr4_dir / fname
        lr4_img.save(dst_lr4)


# ===== ЗАПУСК =====

process_split("train", train_paths)
process_split("valid", val_paths)
process_split("test",  test_paths)

print("Готово.")
print(f"Корневая папка датасета: {out_root.resolve()}")


Найдено HR-изображений: 7616
Train: 5712, Valid: 952, Test: 952
Готово.
Корневая папка датасета: C:\Users\Вячеслав\Documents\superresolution\beton_dataset
