In [1]:
from pathlib import Path
import shutil
from PIL import Image
import numpy as np
from tqdm import tqdm

In [2]:
def is_white_layout(
    image: Image.Image,
    brightness_threshold: int = 230,
    white_pixel_ratio: float = 0.9,
) -> bool:
    """
    Проверяет, является ли изображение "белой" планировкой квартиры.
    
    Параметры:
    - image: изображение в формате PIL.Image
    - brightness_threshold: порог яркости для "белого" пикселя (0-255)
    - white_pixel_ratio: минимальная доля белых пикселей
    
    Возвращает:
    - True, если изображение соответствует критериям "белой" планировки
    """
    img_array = np.array(image.convert("L"))  # Конвертируем в grayscale и NumPy-массив
    
    mean_brightness = np.mean(img_array)
    white_pixels = np.sum(img_array >= brightness_threshold)
    white_ratio = white_pixels / img_array.size
    
    return (mean_brightness >= brightness_threshold) or (white_ratio >= white_pixel_ratio)

In [3]:
def filter_white_layouts(
    data_dir: str | Path,
    output_dir: str | Path,
    brightness_threshold: int = 230,
    white_pixel_ratio: float = 0.9,
) -> int:
    """
    Фильтрует изображения в папке `data_dir` и сохраняет "белые" планировки в `output_dir`.
    
    Параметры:
    - data_dir: путь к папке с изображениями (str или Path)
    - output_dir: путь к папке для сохранения (str или Path)
    - brightness_threshold, white_pixel_ratio: параметры фильтрации
    """
    data_path = Path(data_dir)
    output_path = Path(output_dir)
    output_path.mkdir(exist_ok=True, parents=True)

    move_counter = 0
    # Получаем список всех изображений заранее для прогресс-бара
    image_paths = [p for p in data_path.glob("*.*") if p.suffix.lower() in ('.png', '.jpg', '.jpeg')]
    for img_path in tqdm(image_paths, desc="Обработка изображений"):
        if img_path.suffix.lower() not in ('.png', '.jpg', '.jpeg'):
            continue
        
        try:
            with Image.open(img_path) as img:
                if is_white_layout(img, brightness_threshold, white_pixel_ratio):
                    shutil.move(img_path, output_dir)
                    move_counter += 1
        except Exception as e:
            print(f"Ошибка при обработке {img_path.name}: {e}")
    return move_counter

In [4]:
current_dir = Path.cwd()
print(f"Директория: {current_dir}")
data_dir = current_dir / "data"
cian_data_dir = data_dir / "yandex_data"
output_data_dir = data_dir / "floor_plans"

for dirname in cian_data_dir.iterdir():
    print(dirname)
    move_counter = filter_white_layouts(
        data_dir=dirname,
        output_dir=output_data_dir,
        brightness_threshold=220,
        white_pixel_ratio=0.86
    )
    print(f"Перемещено файлов: {move_counter}")

Директория: /home/little-garden/CodeProjects/InteriorClass
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/B0.json


Обработка изображений: 0it [00:00, ?it/s]


Перемещено файлов: 0
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C0.json


Обработка изображений: 0it [00:00, ?it/s]


Перемещено файлов: 0
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A1


Обработка изображений:   1%|▏         | 12/849 [00:00<00:07, 106.34it/s]

Ошибка при обработке 646.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A1/646.jpg'


Обработка изображений:  48%|████▊     | 406/849 [00:03<00:04, 103.99it/s]

Ошибка при обработке 789.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A1/789.jpg'


Обработка изображений: 100%|██████████| 849/849 [00:08<00:00, 98.57it/s] 


Ошибка при обработке 688.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A1/688.jpg'
Перемещено файлов: 5
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C1.json


Обработка изображений: 0it [00:00, ?it/s]


Перемещено файлов: 0
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C1


Обработка изображений:  18%|█▊        | 159/876 [00:01<00:06, 106.27it/s]

Ошибка при обработке 655.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C1/655.jpg'
Ошибка при обработке 307.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C1/307.jpg'


Обработка изображений: 100%|██████████| 876/876 [00:09<00:00, 94.98it/s] 


Перемещено файлов: 1
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A1.json


Обработка изображений: 0it [00:00, ?it/s]


Перемещено файлов: 0
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/B0


Обработка изображений:  46%|████▌     | 169/366 [00:01<00:01, 146.69it/s]

Ошибка при обработке 556.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/B0/556.jpg'


Обработка изображений: 100%|██████████| 366/366 [00:02<00:00, 149.21it/s]


Перемещено файлов: 11
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/B0_uncertain


Обработка изображений: 100%|██████████| 447/447 [00:03<00:00, 141.38it/s]


Перемещено файлов: 5
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C0


Обработка изображений:   8%|▊         | 67/870 [00:00<00:05, 143.93it/s]

Ошибка при обработке 872.jpg: cannot identify image file '/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/C0/872.jpg'


Обработка изображений:  40%|████      | 352/870 [00:02<00:03, 129.64it/s]

Ошибка при обработке 109.jpg: Destination path '/home/little-garden/CodeProjects/InteriorClass/data/floor_plans/109.jpg' already exists


Обработка изображений: 100%|██████████| 870/870 [00:05<00:00, 147.05it/s]


Ошибка при обработке 30.jpg: Destination path '/home/little-garden/CodeProjects/InteriorClass/data/floor_plans/30.jpg' already exists
Перемещено файлов: 6
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A0.json


Обработка изображений: 0it [00:00, ?it/s]


Перемещено файлов: 0
/home/little-garden/CodeProjects/InteriorClass/data/yandex_data/A0


Обработка изображений: 100%|██████████| 436/436 [00:02<00:00, 146.98it/s]

Перемещено файлов: 0





In [None]:
image = Image.open("/home/little-garden/CodeProjects/InteriorClass/data/cian_data/A0/kvartira-moskva-minskaya-ulica-2405225048-4.jpg")
is_white_layout(image)

In [None]:
# Пример использования
data_dir = "data_dir"  # Папка с исходными изображениями (можно передать как Path)
output_dir = "white_layouts"  # Папка для "белых" планировок
filter_white_layouts(data_dir, output_dir)