In [2]:
import os

def match_files(images_folder, flows_folder, masks_folder):
    """
    Сопоставляет пары изображений с потоками и масками.
    
    Parameters:
    - images_folder: str, путь к папке с изображениями.
    - flows_folder: str, путь к папке с потоками.
    - masks_folder: str, путь к папке с масками.

    Returns:
    - matched_files: list of dict, список с информацией о найденных парах.
    """
    matched_files = []
    
    # Список всех изображений
    image_files = sorted(os.listdir(images_folder))
    image_dict = {f.split('_')[1] + '_' + f.split('_')[2]: f for f in image_files}  # Создаем индекс по date_time
    # print(image_dict)
    # Список всех потоков
    flow_files = sorted(os.listdir(flows_folder))
    
    for flow_file in flow_files:
        if not flow_file.endswith('.flo'):
            continue
        
        # Извлекаем информацию из имени потока
        _, date, time_1, time_2 = flow_file.replace('.flo', '').split('_')
        # print(_, date, time_1, time_2)
        # Ищем соответствующие изображения
        img1_name = image_dict.get(f"{date}_{time_1}")
        img2_name = image_dict.get(f"{date}_{time_2}")
        # print(img1_name, img2_name)
        
        if not img1_name or not img2_name:
            print(f"Пропущены изображения для потока {flow_file}")
            continue
        
        # Проверяем наличие маски
        mask_file = flow_file.replace('.flo', '.npy')  # Имя маски совпадает с именем потока
        if not os.path.exists(os.path.join(masks_folder, mask_file)):
            print(f"Пропущена маска для потока {flow_file}")
            continue
        
        # Добавляем в список
        matched_files.append({
            'img1': os.path.join(images_folder, img1_name),
            'img2': os.path.join(images_folder, img2_name),
            'flow': os.path.join(flows_folder, flow_file),
            'mask': os.path.join(masks_folder, mask_file)
        })
    
    return matched_files

# Папки с данными
images_folder = "r0077-0078_png/small"
flows_folder = "GT_flow/flows"
masks_folder = "GT_flow/masks"

# Сопоставляем файлы
matched_files = match_files(images_folder, flows_folder, masks_folder)

# Проверяем результат
print(f"Найдено пар: {len(matched_files)}")
for match in matched_files[:5]:  # Выводим первые 5 для проверки
    print(match)


Пропущены изображения для потока pair_20180331_220444_000445.flo
Пропущены изображения для потока pair_20180404_224445_004445.flo
Пропущены изображения для потока pair_20180405_224444_004446.flo
Пропущены изображения для потока pair_20180408_230446_010445.flo
Пропущены изображения для потока pair_20180409_230444_010447.flo
Пропущены изображения для потока pair_20180410_220446_000444.flo
Пропущены изображения для потока pair_20180412_220443_000446.flo
Пропущены изображения для потока pair_20180415_190446_210447.flo
Найдено пар: 91
{'img1': 'r0077-0078_png/small/uvi_20180331_080446_365_l3b_v10.png', 'img2': 'r0077-0078_png/small/uvi_20180331_100445_365_l3b_v10.png', 'flow': 'GT_flow/flows/pair_20180331_080446_100445.flo', 'mask': 'GT_flow/masks/pair_20180331_080446_100445.npy'}
{'img1': 'r0077-0078_png/small/uvi_20180331_100445_365_l3b_v10.png', 'img2': 'r0077-0078_png/small/uvi_20180331_120443_365_l3b_v10.png', 'flow': 'GT_flow/flows/pair_20180331_100445_120443.flo', 'mask': 'GT_flow/ma

In [3]:
import json

with open('matched_files.json', 'w') as f:
    json.dump(matched_files, f)
