In [1]:
import cv2
import numpy as np

# Функция для создания маски из изображения с желтым контуром
def create_mask_from_image(image_path, output_path, min_contour_area=2500):
    # Загрузим изображение
    image = cv2.imread(image_path)

    # Преобразуем изображение в HSV (для более точного определения желтого цвета)
    hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

    # Диапазон желтого цвета в формате HSV
    lower_yellow = np.array([20, 100, 100])
    upper_yellow = np.array([30, 255, 255])

    # Найдем все пиксели, которые попадают в диапазон желтого цвета
    yellow_mask = cv2.inRange(hsv_image, lower_yellow, upper_yellow)

    # Морфологическая операция - расширение (dilation), чтобы соединить пунктирные линии
    kernel = np.ones((5, 5), np.uint8)
    yellow_mask_dilated = cv2.dilate(yellow_mask, kernel, iterations=2)

    # Дополнительно применим операцию закрытия (closing), чтобы лучше соединить разрывы
    yellow_mask_closed = cv2.morphologyEx(yellow_mask_dilated, cv2.MORPH_CLOSE, kernel)

    # Найдем контуры на основе обработанной маски
    contours, _ = cv2.findContours(yellow_mask_closed, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # Создадим пустую маску (черную)
    mask = np.zeros(image.shape[:2], dtype=np.uint8)

    # Фильтруем и рисуем только большие контуры (площадь > min_contour_area)
    for contour in contours:
        area = cv2.contourArea(contour)
        if area > min_contour_area:
            # Заполняем контур, если его площадь больше заданного порога
            cv2.drawContours(mask, [contour], -1, (255), thickness=cv2.FILLED)

    # Сохраним полученную бинарную маску как PNG
    cv2.imwrite(output_path, mask)

    print(f'Маска успешно сохранена в {output_path}')

In [27]:
image_path = 'data\\sech_2\\2024.04.16_1\\Image73.jpg'  # Путь к вашему изображению с желтым контуром
output_path = 'data\\sech_2\\2024.04.16_1\\Image73_mask.png'  # Путь для сохранения маски
create_mask_from_image(image_path, output_path)

Маска успешно сохранена в data\sech_2\2024.04.16_1\Image73_mask.png


In [22]:
import cv2
import numpy as np

# Шаг 1: Загрузка изображения
image = cv2.imread('data\\sech_2\\2024.04.16\\Image53_m.jpg')

# Шаг 2: Преобразование в цветовое пространство HSV
hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)

# Шаг 3: Определение диапазона зелёного цвета в HSV
lower_green = np.array([40, 40, 40])  # Нижняя граница зелёного (настраивается)
upper_green = np.array([80, 255, 255])  # Верхняя граница зелёного (настраивается)

# Поиск маски зелёных областей
mask = cv2.inRange(hsv, lower_green, upper_green)

# Шаг 4: Нахождение контуров на основе маски
contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Шаг 5: Создание пустого чёрно-белого изображения для маски
binary_mask = np.zeros_like(mask)

# Заливка контуров белым цветом
cv2.drawContours(binary_mask, contours, -1, (255), thickness=cv2.FILLED)

# Шаг 6: Сохранение результата как PNG
cv2.imwrite('data\\sech_2\\2024.04.16\\Image53_mask.png', binary_mask)


True

In [7]:
import os
import glob
import cv2

def find_masked_png_files(directory, kol):
    im = 'data\\YOLO_sech_1\\images\\'
    labl = 'data\\YOLO_sech_1\\labels\\'
    folder_count = 0  # Счётчик папок
    # Проходим по всем элементам в заданной папке
    for root, dirs, files in os.walk(directory):
        # Ищем папки с окончанием "-masked"
        for dir_name in dirs:
                folder_count += 1  # Увеличиваем номер папки
                masked_dir_path = os.path.join(root, dir_name)
                # Ищем все файлы с расширением .png внутри папки
                png_files = glob.glob(os.path.join(masked_dir_path, '*.png'))
                
                if png_files:
                    print(f"Найдены PNG файлы в папке: {masked_dir_path}")
                    for png_file in png_files:
                        fin_p1 = png_file[:-4] + '_fin' + str(kol) + '_' + str(folder_count) + '.png'
                        fin_p2 = im + str(kol) + '_' + str(folder_count) + '.jpg'
                        txt_p1 = png_file[:-4] + '_fin' + str(kol) + '_' + str(folder_count) + '.txt'
                        txt_p2 = labl + str(kol) + '_' + str(folder_count) + '.txt'
                        im_p = png_file.split('_mask')[0] + '.jpg'
                        process_mask(png_file, fin_p1)
                        imag = cv2.imread(im_p)
                        cv2.imwrite(fin_p2, imag)
                        yolo_bboxes = get_yolo_bounding_boxes(fin_p1, class_id=0)  # class_id=0 можно изменить на нужный класс
                        save_yolo_bboxes_to_txt(yolo_bboxes, txt_p1)
                        save_yolo_bboxes_to_txt(yolo_bboxes, txt_p2)
                        kol += 1

# Пример использования функции
if __name__ == "__main__":
    kol = 0
    # Укажите путь к основной папке, которую хотите просканировать
    directory_to_search = "data\\sech_1\\Sechenov_dataset_revision_v01"
    find_masked_png_files(directory_to_search, kol)


Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.05.03-masked
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.05.03-masked\img1_mask_fin0_6.png
Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.05.31-masked
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.05.31-masked\img1_mask2_fin1_7.png
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.05.31-masked\img2_mask2_fin2_7.png
Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.06.01-masked
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.06.01-masked\img1_mask2_fin3_8.png
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.06.01-masked\img2_mask2_fin4_8.png
Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.06.08-masked
Обработанное изображени

Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03-masked\img1_mask2_fin43_40.png
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03-masked\img2_mask2_fin44_40.png
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03-masked\img3_mask2_fin45_40.png
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03-masked\img4_mask2_fin46_40.png
Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03_1-masked
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.03_1-masked\img1_mask2_fin47_41.png
Найдены PNG файлы в папке: data\sech_1\Sechenov_dataset_revision_v01\2023.11.20-masked
Обработанное изображение сохранено по пути: data\sech_1\Sechenov_dataset_revision_v01\2023.11.20-masked\img1_mask2_fin48_42.png
Обработанное изображение сохранено по пути: data\sech_

In [8]:
import os
import glob
import cv2

def find_masked_png_files(directory, kol):
    im = 'data\\YOLO_sech_2\\images\\'
    labl = 'data\\YOLO_sech_2\\labels\\'
    folder_count = 52  # Счётчик папок
    
    # Проходим по всем элементам в заданной папке
    for root, dirs, files in os.walk(directory):
        # Ищем папки с окончанием "-masked"
        for dir_name in dirs:
            folder_count += 1  # Увеличиваем номер папки
            masked_dir_path = os.path.join(root, dir_name)
            # Ищем все файлы с расширением .png внутри папки
            png_files = glob.glob(os.path.join(masked_dir_path, '*.png'))
            
            if png_files:
                print(f"Найдены PNG файлы в папке {folder_count}: {masked_dir_path}")
                for png_file in png_files:
                    fin_p1 = png_file[:-4] + '_fin' + str(kol) + '_' + str(folder_count) + '.png'
                    fin_p2 = im + str(kol) + '_' + str(folder_count) + '.jpg'
                    txt_p1 = png_file[:-4] + '_fin' + str(kol) + '_' + str(folder_count) + '.txt'
                    txt_p2 = labl + str(kol) + '_' + str(folder_count) + '.txt'
                    im_p = png_file.split('_mask')[0] + '.jpg'
                    
                    process_mask(png_file, fin_p1)
                    imag = cv2.imread(im_p)
                    cv2.imwrite(fin_p2, imag)
                    
                    yolo_bboxes = get_yolo_bounding_boxes(fin_p1, class_id=0)  # class_id=0 можно изменить на нужный класс
                    save_yolo_bboxes_to_txt(yolo_bboxes, txt_p1)
                    save_yolo_bboxes_to_txt(yolo_bboxes, txt_p2)
                    
                    kol += 1

# Пример использования функции
if __name__ == "__main__":
    kol = 71
    # Укажите путь к основной папке, которую хотите просканировать
    directory_to_search = "data\\sech_2"
    find_masked_png_files(directory_to_search, kol)


Найдены PNG файлы в папке 53: data\sech_2\2024.03.21_3
Обработанное изображение сохранено по пути: data\sech_2\2024.03.21_3\Image64_mask_fin71_53.png
Найдены PNG файлы в папке 54: data\sech_2\2024.03.28
Обработанное изображение сохранено по пути: data\sech_2\2024.03.28\Image32_mask_fin72_54.png
Обработанное изображение сохранено по пути: data\sech_2\2024.03.28\Image36_mask_fin73_54.png
Найдены PNG файлы в папке 55: data\sech_2\2024.03.28_1
Обработанное изображение сохранено по пути: data\sech_2\2024.03.28_1\Image46_mask_fin74_55.png
Обработанное изображение сохранено по пути: data\sech_2\2024.03.28_1\Image47_mask_fin75_55.png
Найдены PNG файлы в папке 56: data\sech_2\2024.03.28_2
Обработанное изображение сохранено по пути: data\sech_2\2024.03.28_2\Image59_mask_fin76_56.png
Найдены PNG файлы в папке 57: data\sech_2\2024.03.29
Обработанное изображение сохранено по пути: data\sech_2\2024.03.29\Image47_mask_fin77_57.png
Обработанное изображение сохранено по пути: data\sech_2\2024.03.29\Ima

In [2]:
from PIL import Image

def process_mask(image_path, save_path):
    # Открываем изображение
    img = Image.open(image_path)

    # Преобразуем изображение в RGB, если оно не в RGB формате
    img = img.convert("RGB")

    # Загружаем пиксели изображения
    pixels = img.load()

    # Проходим по каждому пикселю изображения
    for i in range(img.width):
        for j in range(img.height):
            r, g, b = pixels[i, j]
            
            brightness = (r * 0.299 + g * 0.587 + b * 0.114)

            threshold = 240

            # Если яркость выше порога, делаем пиксель белым, иначе черным
            if brightness > threshold:
                pixels[i, j] = (255, 255, 255)  # Белый
            else:
                pixels[i, j] = (0, 0, 0)  # Черный

    # Сохраняем результат
    img.save(save_path)
    print(f"Обработанное изображение сохранено по пути: {save_path}")

In [45]:
process_mask('C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask.png', 'C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask_3.png')

  process_mask('C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask.png', 'C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask_3.png')
  process_mask('C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask.png', 'C:\\R-telematika\DIPLOMA\\data\\sech_2\\2024.04.10\\Image44_mask_3.png')


0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0


IOPub data rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_data_rate_limit`.

Current values:
ServerApp.iopub_data_rate_limit=1000000.0 (bytes/sec)
ServerApp.rate_limit_window=3.0 (secs)



In [4]:
from PIL import Image
import numpy as np
from scipy.ndimage import label

def get_yolo_bounding_boxes(image_path, class_id=0):
    # Открываем изображение и конвертируем в RGB
    img = Image.open(image_path).convert("RGB")
    
    # Преобразуем изображение в numpy массив
    img_np = np.array(img)
    
    # Превращаем изображение в бинарную маску (если пиксель не черный, то считаем его белым)
    mask = np.any(img_np != [0, 0, 0], axis=-1).astype(np.int32)
    
    # Находим связанные компоненты (отдельные объекты) на маске
    labeled_mask, num_features = label(mask)
    
    # Получаем размеры изображения
    img_height, img_width = img_np.shape[:2]
    
    yolo_bboxes = []
    
    # Для каждого найденного объекта находим bounding box
    for label_id in range(1, num_features + 1):
        # Находим индексы, где значение метки равно текущему объекту
        indices = np.where(labeled_mask == label_id)
        
        min_y, min_x = np.min(indices[0]), np.min(indices[1])
        max_y, max_x = np.max(indices[0]), np.max(indices[1])
        
        # Вычисляем ширину, высоту и центр bounding box в пикселях
        bbox_width = max_x - min_x
        bbox_height = max_y - min_y
        x_center = min_x + bbox_width / 2
        y_center = min_y + bbox_height / 2
        
        # Нормализуем значения в диапазон [0, 1]
        x_center_norm = x_center / img_width
        y_center_norm = y_center / img_height
        bbox_width_norm = bbox_width / img_width
        bbox_height_norm = bbox_height / img_height
        
        # Добавляем bounding box в YOLO формате
        yolo_bboxes.append((class_id, x_center_norm, y_center_norm, bbox_width_norm, bbox_height_norm))
    
    return yolo_bboxes

def save_yolo_bboxes_to_txt(yolo_bboxes, output_txt_path):
    # Открываем файл для записи
    with open(output_txt_path, 'w') as f:
        for bbox in yolo_bboxes:
            # YOLO формат: <class_id> <x_center_norm> <y_center_norm> <bbox_width_norm> <bbox_height_norm>
            class_id, x_center_norm, y_center_norm, bbox_width_norm, bbox_height_norm = bbox
            # Записываем bounding box в строку в формате YOLO
            f.write(f"{class_id} {x_center_norm:.6f} {y_center_norm:.6f} {bbox_width_norm:.6f} {bbox_height_norm:.6f}\n")


## train val split

In [9]:
import os
import random
import shutil

# Параметры
images_path = "data\\YOLO_sech_2+1\\images"  # Путь к папке с изображениями
annotations_path = "data\\YOLO_sech_2+1\\labels"  # Путь к папке с аннотациями
output_path = "data\\YOLO_sech_2+1"  # Путь для сохранения разбитого датасета
train_ratio = 0.8  # Доля данных для тренировки (оставшееся пойдет на валидацию)

# Создаем папки для train и val
train_images_path = os.path.join(output_path, "train", "images")
train_labels_path = os.path.join(output_path, "train", "labels")
val_images_path = os.path.join(output_path, "val", "images")
val_labels_path = os.path.join(output_path, "val", "labels")

os.makedirs(train_images_path, exist_ok=True)
os.makedirs(train_labels_path, exist_ok=True)
os.makedirs(val_images_path, exist_ok=True)
os.makedirs(val_labels_path, exist_ok=True)

# Собираем все изображения и аннотации
images = [f for f in os.listdir(images_path) if f.endswith(('.jpg', '.png'))]
random.shuffle(images)  # Перемешиваем данные

# Разделение на train и val
train_count = int(len(images) * train_ratio)
train_images = images[:train_count]
val_images = images[train_count:]

# Копируем файлы в соответствующие папки
def move_files(image_list, src_images_path, src_annotations_path, dest_images_path, dest_labels_path):
    for image_name in image_list:
        # Путь к изображению и аннотации
        image_path = os.path.join(src_images_path, image_name)
        label_name = image_name.replace('.jpg', '.txt').replace('.png', '.txt')
        label_path = os.path.join(src_annotations_path, label_name)

        # Копируем изображение
        shutil.copy(image_path, os.path.join(dest_images_path, image_name))
        # Копируем аннотацию (если она существует)
        if os.path.exists(label_path):
            shutil.copy(label_path, os.path.join(dest_labels_path, label_name))

# Переносим файлы
move_files(train_images, images_path, annotations_path, train_images_path, train_labels_path)
move_files(val_images, images_path, annotations_path, val_images_path, val_labels_path)

print("Разделение завершено!")


Разделение завершено!


In [2]:
import os
import random
import shutil
from collections import defaultdict

images_path = "data\\YOLO_sech_2+1\\images"  
annotations_path = "data\\YOLO_sech_2+1\\labels"  
output_path = "data\\YOLO_sech_2+1"  
train_ratio = 0.8  

train_images_path = os.path.join(output_path, "train", "images")
train_labels_path = os.path.join(output_path, "train", "labels")
val_images_path = os.path.join(output_path, "val", "images")
val_labels_path = os.path.join(output_path, "val", "labels")

os.makedirs(train_images_path, exist_ok=True)
os.makedirs(train_labels_path, exist_ok=True)
os.makedirs(val_images_path, exist_ok=True)
os.makedirs(val_labels_path, exist_ok=True)

def extract_postfix(filename):
    return filename.split('_')[-1]  


images = [f for f in os.listdir(images_path) if f.endswith(('.jpg', '.png'))]
groups = defaultdict(list)
for image in images:
    postfix = extract_postfix(image)
    groups[postfix].append(image)

group_keys = list(groups.keys())
random.shuffle(group_keys)

train_count = int(len(group_keys) * train_ratio)
train_groups = group_keys[:train_count]
val_groups = group_keys[train_count:]

train_images = set(image for group in train_groups for image in groups[group])
val_images = set(image for group in val_groups for image in groups[group])

intersection = train_images & val_images
if intersection:
    raise ValueError(f"Обнаружены дублирующиеся файлы: {intersection}")

def move_files(image_list, src_images_path, src_annotations_path, dest_images_path, dest_labels_path):
    for image_name in image_list:
        image_path = os.path.join(src_images_path, image_name)
        label_name = image_name.replace('.jpg', '.txt').replace('.png', '.txt')
        label_path = os.path.join(src_annotations_path, label_name)

        shutil.copy(image_path, os.path.join(dest_images_path, image_name))
        if os.path.exists(label_path):
            shutil.copy(label_path, os.path.join(dest_labels_path, label_name))

move_files(train_images, images_path, annotations_path, train_images_path, train_labels_path)
move_files(val_images, images_path, annotations_path, val_images_path, val_labels_path)

print("Разделение завершено!")

Разделение завершено!


## Проверка YOLO разметки

In [3]:
import os
import cv2

images_path = "data\\YOLO_sech_2+1\\images"  
annotations_path = "data\\YOLO_sech_2+1\\labels"  

def read_yolo_annotation(annotation_file, image_width, image_height):
    boxes = []
    with open(annotation_file, 'r') as file:
        for line in file:
            data = line.strip().split()
            if len(data) < 5:
                continue
            class_id, x_center, y_center, box_width, box_height = map(float, data)
            x_center *= image_width
            y_center *= image_height
            box_width *= image_width
            box_height *= image_height
            x1 = int(x_center - box_width / 2)
            y1 = int(y_center - box_height / 2)
            x2 = int(x_center + box_width / 2)
            y2 = int(y_center + box_height / 2)
            boxes.append((class_id, x1, y1, x2, y2))
    return boxes

for image_file in os.listdir(images_path):
    if not image_file.endswith(('.jpg', '.png')):
        continue

    image_path = os.path.join(images_path, image_file)
    annotation_file = os.path.join(annotations_path, image_file.replace('.jpg', '.txt').replace('.png', '.txt'))

    if not os.path.exists(annotation_file):
        print(f"Annotation for {image_file} not found, skipping.")
        continue

    image = cv2.imread(image_path)
    if image is None:
        print(f"Failed to read image {image_file}, skipping.")
        continue

    image_height, image_width = image.shape[:2]

    boxes = read_yolo_annotation(annotation_file, image_width, image_height)

    for class_id, x1, y1, x2, y2 in boxes:
        color = (0, 255, 0) 
        cv2.rectangle(image, (x1, y1), (x2, y2), color, 2)
        cv2.putText(image, str(int(class_id)), (x1, y1 - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

    cv2.imshow("Annotated Image", image)
    key = cv2.waitKey(0) 

    if key == 27:  # Если нажата клавиша ESC - выход
        break

cv2.destroyAllWindows()
