# Создание датасета

Импорт необходимых библиотек

In [62]:
import os
import glob
import imageio
import shutil
import xml.etree.ElementTree as ET
import pandas as pd
import matplotlib.pyplot as plt
from PIL import Image
import random

Загрузка изображений и их аннотаций

In [11]:
img_path = '/content/images'
annotations = '/content/annotation'

In [12]:
# Загружаем изображения как массивы NumPy и добавляем их в список images
images = []
for file in glob.glob(os.path.join(img_path, '*.jpg')):
    images.append(imageio.imread(file))

  images.append(imageio.imread(file))


In [13]:
# Сколько у нас изображений
print('We have {} images'.format(len(images)))


We have 210 images


In [14]:
# Размеры изображений
for index, file in enumerate(glob.glob(os.path.join(img_path, '*.jpg'))):
    print('Image {} has size of {}'.format(os.path.basename(file), images[index].shape))

Image 3 (10).jpg has size of (480, 854, 3)
Image 2 (125).jpg has size of (480, 854, 3)
Image 2 (31).jpg has size of (480, 854, 3)
Image 3 (77).jpg has size of (480, 854, 3)
Image 2 (40).jpg has size of (480, 854, 3)
Image 2 (27).jpg has size of (480, 854, 3)
Image 2 (114).jpg has size of (480, 854, 3)
Image 1 (1583).jpg has size of (480, 854, 3)
Image 1 (3044).jpg has size of (480, 854, 3)
Image 3 (100).jpg has size of (480, 854, 3)
Image 3 (56).jpg has size of (480, 854, 3)
Image 2 (136).jpg has size of (480, 854, 3)
Image 1 (2).jpg has size of (480, 854, 3)
Image 1.1 (1029).jpg has size of (480, 854, 3)
Image 1 (2719).jpg has size of (480, 854, 3)
Image 1 (1226).jpg has size of (480, 854, 3)
Image 2 (129).jpg has size of (480, 854, 3)
Image 1 (108).jpg has size of (480, 854, 3)
Image 1 (3).jpg has size of (480, 854, 3)
Image 1 (805).jpg has size of (480, 854, 3)
Image 1.1 (2086).jpg has size of (480, 854, 3)
Image 2 (123).jpg has size of (480, 854, 3)
Image 3 (41).jpg has size of (48

Проверяем загруженнные файлы

In [15]:
# Имена XML файлов соответствуют именам файлов изображений
for file in glob.glob(os.path.join(annotations, '*.xml')):
    print(file)

/content/annotation/2 (112).xml
/content/annotation/3 (86).xml
/content/annotation/2 (76).xml
/content/annotation/1 (1438).xml
/content/annotation/1 (1703).xml
/content/annotation/2 (80).xml
/content/annotation/2 (110).xml
/content/annotation/2 (117).xml
/content/annotation/1 (1252).xml
/content/annotation/1.1 (407).xml
/content/annotation/2 (78).xml
/content/annotation/2 (69).xml
/content/annotation/3 (100).xml
/content/annotation/1 (4).xml
/content/annotation/2 (60).xml
/content/annotation/3 (110).xml
/content/annotation/2 (106).xml
/content/annotation/1 (1226).xml
/content/annotation/2 (134).xml
/content/annotation/3 (70).xml
/content/annotation/1 (650).xml
/content/annotation/2 (141).xml
/content/annotation/3 (137).xml
/content/annotation/1 (906).xml
/content/annotation/2 (86).xml
/content/annotation/2 (77).xml
/content/annotation/1.1 (2948).xml
/content/annotation/3 (56).xml
/content/annotation/2 (97).xml
/content/annotation/2 (75).xml
/content/annotation/3 (121).xml
/content/anno

In [16]:
# Проверяем XML файлы
for xml_file in glob.glob(os.path.join(annotations, '*.xml')):
    with open(xml_file, "r") as annotation_text:
        print(annotation_text.read())

<annotation>
  <filename>2 (112).jpg</filename>
  <folder></folder>
  <source>
    <sourceImage></sourceImage>
    <sourceAnnotation>Datumaro</sourceAnnotation>
  </source>
  <imagesize>
    <nrows>480</nrows>
    <ncols>854</ncols>
  </imagesize>
  <object>
    <name>break</name>
    <deleted>0</deleted>
    <verified>0</verified>
    <occluded>no</occluded>
    <date></date>
    <id>0</id>
    <parts>
      <hasparts></hasparts>
      <ispartof></ispartof>
    </parts>
    <polygon>
      <pt>
        <x>537.08</x>
        <y>233.02</y>
      </pt>
      <pt>
        <x>516.66</x>
        <y>224.42</y>
      </pt>
      <pt>
        <x>505.52</x>
        <y>194.32</y>
      </pt>
      <pt>
        <x>531.71</x>
        <y>177.12</y>
      </pt>
      <username></username>
    </polygon>
    <attributes></attributes>
  </object>
  <object>
    <name>crack</name>
    <deleted>0</deleted>
    <verified>0</verified>
    <occluded>no</occluded>
    <date></date>
    <id>1</id>
    <parts

Функции создания датасета из загруженных данных (изображений и разметки)

In [17]:
# Функция для конвертации XML в DataFrame
def xml_to_csv(xml_file):
    tree = ET.parse(xml_file)
    root = tree.getroot()

    filename = root.find('filename').text
    width = int(root.find('imagesize').find('ncols').text)
    height = int(root.find('imagesize').find('nrows').text)

    data = []
    for obj in root.findall('object'):
        obj_name = obj.find('name').text
        xmin = ymin = xmax = ymax = None

        if len(obj.findall('polygon')) > 0:
            polygon = obj.find('polygon')
            pts = polygon.findall('pt')
            x_coords = [float(pt.find('x').text) for pt in pts]
            y_coords = [float(pt.find('y').text) for pt in pts]
            xmin = min(x_coords)
            xmax = max(x_coords)
            ymin = min(y_coords)
            ymax = max(y_coords)

        data.append([filename, width, height, obj_name, xmin, ymin, xmax, ymax])

    column_names = ['filename', 'width', 'height', 'class', 'xmin', 'ymin', 'xmax', 'ymax']
    df = pd.DataFrame(data, columns=column_names)
    return df

In [18]:
# Создаем пустой DataFrame для сохранения данных
labels_df = pd.DataFrame()

In [31]:
# Пройдем по всем XML файлам в папке с аннотациями и конвертируем их в CSV
for file in os.listdir(annotations):
    if file.endswith('.xml'):
        df = xml_to_csv(os.path.join(annotations, file))
        labels_df = pd.concat([labels_df, df], ignore_index=True)


print('Successfully converted xml to csv.')
print(labels_df)

Successfully converted xml to csv.
        filename  width  height  class    xmin    ymin    xmax    ymax
0    2 (112).jpg    854     480  break  505.52  177.12  537.08  233.02
1    2 (112).jpg    854     480  crack  126.72   39.05  548.75  456.60
2    2 (112).jpg    854     480  joint  507.45    1.20  722.75  479.80
3    2 (112).jpg    854     480  crack  632.60    2.80  725.70  352.80
4     3 (86).jpg    854     480  crack  267.44   34.29  588.16  284.40
..           ...    ...     ...    ...     ...     ...     ...     ...
919  3 (127).jpg    854     480  break  332.40  406.60  412.85  423.80
920  2 (114).jpg    854     480  break  507.34  174.97  538.88  224.42
921  2 (114).jpg    854     480  crack  126.72   37.20  555.60  456.60
922  2 (114).jpg    854     480  joint  513.20    1.90  728.10  480.00
923  2 (114).jpg    854     480  crack  661.88    2.67  726.30  296.70

[924 rows x 8 columns]


In [52]:
# Загрузите DataFrame с аннотациями
labels_df

Unnamed: 0,filename,width,height,class,xmin,ymin,xmax,ymax
0,2 (112).jpg,854,480,break,505.52,177.12,537.08,233.02
1,2 (112).jpg,854,480,crack,126.72,39.05,548.75,456.60
2,2 (112).jpg,854,480,joint,507.45,1.20,722.75,479.80
3,2 (112).jpg,854,480,crack,632.60,2.80,725.70,352.80
4,3 (86).jpg,854,480,crack,267.44,34.29,588.16,284.40
...,...,...,...,...,...,...,...,...
919,3 (127).jpg,854,480,break,332.40,406.60,412.85,423.80
920,2 (114).jpg,854,480,break,507.34,174.97,538.88,224.42
921,2 (114).jpg,854,480,crack,126.72,37.20,555.60,456.60
922,2 (114).jpg,854,480,joint,513.20,1.90,728.10,480.00


Уменьшаем размер изображений

In [53]:
# Укажите исходные и новые размеры изображений
original_width, original_height = 854, 480
new_width, new_height = 600, 337

In [54]:
def resize_image_and_update_coords(image_path, boxes):
    with Image.open(image_path) as img:
        img_resized = img.resize((new_width, new_height), Image.ANTIALIAS)

        # Сохраните новое изображение в нужную директорию (например, "images_resized")
        new_image_path = os.path.join("images_resized", os.path.basename(image_path))
        os.makedirs("images_resized", exist_ok=True)
        img_resized.save(new_image_path)

        # Обновите координаты bounding boxes
        scale_x = new_width / original_width
        scale_y = new_height / original_height
        boxes = boxes.copy()
        boxes['xmin'] = boxes['xmin'] * scale_x
        boxes['ymin'] = boxes['ymin'] * scale_y
        boxes['xmax'] = boxes['xmax'] * scale_x
        boxes['ymax'] = boxes['ymax'] * scale_y

        # Обновите размеры изображения в DataFrame
        boxes['width'] = new_width
        boxes['height'] = new_height
        boxes['filename'] = os.path.basename(new_image_path)

        return boxes

In [56]:
# Обрабатываем каждое изображение и обновляем координаты
updated_frames = []
for image_file in tqdm(labels_df['filename'].unique()):
    image_path = os.path.join("images", image_file)  # Укажите путь к директории с изображениями

    # Получаем все записи для данного изображения
    image_boxes = labels_df[labels_df['filename'] == image_file]

    # Обновляем координаты bounding boxes
    updated_boxes = resize_image_and_update_coords(image_path, image_boxes)

    updated_frames.append(updated_boxes)

# Объединяем все обновленные DataFrame
updated_labels_df = pd.concat(updated_frames)

  img_resized = img.resize((new_width, new_height), Image.ANTIALIAS)
100%|██████████| 210/210 [00:03<00:00, 55.38it/s]


In [57]:
updated_labels_df

Unnamed: 0,filename,width,height,class,xmin,ymin,xmax,ymax
0,2 (112).jpg,600,337,break,355.166276,124.353000,377.339578,163.599458
1,2 (112).jpg,600,337,crack,89.030445,27.416354,385.538642,320.571250
2,2 (112).jpg,600,337,joint,356.522248,0.842500,507.786885,336.859583
3,2 (112).jpg,600,337,crack,444.449649,1.965833,509.859485,247.695000
462,2 (112).jpg,600,337,break,355.166276,124.353000,377.339578,163.599458
...,...,...,...,...,...,...,...,...
461,2 (114).jpg,600,337,crack,465.021077,1.874562,510.281030,208.308125
920,2 (114).jpg,600,337,break,356.444965,122.843521,378.604215,157.561542
921,2 (114).jpg,600,337,crack,89.030445,26.117500,390.351288,320.571250
922,2 (114).jpg,600,337,joint,360.562061,1.333958,511.545667,337.000000


Кодируем целевую категориальную переменную

In [58]:
from sklearn.preprocessing import LabelEncoder

labelencoder = LabelEncoder()
updated_labels_df['class'] = labelencoder.fit_transform(updated_labels_df['class'])


In [59]:
updated_labels_df

Unnamed: 0,filename,width,height,class,xmin,ymin,xmax,ymax
0,2 (112).jpg,600,337,0,355.166276,124.353000,377.339578,163.599458
1,2 (112).jpg,600,337,1,89.030445,27.416354,385.538642,320.571250
2,2 (112).jpg,600,337,2,356.522248,0.842500,507.786885,336.859583
3,2 (112).jpg,600,337,1,444.449649,1.965833,509.859485,247.695000
462,2 (112).jpg,600,337,0,355.166276,124.353000,377.339578,163.599458
...,...,...,...,...,...,...,...,...
461,2 (114).jpg,600,337,1,465.021077,1.874562,510.281030,208.308125
920,2 (114).jpg,600,337,0,356.444965,122.843521,378.604215,157.561542
921,2 (114).jpg,600,337,1,89.030445,26.117500,390.351288,320.571250
922,2 (114).jpg,600,337,2,360.562061,1.333958,511.545667,337.000000


Сохраняем датафрейм для дальнейшей обработки моделью

In [60]:
# Сохраняем обновленный DataFrame в новый CSV-файл
updated_labels_df.to_csv("new_annotations.csv", index=False)

print("Процесс завершен. Изображения и аннотации обновлены и сохранены.")

Процесс завершен. Изображения и аннотации обновлены и сохранены.


# Визуализация измененных изображений и размеченных объектов

In [63]:
# Укажем путь к папке с новыми изображениями
folder_path = "images_resized"

# Укажем имя создаваемого zip-архива
zip_filename = "images_resized.zip"

# Упакуем папку в zip-архив
shutil.make_archive(zip_filename.replace(".zip", ""), 'zip', folder_path)

print(f"Папка {folder_path} успешно упакована в {zip_filename}.")

Папка images_resized успешно упакована в images_resized.zip.


In [64]:
from google.colab import files

files.download(zip_filename)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from PIL import Image
import os


In [None]:
import random

In [None]:
# Количество изображений для отображения
num_images_to_show = 3  # Задайте количество изображений, которые вы хотите отобразить

# Определяем цвета для каждого класса
class_colors = {
    'break': 'red',
    'crack': 'blue',
    'joint': 'green'
}

# Извлекаем уникальные имена файлов из DataFrame
unique_filenames = labels_df['filename'].unique()

# Если количество требуемых изображений больше чем доступных, ограничиваем значение
num_images_to_show = min(num_images_to_show, len(unique_filenames))

# Выбираем случайные имена файлов для визуализации
files_to_visualize = random.sample(list(unique_filenames), num_images_to_show)

# Отображаем каждое изображение с аннотациями
for filename_to_visualize in files_to_visualize:
    # Извлекаем строки DataFrame, соответствующие заданному файлу
    group_df = labels_df[labels_df['filename'] == filename_to_visualize]
    if group_df.empty:
        print(f"No annotations found for file '{filename_to_visualize}'")
        continue

    # Путь к изображению
    img_file = os.path.join(img_dir, filename_to_visualize)
    if not os.path.exists(img_file):
        print(f"Image file '{img_file}' does not exist")
        continue

    # Загрузка изображения
    image = Image.open(img_file)
    plt.figure(figsize=(8, 8))
    plt.imshow(image)

    # Отображение bounding boxes с учетом цвета для каждого класса
    for _, row in group_df.iterrows():
        xmin, ymin, xmax, ymax = row['xmin'], row['ymin'], row['xmax'], row['ymax']
        class_label = row['class']
        color = class_colors.get(class_label, 'white')  # Если класса нет в словаре, используем белый цвет

        # Прямоугольник
        plt.plot([xmin, xmax, xmax, xmin, xmin], [ymin, ymin, ymax, ymax, ymin], color=color, label=class_label)

    # Удаление дублирующихся легенд
    handles, labels = plt.gca().get_legend_handles_labels()
    by_label = dict(zip(labels, handles))
    plt.legend(by_label.values(), by_label.keys())

    plt.axis('off')
    plt.title(filename_to_visualize)
    plt.show()

Датафрейм содержащий информацию о разметке объектов на изображениях создан и сохранен для дальнейшей работы.