<a href="https://colab.research.google.com/github/DmitryMok/od_helper/blob/main/prepare_for_od.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Модуль для анализа и конвертации датасета изображения

1. Анализ датасета (размеры и ориентация изображений)
2. Анализ аннотаций (наличие аннотаций для всех изображений)
3. Конвертация в формат yolo
4. Фильтрация изображений (по размерам, количеству изображений и т.п.)

# Анализ датасета

In [None]:
!git clone https://github.com/DmitryMok/wine_helper # вспомогательные функции
from wine_helper.prepare_data_helper import *

Cloning into 'wine_helper'...
remote: Enumerating objects: 54, done.[K
remote: Counting objects: 100% (54/54), done.[K
remote: Compressing objects: 100% (45/45), done.[K
remote: Total 54 (delta 15), reused 34 (delta 9), pack-reused 0[K
Unpacking objects: 100% (54/54), done.


In [None]:
import time
import random as r

In [None]:
!pip install xmltodict  # устанавливаем библиотеку для работы с xml

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting xmltodict
  Downloading xmltodict-0.13.0-py2.py3-none-any.whl (10.0 kB)
Installing collected packages: xmltodict
Successfully installed xmltodict-0.13.0


In [None]:
import xmltodict

# Классы

In [None]:
# класс для работы с датасетом
class DataSet:
  '''
  класс содержит пути к файлам изображений и разметки
  выводит статистику: количество файлов, разрешения файлов
  разбивает на train и val
  '''
  def __init__(self, img_dirs, lbl_dirs):
    self.img_dirs = img_dirs  # !list of train/val/test dir
    self.lbl_dirs = lbl_dirs

    # os.path.join(img_dir, lbl_dir)

    # self.img_lst = os.listdir(img_dir)
    # self.lbl_lst = os.listdir(lbl_dir)

  def get_stat(self):
    # выводит количество файлов и список расширений файлов
    print('Папки с изображениями:\n')
    commonpath = os.path.commonpath(self.img_dirs)
    print(commonpath) # общая часть папок, чтобы отобразить структуру
    # выводим информацию в каждой папке
    for img_dir in self.img_dirs:
      img_lst = [f for f in os.listdir(img_dir) if os.path.isfile(os.path.join(img_dir, f))]
      print('  |')
      print('  +-- ',os.path.relpath(img_dir, start=commonpath), ' [кол-во файлов - ', 
            len(img_lst), ', расширения: ', *{img_name.split('.')[-1] for img_name in img_lst if len(img_name.split('.'))>1},']', sep='')

    print('\n\nПапки с файлами разметки:\n')
    commonpath = os.path.commonpath(self.lbl_dirs)
    print(commonpath) # общая часть папок, чтобы отобразить структуру
    # выводим информацию в каждой папке
    for lbl_dir in self.lbl_dirs:
      lbl_lst = [f for f in os.listdir(lbl_dir) if os.path.isfile(os.path.join(lbl_dir, f))]
      print('  |')
      print('  +-- ',os.path.relpath(img_dir, start=commonpath), ' [кол-во файлов - ', 
            len(lbl_lst), ', расширения: ', *{lbl_name.split('.')[-1] for lbl_name in lbl_lst if len(lbl_name.split('.'))>1},']', sep='')
      
  # расширенная статистика по классам и объектам (количество, размеры, примеры классов)
  def get_class_stat(self,img_list, bbox_list, img_dir):  #
    # выводит статистику по классам
    # на вход массивы: [image_name], [class, x, y, w, h] и путь к изображениям

    x,y,w,h = bbox_list[0,1:]
    # если координаты относительные, переводим в абсолютные
    if (w < 1) and (h < 1):
      img = cv2.imread(os.path.join(img_dir,img_list[0]))
      bbox_list[:,[1,3]] *= img.shape[1]
      bbox_list[:,[2,4]] *= img.shape[0]

    # 1. список всех классов
    self.class_list = np.unique(bbox_list[:,0])
    print('Классы:', *self.class_list)
    
    # 2. баланс классов
    self.class_counts = [len(np.where(bbox_list[:,0]==cl)[0]) for cl in self.class_list]
    # print(class_counts)
    D = self.class_counts
    with plt.style.context('dark_background'):
      plt.bar(range(len(D)), D, align='center')
      plt.xticks(range(len(D)), range(1,len(D)+1))
      plt.title('Распределение количества классов')
      plt.show()
      print()
    
    # 3. распределение количества объектов на изображениях
    _, count_obj = np.unique(img_list[:], return_counts=True) # считаем количество объектов на каждом изображении
    # повторы уникальных значений
    _, count_obj = np.unique(count_obj, return_counts=True)   # считаем уникальыне повторы
    # print(np.unique(img_list[:]))
    D = count_obj
    with plt.style.context('dark_background'):
      plt.bar(range(len(D)), D, align='center')
      plt.xticks(range(len(D)), range(1,len(D)+1))
      plt.title('Распределение кол. объектов на изображениях')
      plt.show()    

    # 4. выводим рандомно примеры каждого из классов
    for cl in self.class_list:
      cl_idx_num = 5 # количесво примеров класса для вывода
      print('#'*50)
      print('КЛАСС -', cl)
      print('#'*50)
      
      # показываем на графике статистику размеров bbox

      # индексы нужного класса
      idx_classes = np.where(bbox_list[:,0]==cl)[0]  
      
      # индексы нужного размера (5 самых крупных, но не крупнее 400)
      idx_bb_size_min = np.where(bbox_list[:,4] >= np.sort(bbox_list[idx_classes][:,4])[-cl_idx_num])[0]
      idx_bb_size_max = np.where(bbox_list[:,4] <= 400)[0]  # для ограничения максиального размера
      # len(idx_classes), len(idx_bb_size), bbox_list[idx_bb_size][:3]
      
      # индексы из пересечения индексов нужного класса и размера
      idx = list(set(idx_classes) & set(idx_bb_size_min) & set(idx_bb_size_max))
      # print(bbox_list[idx])

      with plt.style.context('dark_background'):
        plt.title(f'Размеры bounding box, class={cl}, {len(idx)}шт')
        # plt.plot(wh_lst[1::2], wh_lst[0::2],':o')
        # plt.show()

        x, y = bbox_list[bbox_list[:,0]==cl][:,3], bbox_list[bbox_list[:,0]==cl][:,4]
        
        wh_zip = list(zip(x,y)) # создаем пары, чтобы работать с ними в словаре
        d = {d:wh_zip.count(d) for d in set(wh_zip)}
        # print(d.values())
        s = [s for s in d.values()]
        # s = [20*4**n for n in range(len(x))]
        plt.scatter([x for x,y in d.keys()],[y for x,y in d.keys()],s=s)
        plt.show()      
      # 5 случайных интексов для вывода
      samp_idx = np.random.choice(idx, np.min([cl_idx_num, len(idx)]), replace=False)
      for i in samp_idx:
        img = cv2.imread(os.path.join(img_dir,img_list[i]))
        x,y,w,h = bbox_list[i][1:]
        
        if (w > 1) and (h > 1):
          print(img_list[i], bbox_list[i])
          # print(x,y,w,h, img.shape)
          img_class = img[int(y-h/2):int(y+h/2), int(x-w/2):int(x+w/2)]
          cv2_imshow(img_class)
      # cv2_imshow(resize_image(img, width=min(img.shape[1],800)))



---

Блок тестов

In [None]:
# !cp /content/drive/MyDrive/Project_people/dataset_land/vis_drone19_sample.zip /content/

In [None]:
# !unzip -q vis_drone19_sample.zip -d /content

конец блока тестов

---



# Функциии

**вывод несколько изображений из папки**

In [None]:
def draw_imgs_from_path(dir, num=8):
  '''
  Draws images from the folder as a grid (4 cols x num / 4 rows)
  :dir: path to folder with images
  :num: number of images (default = 16)
  '''
  # получим список с именами всех картинок, находящихся в папке pic
  pictures = os.listdir(dir)
  # Упорядочим список 
  pictures = sorted(pictures)
  # Создадим фигуру размером 16 на 4 дюйма
  pic_box = plt.figure(figsize=(32,5*(num//4+1)))
  
  # Поочередно считываем в переменную picture имя изображения из списка pictures. В переменную i записываем номер итерации
  for i, picture in enumerate(pictures[:num]):
      # считываем изображение в picture
      picture = cv2.imread(os.path.join(dir,picture))
      # конвертируем BGR изображение в RGB
      picture = cv2.cvtColor(picture, cv2.COLOR_BGR2RGB)
      # добавляем ячейку в pix_box для вывода текущего изображения
      pic_box.add_subplot(num//4+1,4,i+1)
      plt.title(pictures[i] + '\n' + str(picture.shape))
      plt.imshow(picture)
      # отключаем отображение осей
      plt.axis('off')
  # выводим все созданные фигуры на экран
  plt.show()    


In [None]:
def check_img_dir(dir):
  '''
  Counts images in the folder
  shows file extensions and a graph of image sizes
  :dir: path to folder with images
  '''
  wh_lst = []   # массив для размеров изображений
  img_lst = os.listdir(dir)
  flag = True # флаг мониторинга контроля ожидания
  print('Количество файлов в папке:', len(img_lst))
  print('Расширения:', *{img_name.split('.')[-1] for img_name in img_lst})
  new_time = time.time()
  for i,img_name in enumerate(img_lst[:]):
    tmp_img = cv2.imread(os.path.join(dir,img_name))
    wh_lst.extend(tmp_img.shape[:2])
    # print(img_name, tmp_img.shape[:2])
    if flag and time.time()-new_time > 1:
      print('\n...идет обработка, подождите еще примерно', round((time.time()-new_time)*len(img_lst)/(i+1)), 'сек\n')
      flag = False

  with plt.style.context('dark_background'):
    plt.title('Размеры изображений')
    # plt.plot(wh_lst[1::2], wh_lst[0::2],':o')
    # plt.show()

    x, y = wh_lst[1::2], wh_lst[0::2]
    
    wh_zip = list(zip(x,y)) # создаем пары, чтобы работать с ними в словаре
    d = {d:wh_zip.count(d) for d in set(wh_zip)}
    # print(d.values())
    s = [s for s in d.values()]
    # s = [20*4**n for n in range(len(x))]
    plt.scatter([x for x,y in d.keys()],[y for x,y in d.keys()],s=s)
    plt.show()


# check_img_dir(ds.img_dirs[0])

### Для YOLOv5

In [None]:
# создание папок для yolo

def create_dirs_for_yolo(root_dir):
  '''
  Creates root_dir/train/images, root_dir/train/labels and the same for /val
  '''
  os.makedirs(root_dir+'train/images/', exist_ok=True)
  os.makedirs(root_dir+'train/labels/', exist_ok=True)

  os.makedirs(root_dir+'val/images/', exist_ok=True)
  os.makedirs(root_dir+'val/labels/', exist_ok=True)

In [None]:
# создаем custom.yaml
def create_yaml(fname='custom.yaml', classes={0:'person'}, main_dir='/content/dataset/', dirs=['train','val']):
  '''
  Creates custom.yaml for yolov5
  :fname: yaml file name 
  :classes: dictionary of all classes (default {0:'person'})
  :main_dir: path to root folder
  :dirs: train and val subfolders
  '''
  file = open(fname, 'w')  # файл будет создан, если отсутствует

  file.write(f"train: {main_dir+dirs[0]}/\n")
  file.write(f"val: {main_dir+dirs[1]}/\n\n")

  file.write(f"nc: {len(classes)}\n\n")

  file.write(f"names: {list(classes.values())}")
  # names: ['person']
  file.close()

In [None]:
print('\nфункции успешно загружены')
print('используйте функции:')
print('draw_imgs_from_path - для вывода сетки изображений из папки (файлы сортируются по имени)')
print('check_img_dir - чтобы получить количество изображений, типы расширений и разброс размеров на графике')
print('create_dirs_for_yolo - подготовить папки для датасета на котором будет обучаться yolo')
print('create_yaml - для создания файла yaml yolo с описанием путей и классов')




функции успешно загружены
используйте функции:
draw_imgs_from_path - для вывода сетки изображений из папки (файлы сортируются по имени)
check_img_dir - чтобы получить количество изображений, типы расширений и разброс размеров на графике
create_dirs_for_yolo - подготовить папки для датасета на котором будет обучаться yolo
create_yaml - для создания файла yaml yolo с описанием путей и классов
