# Trénování YOLOv12 Small nebo Nano modelu pro detekci objektů

YOLO (You Only Look Once) je jedním z nejpopulárnějších algoritmů pro detekci objektů v reálném čase. V této edukativní příručce si krok za krokem vysvětlíme, jak natrénovat YOLOv12 Small nebo Nano model pro detekci objektů. Tento notebook pokrývá následující témata:

1. Příprava datasetu
2. Anotace dat
3. Formáty dat (YOLO, Pascal VOC, COCO)
4. Trénování modelu


## 1. Příprava datasetu

### Vlastní dataset vs veřejné datasety
Pro trénování modelu můžete použít vlastní dataset nebo veřejně dostupné datasety jako COCO nebo Roboflow. Veřejné datasety jsou často dobře anotované a připravené k použití, což může ušetřit čas.

### Anotace dat
Anotace dat je proces označování objektů v obrázcích. Můžete použít nástroje jako LabelImg nebo Roboflow Annotate pro anotaci dat.

### Formáty dat
Existují různé formáty dat pro anotace, jako jsou YOLO, Pascal VOC a COCO. Každý formát má své specifické požadavky na strukturu souborů.


## 2. Anotace dat

### Použití LabelImg pro anotaci dat
LabelImg je open-source nástroj pro anotaci obrázků. Můžete jej použít k vytváření anotací ve formátu YOLO.

1. Stáhněte a nainstalujte LabelImg z [GitHubu](https://github.com/tzutalin/labelImg).
2. Otevřete LabelImg a načtěte obrázky, které chcete anotovat.
3. Označte objekty v obrázcích a uložte anotace ve formátu YOLO.

### Použití Roboflow Annotate
Roboflow Annotate je online nástroj pro anotaci obrázků, který podporuje různé formáty anotací.

1. Zaregistrujte se na [Roboflow](https://roboflow.com/).
2. Nahrajte své obrázky a použijte nástroj pro anotaci k označení objektů.
3. Exportujte anotace ve formátu YOLO, Pascal VOC nebo COCO.


## 3. Formáty dat

### YOLO formát
YOLO formát používá textové soubory s anotacemi, kde každá řádka představuje jeden objekt ve formátu:
<objekt> <x_center> <y_center> <width> <height>

### Pascal VOC formát
Pascal VOC formát používá XML soubory pro anotace, kde každá anotace obsahuje informace o objektu, jako jsou název, ohraničující rámeček a další.

### COCO formát
COCO formát používá JSON soubory pro anotace, kde každá anotace obsahuje informace o obrázku, kategoriích a ohraničujících rámečcích.


In [None]:
# Pascal VOC
<annotation>
    <folder>images</folder>
    <filename>image1.jpg</filename>
    <path>/path/to/image1.jpg</path>
    <source>
        <database>Unknown</database>
    </source>
    <size>
        <width>640</width>
        <height>480</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    <object>
        <name>dog</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>100</xmin>
            <ymin>150</ymin>
            <xmax>300</xmax>
            <ymax>350</ymax>
        </bndbox>
    </object>
</annotation>

In [None]:
# COCO - JSON
{
  "images": [
    {
      "id": 1,
      "width": 640,
      "height": 480,
      "file_name": "image1.jpg"
    "id": 1,
      "image_id": 1,
      "category_id": 1,
      "bbox": [100, 150, 200, 200],
      "area": 40000,
      "iscrowd": 0
    }
  ],
  "categories": [
    {
      "id": 1,
      "name": "dog"
    }
  ]
}

In [None]:
# YOLOv12 - TXT
0 0.3125 0.5208 0.3125 0.4167

# YOLO formát používá normalizované hodnoty (0–1) pro střed bounding boxu a jeho šířku a výšku:

x_center = (100 + 300) / 2 / 640 = 0.3125
y_center = (150 + 350) / 2 / 480 = 0.5208
width = (300 - 100) / 640 = 0.3125
height = (350 - 150) / 480 = 0.4167