# Analýza formátu datasetu COCO
COCO (Common Objects in Context) je referečný dataset určený na trénovanie a validáciu detekčných a segmnetačných algorytmov počítačového videnia. Dataset obsahuje 328 000 obrázkov, 80 kategórii objektov a 1 500 000 ich inštancíí. Formát datasetu sa stal štandardom pre väčšinu algorytmov počítačového videnia a datasetov určených na ich trénovanie. Jeho autorom je COCO konzorcium.

<img src="jupyter_lab_images/coco_img1.png" style="width: 600px; height: 400px">

---
## COCO formát:
Formát datasetu COCO sa stal štandardom pre väčšinu algorytmov počítačového videnia. Dataset obsahuje samotné dáta a informácie o dátach (obrázkoch) datasetu sú uchované v špecifickej JSON štruktúre. JSON štruktúra určuje ako sa ukladajú štítky (label) a metadáta pre množinu obrázkov konkrétneho datasetu.

Priečinok datasetu COCO formátu má nasledovnú štruktúru:

```
dataset
│   labels.json
│
└───data
      file01.ext
      file02.ext
      ...
```

---
## JSON štruktúra:
JSON štruktúra datasetu vo formáte COCO pozostáva z nasledujúcich __elemetov__:
* __<span style="color: blue;">info </span>__ __(voliteľný):__
Popis a informácie o verzií datasetu.
* __<span style="color: blue;">licenses </span>__ __(voliteľný):__
Zoznam licenčných informácii pre obrázky zahrnuté v datasete.
* __<span style="color: blue;">categories </span>__ __(povinný):__
Zoznam tried, do ktorých sú detekované objekty klasifikované a ich metadát ako jedinečné id triedy, meno alebo voliteľná nad-trieda.
* __<span style="color: blue;">images </span>__ __(povinný):__
Zoznam obrázkov datasetu a ich metadát ako jedinečné id obrázka, cesta k súboru, šírka, výška a iné. 
* __<span style="color: blue;">annotations </span>__ __(povinný):__
Zoznam anotácii objektov so svojim jedinečným id, id obrázka, na ktorom sa daný objekt nachádza, údaj, informácie ohraničení objektu pre detekciu a segmentáciu a iné.

```json
{
    "info": {
        "year": "2021",
        "version": "1.0",
        "description": "Exported from FiftyOne",
        "contributor": "Voxel51",
        "url": "https://fiftyone.ai",
        "date_created": "2021-01-19T09:48:27"
    },
    "licenses": [
        {
          "url": "http://creativecommons.org/licenses/by-nc-sa/2.0/",
          "id": 1,
          "name": "Attribution-NonCommercial-ShareAlike License"
        },
        ...   
    ],
    "categories": [
        ...
        {
            "id": 2,
            "name": "cat",
            "supercategory": "animal"
        },
        ...
    ],
    "images": [
        {
            "id": 0,
            "license": 1,
            "file_name": "file0.ext",
            "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg",
            "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg",
            "height": 480,
            "width": 640,
            "date_captured": null
        },
        ...
    ],
    "annotations": [
        {
            "id": 0,
            "image_id": 0,
            "category_id": 2,
            "bbox": [260, 177, 231, 199],
            "segmentation": [[34.5, 37.8, ...], ...],
            "area": 45969,
            "iscrowd": 0
        },
        ...
    ]
}
```

---
## info (voliteľný):
Objekt obsahujúci informácie o datasete.
* __<span style="color: blue;">year </span>__ __(voliteľný):__
Obsahuje ___rok___ poslednej úpravy datasetu. Dátový typ: ___string___.
* __<span style="color: blue;">version </span>__ __(voliteľný):__
Obsahuje ___verziu___ datasetu. Dátový typ: ___string___.
* __<span style="color: blue;">description </span>__ __(voliteľný):__
Obsahuje ___opis___ datasetu. Dátový typ: ___string___.
* __<span style="color: blue;">contributor </span>__ __(voliteľný):__
Obsahuje ___prispievateľa___ datasetu. Dátový typ: ___string___.
* __<span style="color: blue;">url </span>__ __(voliteľný):__
Obsahuje ___url___. Dátový typ: ___string___. 
* __<span style="color: blue;">date_created </span>__ __(voliteľný):__
Obsahuje ___dátum vytvorenia___ datasetu. Dátový typ: ___string___. 

```json
{
    "info": {
        "year": "2021",
        "version": "1.0",
        "description": "Exported from FiftyOne",
        "contributor": "Voxel51",
        "url": "https://fiftyone.ai",
        "date_created": "2021-01-19T09:48:27"
    },
    ...
}
```

---
## licenses (voliteľný):
List objektov obsahujúcich informácie o licenciách.
* __<span style="color: blue;">url </span>__ __(voliteľný):__
Obsahuje __url__ na popis licencie. Dátový typ: __string__.
* __<span style="color: blue;">id </span>__ __(povinný):__
Obsahuje jedinečný číselný __identifikátor__ licencie. Dátový typ: __int__.
* __<span style="color: blue;">name </span>__ __(voliteľný):__
Obsahuje __meno__ licencie. Dátový typ: __string__.

```json
{
    "licenses": [
        {
          "url": "http://creativecommons.org/licenses/by-nc-sa/2.0/",
          "id": 1,
          "name": "Attribution-NonCommercial-ShareAlike License"
        },
        ...   
    ],
    ...
}
```

---
## categories (__povinný__):
List objektov obsahujúcich informácie o triedach, do ktorých sú objekty v datasete klasifikované.
* __<span style="color: blue;">id </span>__ __(povinný):__
Obsahuje jedinečný číselný __identifikátor__ triedy. Dátový typ: __int__.
* __<span style="color: blue;">name </span>__ __(povinný):__
Obsahuje __meno__ triedy. Dátový typ: __string__.
* __<span style="color: blue;">supercategory </span>__ __(voliteľný):__
Obsahuje meno __nad-triedy__ triedy. Dátový typ: __string__.

```json
{
    "categories": [
        ...
        {
            "id": 2,
            "name": "cat",
            "supercategory": "animal"
        },
        ...
    ],
    ...
}
```

---
## images (__povinný__):
List objektov obsahujúcich informácie o obrázkoch v datasete.
* __<span style="color: blue;">id </span>__ __(povinný):__
Obsahuje jedinečný číselný __identifikátor__ obrázku. Dátový typ: __int__.
* __<span style="color: blue;">license </span>__ __(voliteľný):__
Obsahuje číselný __identifikátor licencie__, ktorá zodpovedá obrázku. Dátový typ: __int__.
* __<span style="color: blue;">file_name </span>__ __(povinný):__
Obsahuje __názov obrázku__/__cestu k obrázku__. Dátový typ: __string__.
* __<span style="color: blue;">coco_url </span>__ __(voliteľný):__
Obsahuje __url stránky coco dasetu__. Dátový typ: __string__. (Len v pôvodnom COCO datasete.)
* __<span style="color: blue;">flickr_url </span>__ __(voliteľný):__
Obsahuje __url na stránku flickr__ s obrázkom. Dátový typ: __string__. (Len v pôvodnom COCO datasete.)
* __<span style="color: blue;">height </span>__ __(povinný):__
Obsahuje __výšku__ obrázka. Dátový typ: __int__. 
* __<span style="color: blue;">width </span>__ __(povinný):__
Obsahuje __šírku__ obrázka. Dátový typ: __int__. 
* __<span style="color: blue;">date_captured </span>__ __(povinný):__
Obsahuje __dátum a čas__ zachytenia obrázka. Dátový typ: __string__. 

```json
{
    "images": [
        {
            "id": 0,
            "license": 1,
            "file_name": "file0.ext",
            "coco_url": "http://images.cocodataset.org/val2017/nnnnnnnnnnnn.jpg",
            "flickr_url": "http://farm1.staticflickr.com/88/nnnnnnnnnnnnnnnnnnn.jpg",
            "height": 480,
            "width": 640,
            "date_captured": null
        },
        ...
    ],
    ...
}
```

---
## annotations (__povinný__):
List objektov anotácii tried na obrázkoch. Priradzuje objektom triedu, obrázok na ktorom sa nachádazú a časť, ktorú objekty na obrázku zaoberajú.
* __<span style="color: blue;">id </span>__ __(voliteľný):__
Obsahuje jedinečný číselný __identifikátor__ obrázku. Dátový typ: __int__.
* __<span style="color: blue;">image_id </span>__ __(povinný):__
Obsahuje číselný __identifikátor obrázku__, na ktorý sa viaže anotácia. Dátový typ: __int__.
* __<span style="color: blue;">category_id </span>__ __(povinný):__
Obsahuje číselný __identifikátor triedy__, na ktorý sa viaže anotácia. Dátový typ: __int__.
* __<span style="color: blue;">bbox </span>__ __(povinný):__
Obsahuje zoznam __x-ovej__ a __y-ovej súradnice__ začiatku boxu a jeho __šírku__ a __výšku__ (__[x-začiatok, y-začiatok, šírka, výška]__). Dátový typ: __list[float, float, float, float]__.
* __<span style="color: blue;">segmentation </span>__ __(voliteľný):__
Obsahuje zoznam zoznamov pixelov tvoriacich polygón/y (__[[x-ová súradnica, y-ová súradnica, ...], ...]__), ktorý/é tvoria masku segmentovaného objektu. Alternatívou tejto štruktúry uchovania masky objektu je RLE (Run Length Encoding). Dátový typ: __list[list[float, float, ...], ...]__.  __(Povinný element pri trénovaní segmentačných algorytmov!)__
* __<span style="color: blue;">area </span>__ __(voliteľný):__
Obsahuje __veľkosť plochy__, ktorú objekt zaberá. Dátový typ: __float__. 
* __<span style="color: blue;">iscrowd </span>__ __(voliteľný):__
Obsahuje informáciu, či je v ohraničenom boxe __samostatný objekt__ (0) alebo __skupina (dav) objektov__ (1) jednej triedy. Dátový typ: __int__.

```json
{
    "annotations": [
        {
            "id": 0,
            "image_id": 0,
            "category_id": 2,
            "bbox": [260, 177, 231, 199],
            "segmentation": [[34.5, 37.8, ...], ...],
            "area": 45969,
            "iscrowd": 0
        },
        ...
    ],
    ...
}
```

<img src="jupyter_lab_images/coco_img2.png" style="width: 600px; height: 400px;">