# Wyszukiwanie unikalnych nazw klas w adnotacjach COCO

Ten notebook służy do automatycznego wyszukiwania i zapisywania unikalnych nazw klas z plików adnotacji w formacie COCO (_annotations.coco.json).
Został opracowany z myślą o projekcie dotyczącym detekcji pojazdów pływających (np. statków, łodzi, okrętów podwodnych), ale może być wykorzystany w dowolnym innym zbiorze danych COCO.

## Główne funkcje

- Przeszukiwanie wszystkich katalogów w strukturze danych (train, valid, test).
- Wczytywanie plików adnotacji w formacie JSON i odczytywanie nazw klas z sekcji "categories".
- Gromadzenie wszystkich unikalnych nazw klas z wielu zbiorów danych.
- Zapis wyników do pliku tekstowego unique_classes.txt.

In [6]:
#  Importowanie wymaganych bibliotek
import os
import json

## Konfiguracja bazowa

In [7]:
# Ścieżka do głównego katalogu z danymi COCO
base_dir = "datasets_coco"

# Zbiór przechowujący unikalne nazwy klas
unique_classes = set()

##  Wyszukiwanie wszystkich unikalnych nazw klas w strukturze COCO

In [8]:
# Iteracja po katalogach w folderze bazowym
for dataset_name in os.listdir(base_dir):
    dataset_path = os.path.join(base_dir, dataset_name)
    if not os.path.isdir(dataset_path):
        continue

    # Iteracja po podkatalogach typu train / valid / test
    for split in ["train", "valid", "test"]:
        json_path = os.path.join(dataset_path, split, "_annotations.coco.json")

        # Pominięcie, jeśli plik z adnotacjami nie istnieje
        if not os.path.exists(json_path):
            continue

        # Wczytywanie danych COCO z pliku JSON
        with open(json_path, "r", encoding="utf-8") as f:
            coco = json.load(f)

        # Pobieranie nazw klas z sekcji "categories"
        for cat in coco.get("categories", []):
            class_name = cat.get("name", "").strip().lower()
            unique_classes.add(class_name)

##  Zapis unikalnych nazw klas do pliku tekstowego

In [9]:
output_file = os.path.join(base_dir, "unique_classes.txt")

with open(output_file, "w", encoding="utf-8") as f:
    for cls in sorted(unique_classes):
        f.write(cls + "\n")

print(f"  Zapisano {len(unique_classes)} unikalnych klas do pliku: {output_file}")

  Zapisano 38 unikalnych klas do pliku: datasets_coco\unique_classes.txt


##  Podsumowanie wyników

In [10]:
print(f"Zapisano {len(unique_classes)} unikalnych klas do pliku: {output_file}")
print("\n Lista wszystkich unikalnych klas:\n")
for cls in sorted(unique_classes):
    print("-", cls)

Zapisano 38 unikalnych klas do pliku: datasets_coco\unique_classes.txt

 Lista wszystkich unikalnych klas:

- 0
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- aircraft carrier
- buoy
- canoe
- cargo
- carrier
- civilianship
- coastguard
- container
- container-warship-ships-buoys
- cruise
- fish-b
- human-drowning
- human-swimming
- human-water
- krazownik rakietowy
- lotniskowiec
- niszczyciel rakietowy
- okret desantowy
- okret podwodny
- przybrzezny okret bojowy
- sail boat
- ships
- speedboat
- submarine
- tanker
- uniwersalny okret desantowy
- vessel-z4gu
- warship
