In [1]:
import json
import os
from PIL import Image

## fonctions pour la conversion d'annotation de VIA vers Yolo Anotator

In [2]:
def load_annotations(json_file):
    """Charge le fichier JSON d'annotations VIA et extrait les annotations."""
    with open(json_file, 'r') as f:
        data = json.load(f)
    # Si le format est VIA, les annotations se trouvent dans "_via_img_metadata"
    if "_via_img_metadata" in data:
        return data["_via_img_metadata"]
    return data

In [3]:
def get_class_mapping(annotations):
    """
    Génère un mapping (classe combinée -> id) à partir des annotations.
    Pour chaque région, on parcourt les attributs pour extraire la main classe.
    """
    classes = set()
    for key, value in annotations.items():
        regions = value.get("regions", [])
        # Certains fichiers VIA stockent les régions dans un dictionnaire
        if isinstance(regions, dict):
            regions = regions.values()
        for region in regions:
            region_attr = region.get("region_attributes", {})
            # On attend qu'une seule clé ait une valeur non vide
            for main_key, sub_class in region_attr.items():
                if sub_class:  
                    # Conversion de "4x2" en "2x4" pour respecter la nomenclature souhaitée
                    main_class = "2x4" if main_key == "4x2" else main_key
                    combined_class = f"{main_class}_{sub_class}"
                    classes.add(combined_class)
                    break  # on considère la première valeur non vide
    # Crée un mapping trié pour un ordre stable
    class_to_id = {cls: idx for idx, cls in enumerate(sorted(classes))}
    return class_to_id

In [4]:
def convert_annotations(annotations, images_dir, output_dir, class_mapping):
    """
    Convertit les annotations VIA en fichiers texte au format YOLO.
    Pour chaque région, la classe est déterminée .
    """
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    for key, value in annotations.items():
        filename = value.get("filename")
        image_path = os.path.join(images_dir, filename)
        if not os.path.exists(image_path):
            print(f"Image {image_path} non trouvée, passage...")
            continue
        
        # Ouvre l'image pour récupérer sa taille
        with Image.open(image_path) as img:
            img_width, img_height = img.size
        
        # Fichier de sortie (même nom que l'image, extension .txt)
        base_filename = os.path.splitext(filename)[0]
        output_file = os.path.join(output_dir, base_filename + ".txt")
        
        lines = []
        regions = value.get("regions", [])
        if isinstance(regions, dict):
            regions = regions.values()
        for region in regions:
            shape_attr = region.get("shape_attributes", {})
            region_attr = region.get("region_attributes", {})
            
            combined_class = None
            for main_key, sub_class in region_attr.items():
                if sub_class:
                    main_class = "2x4" if main_key == "4x2" else main_key
                    combined_class = f"{main_class}_{sub_class}"
                    break
            if combined_class is None:
                continue  # pas d'annotation pour cette région
            
            class_id = class_mapping.get(combined_class)
            if class_id is None:
                print(f"Classe {combined_class} non trouvée dans le mapping.")
                continue
            
            # On traite  les rectangles
            if shape_attr.get("name") == "rect":
                x = shape_attr.get("x", 0)
                y = shape_attr.get("y", 0)
                width = shape_attr.get("width", 0)
                height = shape_attr.get("height", 0)
                
                # Conversion au format YOLO : coordonnées normalisées
                x_center = (x + width/2) / img_width
                y_center = (y + height/2) / img_height
                width_norm = width / img_width
                height_norm = height / img_height
                
                line = f"{class_id} {x_center:.6f} {y_center:.6f} {width_norm:.6f} {height_norm:.6f}"
                lines.append(line)
            
        with open(output_file, "w") as f:
            f.write("\n".join(lines))
        print(f"Annotations converties pour {filename} enregistrées dans {output_file}")

In [5]:
def convert_via_to_yolo(json_file, images_dir, output_dir):
    """
    Fonction principale pour convertir les annotations VIA en format YOLO.
    """
    annotations = load_annotations(json_file)
    class_mapping = get_class_mapping(annotations)
    
    # Sauvegarde le mapping dans un fichier classes.txt
    classes_file = os.path.join(output_dir, "classes.txt")
    with open(classes_file, "w") as f:
        for cls, idx in class_mapping.items():
            f.write(f"{cls}\n")
    
    convert_annotations(annotations, images_dir, output_dir, class_mapping)

## Génération yolo annotation pour train_set, val_set

In [9]:
# Chemins pour l'étape de train
json_file_train_set  = "../../outputs/VIA_json_fine_tuning/fighters_fineTuning_trainSet.json"
images_dir_train_set = "../../data/processed/dataset_fine_tuning_fighters/train_set/imgs"
output_dir_train_set = "../../data/processed/dataset_fine_tuning_fighters/train_set/labels"

In [12]:
# # Chemin pour l'étape de train
json_file_validation_set  = "../../outputs/VIA_json_fine_tuning/fighters_fineTuning_validationSet.json"
images_dir_validation_set = "../../data/processed/dataset_fine_tuning_fighters/validation_set/imgs"
output_dir_train_set      = "../../data/processed/dataset_fine_tuning_fighters/validation_set/labels"



In [11]:
# convertir le train_set et enregistrement
convert_via_to_yolo(json_file_train_set, images_dir_train_set, output_dir_train_set)


Annotations converties pour frame_0000.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0000.txt
Annotations converties pour frame_0001.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0001.txt
Annotations converties pour frame_0002.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0002.txt
Annotations converties pour frame_0003.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0003.txt
Annotations converties pour frame_0005.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0005.txt
Annotations converties pour frame_0006.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0006.txt
Annotations converties pour frame_0007.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/train_set/labels/frame_0007.txt

In [13]:
# convertir le validation_set et enregistrement
convert_via_to_yolo(json_file_validation_set, images_dir_validation_set, output_dir_train_set)

Annotations converties pour frame_0034.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0034.txt
Annotations converties pour frame_0035.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0035.txt
Annotations converties pour frame_0036.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0036.txt
Annotations converties pour frame_0037.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0037.txt
Annotations converties pour frame_0038.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0038.txt
Annotations converties pour frame_0039.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/validation_set/labels/frame_0039.txt
Annotations converties pour frame_0040.jpg enregistrées dans ../../data/processed/dataset_fine_tuning_fighters/v