<a href="https://colab.research.google.com/github/gskumlehn/yolo-data-training/blob/main/convert_coco_annotations_to_yolo_labels.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import json
import os
from google.colab import drive

# Montar o Google Drive
print("Montando o Google Drive...")
drive.mount('/content/drive')

# Caminho no Google Drive para o dataset
coco_annotations_path = '/content/drive/My Drive/coco-dataset/annotations/instances_train2017.json'
coco_images_path = '/content/drive/My Drive/coco-dataset/train2017/'
output_labels_path = '/content/drive/My Drive/coco-dataset/yolo-labels/'

# Criar pasta de saída para os labels no formato YOLO
os.makedirs(output_labels_path, exist_ok=True)

# Função para normalizar valores
def normalize_bbox(bbox, img_width, img_height):
    x, y, width, height = bbox
    x_center = (x + width / 2) / img_width
    y_center = (y + height / 2) / img_height
    norm_width = width / img_width
    norm_height = height / img_height
    return x_center, y_center, norm_width, norm_height

# Carregar arquivo de anotações COCO
print(f"Lendo anotações do arquivo {coco_annotations_path}...")
with open(coco_annotations_path, 'r') as f:
    coco_data = json.load(f)

# Criar um mapeamento de categorias
category_map = {cat['id']: cat['name'] for cat in coco_data['categories']}

# Processar cada anotação
print("Convertendo anotações para o formato YOLO...")
for annotation in coco_data['annotations']:
    image_id = annotation['image_id']
    category_id = annotation['category_id']
    bbox = annotation['bbox']

    # Encontrar as dimensões da imagem correspondente
    image_info = next(img for img in coco_data['images'] if img['id'] == image_id)
    img_width, img_height = image_info['width'], image_info['height']

    # Normalizar a bounding box
    x_center, y_center, norm_width, norm_height = normalize_bbox(bbox, img_width, img_height)

    # Criar o nome do arquivo de saída para os labels
    output_file = os.path.join(output_labels_path, f"{image_info['file_name'].split('.')[0]}.txt")

    # Escrever a anotação no arquivo YOLO
    with open(output_file, 'a') as out_f:
        out_f.write(f"{category_id - 1} {x_center:.6f} {y_center:.6f} {norm_width:.6f} {norm_height:.6f}\n")

print("Conversão concluída!")


Montando o Google Drive...
Mounted at /content/drive
Lendo anotações do arquivo /content/drive/My Drive/coco-dataset/annotations/instances_train2017.json...
Convertendo anotações para o formato YOLO...
