In [1]:
import os

def remover_classe_dataset_yolov8(dataset_root, classe_para_remover):
    """
    Remove imagens e arquivos de anotações de uma classe específica de um dataset YOLOv8.

    O dataset deve estar no formato YOLOv8, com as seguintes pastas:
    dataset_root/
    ├── train/
    │   ├── images/
    │   └── labels/
    └── valid/
        ├── images/
        └── labels/

    Args:
        dataset_root (str): Caminho para a pasta raiz do dataset.
        classe_para_remover (int): Índice da classe a ser removida (inteiro).
                                     Este índice corresponde ao número que representa a classe nos arquivos de anotação.
    """

    splits = ["train", "valid"]  # Divisões do dataset a serem processadas
    formatos_imagem = ['.jpg', '.jpeg', '.png', '.bmp'] # Formatos de imagem comuns

    for split in splits:
        labels_dir = os.path.join(dataset_root, split, "labels")
        images_dir = os.path.join(dataset_root, split, "images")

        if not os.path.exists(labels_dir) or not os.path.exists(images_dir):
            print(f"Pastas 'labels' ou 'images' não encontradas em {os.path.join(dataset_root, split)}. Pulando esta divisão.")
            continue

        print(f"Processando divisão: {split}")

        arquivos_labels = os.listdir(labels_dir)
        for arquivo_label in arquivos_labels:
            if not arquivo_label.endswith(".txt"):
                continue # Ignora arquivos que não são de anotação

            caminho_label = os.path.join(labels_dir, arquivo_label)
            caminho_imagem_base = os.path.splitext(arquivo_label)[0] # Remove a extensão .txt para encontrar a imagem correspondente

            linhas_mantidas = []
            imagens_removidas = 0
            labels_removidos = 0

            with open(caminho_label, 'r') as f:
                linhas = f.readlines()

            for linha in linhas:
                partes = linha.strip().split()
                if partes: # Garante que a linha não está vazia
                    classe_id = int(partes[0])
                    if classe_id != classe_para_remover:
                        linhas_mantidas.append(linha)

            if len(linhas_mantidas) < len(linhas): # Se alguma linha foi removida (classe encontrada)
                if not linhas_mantidas: # Se todas as anotações foram removidas, remove imagem e label
                    os.remove(caminho_label)
                    labels_removidos += 1
                    for formato in formatos_imagem:
                        caminho_imagem = os.path.join(images_dir, caminho_imagem_base + formato)
                        if os.path.exists(caminho_imagem):
                            os.remove(caminho_imagem)
                            imagens_removidas += 1
                            print(f"Removido imagem e label: {caminho_imagem_base}{formato}")
                            break # Assume que só existe um formato de imagem correspondente
                    else: # Se nenhum formato de imagem correspondente for encontrado
                        print(f"Aviso: Arquivo de imagem correspondente não encontrado para label: {arquivo_label}")

                else: # Se ainda restam anotações de outras classes, atualiza o arquivo label
                    with open(caminho_label, 'w') as f:
                        f.writelines(linhas_mantidas)
                    print(f"Classe {classe_para_remover} removida do label: {arquivo_label}")


        print(f"Processamento da divisão '{split}' concluído.")


In [2]:
dataset_path = '/home/gerdson/projetos/detector_armas/datasets/cortantes' # Substitua pelo caminho real do seu dataset YOLOv8
classe_alvo = 1  # Substitua pelo índice da classe que você deseja remover

remover_classe_dataset_yolov8(dataset_path, classe_alvo)
print(f"Remoção da classe {classe_alvo} concluída para o dataset em: {dataset_path}")

Processando divisão: train
Classe 1 removida do label: 6_22_2_0001652_jpg.rf.39f837b6f80793380b502c51b0af5dbe.txt
Removido imagem e label: armas--2542-_jpg.rf.68c7d3967b3eaefe818d23e55f99f4c7.jpg
Removido imagem e label: armas (2698).jpg
Removido imagem e label: batch_352_jpg.rf.1251732f65bef606fdee6b42bfe15ee6.jpg
Removido imagem e label: gun_2_1_1__0001610_jpg.rf.cd7f9e496090d9c668bf57f3b4725653.jpg
Classe 1 removida do label: batch_210_jpg.rf.5f8fb587d3e0cca8b8d146977e321f0c.txt
Classe 1 removida do label: VacSAA5_jpg.rf.31b8bb8b092acac240997480135e1c66.txt
Removido imagem e label: Torrente-LlamaModel8-04_jpg.rf.eee5b0cfeacd125c790b2fade4525a69.jpg
Classe 1 removida do label: gun_2_1_1__0004185_jpg.rf.f82e7ccee77671b6d92cad6dcd8e0ac6.txt
Removido imagem e label: Le_soleil_des_voyous-MAB-1_jpg.rf.96e16d1f40bab8f6a04935c143520fec.jpg
Removido imagem e label: armas (1658).jpg
Removido imagem e label: gun_3_2_1__0000168_jpg.rf.ffcb2d987345bcf634df650287c49b8f.jpg
Removido imagem e label