# Libraries

In [1]:
import os
import numpy as np
from pycocotools.coco import COCO
from PIL import Image
from collections import Counter

# Paths for annotations and output

In [2]:
BASE_DIR = os.path.dirname(os.path.abspath(__file__))
ANNOTATIONS_PATH = os.path.join(BASE_DIR, 'annotations', '_annotations.coco.json')
OUTPUT_DIR = os.path.join(BASE_DIR, 'output')
os.makedirs(OUTPUT_DIR, exist_ok=True)

NameError: name '__file__' is not defined

# Color map for each category from RoboFlow

In [None]:
COLOR_MAP = {
                'agua': (61, 61, 245),
                'erosao': (221, 255, 51),
                'trinca': (252, 128, 7),
                'ruptura': (36, 179, 83)
            }

# COCO file initialization and category mapping

In [None]:
coco = COCO(ANNOTATIONS_PATH)
categories = coco.loadCats(coco.getCatIds())
id_to_name = {cat['id']: cat['name'].lower() for cat in categories}
print("\nDetected categories:")
for k, v in id_to_name.items():
    print(f"  {k}: {v}")

# Generate masks for each image

In [None]:
for img_id in coco.imgs:
    img_info = coco.imgs[img_id]
    print(f"\nGenerating mask for: {img_info['file_name']}")
    ann_ids = coco.getAnnIds(imgIds=img_id)
    anns = coco.loadAnns(ann_ids)
    height, width = img_info['height'], img_info['width']
    colored_mask = np.zeros((height, width, 3), dtype=np.uint8)
    for ann in anns:
        if ann.get('iscrowd', 0) == 1:
            continue
        if not ann.get('segmentation'):
            continue
        cat_name = id_to_name.get(ann['category_id'])
        if cat_name not in COLOR_MAP:
            continue
        ann_mask = coco.annToMask(ann)
        if ann_mask.sum() == 0:
            continue
        colored_mask[ann_mask == 1] = COLOR_MAP[cat_name]
    mask_name = os.path.splitext(img_info['file_name'])[0] + '.png'
    output_path = os.path.join(OUTPUT_DIR, mask_name)
    Image.fromarray(colored_mask).save(output_path)
    print(f"‚úî mask saved at: {output_path}")
print("\nüéâ Processing completed! All masks have been generated.")

# Count unique colors in the generated masks

In [None]:
path_masks = OUTPUT_DIR
arquivos = get_image_files(path_masks)
print(f"üìÇ Reading {len(arquivos)} masks... please wait.")

# Contadores para armazenar as cores encontradas
cores_encontradas = Counter()
tipos_arquivos = Counter()

for arquivo in arquivos:
    # Abre a imagem
    img = PIL.Image.open(arquivo)
    arr = np.array(img)
    
    # Verifica se √© Grayscale (2D) ou RGB (3D)
    if len(arr.shape) == 2:
        tipos_arquivos['Grayscale (2D)'] += 1
        # Pega valores √∫nicos
        uniques = np.unique(arr)
        cores_encontradas.update(uniques)
        
    elif len(arr.shape) == 3:
        tipos_arquivos['RGB (3D)'] += 1
        # Transforma a matriz 3D em uma lista de pixels (R, G, B)
        # Ex: transforma (1024, 1024, 3) em (1048576, 3)
        pixels = arr.reshape(-1, 3)
        # Pega as linhas √∫nicas (cores √∫nicas)
        uniques = np.unique(pixels, axis=0)
        # Adiciona ao contador (convertendo para tupla para poder contar)
        cores_encontradas.update([tuple(p) for p in uniques])

print("-" * 40)
print("üìä Statistics")
print("-" * 40)
print(f"File types found: {dict(tipos_arquivos)}")
print("\nüé® THE 10 MOST COMMON COLORS (Format: Color -> How many images have this color):")
for cor, contagem in cores_encontradas.most_common():
    print(f"   üëâ Color: {cor} \t(Appears in pixels of various images)")
print("-" * 40)

# Build a pixel map for Fast AI

In [None]:
import numpy as np
import PIL.Image
from pathlib import Path
from collections import Counter

# --- CONFIGURA√á√ÉO ---
PATH_MASKS = Path("caminho/para/suas/mascaras")  # <--- COLOQUE O CAMINHO AQUI
# Se tiver cores que voc√™ J√Å SABE o nome, coloque aqui para ele usar o nome certo.
# Se n√£o souber, deixe vazio, ele vai criar nomes como "Classe_1", "Classe_2".
NOMES_CONHECIDOS = {
    (0, 0, 0): "Background",
    (61, 61, 245): "Agua",     # Azul
    (221, 255, 51): "Erosao",  # Amarelo
}
# --------------------

def analisar_dataset(path_masks):
    arquivos = list(path_masks.glob("*.png")) + list(path_masks.glob("*.jpg")) # Ajuste extens√µes se precisar
    print(f"üìÇ Lendo {len(arquivos)} m√°scaras...")

    todas_cores = Counter()

    for arquivo in arquivos:
        img = PIL.Image.open(arquivo)
        arr = np.array(img)

        # Se for 3D (RGB)
        if len(arr.shape) == 3:
            pixels = arr.reshape(-1, 3)
            # Pega cores √∫nicas dessa imagem
            cores_img = np.unique(pixels, axis=0)
            # Adiciona ao contador geral (transforma em tupla para poder contar)
            todas_cores.update([tuple(c) for c in cores_img])
        
        # Se for 2D (Grayscale/Indexed)
        elif len(arr.shape) == 2:
            cores_img = np.unique(arr)
            todas_cores.update(cores_img)

    return todas_cores

# --- EXECU√á√ÉO ---
cores_encontradas = analisar_dataset(PATH_MASKS)

# Filtra ru√≠do (cores que aparecem em menos de 1000 pixels no total do dataset)
# Isso evita que um pixelzinho borrado crie uma classe nova errada
LIMITE_RUIDO = 1000 
cores_validas = [c for c, qtd in cores_encontradas.items() if qtd > LIMITE_RUIDO]

# --- ORDENA√á√ÉO INTELIGENTE ---
# 1. Background sempre primeiro (0,0,0) ou 0
# 2. Depois, ordena por frequ√™ncia (quem tem mais pixels ganha ID menor)
#    OU ordena fixo se voc√™ quiser garantir consist√™ncia sempre.

# Vamos separar o background
tem_bg_rgb = (0,0,0) in cores_validas
tem_bg_gray = 0 in cores_validas

lista_final = []

# Adiciona Background primeiro
if tem_bg_rgb:
    lista_final.append((0,0,0))
    cores_validas.remove((0,0,0))
elif tem_bg_gray:
    lista_final.append(0)
    cores_validas.remove(0)

# Ordena o resto pela quantidade de pixels (do mais comum para o menos comum)
# Isso explica pq Eros√£o pode estar vindo antes da √Ågua: ela pode ter mais pixels no total!
resto_ordenado = sorted(cores_validas, key=lambda x: cores_encontradas[x], reverse=True)
lista_final.extend(resto_ordenado)

# --- GERAR O CODIGO ---
print("\n" + "="*40)
print("‚úÖ AQUI EST√Å SEU MAPEAMENTO FINAL")
print("="*40)

pixel_map = {}
meus_codes = []

for idx, cor in enumerate(lista_final):
    # Tenta achar o nome
    nome = NOMES_CONHECIDOS.get(cor, f"Classe_{idx}")
    
    pixel_map[cor] = idx
    meus_codes.append(nome)
    
    print(f"ID {idx}: {str(cor):<15} -> {nome}")

print("\nCOPIE E COLE ISSO NO SEU CODIGO DE TREINO:")
print("-" * 30)
print(f"pixel_map = {pixel_map}")
print(f"meus_codes = {meus_codes}")
print("-" * 30)

if len(cores_encontradas) > len(lista_final):
    print(f"\n‚ö†Ô∏è  Aten√ß√£o: {len(cores_encontradas) - len(lista_final)} cores raras foram ignoradas como ru√≠do.")