In [None]:
# ============================================================
# 0. CLONAR O REPOSITÓRIO DO PROJETO E ENTRAR NA PASTA
# ============================================================

import os

REPO_URL = "https://github.com/danisilva1110-spec/PFVC.git"
REPO_NAME = "PFVC"

if not os.path.exists(REPO_NAME):
    !git clone {REPO_URL}

%cd {REPO_NAME}
!ls


In [None]:
# ============================================================
# 1. CLONAR O DATASET UAVVaste DENTRO DO PROJETO
# ============================================================

UAVVASTE_URL = "https://github.com/PUTvision/UAVVaste.git"
UAVVASTE_DIR = "UAVVaste"

if not os.path.exists(UAVVASTE_DIR):
    !git clone {UAVVASTE_URL}

%cd {UAVVASTE_DIR}
!ls


In [None]:
# ============================================================
# 2. CAMINHOS IMPORTANTES
# ============================================================

import os

BASE_DIR = os.getcwd()                 # /content/PFVC
UAVVASTE_DIR = os.path.join(BASE_DIR, "UAVVaste")
UAV_IMAGES_DIR = os.path.join(UAVVASTE_DIR, "images")
UAV_ANNO_DIR   = os.path.join(UAVVASTE_DIR, "annotations")

print("PFVC base:", BASE_DIR)
print("UAVVaste:", UAVVASTE_DIR)
print("Imagens :", UAV_IMAGES_DIR)
print("Annots  :", UAV_ANNO_DIR)


In [None]:
# ============================================================
# 3. LER ANOTAÇÕES COCO DO UAVVASTE E INDEXAR
# ============================================================
import json
import os
from collections import defaultdict

# caminho do arquivo COCO
ann_file = os.path.join(UAV_ANNO_DIR, "instances_default.json")
print("Lendo anotações de:", ann_file)

with open(ann_file, "r") as f:
    coco = json.load(f)

print("Chaves do COCO:", coco.keys())

# dicionário: id_da_imagem -> info da imagem
images_info = {img["id"]: img for img in coco["images"]}

# dicionário: id_da_imagem -> lista de anotações
anns_by_img = defaultdict(list)
for ann in coco["annotations"]:
    anns_by_img[ann["image_id"]].append(ann)

print("Total de imagens:", len(images_info))
print("Total de anotações:", len(coco["annotations"]))


In [None]:
# ============================================================
# 4. CRIAR ESTRUTURA PARA DATASET BINÁRIO (FOCOS)
# ============================================================
FOCOS_ROOT = os.path.join(BASE_DIR, "data_focos")
LIXO_DIR = os.path.join(FOCOS_ROOT, "lixo")
NAO_LIXO_DIR = os.path.join(FOCOS_ROOT, "nao_lixo")

os.makedirs(LIXO_DIR, exist_ok=True)
os.makedirs(NAO_LIXO_DIR, exist_ok=True)

print("Diretório base dos focos:", FOCOS_ROOT)
print("  ->", LIXO_DIR)
print("  ->", NAO_LIXO_DIR)


In [None]:
# ============================================================
# 5. GERAR PATCHES "LIXO" A PARTIR DAS CAIXAS ANOTADAS
# ============================================================
import cv2
import numpy as np

def gerar_patches_lixo(margin=0.2, max_imgs=None):
    """
    margin: porcentagem para aumentar a caixa (0.2 = 20%)
    max_imgs: limita quantas imagens usar (None = todas)
    """
    count = 0
    img_ids = list(images_info.keys())

    if max_imgs is not None:
        img_ids = img_ids[:max_imgs]

    for idx, img_id in enumerate(img_ids):
        img_info = images_info[img_id]
        file_name = img_info["file_name"]
        img_path = os.path.join(UAV_IMAGES_DIR, file_name)

        img = cv2.imread(img_path)
        if img is None:
            continue

        h, w = img.shape[:2]
        anns = anns_by_img.get(img_id, [])

        for ann in anns:
            x, y, bw, bh = ann["bbox"]  # COCO: [x, y, width, height]
            x, y, bw, bh = float(x), float(y), float(bw), float(bh)

            # centro da bbox
            cx = x + bw / 2.0
            cy = y + bh / 2.0

            # aumenta bbox
            bw2 = bw * (1.0 + margin)
            bh2 = bh * (1.0 + margin)

            x1 = int(max(0, cx - bw2 / 2.0))
            y1 = int(max(0, cy - bh2 / 2.0))
            x2 = int(min(w, cx + bw2 / 2.0))
            y2 = int(min(h, cy + bh2 / 2.0))

            if x2 <= x1 or y2 <= y1:
                continue

            patch = img[y1:y2, x1:x2]
            if patch.size == 0:
                continue

            out_name = f"lixo_{img_id}_{ann['id']}.jpg"
            out_path = os.path.join(LIXO_DIR, out_name)
            cv2.imwrite(out_path, patch)
            count += 1

        if (idx + 1) % 50 == 0:
            print(f"Processadas {idx+1} imagens...")

    print("Total de patches de LIXO gerados:", count)

# RODAR (ajuste max_imgs se quiser menos imagens na primeira vez)
gerar_patches_lixo(margin=0.2, max_imgs=200)  # por exemplo, 200 imagens


In [None]:
# ============================================================
# 6. GERAR PATCHES "NAO_LIXO" (FUNDOS) ALEATÓRIOS
# ============================================================
import random

def ponto_dentro_bbox(bbox, px, py):
    x, y, bw, bh = bbox
    return (px >= x) and (px <= x + bw) and (py >= y) and (py <= y + bh)

def gerar_patches_nao_lixo(patch_size=224, samples_per_img=5, max_imgs=None):
    """
    patch_size: tamanho do patch quadrado em pixels
    samples_per_img: quantos patches de fundo tentar por imagem
    """
    count = 0
    img_ids = list(images_info.keys())

    if max_imgs is not None:
        img_ids = img_ids[:max_imgs]

    for idx, img_id in enumerate(img_ids):
        img_info = images_info[img_id]
        file_name = img_info["file_name"]
        img_path = os.path.join(UAV_IMAGES_DIR, file_name)

        img = cv2.imread(img_path)
        if img is None:
            continue

        h, w = img.shape[:2]
        bboxes = [ann["bbox"] for ann in anns_by_img.get(img_id, [])]

        # se a imagem for menor que o patch, pula
        if h <= patch_size or w <= patch_size:
            continue

        gerados_img = 0
        tentativas = 0
        max_tentativas = samples_per_img * 10

        while gerados_img < samples_per_img and tentativas < max_tentativas:
            tentativas += 1

            x1 = random.randint(0, w - patch_size)
            y1 = random.randint(0, h - patch_size)
            x2 = x1 + patch_size
            y2 = y1 + patch_size

            cx = x1 + patch_size / 2.0
            cy = y1 + patch_size / 2.0

            # verifica se o centro cai dentro de alguma bbox
            inside_any = False
            for bbox in bboxes:
                if ponto_dentro_bbox(bbox, cx, cy):
                    inside_any = True
                    break

            if inside_any:
                continue

            patch = img[y1:y2, x1:x2]
            if patch.size == 0:
                continue

            out_name = f"bg_{img_id}_{gerados_img}.jpg"
            out_path = os.path.join(NAO_LIXO_DIR, out_name)
            cv2.imwrite(out_path, patch)

            gerados_img += 1
            count += 1

        if (idx + 1) % 50 == 0:
            print(f"Processadas {idx+1} imagens...")

    print("Total de patches de NAO_LIXO gerados:", count)

# RODAR
gerar_patches_nao_lixo(patch_size=224, samples_per_img=5, max_imgs=200)
