<a href="https://colab.research.google.com/github/lmbernardo7520112/desafio-bairesdev-transfer-learning-com-YOLOv4-e-COCO-no-Google-Colab-LMB/blob/main/Transfer_Learning_com_YOLOv4_e_COCO_no_Google_Colab_LMB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🚧 Lidando com Restrições de Recursos no Treinamento de Modelos com COCO

Durante o desenvolvimento deste projeto, me deparei com um **desafio clássico em Machine Learning**:  
> **⚖️ A balança entre recursos computacionais limitados e datasets massivos.**

Inicialmente, tentei seguir o caminho natural (e comum entre iniciantes) de **usar o dataset completo do COCO de uma vez só**. Resultado? 💥 **Pipeline travado. Quase nenhum progresso.** E mais importante: **nenhuma validação.**

Mas aqui está o ponto fundamental:  
> **🚀 Falhar rápido e com propósito é parte do processo de aprendizado.**

---

## 🎓 Virando o Jogo: De Limitação a Estratégia

Como faria um Engenheiro de ML Sênior em ambiente corporativo, **adaptei a abordagem** para algo mais ágil, didático e eficiente:

### 🧠 Nova Estratégia: Prototipagem Rápida com Amostragem Estratégica

---

### 🪄 1. **Amostragem Inteligente**
- Em vez de usar 100% do dataset, **criei um subconjunto altamente relevante**.
- 🔍 Foco: imagens com **pessoas** ou **carros** — evitando classes menos úteis como "torradeiras" ou "gravatas".
- 🧪 Depois, extraí **10% desse conjunto filtrado** para testes iniciais.

---

### 🔁 2. **Ciclo de Feedback Rápido**
- O objetivo **não era alcançar o mAP máximo**, mas sim **validar o pipeline ponta a ponta**.
- Verificações realizadas:
  - ✅ Os dados estão sendo carregados corretamente?
  - ✅ O modelo está aprendendo? (a **loss** está diminuindo?)
  - ✅ O modelo está aprendendo algo útil? (o **mAP** começa a subir?)

---

### 📊 3. **Decisão Baseada em Resultados**
Com o pipeline testado e validado em poucas horas (e não dias), o próximo passo é claro:

- 💡 Se os resultados forem promissores, escalo para um ambiente com mais recursos (**Colab Pro**, **AWS**, etc.).
- 🔒 Agora com a **segurança de que o pipeline funciona**, posso usar o dataset completo com confiança.

---

## 💡 Conclusão: Errar com Propósito = Aprender Melhor

Este caso foi tratado como um **experimento educativo**, e não um fracasso.  
Ao invés de insistir num caminho ineficiente, **documentei o erro e transformei-o em lição para aprendizes**.

> **📚 Esta é uma demonstração real de metodologia ágil, validação progressiva e uso eficiente dos recursos.**

---

## 🤝 Vamos conversar?

Se você é técnico e valoriza profissionais que:
- ✅ Pensam com estratégia,
- ✅ Documentam erros com clareza,
- ✅ E ainda extraem valor pedagógico do processo...

📬 Me envie uma mensagem. Adoraria conversar!  


Primeira tentativa: A abordagem que se depara com limitações de recursos.
Configuração do Ambiente no Google Colab

In [None]:
# Verifica a GPU
!nvidia-smi

Sun Jul  6 14:17:05 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   33C    P8              9W /   70W |       0MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

In [3]:
# Monta o Google Drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [4]:
# Navega para a pasta do seu Drive
%cd /content/drive/MyDrive/

# Clona o repositório (apenas uma vez)
!git clone https://github.com/AlexeyAB/darknet

/content/drive/MyDrive
Cloning into 'darknet'...
remote: Enumerating objects: 15900, done.[K
remote: Counting objects: 100% (40/40), done.[K
remote: Compressing objects: 100% (29/29), done.[K
remote: Total 15900 (delta 23), reused 11 (delta 11), pack-reused 15860 (from 3)[K
Receiving objects: 100% (15900/15900), 14.51 MiB | 11.86 MiB/s, done.
Resolving deltas: 100% (10694/10694), done.
Updating files: 100% (2054/2054), done.


In [5]:
# Entra na pasta do darknet
%cd darknet

# Altera o Makefile para habilitar GPU e OpenCV
!sed -i 's/OPENCV=0/OPENCV=1/' Makefile
!sed -i 's/GPU=0/GPU=1/' Makefile
!sed -i 's/CUDNN=0/CUDNN=1/' Makefile
!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile

# Compila o darknet (pode demorar alguns minutos)
!make

/content/drive/MyDrive/darknet
mkdir -p ./obj/
mkdir -p backup
mkdir -p results
chmod +x *.sh
g++ -std=c++11 -std=c++11 -Iinclude/ -I3rdparty/stb/include -DOPENCV `pkg-config --cflags opencv4 2> /dev/null || pkg-config --cflags opencv` -DGPU -I/usr/local/cuda/include/ -DCUDNN -DCUDNN_HALF -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC -rdynamic -Ofast -DOPENCV -DGPU -DCUDNN -I/usr/local/cudnn/include -DCUDNN_HALF -c ./src/image_opencv.cpp -o obj/image_opencv.o
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid draw_detections_cv_v3(void**, detection*, int, float, char**, image**, int, int)[m[K’:
  945 |                 float [01;35m[Krgb[m[K[3];
      |                       [01;35m[K^~~[m[K
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid cv_draw_object(image, float*, int, int, int*, float*, int*, int, char**)[m[K’:
 1443 |         char [01;35m[Kbuff[m[K[100];
      |              [01;35m[K^~~~[m[K
 1419 |     int [0

 Preparação dos Dados (Dataset COCO)


In [None]:
# Volta para a pasta do darknet se não estiver nela
%cd /content/drive/MyDrive/darknet

# Baixa as imagens e anotações
!wget http://images.cocodataset.org/zips/train2017.zip
!wget http://images.cocodataset.org/zips/val2017.zip
!wget http://images.cocodataset.org/annotations/annotations_trainval2017.zip

# Descompacta os arquivos
!unzip train2017.zip -d data/
!unzip val2017.zip -d data/
!unzip annotations_trainval2017.zip -d data/

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
 extracting: data/val2017/000000320425.jpg  
 extracting: data/val2017/000000481404.jpg  
 extracting: data/val2017/000000314294.jpg  
 extracting: data/val2017/000000335328.jpg  
 extracting: data/val2017/000000513688.jpg  
 extracting: data/val2017/000000158548.jpg  
 extracting: data/val2017/000000132116.jpg  
 extracting: data/val2017/000000415238.jpg  
 extracting: data/val2017/000000321333.jpg  
 extracting: data/val2017/000000081738.jpg  
 extracting: data/val2017/000000577584.jpg  
 extracting: data/val2017/000000346905.jpg  
 extracting: data/val2017/000000433980.jpg  
 extracting: data/val2017/000000228144.jpg  
 extracting: data/val2017/000000041872.jpg  
 extracting: data/val2017/000000117492.jpg  
 extracting: data/val2017/000000368900.jpg  
 extracting: data/val2017/000000376900.jpg  
 extracting: data/val2017/000000352491.jpg  
 extracting: data/val2017/000000330790.jpg  
 extracting: data/val2017/0

In [None]:
import os
import json
from tqdm import tqdm

def convert_coco_to_yolo(img_dir, json_path, target_classes):
    """
    Converte anotações do COCO (JSON) para o formato YOLO (.txt).
    Filtra apenas para as classes de interesse.
    """
    with open(json_path, 'r') as f:
        coco_data = json.load(f)

    # Mapeia os nomes das classes para os IDs do COCO
    coco_classes = {cat['id']: cat['name'] for cat in coco_data['categories']}

    # Mapeia nossas classes alvo para novos IDs (0, 1, 2...)
    class_map = {name: i for i, name in enumerate(target_classes)}

    # Inverte o mapa para encontrar o nome pelo ID do COCO
    target_coco_ids = {cat_id for cat_id, name in coco_classes.items() if name in target_classes}

    images = {img['id']: img for img in coco_data['images']}

    # Garante que o diretório de labels exista
    label_dir = os.path.join(img_dir, '../labels')
    os.makedirs(label_dir, exist_ok=True)

    image_paths = []

    for ann in tqdm(coco_data['annotations']):
        image_id = ann['image_id']
        cat_id = ann['category_id']

        if cat_id in target_coco_ids:
            img_info = images[image_id]
            img_h, img_w = img_info['height'], img_info['width']

            # Converte o formato do bounding box [x_min, y_min, width, height] para o formato YOLO
            # [<center_x>, <center_y>, <width>, <height>] normalizado
            x_min, y_min, w, h = ann['bbox']
            x_center = (x_min + w / 2) / img_w
            y_center = (y_min + h / 2) / img_h
            w_norm = w / img_w
            h_norm = h / img_h

            class_name = coco_classes[cat_id]
            yolo_class_id = class_map[class_name]

            label_filename = os.path.join(label_dir, f"{os.path.splitext(img_info['file_name'])[0]}.txt")

            with open(label_filename, 'a') as f:
                f.write(f"{yolo_class_id} {x_center:.6f} {y_center:.6f} {w_norm:.6f} {h_norm:.6f}\n")

            # Adiciona o caminho da imagem à lista (se ainda não estiver lá)
            img_path = os.path.abspath(os.path.join(img_dir, img_info['file_name']))
            if img_path not in image_paths:
                image_paths.append(img_path)

    return image_paths

# --- EXECUÇÃO DO SCRIPT ---

# Nossas duas classes de interesse (retreinadas)
my_classes = ['person', 'car']

# Processa o conjunto de treino
train_paths = convert_coco_to_yolo('data/train2017', 'data/annotations/instances_train2017.json', my_classes)
with open('data/train.txt', 'w') as f:
    for path in train_paths:
        f.write(path + '\n')

# Processa o conjunto de validação
val_paths = convert_coco_to_yolo('data/val2017', 'data/annotations/instances_val2017.json', my_classes)
with open('data/val.txt', 'w') as f:
    for path in val_paths:
        f.write(path + '\n')

print(f"Processamento concluído. {len(train_paths)} imagens de treino e {len(val_paths)} imagens de validação preparadas.")

100%|██████████| 860001/860001 [36:32<00:00, 392.31it/s]
100%|██████████| 36781/36781 [01:06<00:00, 551.48it/s]

Processamento concluído. 67847 imagens de treino e 2869 imagens de validação preparadas.






Configuração do Modelo YOLO

You need to define the `my_classes` variable with the names of the objects you want your model to detect.

In [None]:
# Define the list of custom classes
my_classes = ["person", "bicycle", "car", "motorcycle", "airplane", "bus", "train", "truck", "boat", "traffic light", "fire hydrant", "stop sign", "parking meter", "bench", "bird", "cat", "dog", "horse", "sheep", "cow", "elephant", "bear", "zebra", "giraffe", "backpack", "umbrella", "handbag", "tie", "suitcase", "frisbee", "skis", "snowboard", "sports ball", "kite", "baseball bat", "baseball glove", "skateboard", "surfboard", "tennis racket", "bottle", "wine glass", "cup", "fork", "knife", "spoon", "bowl", "banana", "apple", "sandwich", "orange", "broccoli", "carrot", "hot dog", "pizza", "donut", "cake", "chair", "couch", "potted plant", "bed", "dining table", "toilet", "tv", "laptop", "mouse", "remote", "keyboard", "cell phone", "microwave", "oven", "toaster", "sink", "refrigerator", "book", "clock", "vase", "scissors", "teddy bear", "hair drier", "toothbrush"]

In [None]:
# Cria o arquivo .names
with open("data/coco_custom.names", "w") as f:
    for cls in my_classes:
        f.write(cls + '\n')

In [None]:
# Cria o arquivo .data
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")  # O número de classes que escolhemos
    f.write("train = data/train.txt\n")
    f.write("valid = data/val.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n") # Pasta para salvar os pesos do modelo

In [None]:
# Baixa os pesos convolucionais pré-treinados
!wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137

--2025-07-06 16:17:49--  https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
Resolving github.com (github.com)... 20.205.243.166
Connecting to github.com (github.com)|20.205.243.166|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250706%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250706T161749Z&X-Amz-Expires=1800&X-Amz-Signature=30491759ed3525117f144a0b3a6b8183ba542b9e49021ab3b624aa4ae3b526e0&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dyolov4.conv.137&response-content-type=application%2Foctet-stream [following]
--2025-07-06 16:17:49--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMA

In [None]:
# Copia o arquivo de configuração
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg

# Faz as alterações necessárias no arquivo de configuração
# Batch e Subdivisions (ajuste conforme a memória da sua GPU no Colab)
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
# Max batches (regra geral: 2000 * número de classes)
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
# Steps (80% e 90% de max_batches)
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
# Número de classes
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
# Filtros nas camadas convolucionais antes de cada camada YOLO
# A fórmula é: filters = (classes + 5) * 3
# Para 2 classes, filters = (2 + 5) * 3 = 21
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

Treinamento do Modelo

Neste ponto a limitação de recursos impede o prosseguimento.

In [None]:
# Inicia o treinamento!
!./darknet detector train data/coco_custom.data cfg/yolov4-custom-training.cfg yolov4.conv.137 -dont_show -map

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000225369.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000407743.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000255925.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000570857.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000032129.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000013944.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000389184.txt 
Can

Nova abordagem


In [23]:
# Célula Definitiva: Pipeline Completo de Preparação de Dados

import os
import json
import random
from tqdm.notebook import tqdm
import shutil

# --- 1. CONFIGURAÇÃO E GARANTIA DE AMBIENTE ---
print("⚙️  Configurando ambiente...")
project_root = "/content/drive/MyDrive/darknet"
%cd {project_root}

data_dir = os.path.join(project_root, "data")
annotations_dir = os.path.join(data_dir, "annotations")
train_image_dir = os.path.join(data_dir, 'train2017')
val_image_dir = os.path.join(data_dir, 'val2017')
labels_subset_dir = os.path.join(data_dir, 'labels_subset')

os.makedirs(data_dir, exist_ok=True)
if os.path.exists(labels_subset_dir):
    shutil.rmtree(labels_subset_dir)
os.makedirs(labels_subset_dir, exist_ok=True)
print("   -> Estrutura de pastas garantida.")

# --- 2. VERIFICAÇÃO E DOWNLOAD AUTOMÁTICO DE DEPENDÊNCIAS ---

# Função auxiliar para baixar e extrair dados apenas se necessário
def download_and_unzip(zip_name, url, target_dir):
    if not os.path.exists(target_dir) or not os.listdir(target_dir):
        print(f"Diretório '{os.path.basename(target_dir)}' não encontrado ou vazio. Iniciando download...")
        !wget -q {url} -O {zip_name}
        print(f"Extraindo {zip_name}...")
        !unzip -q -o {zip_name} -d {data_dir}
        !rm {zip_name}
        print(f"✅ {os.path.basename(target_dir)} pronto.")
    else:
        print(f"✅ Diretório '{os.path.basename(target_dir)}' já existe e está populado.")

# Verifica e obtém Anotações
download_and_unzip("annotations_trainval2017.zip", "http://images.cocodataset.org/annotations/annotations_trainval2017.zip", annotations_dir)
# Verifica e obtém Imagens de Treino (Pode demorar bastante!)
download_and_unzip("train2017.zip", "http://images.cocodataset.org/zips/train2017.zip", train_image_dir)
# Verifica e obtém Imagens de Validação
download_and_unzip("val2017.zip", "http://images.cocodataset.org/zips/val2017.zip", val_image_dir)

print("\n--- Todas as dependências de dados estão prontas. ---")


# --- 3. SCRIPT DE AMOSTRAGEM ESTRATÉGICA ---
def generate_yolo_subset(img_dir, json_path, target_classes, subset_fraction, output_filename, labels_output_dir):
    print(f"\nIniciando processamento do subset para: {output_filename}")
    with open(json_path, 'r') as f:
        coco_data = json.load(f)

    coco_classes = {cat['id']: cat['name'] for cat in coco_data['categories']}
    class_map = {name: i for i, name in enumerate(target_classes)}
    target_coco_ids = {cat_id for cat_id, name in coco_classes.items() if name in target_classes}

    relevant_image_ids = set()
    for ann in tqdm(coco_data['annotations'], desc="Mapeando imagens relevantes"):
        if ann['category_id'] in target_coco_ids:
            relevant_image_ids.add(ann['image_id'])

    num_to_sample = int(len(relevant_image_ids) * subset_fraction)
    sampled_image_ids = set(random.sample(list(relevant_image_ids), num_to_sample))
    print(f"   -> {len(relevant_image_ids)} imagens relevantes encontradas. Amostrando {len(sampled_image_ids)}.")

    images_info = {img['id']: img for img in coco_data['images']}
    image_paths = []

    for ann in tqdm(coco_data['annotations'], desc="Processando anotações"):
        if ann['image_id'] in sampled_image_ids and ann['category_id'] in target_coco_ids:
            img_info = images_info[ann['image_id']]
            img_h, img_w = img_info['height'], img_info['width']
            x_min, y_min, w, h = ann['bbox']
            x_center, y_center, w_norm, h_norm = (x_min + w / 2) / img_w, (y_min + h / 2) / img_h, w / img_w, h / img_h
            class_name = coco_classes[ann['category_id']]
            yolo_class_id = class_map[class_name]
            label_filename = os.path.join(labels_output_dir, f"{os.path.splitext(img_info['file_name'])[0]}.txt")
            with open(label_filename, 'a') as f:
                f.write(f"{yolo_class_id} {x_center:.6f} {y_center:.6f} {w_norm:.6f} {h_norm:.6f}\n")
            img_path = os.path.abspath(os.path.join(img_dir, img_info['file_name']))
            if img_path not in image_paths:
                image_paths.append(img_path)

    with open(output_filename, 'w') as f:
        for path in tqdm(image_paths, desc="Salvando paths"):
            f.write(path + '\n')
    return image_paths

# --- 4. EXECUÇÃO DA ESTRATÉGIA ---
my_classes = ['person', 'car']
train_subset_fraction = 0.1
val_subset_fraction = 0.2

train_paths = generate_yolo_subset(train_image_dir, os.path.join(annotations_dir, 'instances_train2017.json'), my_classes, train_subset_fraction, 'data/train_subset.txt', labels_subset_dir)
print("-" * 50)
val_paths = generate_yolo_subset(val_image_dir, os.path.join(annotations_dir, 'instances_val2017.json'), my_classes, val_subset_fraction, 'data/val_subset.txt', labels_subset_dir)
print("-" * 50)
print(f"\n🚀 Processamento estratégico finalizado!")
print(f"   -> Subset de Treino gerado: {len(train_paths)} imagens.")
print(f"   -> Subset de Validação gerado: {len(val_paths)} imagens.")

⚙️  Configurando ambiente...
/content/drive/MyDrive/darknet
   -> Estrutura de pastas garantida.
✅ Diretório 'annotations' já existe e está populado.
Diretório 'train2017' não encontrado ou vazio. Iniciando download...
Extraindo train2017.zip...
✅ train2017 pronto.
Diretório 'val2017' não encontrado ou vazio. Iniciando download...
Extraindo val2017.zip...
✅ val2017 pronto.

--- Todas as dependências de dados estão prontas. ---

Iniciando processamento do subset para: data/train_subset.txt


Mapeando imagens relevantes:   0%|          | 0/860001 [00:00<?, ?it/s]

   -> 67847 imagens relevantes encontradas. Amostrando 6784.


Processando anotações:   0%|          | 0/860001 [00:00<?, ?it/s]

Salvando paths:   0%|          | 0/6784 [00:00<?, ?it/s]

--------------------------------------------------

Iniciando processamento do subset para: data/val_subset.txt


Mapeando imagens relevantes:   0%|          | 0/36781 [00:00<?, ?it/s]

   -> 2869 imagens relevantes encontradas. Amostrando 573.


Processando anotações:   0%|          | 0/36781 [00:00<?, ?it/s]

Salvando paths:   0%|          | 0/573 [00:00<?, ?it/s]

--------------------------------------------------

🚀 Processamento estratégico finalizado!
   -> Subset de Treino gerado: 6784 imagens.
   -> Subset de Validação gerado: 573 imagens.


In [6]:
# Não é necessário executar - Célula de Diagnóstico

# Garanta que você está na pasta correta do projeto
%cd /content/drive/MyDrive/darknet

print("--- Conteúdo da pasta 'data/' ---")
!ls -l data/

print("\n--- Conteúdo da pasta 'data/annotations/' (se existir) ---")
!ls -l data/annotations/

/content/drive/MyDrive/darknet
--- Conteúdo da pasta 'data/' ---
total 1689
-rw------- 1 root root 140047 Jul  6 22:37 9k.tree
-rw------- 1 root root    387 Jul  6 22:37 coco9k.map
-rw------- 1 root root    625 Jul  6 22:37 coco.names
-rw------- 1 root root 163759 Jul  6 22:37 dog.jpg
-rw------- 1 root root 141886 Jul  6 22:37 eagle.jpg
-rw------- 1 root root 382965 Jul  6 22:37 giraffe.jpg
-rw------- 1 root root     80 Jul  6 22:37 goal.txt
-rw------- 1 root root 133495 Jul  6 22:37 horses.jpg
-rw------- 1 root root 218420 Jul  6 22:37 imagenet.labels.list
-rw------- 1 root root 246356 Jul  6 22:37 imagenet.shortnames.list
drwx------ 2 root root   4096 Jul  6 22:38 labels
-rw------- 1 root root   5476 Jul  6 22:38 openimages.names
-rw------- 1 root root 113880 Jul  6 22:38 person.jpg
-rw------- 1 root root 174515 Jul  6 22:38 scream.jpg
-rw------- 1 root root    135 Jul  6 22:38 voc.names

--- Conteúdo da pasta 'data/annotations/' (se existir) ---
ls: cannot access 'data/annotations/'

In [8]:
# Não é necessário executar - Célula de Limpeza (Opcional, mas recomendado)
# Remove qualquer pasta de anotações antiga para começar do zero.
%cd /content/drive/MyDrive/darknet
!rm -rf annotations
!rm -rf data/annotations
!rm -rf data/annotations_trainval2017

print("Ambiente limpo e pronto para o pipeline robusto.")

/content/drive/MyDrive/darknet
Ambiente limpo e pronto para o pipeline robusto.


In [9]:
# Não é necessário executar - (já executamos) Célula Única de Preparação de Dados e Amostragem Estratégica

import os
import json
import random
from tqdm.notebook import tqdm
import shutil

# --- 1. CONFIGURAÇÃO E GARANTIA DE AMBIENTE ---
print("⚙️  Configurando ambiente e garantindo estrutura de pastas...")

# Define o diretório raiz do projeto e navega até ele
project_root = "/content/drive/MyDrive/darknet"
%cd {project_root}

# Define caminhos essenciais
data_dir = os.path.join(project_root, "data")
annotations_dir = os.path.join(data_dir, "annotations")
labels_subset_dir = os.path.join(data_dir, 'labels_subset')

# Limpa o diretório de labels de subsets anteriores para garantir uma execução limpa
if os.path.exists(labels_subset_dir):
    shutil.rmtree(labels_subset_dir)
os.makedirs(labels_subset_dir, exist_ok=True)
print(f"Diretório de labels do subset garantido em: {labels_subset_dir}")

# --- 2. DOWNLOAD E EXTRAÇÃO AUTOMÁTICA DOS DADOS ---
annotations_zip = "annotations_trainval2017.zip"
# Verifica se o arquivo principal de anotações existe. Se não, baixa e extrai.
if not os.path.exists(os.path.join(annotations_dir, 'instances_train2017.json')):
    print(f"Diretório de anotações não encontrado ou incompleto.")
    print(f"Baixando {annotations_zip}...")
    !wget -q http://images.cocodataset.org/annotations/{annotations_zip}
    print(f"Extraindo {annotations_zip} para o diretório '{data_dir}'...")
    # O -o força a sobrescrita sem pedir confirmação
    !unzip -q -o {annotations_zip} -d {data_dir}
    !rm {annotations_zip}
    print("✅ Anotações prontas.")
else:
    print("✅ Diretório de anotações já existe e está correto.")

# --- 3. SCRIPT DE AMOSTRAGEM ESTRATÉGICA (A mesma função de antes) ---

def generate_yolo_subset(img_dir, json_path, target_classes, subset_fraction, output_filename, labels_output_dir):
    print(f"\nIniciando o processamento para: {output_filename} com fração de {subset_fraction:.0%}")
    with open(json_path, 'r') as f:
        coco_data = json.load(f)

    coco_classes = {cat['id']: cat['name'] for cat in coco_data['categories']}
    class_map = {name: i for i, name in enumerate(target_classes)}
    target_coco_ids = {cat_id for cat_id, name in coco_classes.items() if name in target_classes}

    relevant_image_ids = set()
    for ann in tqdm(coco_data['annotations'], desc="1/3 Mapeando imagens relevantes"):
        if ann['category_id'] in target_coco_ids:
            relevant_image_ids.add(ann['image_id'])

    print(f"Total de imagens relevantes: {len(relevant_image_ids)}")
    num_to_sample = int(len(relevant_image_ids) * subset_fraction)
    sampled_image_ids = set(random.sample(list(relevant_image_ids), num_to_sample))
    print(f"Amostrando {len(sampled_image_ids)} imagens.")

    images_info = {img['id']: img for img in coco_data['images']}
    image_paths = []

    for ann in tqdm(coco_data['annotations'], desc="2/3 Processando anotações"):
        if ann['image_id'] in sampled_image_ids and ann['category_id'] in target_coco_ids:
            img_info = images_info[ann['image_id']]
            img_h, img_w = img_info['height'], img_info['width']
            x_min, y_min, w, h = ann['bbox']
            x_center, y_center, w_norm, h_norm = (x_min + w / 2) / img_w, (y_min + h / 2) / img_h, w / img_w, h / img_h
            class_name = coco_classes[ann['category_id']]
            yolo_class_id = class_map[class_name]
            label_filename = os.path.join(labels_output_dir, f"{os.path.splitext(img_info['file_name'])[0]}.txt")
            with open(label_filename, 'a') as f:
                f.write(f"{yolo_class_id} {x_center:.6f} {y_center:.6f} {w_norm:.6f} {h_norm:.6f}\n")
            img_path = os.path.abspath(os.path.join(img_dir, img_info['file_name']))
            if img_path not in image_paths:
                image_paths.append(img_path)

    with open(output_filename, 'w') as f:
        for path in tqdm(image_paths, desc="3/3 Salvando paths"):
            f.write(path + '\n')
    return image_paths

# --- 4. EXECUÇÃO DA ESTRATÉGIA ---
my_classes = ['person', 'car']
train_subset_fraction = 0.1
val_subset_fraction = 0.2

train_paths = generate_yolo_subset('data/train2017', os.path.join(annotations_dir, 'instances_train2017.json'), my_classes, train_subset_fraction, 'data/train_subset.txt', labels_subset_dir)
print("-" * 50)
val_paths = generate_yolo_subset('data/val2017', os.path.join(annotations_dir, 'instances_val2017.json'), my_classes, val_subset_fraction, 'data/val_subset.txt', labels_subset_dir)
print("-" * 50)
print(f"\n🚀 Processamento estratégico finalizado!")
print(f"   -> Subset de Treino gerado: {len(train_paths)} imagens.")
print(f"   -> Subset de Validação gerado: {len(val_paths)} imagens.")

⚙️  Configurando ambiente e garantindo estrutura de pastas...
/content/drive/MyDrive/darknet
Diretório de labels do subset garantido em: /content/drive/MyDrive/darknet/data/labels_subset
Diretório de anotações não encontrado ou incompleto.
Baixando annotations_trainval2017.zip...
Extraindo annotations_trainval2017.zip para o diretório '/content/drive/MyDrive/darknet/data'...
✅ Anotações prontas.

Iniciando o processamento para: data/train_subset.txt com fração de 10%


1/3 Mapeando imagens relevantes:   0%|          | 0/860001 [00:00<?, ?it/s]

Total de imagens relevantes: 67847
Amostrando 6784 imagens.


2/3 Processando anotações:   0%|          | 0/860001 [00:00<?, ?it/s]

3/3 Salvando paths:   0%|          | 0/6784 [00:00<?, ?it/s]

--------------------------------------------------

Iniciando o processamento para: data/val_subset.txt com fração de 20%


1/3 Mapeando imagens relevantes:   0%|          | 0/36781 [00:00<?, ?it/s]

Total de imagens relevantes: 2869
Amostrando 573 imagens.


2/3 Processando anotações:   0%|          | 0/36781 [00:00<?, ?it/s]

3/3 Salvando paths:   0%|          | 0/573 [00:00<?, ?it/s]

--------------------------------------------------

🚀 Processamento estratégico finalizado!
   -> Subset de Treino gerado: 6784 imagens.
   -> Subset de Validação gerado: 573 imagens.


In [22]:
# Não é necessário executar - Célula de Diagnóstico Rápido

import os

# Caminho para o diretório que DEVERIA conter as imagens de treino
train_image_dir = "/content/drive/MyDrive/darknet/data/train2017"

if os.path.exists(train_image_dir) and len(os.listdir(train_image_dir)) > 100:
    print(f"✅ Diretório de imagens '{train_image_dir}' parece estar correto e populado.")
else:
    print(f"❌ PROBLEMA: O diretório '{train_image_dir}' não existe ou está vazio.")
    print("Isso confirma que as imagens não foram baixadas ou estão no local errado nesta sessão.")

❌ PROBLEMA: O diretório '/content/drive/MyDrive/darknet/data/train2017' não existe ou está vazio.
Isso confirma que as imagens não foram baixadas ou estão no local errado nesta sessão.


In [11]:
# Não é necessário executar - Configuração Final do Modelo

# Cria o arquivo .names com nossas classes customizadas
with open("data/coco_custom.names", "w") as f:
    for cls in ['person', 'car']:
        f.write(cls + '\\n')

# Cria o arquivo .data apontando para os SUBSETS
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")
    f.write("train = data/train_subset.txt\n")
    f.write("valid = data/val_subset.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n")

# Copia e configura o arquivo de treinamento
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg

# Faz as alterações necessárias no arquivo de configuração
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

print("✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.")

✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.


In [16]:
# Não é necessário executar - Célula 3: Configuração Final do Modelo
# (Execute esta célula se ainda não o fez)

# Cria o arquivo .names
with open("data/coco_custom.names", "w") as f:
    for cls in ['person', 'car']:
        f.write(cls + '\\n')

# Cria o arquivo .data apontando para os SUBSETS
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")
    f.write("train = data/train_subset.txt\n")
    f.write("valid = data/val_subset.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n")

# Copia e configura o arquivo de treinamento
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg

# Faz as alterações necessárias no arquivo de configuração
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

print("✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.")

✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.


In [24]:
# Célula 3: Configuração Final do Modelo
# (Execute esta célula se ainda não o fez)

# Cria o arquivo .names
with open("data/coco_custom.names", "w") as f:
    for cls in ['person', 'car']:
        f.write(cls + '\\n')

# Cria o arquivo .data apontando para os SUBSETS
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")
    f.write("train = data/train_subset.txt\n")
    f.write("valid = data/val_subset.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n")

# Copia e configura o arquivo de treinamento
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg

# Faz as alterações necessárias no arquivo de configuração
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

print("✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.")

✅ Arquivo de configuração do modelo ajustado com sucesso para o treinamento com subset.


In [25]:
# Célula 3.5: Garantia de Dependências - Pesos Pré-treinados

import os

weights_file = "yolov4.conv.137"

# Verifica se o arquivo de pesos já existe no diretório correto.
# Se não existir, faz o download.
if not os.path.exists(weights_file):
    print("Pesos pré-treinados não encontrados. Baixando agora...")
    !wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
    print("✅ Download concluído.")
else:
    print("✅ Pesos pré-treinados já existem no diretório.")

✅ Pesos pré-treinados já existem no diretório.


In [None]:
# Célula 4: Treinamento Rápido de Validação (Com Geração de Log)

# O comando `-tee darknet_log.txt` mostra o output na tela e, ao mesmo tempo,
# salva uma cópia limpa em um arquivo para análise posterior.
!./darknet detector train data/coco_custom.data cfg/yolov4-custom-training.cfg yolov4.conv.137 -dont_show -map -tee darknet_log.txt

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000233384.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000136346.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000099186.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000199432.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000220483.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000326639.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000081798.txt 
Can

Análise Quantitativa - Gráfico de mAP e Loss

In [13]:
# Célula 5: Análise Quantitativa - Plotando o Gráfico de Treinamento

import pandas as pd
import matplotlib.pyplot as plt
import re

def plot_training_log(log_path='darknet_log.txt'):
    """
    Plota o gráfico de loss e mAP a partir do log gerado pelo Darknet.
    Esta função é robusta e extrai os dados diretamente do arquivo de log.
    """
    try:
        with open(log_path, 'r') as f:
            log_content = f.readlines()

        iterations = []
        losses = []
        maps = []

        print(f"Lendo arquivo de log '{log_path}' para extrair métricas...")
        for line in log_content:
            # Extrai a iteração e a loss
            if "avg loss" in line:
                match = re.search(r'(\d+): ([\d.]+),', line)
                if match:
                    iterations.append(int(match.group(1)))
                    losses.append(float(match.group(2)))

            # Extrai o mAP
            if "mean_average_precision (mAP@0.50)" in line:
                match = re.search(r'= ([\d.]+)', line)
                if match and iterations:
                    # Multiplica por 100 para exibir em porcentagem
                    map_value = float(match.group(1)) * 100
                    maps.append((iterations[-1], map_value))

        if not iterations or not losses:
            print("AVISO: Nenhum dado de treino (loss/iteração) encontrado no log. O treinamento chegou a iniciar?")
            return

        # Gera o gráfico
        fig, ax1 = plt.subplots(figsize=(15, 9))

        # Eixo 1: Loss
        color = 'tab:red'
        ax1.set_xlabel('Iterações', fontsize=14)
        ax1.set_ylabel('Avg Loss', color=color, fontsize=14)
        ax1.plot(iterations, losses, color=color, alpha=0.7, label='Avg Loss')
        ax1.tick_params(axis='y', labelcolor=color)
        ax1.grid(True, axis='y', linestyle='--', alpha=0.6)

        # Eixo 2: mAP
        ax2 = ax1.twinx()
        color = 'tab:blue'
        ax2.set_ylabel('mAP@0.50 (%)', color=color, fontsize=14)

        if maps:
            map_iters, map_values = zip(*maps)
            ax2.plot(map_iters, map_values, color=color, marker='o', linestyle='-', label='mAP@0.50')
            ax2.tick_params(axis='y', labelcolor=color)
            # Adiciona os valores de mAP no gráfico para fácil visualização
            for i, txt in enumerate(map_values):
                ax2.annotate(f'{txt:.2f}%', (map_iters[i], map_values[i]), textcoords="offset points", xytext=(0,10), ha='center')

        plt.title('Evolução do Treinamento: Loss vs. mAP', fontsize=18, pad=20)
        fig.tight_layout()
        plt.show()

    except FileNotFoundError:
        print(f"ERRO: Arquivo de log '{log_path}' não encontrado. Certifique-se de que o comando de treino (Passo 4) foi executado com a flag '-tee {log_path}'.")
    except Exception as e:
        print(f"Ocorreu um erro ao gerar o gráfico: {e}")

# Executa a função para gerar o gráfico
plot_training_log()

ERRO: Arquivo de log 'darknet_log.txt' não encontrado. Certifique-se de que o comando de treino (Passo 4) foi executado com a flag '-tee darknet_log.txt'.
