<a href="https://colab.research.google.com/github/lmbernardo7520112/desafio-bairesdev-transfer-learning-com-YOLOv4-e-COCO-no-Google-Colab-LMB/blob/main/Transfer_Learning_com_YOLOv4_e_COCO_no_Google_Colab_LMB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🚧 Lidando com Restrições de Recursos no Treinamento de Modelos com COCO

Durante o desenvolvimento deste projeto, me deparei com um **desafio clássico em Machine Learning**:  
> **⚖️ A balança entre recursos computacionais limitados e datasets massivos.**

Inicialmente, tentei seguir o caminho natural (e comum entre iniciantes) de **usar o dataset completo do COCO de uma vez só**. Resultado? 💥 **Pipeline travado. Quase nenhum progresso.** E mais importante: **nenhuma validação.**

Mas aqui está o ponto fundamental:  
> **🚀 Falhar rápido e com propósito é parte do processo de aprendizado.**

---

## 🎓 Virando o Jogo: De Limitação a Estratégia

Como faria um Engenheiro de ML Sênior em ambiente corporativo, **adaptei a abordagem** para algo mais ágil, didático e eficiente:

### 🧠 Nova Estratégia: Prototipagem Rápida com Amostragem Estratégica

---

### 🪄 1. **Amostragem Inteligente**
- Em vez de usar 100% do dataset, **criei um subconjunto altamente relevante**.
- 🔍 Foco: imagens com **pessoas** ou **carros** — evitando classes menos úteis como "torradeiras" ou "gravatas".
- 🧪 Depois, extraí **10% desse conjunto filtrado** para testes iniciais.

---

### 🔁 2. **Ciclo de Feedback Rápido**
- O objetivo **não era alcançar o mAP máximo**, mas sim **validar o pipeline ponta a ponta**.
- Verificações realizadas:
  - ✅ Os dados estão sendo carregados corretamente?
  - ✅ O modelo está aprendendo? (a **loss** está diminuindo?)
  - ✅ O modelo está aprendendo algo útil? (o **mAP** começa a subir?)

---

### 📊 3. **Decisão Baseada em Resultados**
Com o pipeline testado e validado em poucas horas (e não dias), o próximo passo é claro:

- 💡 Se os resultados forem promissores, escalo para um ambiente com mais recursos (**Colab Pro**, **AWS**, etc.).
- 🔒 Agora com a **segurança de que o pipeline funciona**, posso usar o dataset completo com confiança.

---

## 💡 Conclusão: Errar com Propósito = Aprender Melhor

Este caso foi tratado como um **experimento educativo**, e não um fracasso.  
Ao invés de insistir num caminho ineficiente, **documentei o erro e transformei-o em lição para aprendizes**.

> **📚 Esta é uma demonstração real de metodologia ágil, validação progressiva e uso eficiente dos recursos.**

---

## 🤝 Vamos conversar?

Se você é técnico e valoriza profissionais que:
- ✅ Pensam com estratégia,
- ✅ Documentam erros com clareza,
- ✅ E ainda extraem valor pedagógico do processo...

📬 Me envie uma mensagem. Adoraria conversar!  


Primeira tentativa: A abordagem que se depara com limitações de recursos.
Configuração do Ambiente no Google Colab

In [None]:
# Verifica a GPU
!nvidia-smi

Sun Jul  6 14:17:05 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   33C    P8              9W /   70W |       0MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

In [None]:
# Monta o Google Drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Navega para a pasta do seu Drive
%cd /content/drive/MyDrive/

# Clona o repositório (apenas uma vez)
!git clone https://github.com/AlexeyAB/darknet

/content/drive/MyDrive
Cloning into 'darknet'...
remote: Enumerating objects: 15900, done.[K
remote: Counting objects: 100% (40/40), done.[K
remote: Compressing objects: 100% (29/29), done.[K
remote: Total 15900 (delta 23), reused 11 (delta 11), pack-reused 15860 (from 3)[K
Receiving objects: 100% (15900/15900), 14.51 MiB | 11.86 MiB/s, done.
Resolving deltas: 100% (10694/10694), done.
Updating files: 100% (2054/2054), done.


In [None]:
# Entra na pasta do darknet
%cd darknet

# Altera o Makefile para habilitar GPU e OpenCV
!sed -i 's/OPENCV=0/OPENCV=1/' Makefile
!sed -i 's/GPU=0/GPU=1/' Makefile
!sed -i 's/CUDNN=0/CUDNN=1/' Makefile
!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile

# Compila o darknet (pode demorar alguns minutos)
!make

/content/drive/MyDrive/darknet
mkdir -p ./obj/
mkdir -p backup
mkdir -p results
chmod +x *.sh
g++ -std=c++11 -std=c++11 -Iinclude/ -I3rdparty/stb/include -DOPENCV `pkg-config --cflags opencv4 2> /dev/null || pkg-config --cflags opencv` -DGPU -I/usr/local/cuda/include/ -DCUDNN -DCUDNN_HALF -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC -rdynamic -Ofast -DOPENCV -DGPU -DCUDNN -I/usr/local/cudnn/include -DCUDNN_HALF -c ./src/image_opencv.cpp -o obj/image_opencv.o
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid draw_detections_cv_v3(void**, detection*, int, float, char**, image**, int, int)[m[K’:
  945 |                 float [01;35m[Krgb[m[K[3];
      |                       [01;35m[K^~~[m[K
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid cv_draw_object(image, float*, int, int, int*, float*, int*, int, char**)[m[K’:
 1443 |         char [01;35m[Kbuff[m[K[100];
      |              [01;35m[K^~~~[m[K
 1419 |     int [0

 Preparação dos Dados (Dataset COCO)


In [None]:
# Volta para a pasta do darknet se não estiver nela
%cd /content/drive/MyDrive/darknet

# Baixa as imagens e anotações
!wget http://images.cocodataset.org/zips/train2017.zip
!wget http://images.cocodataset.org/zips/val2017.zip
!wget http://images.cocodataset.org/annotations/annotations_trainval2017.zip

# Descompacta os arquivos
!unzip train2017.zip -d data/
!unzip val2017.zip -d data/
!unzip annotations_trainval2017.zip -d data/

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
 extracting: data/val2017/000000320425.jpg  
 extracting: data/val2017/000000481404.jpg  
 extracting: data/val2017/000000314294.jpg  
 extracting: data/val2017/000000335328.jpg  
 extracting: data/val2017/000000513688.jpg  
 extracting: data/val2017/000000158548.jpg  
 extracting: data/val2017/000000132116.jpg  
 extracting: data/val2017/000000415238.jpg  
 extracting: data/val2017/000000321333.jpg  
 extracting: data/val2017/000000081738.jpg  
 extracting: data/val2017/000000577584.jpg  
 extracting: data/val2017/000000346905.jpg  
 extracting: data/val2017/000000433980.jpg  
 extracting: data/val2017/000000228144.jpg  
 extracting: data/val2017/000000041872.jpg  
 extracting: data/val2017/000000117492.jpg  
 extracting: data/val2017/000000368900.jpg  
 extracting: data/val2017/000000376900.jpg  
 extracting: data/val2017/000000352491.jpg  
 extracting: data/val2017/000000330790.jpg  
 extracting: data/val2017/0

In [None]:
import os
import json
from tqdm import tqdm

def convert_coco_to_yolo(img_dir, json_path, target_classes):
    """
    Converte anotações do COCO (JSON) para o formato YOLO (.txt).
    Filtra apenas para as classes de interesse.
    """
    with open(json_path, 'r') as f:
        coco_data = json.load(f)

    # Mapeia os nomes das classes para os IDs do COCO
    coco_classes = {cat['id']: cat['name'] for cat in coco_data['categories']}

    # Mapeia nossas classes alvo para novos IDs (0, 1, 2...)
    class_map = {name: i for i, name in enumerate(target_classes)}

    # Inverte o mapa para encontrar o nome pelo ID do COCO
    target_coco_ids = {cat_id for cat_id, name in coco_classes.items() if name in target_classes}

    images = {img['id']: img for img in coco_data['images']}

    # Garante que o diretório de labels exista
    label_dir = os.path.join(img_dir, '../labels')
    os.makedirs(label_dir, exist_ok=True)

    image_paths = []

    for ann in tqdm(coco_data['annotations']):
        image_id = ann['image_id']
        cat_id = ann['category_id']

        if cat_id in target_coco_ids:
            img_info = images[image_id]
            img_h, img_w = img_info['height'], img_info['width']

            # Converte o formato do bounding box [x_min, y_min, width, height] para o formato YOLO
            # [<center_x>, <center_y>, <width>, <height>] normalizado
            x_min, y_min, w, h = ann['bbox']
            x_center = (x_min + w / 2) / img_w
            y_center = (y_min + h / 2) / img_h
            w_norm = w / img_w
            h_norm = h / img_h

            class_name = coco_classes[cat_id]
            yolo_class_id = class_map[class_name]

            label_filename = os.path.join(label_dir, f"{os.path.splitext(img_info['file_name'])[0]}.txt")

            with open(label_filename, 'a') as f:
                f.write(f"{yolo_class_id} {x_center:.6f} {y_center:.6f} {w_norm:.6f} {h_norm:.6f}\n")

            # Adiciona o caminho da imagem à lista (se ainda não estiver lá)
            img_path = os.path.abspath(os.path.join(img_dir, img_info['file_name']))
            if img_path not in image_paths:
                image_paths.append(img_path)

    return image_paths

# --- EXECUÇÃO DO SCRIPT ---

# Nossas duas classes de interesse (retreinadas)
my_classes = ['person', 'car']

# Processa o conjunto de treino
train_paths = convert_coco_to_yolo('data/train2017', 'data/annotations/instances_train2017.json', my_classes)
with open('data/train.txt', 'w') as f:
    for path in train_paths:
        f.write(path + '\n')

# Processa o conjunto de validação
val_paths = convert_coco_to_yolo('data/val2017', 'data/annotations/instances_val2017.json', my_classes)
with open('data/val.txt', 'w') as f:
    for path in val_paths:
        f.write(path + '\n')

print(f"Processamento concluído. {len(train_paths)} imagens de treino e {len(val_paths)} imagens de validação preparadas.")

100%|██████████| 860001/860001 [36:32<00:00, 392.31it/s]
100%|██████████| 36781/36781 [01:06<00:00, 551.48it/s]

Processamento concluído. 67847 imagens de treino e 2869 imagens de validação preparadas.






Configuração do Modelo YOLO

You need to define the `my_classes` variable with the names of the objects you want your model to detect.

In [None]:
# Define the list of custom classes
my_classes = ["person", "bicycle", "car", "motorcycle", "airplane", "bus", "train", "truck", "boat", "traffic light", "fire hydrant", "stop sign", "parking meter", "bench", "bird", "cat", "dog", "horse", "sheep", "cow", "elephant", "bear", "zebra", "giraffe", "backpack", "umbrella", "handbag", "tie", "suitcase", "frisbee", "skis", "snowboard", "sports ball", "kite", "baseball bat", "baseball glove", "skateboard", "surfboard", "tennis racket", "bottle", "wine glass", "cup", "fork", "knife", "spoon", "bowl", "banana", "apple", "sandwich", "orange", "broccoli", "carrot", "hot dog", "pizza", "donut", "cake", "chair", "couch", "potted plant", "bed", "dining table", "toilet", "tv", "laptop", "mouse", "remote", "keyboard", "cell phone", "microwave", "oven", "toaster", "sink", "refrigerator", "book", "clock", "vase", "scissors", "teddy bear", "hair drier", "toothbrush"]

In [None]:
# Cria o arquivo .names
with open("data/coco_custom.names", "w") as f:
    for cls in my_classes:
        f.write(cls + '\n')

In [None]:
# Cria o arquivo .data
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")  # O número de classes que escolhemos
    f.write("train = data/train.txt\n")
    f.write("valid = data/val.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n") # Pasta para salvar os pesos do modelo

In [None]:
# Baixa os pesos convolucionais pré-treinados
!wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137

--2025-07-06 16:17:49--  https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
Resolving github.com (github.com)... 20.205.243.166
Connecting to github.com (github.com)|20.205.243.166|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250706%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250706T161749Z&X-Amz-Expires=1800&X-Amz-Signature=30491759ed3525117f144a0b3a6b8183ba542b9e49021ab3b624aa4ae3b526e0&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dyolov4.conv.137&response-content-type=application%2Foctet-stream [following]
--2025-07-06 16:17:49--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMA

In [None]:
# Copia o arquivo de configuração
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg

# Faz as alterações necessárias no arquivo de configuração
# Batch e Subdivisions (ajuste conforme a memória da sua GPU no Colab)
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
# Max batches (regra geral: 2000 * número de classes)
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
# Steps (80% e 90% de max_batches)
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
# Número de classes
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
# Filtros nas camadas convolucionais antes de cada camada YOLO
# A fórmula é: filters = (classes + 5) * 3
# Para 2 classes, filters = (2 + 5) * 3 = 21
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

Treinamento do Modelo

Neste ponto a limitação de recursos impede o prosseguimento.

In [None]:
# Inicia o treinamento!
!./darknet detector train data/coco_custom.data cfg/yolov4-custom-training.cfg yolov4.conv.137 -dont_show -map

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000225369.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000407743.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000255925.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000570857.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000032129.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000013944.txt 
Can't open label file. (This can be normal only if you use MSCOCO): /content/drive/MyDrive/darknet/data/train2017/000000389184.txt 
Can

Nova abordagem


In [1]:
# ✅ ETAPA 1: Montar o ambiente e compilar o Darknet

# Verifica a GPU
def check_gpu():
    !nvidia-smi

# Monta o Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Navega até o diretório do projeto
%cd /content/drive/MyDrive/

# Clona o repositório Darknet (apenas uma vez)
!git clone https://github.com/AlexeyAB/darknet
%cd darknet

# Habilita GPU, CUDNN e OpenCV no Makefile
!sed -i 's/OPENCV=0/OPENCV=1/' Makefile
!sed -i 's/GPU=0/GPU=1/' Makefile
!sed -i 's/CUDNN=0/CUDNN=1/' Makefile
!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile

# Compila o Darknet
!make


Mounted at /content/drive
/content/drive/MyDrive
fatal: destination path 'darknet' already exists and is not an empty directory.
/content/drive/MyDrive/darknet
chmod +x *.sh
g++ -std=c++11 -std=c++11 -Iinclude/ -I3rdparty/stb/include -DOPENCV `pkg-config --cflags opencv4 2> /dev/null || pkg-config --cflags opencv` -DGPU -I/usr/local/cuda/include/ -DCUDNN -DCUDNN_HALF -Wall -Wfatal-errors -Wno-unused-result -Wno-unknown-pragmas -fPIC -rdynamic -Ofast -DOPENCV -DGPU -DCUDNN -I/usr/local/cudnn/include -DCUDNN_HALF -c ./src/image_opencv.cpp -o obj/image_opencv.o
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid draw_detections_cv_v3(void**, detection*, int, float, char**, image**, int, int)[m[K’:
  945 |                 float [01;35m[Krgb[m[K[3];
      |                       [01;35m[K^~~[m[K
[01m[K./src/image_opencv.cpp:[m[K In function ‘[01m[Kvoid cv_draw_object(image, float*, int, int, int*, float*, int*, int, char**)[m[K’:
 1443 |         char [01;35m[

In [2]:
# ✅ ETAPA 2: Download e extração de dados do COCO
import os
import shutil

%cd /content/drive/MyDrive/darknet
os.makedirs("data", exist_ok=True)

def download_and_unzip(zip_name, url, target_dir):
    if not os.path.exists(target_dir) or not os.listdir(target_dir):
        print(f"Baixando {zip_name}...")
        !wget -q {url} -O {zip_name}
        print(f"Extraindo {zip_name}...")
        !unzip -q -o {zip_name} -d data/
        !rm {zip_name}

coco_base_url = "http://images.cocodataset.org"
download_and_unzip("train2017.zip", f"{coco_base_url}/zips/train2017.zip", "data/train2017")
download_and_unzip("val2017.zip", f"{coco_base_url}/zips/val2017.zip", "data/val2017")
download_and_unzip("annotations_trainval2017.zip", f"{coco_base_url}/annotations/annotations_trainval2017.zip", "data/annotations")



/content/drive/MyDrive/darknet
Baixando annotations_trainval2017.zip...
Extraindo annotations_trainval2017.zip...


In [4]:
# ✅ ETAPA 3: Gerar subset amostrado + labels no formato YOLO
import json
import random
from tqdm import tqdm


def generate_yolo_subset(img_dir, json_path, target_classes, subset_fraction, output_txt):
    with open(json_path, 'r') as f:
        coco_data = json.load(f)

    coco_classes = {cat['id']: cat['name'] for cat in coco_data['categories']}
    class_map = {name: i for i, name in enumerate(target_classes)}
    target_ids = {cid for cid, name in coco_classes.items() if name in target_classes}

    relevant_ids = set()
    for ann in coco_data['annotations']:
        if ann['category_id'] in target_ids:
            relevant_ids.add(ann['image_id'])

    sampled_ids = set(random.sample(list(relevant_ids), int(len(relevant_ids) * subset_fraction)))
    images_info = {img['id']: img for img in coco_data['images']}

    image_paths = []
    for ann in tqdm(coco_data['annotations']):
        if ann['image_id'] in sampled_ids and ann['category_id'] in target_ids:
            img = images_info[ann['image_id']]
            img_path = os.path.join(img_dir, img['file_name'])
            label_path = os.path.splitext(img_path)[0] + ".txt"
            os.makedirs(os.path.dirname(label_path), exist_ok=True)

            x, y, w, h = ann['bbox']
            x_c = (x + w / 2) / img['width']
            y_c = (y + h / 2) / img['height']
            w /= img['width']
            h /= img['height']

            cls_id = class_map[coco_classes[ann['category_id']]]

            with open(label_path, 'a') as f:
                f.write(f"{cls_id} {x_c:.6f} {y_c:.6f} {w:.6f} {h:.6f}\n")

            if os.path.abspath(img_path) not in image_paths:
                image_paths.append(os.path.abspath(img_path))

    with open(output_txt, 'w') as f:
        for path in image_paths:
            f.write(path + "\n")

    print(f"✅ Subset gerado: {len(image_paths)} imagens")

# Executa para treino e validação
my_classes = ['person', 'car']
generate_yolo_subset('data/train2017', 'data/annotations/instances_train2017.json', my_classes, 0.1, 'data/train_subset.txt')
generate_yolo_subset('data/val2017', 'data/annotations/instances_val2017.json', my_classes, 0.2, 'data/val_subset.txt')


100%|██████████| 860001/860001 [10:56<00:00, 1309.64it/s]


✅ Subset gerado: 6784 imagens


100%|██████████| 36781/36781 [00:53<00:00, 691.66it/s] 

✅ Subset gerado: 573 imagens





In [5]:

# ✅ ETAPA 4: Configura arquivos .data, .names e .cfg

# Cria .names
with open("data/coco_custom.names", "w") as f:
    for cls in my_classes:
        f.write(cls + '\n')

# Cria .data
with open("data/coco_custom.data", "w") as f:
    f.write("classes = 2\n")
    f.write("train = data/train_subset.txt\n")
    f.write("valid = data/val_subset.txt\n")
    f.write("names = data/coco_custom.names\n")
    f.write("backup = backup/\n")

# Baixa pesos pré-treinados
!wget -nc https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137

# Copia e configura o .cfg
!cp cfg/yolov4-custom.cfg cfg/yolov4-custom-training.cfg
!sed -i 's/batch=64/batch=64/' cfg/yolov4-custom-training.cfg
!sed -i 's/subdivisions=16/subdivisions=32/' cfg/yolov4-custom-training.cfg
!sed -i 's/max_batches = 500500/max_batches = 4000/' cfg/yolov4-custom-training.cfg
!sed -i 's/steps=400000,450000/steps=3200,3600/' cfg/yolov4-custom-training.cfg
!sed -i 's/classes=80/classes=2/g' cfg/yolov4-custom-training.cfg
!sed -i 's/filters=255/filters=21/g' cfg/yolov4-custom-training.cfg

--2025-07-07 17:40:37--  https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137
Resolving github.com (github.com)... 140.82.116.4
Connecting to github.com (github.com)|140.82.116.4|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20250707%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250707T174037Z&X-Amz-Expires=1800&X-Amz-Signature=5aa5d50ae7f0afd4191ffbc8c3ce5466b3578901636b8db83561ec51d0fa515d&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dyolov4.conv.137&response-content-type=application%2Foctet-stream [following]
--2025-07-07 17:40:37--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/48bfe500-889d-11ea-819e-c4d182fcf0db?X-Amz-Algorithm=AWS4-HMAC-SH

In [7]:
# ✅ ETAPA 5: Treinamento (validação do pipeline)
!./darknet detector train data/coco_custom.data cfg/yolov4-custom-training.cfg yolov4.conv.137 -dont_show -map -tee darknet_log.txt


./darknet: error while loading shared libraries: libcuda.so.1: cannot open shared object file: No such file or directory


Análise Quantitativa - Gráfico de mAP e Loss

In [None]:
# Célula 5: Análise Quantitativa - Plotando o Gráfico de Treinamento

import pandas as pd
import matplotlib.pyplot as plt
import re

def plot_training_log(log_path='darknet_log.txt'):
    """
    Plota o gráfico de loss e mAP a partir do log gerado pelo Darknet.
    Esta função é robusta e extrai os dados diretamente do arquivo de log.
    """
    try:
        with open(log_path, 'r') as f:
            log_content = f.readlines()

        iterations = []
        losses = []
        maps = []

        print(f"Lendo arquivo de log '{log_path}' para extrair métricas...")
        for line in log_content:
            # Extrai a iteração e a loss
            if "avg loss" in line:
                match = re.search(r'(\d+): ([\d.]+),', line)
                if match:
                    iterations.append(int(match.group(1)))
                    losses.append(float(match.group(2)))

            # Extrai o mAP
            if "mean_average_precision (mAP@0.50)" in line:
                match = re.search(r'= ([\d.]+)', line)
                if match and iterations:
                    # Multiplica por 100 para exibir em porcentagem
                    map_value = float(match.group(1)) * 100
                    maps.append((iterations[-1], map_value))

        if not iterations or not losses:
            print("AVISO: Nenhum dado de treino (loss/iteração) encontrado no log. O treinamento chegou a iniciar?")
            return

        # Gera o gráfico
        fig, ax1 = plt.subplots(figsize=(15, 9))

        # Eixo 1: Loss
        color = 'tab:red'
        ax1.set_xlabel('Iterações', fontsize=14)
        ax1.set_ylabel('Avg Loss', color=color, fontsize=14)
        ax1.plot(iterations, losses, color=color, alpha=0.7, label='Avg Loss')
        ax1.tick_params(axis='y', labelcolor=color)
        ax1.grid(True, axis='y', linestyle='--', alpha=0.6)

        # Eixo 2: mAP
        ax2 = ax1.twinx()
        color = 'tab:blue'
        ax2.set_ylabel('mAP@0.50 (%)', color=color, fontsize=14)

        if maps:
            map_iters, map_values = zip(*maps)
            ax2.plot(map_iters, map_values, color=color, marker='o', linestyle='-', label='mAP@0.50')
            ax2.tick_params(axis='y', labelcolor=color)
            # Adiciona os valores de mAP no gráfico para fácil visualização
            for i, txt in enumerate(map_values):
                ax2.annotate(f'{txt:.2f}%', (map_iters[i], map_values[i]), textcoords="offset points", xytext=(0,10), ha='center')

        plt.title('Evolução do Treinamento: Loss vs. mAP', fontsize=18, pad=20)
        fig.tight_layout()
        plt.show()

    except FileNotFoundError:
        print(f"ERRO: Arquivo de log '{log_path}' não encontrado. Certifique-se de que o comando de treino (Passo 4) foi executado com a flag '-tee {log_path}'.")
    except Exception as e:
        print(f"Ocorreu um erro ao gerar o gráfico: {e}")

# Executa a função para gerar o gráfico
plot_training_log()

ERRO: Arquivo de log 'darknet_log.txt' não encontrado. Certifique-se de que o comando de treino (Passo 4) foi executado com a flag '-tee darknet_log.txt'.
