# üîß Treinamento de Detector de Ferramentas com YOLO v8

**Notebook otimizado para Google Colab**

Este notebook treina um modelo de detec√ß√£o de objetos usando YOLOv8 com pr√©-processamento avan√ßado de imagens.

## üìã Pr√©-requisitos:
1. Dataset no formato YOLO (train/valid/test com images/ e labels/)
2. Google Colab com GPU habilitada (**Runtime > Change runtime type > GPU**)
3. Dataset zipado pronto para upload

## üöÄ Passos:
1. Verificar GPU e ambiente
2. Upload do dataset
3. Pr√©-processamento das imagens
4. Treinamento do modelo
5. Valida√ß√£o e resultados
6. Download do modelo treinado


## üîç PASSO 1: Verificar Ambiente e GPU


In [None]:
# Verificar se est√° no Colab
try:
    import google.colab
    IN_COLAB = True
    print("‚úÖ Rodando no Google Colab")
except:
    IN_COLAB = False
    print("‚ö†Ô∏è N√£o est√° no Colab")

# Verificar GPU dispon√≠vel
import torch
print(f"\nüñ•Ô∏è PyTorch version: {torch.__version__}")
print(f"üéÆ CUDA dispon√≠vel: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"üìä GPU: {torch.cuda.get_device_name(0)}")
    print(f"üíæ Mem√≥ria GPU: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.2f} GB")
else:
    print("‚ö†Ô∏è GPU n√£o dispon√≠vel. V√° em: Runtime > Change runtime type > GPU")


## üì¶ PASSO 2: Instalar Depend√™ncias


In [None]:
# Instala as bibliotecas necess√°rias
!pip install -q ultralytics pyyaml opencv-python matplotlib

print("‚úÖ Depend√™ncias instaladas!")


In [None]:
# Importar bibliotecas
import os
import cv2
import shutil
import yaml
import numpy as np
from pathlib import Path
from IPython.display import Image, display
import matplotlib.pyplot as plt

print("‚úÖ Bibliotecas importadas!")


## üíæ PASSO 3: Montar Google Drive (Opcional)

**Se seu dataset estiver no Google Drive, execute esta c√©lula.**


In [None]:
# Montar Google Drive
if IN_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')
    print("‚úÖ Google Drive montado em /content/drive")
    print("\nüìÇ Seus arquivos est√£o em: /content/drive/MyDrive/")


## üì§ PASSO 4: Upload do Dataset

**Execute a c√©lula abaixo para fazer upload do arquivo .zip**


In [None]:
# Upload do arquivo .zip do dataset
if IN_COLAB:
    from google.colab import files
    print("üì§ Fa√ßa upload do arquivo .zip do dataset...")
    uploaded = files.upload()
    
    # Pega o nome do arquivo
    dataset_zip = list(uploaded.keys())[0]
    print(f"\n‚úÖ Arquivo recebido: {dataset_zip}")
else:
    # Se n√£o estiver no Colab, defina manualmente
    dataset_zip = "baseScrewdriver.zip"  # ‚Üê Altere para o nome do seu arquivo

# Alternativamente, copie do Google Drive (descomente se usar):
# dataset_zip = "/content/drive/MyDrive/seu_dataset.zip"


## üìÇ PASSO 5: Descompactar e Verificar Dataset


In [None]:
# Descompactar o dataset
ORIGINAL_DATA_DIR = "/content/datasets_originais/"

print(f"üì¶ Descompactando {dataset_zip}...")
!unzip -q {dataset_zip} -d {ORIGINAL_DATA_DIR}

print(f"\n‚úÖ Dataset descompactado em: {ORIGINAL_DATA_DIR}")

# Listar estrutura
print("\nüìÅ Estrutura do dataset:")
!ls -R {ORIGINAL_DATA_DIR} | head -20


## üé® PASSO 6: Pr√©-Processamento das Imagens

Aplica t√©cnicas avan√ßadas:
- **Redimensionamento** (640x640)
- **CLAHE** (equaliza√ß√£o de histograma adaptativa)
- **Gaussian Blur** (redu√ß√£o de ru√≠do)


In [None]:
def preProcessDataset(base_input_dir, base_output_dir, target_size=(640, 640)):
    """
    Aplica pr√©-processamento em todo o dataset.
    
    T√©cnicas aplicadas:
    1. Redimensionamento para tamanho padr√£o
    2. CLAHE (Contrast Limited Adaptive Histogram Equalization)
    3. Gaussian Blur para redu√ß√£o de ru√≠do
    """
    print("\nüé® Iniciando pr√©-processamento do dataset...\n")
    
    total_processed = 0
    
    # Itera sobre train, valid, test
    for split in ['train', 'valid', 'test']:
        input_images_path = os.path.join(base_input_dir, split, 'images')
        input_labels_path = os.path.join(base_input_dir, split, 'labels')
        
        output_images_path = os.path.join(base_output_dir, split, 'images')
        output_labels_path = os.path.join(base_output_dir, split, 'labels')
        
        # Criar pastas de sa√≠da
        os.makedirs(output_images_path, exist_ok=True)
        os.makedirs(output_labels_path, exist_ok=True)
        
        # Processar imagens
        if os.path.exists(input_images_path):
            images = [f for f in os.listdir(input_images_path) 
                     if f.endswith(('.jpg', '.jpeg', '.png'))]
            
            print(f"üìÇ Processando {split.upper()}: {len(images)} imagens")
            
            for idx, filename in enumerate(images):
                img_path = os.path.join(input_images_path, filename)
                image = cv2.imread(img_path)
                
                if image is None:
                    print(f"   ‚ö†Ô∏è Erro ao ler: {filename}")
                    continue
                
                # ETAPA 1: Redimensionamento
                processed_image = cv2.resize(image, target_size, interpolation=cv2.INTER_AREA)
                
                # ETAPA 2: CLAHE (Realce de Contraste)
                lab = cv2.cvtColor(processed_image, cv2.COLOR_BGR2LAB)
                l, a, b = cv2.split(lab)
                clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8, 8))
                l_clahe = clahe.apply(l)
                lab_clahe = cv2.merge((l_clahe, a, b))
                processed_image = cv2.cvtColor(lab_clahe, cv2.COLOR_LAB2BGR)
                
                # ETAPA 3: Redu√ß√£o de Ru√≠do
                processed_image = cv2.GaussianBlur(processed_image, (5, 5), 0)
                
                # Salvar imagem processada
                output_path = os.path.join(output_images_path, filename)
                cv2.imwrite(output_path, processed_image)
                
                total_processed += 1
                
                # Mostrar progresso a cada 50 imagens
                if (idx + 1) % 50 == 0:
                    print(f"   üìä Progresso: {idx + 1}/{len(images)}")
        
        # Copiar labels (n√£o precisam ser modificados)
        if os.path.exists(input_labels_path):
            labels = os.listdir(input_labels_path)
            for label_file in labels:
                shutil.copy(
                    os.path.join(input_labels_path, label_file),
                    output_labels_path
                )
            print(f"   ‚úÖ {len(labels)} labels copiados\n")
    
    print(f"\n‚úÖ Pr√©-processamento conclu√≠do!")
    print(f"üìä Total de imagens processadas: {total_processed}")
    
    return total_processed

# Executar pr√©-processamento
PROCESSED_DATA_DIR = "/content/datasets_processados/"
total = preProcessDataset(ORIGINAL_DATA_DIR, PROCESSED_DATA_DIR)


## üìù PASSO 7: Configurar data.yaml


In [None]:
# Copiar e ajustar o data.yaml
original_yaml_path = os.path.join(ORIGINAL_DATA_DIR, 'data.yaml')
processed_yaml_path = os.path.join(PROCESSED_DATA_DIR, 'data.yaml')

print("üìù Configurando data.yaml...")

with open(original_yaml_path, 'r') as f:
    data_config = yaml.safe_load(f)

# Atualizar caminhos para dados processados
data_config['path'] = PROCESSED_DATA_DIR
data_config['train'] = 'train/images'
data_config['val'] = 'valid/images'
data_config['test'] = 'test/images'

# Salvar novo yaml
with open(processed_yaml_path, 'w') as f:
    yaml.dump(data_config, f)

print(f"\n‚úÖ Arquivo data.yaml criado!")
print(f"\nüìã Classes: {data_config.get('names', [])}")
print(f"üî¢ Total: {data_config.get('nc', 0)} classes")


## üöÄ PASSO 8: Treinamento do Modelo

**IMPORTANTE:** Este processo pode levar de **30 minutos a 2 horas** dependendo:
- Tamanho do dataset
- N√∫mero de √©pocas
- GPU dispon√≠vel


In [None]:
from ultralytics import YOLO

print("üöÄ Iniciando treinamento do modelo YOLO...\n")
print("‚è±Ô∏è Isso pode levar algum tempo. Aguarde...\n")

# Carregar modelo pr√©-treinado
model = YOLO('yolov8n.pt')  # Nano (mais r√°pido)
# model = YOLO('yolov8s.pt')  # Small (mais preciso)
# model = YOLO('yolov8m.pt')  # Medium (ainda mais preciso)

print("‚úÖ Modelo YOLOv8 Nano carregado\n")

# Configura√ß√£o do treinamento
results = model.train(
    data=processed_yaml_path,      # Caminho para data.yaml
    epochs=50,                      # N√∫mero de √©pocas
    imgsz=640,                      # Tamanho da imagem
    batch=16,                       # Tamanho do batch
    project='meus_treinamentos',    # Nome do projeto
    name='detector_ferramentas_v1', # Nome do experimento
    patience=10,                    # Early stopping
    save=True,                      # Salvar checkpoints
    device=0 if torch.cuda.is_available() else 'cpu',  # GPU ou CPU
    workers=2,                      # N√∫mero de workers
    verbose=True                    # Mostrar logs detalhados
)

print("\nüéâ Treinamento conclu√≠do!")


## üìä PASSO 9: Visualizar Resultados


In [None]:
# Caminho dos resultados
results_dir = "/content/meus_treinamentos/detector_ferramentas_v1"

print("üìä Resultados do Treinamento:\n")

# Mostrar gr√°ficos de treinamento
plots = [
    'results.png',           # M√©tricas gerais
    'confusion_matrix.png',  # Matriz de confus√£o
    'val_batch0_pred.jpg',   # Predi√ß√µes no validation
]

for plot in plots:
    plot_path = os.path.join(results_dir, plot)
    if os.path.exists(plot_path):
        print(f"\nüìà {plot}:")
        display(Image(filename=plot_path))
    else:
        print(f"‚ö†Ô∏è {plot} n√£o encontrado")


## üß™ PASSO 10: Validar Modelo


In [None]:
# Carregar o melhor modelo treinado
best_model_path = os.path.join(results_dir, 'weights', 'best.pt')

if os.path.exists(best_model_path):
    print(f"‚úÖ Modelo encontrado: {best_model_path}\n")
    
    # Carregar modelo
    model_trained = YOLO(best_model_path)
    
    # Validar no dataset de teste
    print("üß™ Validando modelo no dataset de teste...\n")
    metrics = model_trained.val(data=processed_yaml_path, split='test')
    
    print("\nüìä M√©tricas de Valida√ß√£o:")
    print(f"   mAP50: {metrics.box.map50:.4f}")
    print(f"   mAP50-95: {metrics.box.map:.4f}")
    print(f"   Precision: {metrics.box.mp:.4f}")
    print(f"   Recall: {metrics.box.mr:.4f}")
else:
    print("‚ùå Modelo n√£o encontrado!")


## üéØ PASSO 11: Testar em Imagens de Exemplo


In [None]:
# Testar em imagens de exemplo
test_images_dir = os.path.join(PROCESSED_DATA_DIR, 'test', 'images')

if os.path.exists(test_images_dir):
    test_images = [f for f in os.listdir(test_images_dir) if f.endswith(('.jpg', '.jpeg', '.png'))][:3]
    
    if test_images:
        print("üéØ Testando modelo em imagens de exemplo...\n")
        
        for img_name in test_images:
            img_path = os.path.join(test_images_dir, img_name)
            
            # Fazer predi√ß√£o
            results = model_trained.predict(
                source=img_path,
                conf=0.5,  # Confian√ßa m√≠nima 50%
                save=True,
                project='predicoes_teste',
                name='resultados'
            )
            
            print(f"\n‚úÖ {img_name}:")
            for r in results:
                print(f"   Detectados: {len(r.boxes)} objetos")
                for box in r.boxes:
                    cls = int(box.cls[0])
                    conf = float(box.conf[0])
                    class_name = model_trained.names[cls]
                    print(f"   - {class_name}: {conf:.2%}")
        
        # Mostrar resultados
        print("\nüñºÔ∏è Imagens com detec√ß√µes:")
        pred_dir = "/content/predicoes_teste/resultados"
        if os.path.exists(pred_dir):
            for img in os.listdir(pred_dir):
                if img.endswith(('.jpg', '.jpeg', '.png')):
                    display(Image(filename=os.path.join(pred_dir, img)))
else:
    print("‚ö†Ô∏è Nenhuma imagem de teste encontrada")


## üíæ PASSO 12: Download do Modelo Treinado


In [None]:
# Download do modelo treinado
if IN_COLAB and os.path.exists(best_model_path):
    from google.colab import files
    
    print("üíæ Preparando download do modelo...\n")
    
    # Copiar para um nome mais amig√°vel
    model_download_path = "/content/modelo_detector_ferramentas.pt"
    shutil.copy(best_model_path, model_download_path)
    
    print("üì• Fazendo download do modelo...")
    files.download(model_download_path)
    
    print("\n‚úÖ Download conclu√≠do!")
    print(f"üìä Tamanho: {os.path.getsize(model_download_path) / (1024*1024):.2f} MB")
else:
    print("‚ÑπÔ∏è Para download manual, localize:")
    print(f"   {best_model_path}")


## üíæ PASSO 13: Salvar no Google Drive (Opcional)


In [None]:
# Salvar modelo no Google Drive
if IN_COLAB:
    save_to_drive = input("üíæ Salvar modelo no Google Drive? (s/n): ")
    
    if save_to_drive.lower() == 's':
        # Criar pasta no Drive
        drive_save_path = "/content/drive/MyDrive/Modelos_YOLO/"
        os.makedirs(drive_save_path, exist_ok=True)
        
        # Copiar modelo
        final_path = os.path.join(drive_save_path, "detector_ferramentas_best.pt")
        shutil.copy(best_model_path, final_path)
        
        print(f"\n‚úÖ Modelo salvo no Drive: {final_path}")
        
        # Tamb√©m salvar resultados
        results_zip = "/content/resultados_treinamento.zip"
        !zip -r -q {results_zip} {results_dir}
        shutil.copy(results_zip, drive_save_path)
        print(f"‚úÖ Resultados salvos: {drive_save_path}resultados_treinamento.zip")


## üìã RESUMO FINAL


In [None]:
print("\n" + "="*70)
print(" "*20 + "üìä RESUMO DO TREINAMENTO")
print("="*70)

print(f"\n‚úÖ Dataset:")
print(f"   - Imagens processadas: {total} imagens")
print(f"   - Classes: {data_config.get('nc', 0)}")

print(f"\n‚úÖ Modelo:")
print(f"   - Arquitetura: YOLOv8 Nano")
print(f"   - √âpocas: 50")
print(f"   - Caminho: {best_model_path}")

print(f"\n‚úÖ Pr√≥ximos Passos:")
print(f"   1. Baixe o modelo best.pt")
print(f"   2. Use no seu projeto Flask/Python")
print(f"   3. Substitua o modelo no Roboflow")

print("\n" + "="*70)
print("\nüéâ Treinamento conclu√≠do com sucesso!")
print("="*70 + "\n")
