# Projeto de Detecção de Defeitos em Chapas de Granito com YOLOv8
**Dissertação de Mestrado**

**Autor**: Alexsander Alves Novaes

**Orientador**: Prof. Dr. Daniel Cruz Cavalieri

**Instituição**: IFES

**Data**: Jul/2024 

## Contexto

Este projeto visa a detecção automática de defeitos em chapas de granito utilizando o modelo YOLOv8. O objetivo é desenvolver um pipeline completo e replicável para identificar diferentes tipos de defeitos em imagens de chapas de granito. Este documento é parte integrante da dissertação de mestrado e contém todos os passos necessários para executar e replicar o projeto, desde a configuração do ambiente até o treinamento do modelo.

## Objetivos

1. **Configuração do Ambiente**: Carregar configurações e preparar o ambiente de trabalho.
2. **Download do Dataset**: Baixar o dataset do Roboflow e organizar as pastas necessárias.
3. **Ajuste do Arquivo YAML**: Configurar o arquivo YAML com os caminhos corretos e parâmetros de detecção.
4. **Divisão do Dataset**: Dividir o dataset em conjuntos de treino, validação e teste.
5. **Treinamento do Modelo**: Treinar o modelo YOLOv8 com os dados preparados.

## Requisitos

- Python 3.8 ou superior
- Bibliotecas: roboflow, sklearn, torch, ultralytics, yaml
- Jupyter Notebook ou similar para execução dos blocos de código

Cada seção a seguir detalha os passos necessários e inclui o código correspondente com comentários explicativos.

## Etapa 1: Configuração do Ambiente

Nesta etapa, carregamos as configurações do arquivo `settings.yaml` e preparamos o ambiente de trabalho. É importante garantir que o diretório base e o diretório de datasets estejam corretamente configurados antes de prosseguir.

### Parâmetros Ajustáveis

- `settings_file`: Caminho para o arquivo de configurações `settings.yaml`.
- `datasets_dir`: Diretório onde os datasets serão armazenados.

### Variáveis para Download do Dataset

- `api_key`: Chave da API do Roboflow.
- `workspace_name`: Nome do workspace no Roboflow.
- `project_name`: Nome do projeto no Roboflow.
- `version_number`: Número da versão do dataset.
- `download_format`: Formato desejado para download.

### Código de Configuração do Ambiente

Este bloco de código faz o carregamento das configurações e prepara o ambiente de trabalho. Ele define variáveis importantes para o download do dataset e ajusta a estrutura de diretórios conforme necessário.

In [None]:
# Etapa 1: Configuração do Ambiente
# Esta etapa carrega as configurações do arquivo settings.yaml e garante que a estrutura de diretórios necessária esteja presente.
# Espera-se que as configurações sejam carregadas corretamente e que os diretórios base e de datasets estejam configurados.

import os
import yaml
import subprocess

# Função para carregar configurações do settings.yaml
def load_settings():
    # Expande o caminho para o diretório do usuário
    user_home_dir = os.path.expanduser("~")
    # Define o caminho do arquivo settings.yaml no diretório padrão do Ultralytics
    settings_file = os.path.join(user_home_dir, "Library", "Application Support", "Ultralytics", "settings.yaml")

    try:
        # Tenta abrir e carregar o arquivo settings.yaml
        with open(settings_file, 'r') as file:
            settings = yaml.safe_load(file)
        print("Configurações carregadas com sucesso.")
        return settings
    except FileNotFoundError:
        # Caso o arquivo não seja encontrado, usa valores padrão
        print(f"Arquivo {settings_file} não encontrado. Usando valores padrão.")
        return {
            'datasets_dir': 'datasets',
            'weights_dir': 'weights',
            'runs_dir': 'runs'
        }
    except Exception as e:
        # Caso ocorra outro tipo de erro ao carregar o arquivo, usa valores padrão
        print(f"Erro ao carregar configurações: {e}")
        return {
            'datasets_dir': 'datasets',
            'weights_dir': 'weights',
            'runs_dir': 'runs'
        }

# Carregar configurações a partir do arquivo settings.yaml
settings = load_settings()

# Obter o diretório de datasets a partir das configurações carregadas
datasets_dir = settings.get('datasets_dir', 'datasets')
# Definir o diretório base como o diretório pai do diretório de datasets
base_dir = os.path.dirname(datasets_dir)

# Variáveis para download do dataset
api_key = "caWwvxqugMKTqbXr3PBz"       # Chave da API do Roboflow
workspace_name = "alex-novaes"         # Nome do workspace no Roboflow
project_name = "granito-3nbcw"         # Nome do projeto no Roboflow
version_number = 1                     # Número da versão do dataset
download_format = "yolov8"             # Formato desejado para download

# Exibir os diretórios base e de datasets
print(f"Diretório base: {base_dir}")
print(f"Diretório de datasets: {datasets_dir}")

# Função para garantir que o diretório base está correto e criar estrutura se necessário
def setup_environment(base_dir, datasets_dir):
    # Verifica e cria o diretório base, se necessário
    if not os.path.exists(base_dir):
        os.makedirs(base_dir)
        print(f"Diretório base criado: {base_dir}")

    # Verifica e cria o diretório de datasets, se necessário
    if not os.path.exists(datasets_dir):
        os.makedirs(datasets_dir)
        print(f"Diretório de datasets criado: {datasets_dir}")

    # Muda para o diretório base
    os.chdir(base_dir)
    print(f"Diretório de trabalho alterado para: {base_dir}")

# Configura o ambiente
setup_environment(base_dir, datasets_dir)

## Etapa 2: Download do Dataset

Nesta etapa, fazemos o download do dataset do Roboflow e organizamos as pastas necessárias. Se uma pasta com o mesmo nome já existir, ela será renomeada com a extensão "-bkp" para evitar conflitos.

### Parâmetros Ajustáveis

- `api_key`: Chave da API do Roboflow.
- `workspace_name`: Nome do workspace no Roboflow.
- `project_name`: Nome do projeto no Roboflow.
- `version_number`: Número da versão do dataset.
- `download_format`: Formato desejado para download.
- `base_dir`: Diretório base onde o dataset será armazenado.

### Código para Download do Dataset

Este bloco de código realiza o download do dataset do Roboflow e garante que a estrutura de diretórios esteja correta.

In [None]:
# Etapa 2: Download do Dataset
# Esta etapa baixa o dataset do Roboflow e o prepara para uso.

from roboflow import Roboflow
import shutil

# Função para baixar o dataset do Roboflow
def download_dataset(api_key, workspace_name, project_name, version_number, download_format, base_dir):
    try:
        # Configuração e autenticação com a API do Roboflow
        rf = Roboflow(api_key=api_key)
        project = rf.workspace(workspace_name).project(project_name)
        version = project.version(version_number)

        # Criação do diretório base se não existir
        if not os.path.exists(base_dir):
            os.makedirs(base_dir)

        # Verificação e renomeação da pasta existente
        dataset_location = os.path.join(base_dir, project_name)
        if os.path.exists(dataset_location):
            backup_location = dataset_location + "-bkp"
            i = 1
            while os.path.exists(backup_location):
                backup_location = f"{dataset_location}-bkp-{i}"
                i += 1
            shutil.move(dataset_location, backup_location)
            print(f"Diretório existente renomeado para: {backup_location}")

        # Download do dataset no formato especificado
        dataset = version.download(download_format)

        # Move o dataset baixado para o diretório desejado
        shutil.move(dataset.location, dataset_location)
        print("Dataset {} versão {} baixado com sucesso no formato {}.".format(project_name, version_number, download_format))
        return dataset_location
    except Exception as e:
        import sys
        sys.stderr.write(f"Erro ao baixar o dataset: {e}\n")
        return None

# Executa o download do dataset
dataset_dir = download_dataset(api_key, workspace_name, project_name, version_number, download_format, datasets_dir)

if dataset_dir:
    print(f"Dataset baixado e salvo em: {dataset_dir}")
else:
    print("Falha ao baixar o dataset.")


## Etapa 3: Ajuste do Arquivo YAML

Nesta etapa, ajustamos o arquivo YAML com os caminhos corretos e parâmetros de detecção. Isso garante que o YOLOv8 possa encontrar os dados corretamente durante o treinamento.

### Parâmetros Ajustáveis

- `data_yaml_path`: Caminho para o arquivo YAML do dataset.
- `conf_thres`: Limiar de confiança para detecção.
- `iou_thres`: Limiar de IOU para Non-Maximum Suppression.

### Código para Ajuste do Arquivo YAML

Este bloco de código ajusta o arquivo YAML com os caminhos e parâmetros apropriados.

In [None]:
# Bloco 4 - Ajuste dos Rótulos
# Este bloco ajusta os arquivos de rótulo para remover a classe "fanado" e reindexar as outras classes.

import os

# Caminho para os diretórios de labels (todas as imagens baixadas)
label_dirs = [
    os.path.join(dataset_dir, "train", "labels"),
    os.path.join(dataset_dir, "valid", "labels"),
    os.path.join(dataset_dir, "test", "labels")
]

# Função para ajustar os arquivos de rótulo
def adjust_labels(label_dirs):
    try:
        for label_dir in label_dirs:
            if os.path.exists(label_dir):
                for label_file in os.listdir(label_dir):
                    if label_file.endswith('.txt'):
                        label_path = os.path.join(label_dir, label_file)
                        with open(label_path, 'r') as file:
                            lines = file.readlines()

                        new_lines = []
                        for line in lines:
                            parts = line.strip().split()
                            class_id = int(parts[0])
                            if class_id == 3:  # Classe 'fanado' que queremos remover
                                continue
                            elif class_id > 3:  # Reindexando classes
                                parts[0] = str(class_id - 1)
                            new_lines.append(' '.join(parts))

                        with open(label_path, 'w') as file:
                            file.write('\n'.join(new_lines) + '\n')
                print(f"Arquivos de rótulo ajustados com sucesso em {label_dir}.")
            else:
                print(f"Diretório {label_dir} não encontrado.")
    except Exception as e:
        print(f"Erro ao ajustar os arquivos de rótulo: {e}")

# Ajustar os arquivos de rótulo
adjust_labels(label_dirs)

In [None]:
# Etapa 3: Definição de Parâmetros Ajustáveis
# Esta etapa define os parâmetros que podem ser ajustados pelo operador para a configuração do dataset e do modelo de detecção.
# Espera-se que esses parâmetros possam ser modificados facilmente conforme necessário.

import os

# Parâmetros ajustáveis pelo operador
# Caminho para o arquivo data.yaml no diretório do dataset baixado
data_yaml_path = os.path.join(dataset_dir, "data.yaml")

# Parâmetros de detecção
conf_thres = 0.3  # Limiar de confiança para detecção
iou_thres = 0.5   # Limiar de IOU para Non-Maximum Suppression

# Exibindo os parâmetros configurados para verificação
print(f"Caminho para o arquivo data.yaml: {data_yaml_path}")
print(f"Limiar de confiança para detecção (conf_thres): {conf_thres}")
print(f"Limiar de IOU para Non-Maximum Suppression (iou_thres): {iou_thres}")

In [None]:
# Bloco 5 - Ajuste do Arquivo YAML
# Este bloco ajusta o arquivo YAML para refletir as mudanças na estrutura das classes.

def adjust_yaml_file(data_yaml_path, datasets_dir, project_name, conf_thres, iou_thres):
    try:
        data = {
            'path': os.path.join("..", datasets_dir, project_name, 'train'),
            'train': 'train',
            'val': 'valid',
            'test': 'test',
            'names': {
                0: 'chapa',
                1: 'furo',
                2: 'veio'
            },
            'nc': 3,
            'detection': {
                'conf_thres': conf_thres,
                'iou_thres': iou_thres
            },
            'roboflow': {
                'license': 'Public Domain',
                'project': 'granito-3nbcw',
                'url': 'https://universe.roboflow.com/alex-novaes/granito-3nbcw/dataset/1',
                'version': 1,
                'workspace': 'alex-novaes'
            }
        }

        yaml_content = f"""
# Configuração do Dataset GRANITO para Treinamento com YOLOv8
# Este arquivo YAML configura o acesso e uso do dataset GRANITO para treinamento, validação e teste de um modelo YOLOv8.
# A estrutura do diretório assume que as imagens estão organizadas dentro do diretório '{project_name}' em '{datasets_dir}'.

# Estrutura de Diretórios Esperada:
# ┌─ {os.path.basename(datasets_dir)}
# │  └─ {project_name}
# │     ├─ imagens
# │     ├─ train
# │     ├─ valid
# │     └─ test

# Caminhos para conjuntos de dados
path: {data['path']}
train: {data['train']}
val: {data['val']}
test: {data['test']}

# Definição das Classes de Objetos
names:
  0: {data['names'][0]}
  1: {data['names'][1]}
  2: {data['names'][2]}

nc: {data['nc']}  # Número de classes

detection:
  conf_thres: {data['detection']['conf_thres']}
  iou_thres: {data['detection']['iou_thres']}

roboflow:
  license: {data['roboflow']['license']}
  project: {data['roboflow']['project']}
  url: {data['roboflow']['url']}
  version: {data['roboflow']['version']}
  workspace: {data['roboflow']['workspace']}
"""

        with open(data_yaml_path, 'w') as file:
            file.write(yaml_content)

        print(f"Arquivo {data_yaml_path} ajustado com sucesso.")
    except Exception as e:
        print(f"Erro ao ajustar o arquivo {data_yaml_path}: {e}")

# Ajustar o arquivo YAML com base nas configurações
adjust_yaml_file(data_yaml_path, datasets_dir, project_name, conf_thres, iou_thres)

## Etapa 4: Divisão do Dataset

Dividimos o dataset em conjuntos de treino, validação e teste. Esta etapa é crucial para garantir que o modelo seja treinado, validado e testado de forma eficiente e correta.

### Parâmetros Ajustáveis

- **data_dir**: Caminho para o diretório de dados.
- **subsets**: Subconjuntos de dados (train, valid, test).
- **test_size**: Percentual de dados para validação e teste. Este parâmetro define a proporção do dataset total que será usada para validação e teste. No nosso caso, usamos 0.2, o que significa que 20% do dataset será dividido entre validação e teste.
  - **Motivo da escolha**: 20% é um valor comum que oferece um bom equilíbrio entre o tamanho dos conjuntos de treino e validação/teste, garantindo dados suficientes para ambos.
  - **Opções**: Pode variar entre 0.1 e 0.3, dependendo do tamanho do dataset e da necessidade específica do projeto. Valores menores (ex: 0.1) são usados quando o dataset é muito grande, enquanto valores maiores (ex: 0.3) são usados quando o dataset é menor e é importante ter mais dados para validação e teste.
- **val_size**: Percentual de dados de validação dentro do conjunto val/test. Este parâmetro define a proporção de dados no conjunto val/test que será usada para validação. No nosso caso, usamos 0.5, o que significa que metade dos dados de val/test será usada para validação.
  - **Motivo da escolha**: 50% é uma escolha equilibrada, garantindo uma divisão igual entre validação e teste.
  - **Opções**: Pode variar entre 0.3 e 0.7, dependendo da necessidade de dados de validação em relação aos dados de teste.
- **random_state**: Seed para garantir a reprodutibilidade. Este parâmetro garante que a divisão dos dados seja a mesma a cada execução do código, permitindo a replicabilidade dos experimentos.
  - **Motivo da escolha**: Usar um seed fixo (42) é uma prática comum que facilita a reprodutibilidade e comparação de resultados.
  - **Opções**: Pode ser qualquer número inteiro. A escolha do número específico (42) é arbitrária, mas deve ser consistente entre as execuções para garantir a reprodutibilidade.

### Código para Divisão do Dataset

Este bloco de código realiza a divisão do dataset e organiza as pastas necessárias.

In [None]:
# Etapa 4: Divisão do Dataset
# Esta etapa configura os parâmetros e prepara a divisão do dataset em conjuntos de treinamento, validação e teste.

from sklearn.model_selection import train_test_split
import shutil
import os

# Diretório onde as imagens e labels estão localizadas
data_dir = os.path.join(dataset_dir, "train")

# Subconjuntos de dados
subsets = ['train', 'valid', 'test']

# Parâmetros de divisão dos dados
test_size = 0.2      # Percentual de dados para validação e teste
val_size = 0.5       # Percentual de dados de validação dentro do conjunto val/test
random_state = 42    # Seed para garantir a reproducibilidade

In [None]:
# Etapa 4.1: Execução da Divisão do Dataset
# Esta etapa divide o dataset em conjuntos de treinamento, validação e teste, e copia os arquivos para as respectivas pastas.

# Cria os subdiretórios para imagens e labels dentro de train, valid e test
for subset in subsets:
    os.makedirs(os.path.join(data_dir, subset, 'images'), exist_ok=True)
    os.makedirs(os.path.join(data_dir, subset, 'labels'), exist_ok=True)

try:
    # Caminhos para as pastas de imagens e labels originais
    image_dir = os.path.join(data_dir, "images")
    label_dir = os.path.join(data_dir, "labels")
    
    # Listagem das imagens e labels
    all_images = [f for f in os.listdir(image_dir) if f.endswith('.jpg')]
    all_labels = [f.replace('.jpg', '.txt') for f in all_images]

    # Divisão das imagens e labels em conjuntos de treino, validação e teste
    train_images, val_test_images = train_test_split(all_images, test_size=test_size, random_state=random_state)
    train_labels, val_test_labels = train_test_split(all_labels, test_size=test_size, random_state=random_state)

    val_images, test_images = train_test_split(val_test_images, test_size=val_size, random_state=random_state)
    val_labels, test_labels = train_test_split(val_test_labels, test_size=val_size, random_state=random_state)

    # Função para copiar arquivos para os diretórios correspondentes
    def copy_files(images, labels, subset):
        img_dir = os.path.join(data_dir, subset, 'images')
        lbl_dir = os.path.join(data_dir, subset, 'labels')
        for img, lbl in zip(images, labels):
            shutil.copy(os.path.join(image_dir, img), img_dir)
            shutil.copy(os.path.join(label_dir, lbl), lbl_dir)
            print(f"Arquivo {img} e seu label {lbl} copiados para {subset}")

    # Copiando os arquivos para os diretórios apropriados
    copy_files(train_images, train_labels, 'train')
    copy_files(val_images, val_labels, 'valid')
    copy_files(test_images, test_labels, 'test')

except Exception as e:
    # Tratamento de exceções durante o processo de divisão
    print(f"Erro durante o processamento: {e}")

## Etapa 5: Treinamento do Modelo YOLOv8

Nesta etapa, treinamos o modelo YOLOv8 usando os dados preparados nas etapas anteriores. Os parâmetros de treinamento são configurados para garantir um equilíbrio entre precisão e eficiência.

### Parâmetros Ajustáveis

- **data**: Caminho para o arquivo YAML que contém as configurações do dataset.
  - **Motivo da escolha**: Necessário para o treinamento do modelo com as configurações e caminhos corretos para os dados.
  - **Opções**: Caminho para qualquer arquivo YAML configurado corretamente.

- **epochs**: Número de épocas de treinamento.
  - **Motivo da escolha**: O valor de 10 é escolhido para um equilíbrio entre tempo de treinamento e qualidade do modelo. Mais épocas podem melhorar a precisão, mas aumentam o tempo de treinamento.
  - **Opções**: Qualquer valor inteiro. Valores comuns são entre 10 e 100, dependendo dos recursos computacionais e do tempo disponível.

- **imgsz**: Tamanho das imagens de entrada.
  - **Motivo da escolha**: O valor de 640 é um bom compromisso entre qualidade da imagem e eficiência computacional.
  - **Opções**: Comuns são 320, 416, 512, 640, etc. Tamanhos menores aumentam a velocidade, mas podem reduzir a precisão.

- **batch**: Tamanho do lote de treinamento.
  - **Motivo da escolha**: O valor de 16 é uma escolha comum que funciona bem na maioria dos sistemas sem esgotar a memória.
  - **Opções**: Qualquer valor inteiro. Comuns são 8, 16, 32, 64. Depende da capacidade de memória da GPU.

- **workers**: Número de workers.
  - **Motivo da escolha**: O valor de 8 permite um bom balanceamento entre carga de CPU e velocidade de processamento.
  - **Opções**: Qualquer valor inteiro. Comuns são entre 4 e 16, dependendo do número de núcleos da CPU.

- **optimizer**: Otimizador.
  - **Motivo da escolha**: A escolha de 'auto' permite ao sistema selecionar o melhor otimizador baseado no hardware e configuração.
  - **Opções**: 'AdamW','SGD', 'Adam', 'RMSprop', 'auto'. A escolha depende do tipo de modelo e dados.

- **verbose**: Modo verboso.
  - **Motivo da escolha**: Ativar o modo verboso (`True`) ajuda a monitorar o progresso do treinamento e a identificar problemas rapidamente.
  - **Opções**: `True` ou `False`. `True` para debug e monitoramento detalhado, `False` para execução silenciosa.

- **device**: Tipo de dispositivo.
  - **Motivo da escolha**: Definido automaticamente (`mps` se disponível, senão `cpu`), permite ao treinamento usar o melhor hardware disponível.
  - **Opções**: 'cpu', 'cuda', 'mps'. A escolha depende do hardware disponível.
  
### Código para Treinamento do Modelo

Este bloco de código realiza o treinamento do modelo YOLOv8 utilizando os parâmetros ajustados.

In [None]:
# Etapa 5: Configuração dos Parâmetros de Treinamento
# Esta etapa configura os parâmetros necessários para o treinamento do modelo YOLOv8.

import torch
from ultralytics import YOLO
import subprocess

# Caminho para o arquivo de pesos do modelo YOLOv8
model_path = "runs/detect/train7/weights/best.pt"

# Caminho para o arquivo YAML que contém as configurações do dataset
data_path = os.path.join(dataset_dir, "data.yaml")

# Número de épocas de treinamento
epochs = 10

# Tamanho das imagens de entrada
img_size = 640

# Diretório para logs do TensorBoard, obtido das configurações carregadas
log_dir = settings.get('runs_dir', 'runs')

# Configuração do dispositivo de treinamento (usa 'mps' se disponível, senão 'cpu')
device = torch.device('mps' if torch.backends.mps.is_available() else 'cpu')

# Configuração dos parâmetros do treinamento
batch_size = 16     # Tamanho do lote de treinamento
workers = 8         # Número de workers
optimizer = 'auto'  # Otimizador
verbose = True      # Modo verboso

In [None]:
# Etapa 5.1: Execução do Treinamento do Modelo
# Esta etapa executa o treinamento do modelo YOLOv8 com os parâmetros configurados anteriormente.

# Exibir o dispositivo de treinamento
print("Using device:", device)

# Carregar o modelo YOLOv8
model = YOLO(model_path)

# Enviar o modelo para o dispositivo especificado (MPS ou CPU)
model.to(device)

# Verificar e criar o diretório de logs do TensorBoard, se necessário
if not os.path.exists(log_dir):
    os.makedirs(log_dir)

# Iniciar o TensorBoard apontando para o diretório de logs
subprocess.Popen(["tensorboard", "--logdir", log_dir])

# Executar o treinamento do modelo com os parâmetros configurados
results = model.train(
    data=data_path,     # Caminho para o arquivo YAML que contém as configurações do dataset
    epochs=epochs,      # Número de épocas de treinamento
    imgsz=img_size,     # Tamanho das imagens de entrada
    batch=batch_size,   # Tamanho do lote de treinamento
    workers=workers,    # Número de workers
    optimizer=optimizer,# Otimizador
    verbose=verbose,    # Modo verboso
    device=device.type  # Tipo de dispositivo como uma string
)

# Salvar o modelo treinado no diretório do dataset
model.save(os.path.join(dataset_dir, "model.pt"))

# Imprimir os resultados do treinamento
print("Training completed. Results:", results)

## Considerações Finais

Este projeto foi desenvolvido com o objetivo de ser replicável e fácil de entender. Cada etapa foi detalhadamente documentada para garantir que futuros usuários possam seguir o processo sem dificuldades. Se houver dúvidas ou sugestões, sinta-se à vontade para entrar em contato comigo ou com meu orientador.