# Detec√ß√£o de Ve√≠culos com YOLOv5 Adaptado (Treinamento e Avalia√ß√£o)  
### Referente √† Entrega 1 do Projeto PBL - Fase 6

## PBL Fase 6 ‚Äì Vis√£o Computacional com YOLOv5

### Reconhecimento de Ve√≠culos: Carros e Motos

Este notebook apresenta o desenvolvimento de um sistema de vis√£o computacional utilizando a arquitetura YOLOv5 para detectar e classificar dois tipos de ve√≠culos: carros e motos. A atividade faz parte da Fase 6 do Projeto Baseado em Problemas (PBL) da FIAP, no contexto da empresa fict√≠cia FarmTech Solutions, que est√° explorando o uso de intelig√™ncia artificial em aplica√ß√µes de seguran√ßa patrimonial e automa√ß√£o.

O objetivo principal √© treinar um modelo YOLOv5 com base em imagens rotuladas manualmente e avaliar seu desempenho na detec√ß√£o dos objetos escolhidos. O projeto envolve tamb√©m a compara√ß√£o de resultados com diferentes quantidades de √©pocas de treinamento.

### Objetivos do notebook

- Organizar e utilizar um dataset rotulado manualmente.
- Treinar um modelo YOLOv5 com 30 e 60 √©pocas.
- Avaliar acur√°cia, perda e desempenho.
- Realizar infer√™ncia em imagens de teste.
- Apresentar conclus√µes com base nos resultados obtidos.

### Aquisi√ß√£o e prepara√ß√£o do dataset

Para este projeto, foram utilizadas imagens de dois objetos distintos: **carros** e **motos**. As imagens foram obtidas manualmente a partir de pesquisas com licenciamento livre (Creative Commons) e screenshots, priorizando variedade de √¢ngulos e contextos.

Ap√≥s a coleta, foram selecionadas:

- 40 imagens de carros
- 40 imagens de motos

As imagens foram rotuladas manualmente utilizando a plataforma [MakeSense.ai](https://www.makesense.ai/), onde foram desenhadas as bounding boxes para cada objeto identificado e atribu√≠dos os r√≥tulos correspondentes.

A estrutura final do dataset foi organizada conforme o padr√£o exigido pelo YOLOv5, separando as imagens e seus respectivos r√≥tulos em tr√™s conjuntos:

- **Treinamento**: 32 imagens de cada classe (total de 64)
- **Valida√ß√£o**: 4 imagens de cada classe (total de 8)
- **Teste**: 4 imagens de cada classe (total de 8)

As pastas est√£o organizadas da seguinte forma:

```
üì¶ 1TIAOR20242_FASE6_CAP1
‚îÇ‚îÄ‚îÄ üìÅ dataset_images               # Pasta principal contendo imagens e labels
‚îÇ   ‚îú‚îÄ‚îÄ üìÅ images                   # Subpasta com as imagens divididas em conjuntos
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ train                # Imagens utilizadas no treinamento (64 imagens)
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ val                  # Imagens utilizadas na valida√ß√£o (8 imagens)
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ test                 # Imagens utilizadas para avalia√ß√£o final (8 imagens)
‚îÇ   ‚îú‚îÄ‚îÄ üìÅ labels                   # Subpasta com os arquivos de r√≥tulo no formato YOLO
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ train                # Labels correspondentes √†s imagens de treinamento
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ val                  # Labels correspondentes √†s imagens de valida√ß√£o
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ test                 # Labels correspondentes √†s imagens de teste
‚îÇ‚îÄ‚îÄ üìÑ veiculos.yaml                # Arquivo de configura√ß√£o que define caminhos, n√∫mero de classes e seus nomes
```
### Estrutura deste notebook

1. Verifica√ß√£o da disponibilidade de GPU
2. Conex√£o com o Google Drive e prepara√ß√£o do ambiente
3. Clonagem do reposit√≥rio YOLOv5 e instala√ß√£o das depend√™ncias
4. Treinamento do modelo com 30 √©pocas
5. Treinamento do modelo com 60 √©pocas
6. Compara√ß√£o dos resultados
7. Infer√™ncia no conjunto de teste
8. Conclus√µes

### Verifica√ß√£o da disponibilidade de GPU


Antes de prosseguir com a montagem do ambiente e instala√ß√£o das depend√™ncias, √© importante verificar se o ambiente Colab est√° configurado com GPU.

O uso da GPU √© altamente recomendado para o treinamento de modelos de detec√ß√£o de objetos, pois reduz significativamente o tempo de execu√ß√£o. Caso a GPU n√£o esteja habilitada, ser√° necess√°rio alterar o tipo de ambiente e reiniciar o notebook.

In [None]:
import torch

if torch.cuda.is_available():
    device_name = torch.cuda.get_device_name(0)
    print("\033[92m‚úÖ GPU dispon√≠vel:\033[0m", device_name)
    print("O ambiente est√° configurado corretamente. Voc√™ pode prosseguir com as pr√≥ximas etapas.")
else:
    print("\033[91m‚ùå ATEN√á√ÉO: GPU n√£o dispon√≠vel. O notebook est√° executando em CPU.\033[0m\n")
    print("‚ùó O treinamento com YOLOv5 em CPU pode ser extremamente lento e est√° sujeito a interrup√ß√µes por tempo limite.")
    print("\n\033[1mRecomenda√ß√µes:\033[0m")
    print("- V√° at√© o menu 'Ambiente de execu√ß√£o > Alterar tipo de ambiente de execu√ß√£o'")
    print("- Selecione 'GPU' como acelerador de hardware e clique em 'Salvar'")
    print("- O ambiente ser√° reiniciado. Ap√≥s a reinicializa√ß√£o, reexecute esta c√©lula antes de continuar.")


### Conex√£o com o Google Drive


Nesta etapa, vamos conectar o ambiente do Google Colab com a conta do Google Drive onde o dataset e os arquivos de configura√ß√£o est√£o armazenados.

Essa conex√£o permite que o notebook tenha acesso direto aos arquivos necess√°rios para o treinamento, valida√ß√£o e testes do modelo, como imagens, r√≥tulos e o arquivo de configura√ß√£o `.yaml`.

In [None]:
import os

# Verifica se o ambiente √© Google Colab ou local
try:
    # Verifica se est√° no Google Colab
    from google.colab import drive
    print("‚úÖ Executando no Google Colab")

    # Verifica se o Google Drive j√° est√° montado
    if not os.path.exists('/content/drive/MyDrive'):
        print("üîÑ Google Drive n√£o est√° montado. Montando agora...")
        drive.mount('/content/drive')
    else:
        drive.mount('/content/drive', force_remount=True)
        print("‚úÖ Google Drive j√° est√° montado.")

    # Caminho no Google Drive
    dataset_dir = "/content/drive/MyDrive/1TIAOR20242_FASE6_CAP1"
    yaml_filename = "veiculos.yaml"

    # Verifica se o arquivo veiculos.yaml existe
    if not os.path.exists(f"{dataset_dir}/veiculos.yaml"):
        raise FileNotFoundError(f"Arquivo n√£o encontrado: {dataset_dir}/veiculos.yaml")
except ImportError:
    # Caso n√£o esteja no Colab, executa localmente
    print("‚úÖ Executando localmente")

    # Caminho local
    dataset_dir = os.path.abspath("../")
    yaml_filename = "veiculos_local.yaml"

    # Verifica se o arquivo veiculos.yaml existe
    if not os.path.exists(f"{dataset_dir}/configuration/{yaml_filename}"):
        # Ajusta o caminho descendo um n√≠vel
        dataset_dir = os.path.abspath("../../")
        if not os.path.exists(f"{dataset_dir}/configuration/{yaml_filename}"):
            raise FileNotFoundError(f"Arquivo n√£o encontrado: {dataset_dir}/configuration/{yaml_filename}")

# Exemplo de uso do caminho
print(f"Caminho dos Datasets: {dataset_dir}")
print(f"Nome do Arquivo para Yolo: {yaml_filename}")

### Clonagem do reposit√≥rio YOLOv5


Nesta etapa, clonamos o reposit√≥rio oficial do YOLOv5, mantido pela Ultralytics. Esse reposit√≥rio cont√©m os scripts de treinamento, valida√ß√£o e infer√™ncia, al√©m de arquivos de configura√ß√£o e exemplos pr√°ticos.

A clonagem cria uma c√≥pia local do reposit√≥rio no ambiente de execu√ß√£o do Google Colab.

In [None]:
# Clonar o reposit√≥rio oficial do YOLOv5
!git clone https://github.com/ultralytics/yolov5

### Instala√ß√£o das depend√™ncias


Ap√≥s a clonagem do reposit√≥rio, √© necess√°rio instalar as depend√™ncias listadas no arquivo `requirements.txt`, presente no diret√≥rio do YOLOv5.

Essas bibliotecas s√£o respons√°veis por garantir o funcionamento adequado dos scripts de treinamento e infer√™ncia.

In [None]:
# !pip install -r requirements.txt
import subprocess

def install_dependencies():
    try:
        # Executa o comando de instala√ß√£o e suprime a sa√≠da
        result = subprocess.run(
            ["pip", "install", "-r", "yolov5/requirements.txt"],
            stdout=subprocess.PIPE,  # Suprime a sa√≠da padr√£o
            stderr=subprocess.PIPE,  # Suprime a sa√≠da de erro
            text=True,
            check=True  # Levanta uma exce√ß√£o se o comando falhar
        )
        print("‚úÖ Instala√ß√£o conclu√≠da com sucesso!")
    except subprocess.CalledProcessError as e:
        print("‚ùå Erro durante a instala√ß√£o.")
        print(f"Detalhes do erro: {e.stderr}")

# Chama a fun√ß√£o para instalar as depend√™ncias
install_dependencies()

### Treinamento do modelo com 30 √©pocas (YOLOv5 adaptado)


Nesta etapa ser√° realizado o primeiro treinamento do modelo YOLOv5 com 30 √©pocas, utilizando o dataset rotulado manualmente com imagens de carros e motos.

Este modelo ser√° utilizado posteriormente na compara√ß√£o com um segundo treinamento, com 60 √©pocas, a fim de observar os efeitos do tempo de treinamento na precis√£o e no desempenho do modelo.

As m√©tricas e o tempo de execu√ß√£o ser√£o armazenados para an√°lise comparativa entre os dois modelos.

In [None]:
import os
print(f'{dataset_dir}/{yaml_filename}')
print(os.path.exists(f'{dataset_dir}/configuration/{yaml_filename}'))

In [None]:
import subprocess
import time

# Caminho do arquivo de log
nome_treinamento = "veiculos_yolo_30ep"

log_file_path = f'{nome_treinamento}.log'

# Par√¢metros utilizados:
# --img: define o tamanho das imagens de entrada (640x640 pixels)
# --batch: n√∫mero de imagens processadas por vez (tamanho do lote)
# --epochs: n√∫mero total de √©pocas de treinamento
# --data: caminho do arquivo .yaml com o dataset e classes
# --weights: modelo base pr√©-treinado (YOLOv5s)
# --name: nome da pasta onde os resultados ser√£o salvos

# Comando de treinamento
command = [
    "python", "./yolov5/train.py",
    "--img", "640",
    "--batch", "16",
    "--epochs", "30",
    "--data", f"{dataset_dir}/configuration/{yaml_filename}",
    "--weights", "yolov5s.pt",
    "--name", f"{nome_treinamento}"
]

# Fun√ß√£o para executar o comando e monitorar o processo
def executar_treinamento(command, log_file_path):
    with open(log_file_path, "w") as log_file:
        try:
            # Inicia o processo
            process = subprocess.Popen(
                command,
                stdout=log_file,  # Redireciona stdout para o arquivo de log
                stderr=log_file,  # Redireciona stderr para o arquivo de log
                text=True
            )

            print(f"Treinamento {nome_treinamento} iniciado. Acompanhe o progresso no arquivo de log.")

            # Verifica se o processo ainda est√° em execu√ß√£o
            pontos = ""  # String para acumular os pontos
            while process.poll() is None:
                pontos += "."  # Adiciona um ponto a cada itera√ß√£o
                print(f"Treinamento em andamento{pontos}", end="\r")  # Atualiza na mesma linha
                time.sleep(10)  # Aguarda 10 segundos antes de verificar novamente

            # Verifica o c√≥digo de sa√≠da
            if process.returncode == 0:
                print(f"Treinamento {nome_treinamento} conclu√≠do com sucesso!")
            else:
                print(f"Erro durante o treinamento {nome_treinamento}. Verifique o log: {log_file_path}")
        except Exception as e:
            print(f"Erro ao executar o comando: {e}")


# Marca o tempo de in√≠cio do treinamento
inicio = time.time()

# Executa o treinamento
executar_treinamento(command, f'./logs/{log_file_path}')

# Marca o tempo de t√©rmino e calcula a dura√ß√£o
fim = time.time()
duracao = fim - inicio
print(f"Tempo de treinamento (30 √©pocas): {duracao:.2f} segundos")

#### An√°lise dos resultados do treinamento (30 √©pocas)


A imagem gerada pelo YOLOv5 cont√©m as curvas de perda (loss), precis√£o, recall, mAP e outras m√©tricas relevantes coletadas durante o processo de treinamento.

Essa visualiza√ß√£o ajuda a identificar se o modelo est√° convergindo corretamente e a verificar sinais de overfitting ou subajuste.

In [None]:
from IPython.display import Image, display

# Exibe o gr√°fico de m√©tricas do treinamento
display(Image(filename=f'./yolov5/runs/train/{nome_treinamento}/results.png', width=1200))


#### Infer√™ncia no conjunto de teste (modelo com 30 √©pocas)


Nesta etapa, utilizamos o modelo YOLOv5 treinado com 30 √©pocas para realizar infer√™ncia nas imagens do conjunto de teste. O objetivo √© observar o desempenho do modelo em imagens n√£o vistas anteriormente.

O tempo total de execu√ß√£o ser√° registrado para fins comparativos com outras vers√µes e abordagens, conforme exigido na Entrega 2.

In [None]:
import time

# Par√¢metros utilizados:
# --weights: caminho para o modelo treinado (melhor vers√£o salva durante o treino de 30 √©pocas)
# --img: tamanho das imagens usadas na infer√™ncia (em pixels)
# --conf: n√≠vel m√≠nimo de confian√ßa para exibir uma detec√ß√£o
# --source: diret√≥rio com as imagens de teste
# --name: nome da pasta de sa√≠da (dentro de runs/detect)

# Marca o in√≠cio da infer√™ncia
inicio = time.time()

# Executa a infer√™ncia com o modelo treinado
!python ./yolov5/detect.py \
  --weights ./yolov5/runs/train/{nome_treinamento}/weights/best.pt \
  --img 640 \
  --conf 0.25 \
  --source {dataset_dir}/dataset_images/images/test \
  --name {nome_treinamento}_test

# Marca o fim e calcula a dura√ß√£o
fim = time.time()
duracao = fim - inicio

# Exibe o tempo total de infer√™ncia
print(f"Tempo de infer√™ncia no conjunto de teste: {duracao:.2f} segundos")


#### Visualiza√ß√£o dos resultados da infer√™ncia




A seguir, s√£o exibidas algumas das imagens do conjunto de teste processadas pelo modelo treinado com 30 √©pocas. Os resultados mostram as bounding boxes geradas e as classes detectadas com suas respectivas confian√ßas.

Essas evid√™ncias visuais s√£o importantes para demonstrar o funcionamento real do modelo e ser√£o utilizadas na an√°lise comparativa com o modelo treinado com 60 √©pocas e as outras abordagens previstas na Entrega 2.

In [None]:
import glob
from IPython.display import Image, display

# Lista os arquivos resultantes da infer√™ncia
resultado_imgs = glob.glob(f'./yolov5/runs/detect/{nome_treinamento}_test/*.jpg')

# Exibe at√© 4 imagens para visualiza√ß√£o
for img_path in resultado_imgs[:4]:
    display(Image(filename=img_path, width=500))


#### Conclus√£o preliminar do modelo treinado com 30 √©pocas



Com base na execu√ß√£o realizada, o modelo YOLOv5 treinado com 30 √©pocas apresentou os seguintes resultados:

- O tempo total de treinamento foi de aproximadamente **192 segundos**, utilizando a GPU do Colab.
- O tempo de infer√™ncia no conjunto de teste foi de **13,35 segundos**, com m√©dia de aproximadamente **26,9 ms por imagem** para infer√™ncia e **21,6 ms** para NMS.
- A an√°lise do gr√°fico `results.png` mostra uma boa converg√™ncia dos erros (loss), com redu√ß√£o progressiva e sem sinais de overfitting vis√≠veis. Os valores de precis√£o e recall tamb√©m aumentaram de forma consistente.
- A m√©trica **mAP@0.5** se aproximou de **0.9**, o que indica excelente capacidade de detec√ß√£o em um cen√°rio com duas classes apenas.
- O modelo identificou corretamente **6 de 8 imagens** no conjunto de teste, mantendo uma taxa pr√°tica de acerto de **75%**.
- As duas imagens que n√£o apresentaram detec√ß√µes possivelmente envolvem limita√ß√µes naturais do modelo ou caracter√≠sticas espec√≠ficas das imagens, como √¢ngulos desfavor√°veis ou baixa resolu√ß√£o.

Estes resultados servir√£o como base de compara√ß√£o para o pr√≥ximo experimento, com 60 √©pocas, permitindo avaliar se o aumento no n√∫mero de ciclos de treinamento traz ganhos relevantes em desempenho.

### Treinamento do modelo com 60 √©pocas (YOLOv5 adaptado)

Nesta etapa, ser√° realizado um segundo treinamento do modelo YOLOv5 utilizando o mesmo dataset e os mesmos par√¢metros anteriores, exceto pelo n√∫mero de √©pocas, que foi ampliado para 60.

O objetivo √© observar se o aumento no tempo de treinamento resulta em melhorias nas m√©tricas de desempenho e na capacidade de generaliza√ß√£o do modelo. O tempo de execu√ß√£o ser√° registrado para fins comparativos.


In [None]:
import subprocess
import time

# Caminho do arquivo de log
nome_treinamento = "veiculos_yolo_60ep"

log_file_path = f'{nome_treinamento}.log'

# Par√¢metros utilizados:
# --img: define o tamanho das imagens de entrada (640x640 pixels)
# --batch: n√∫mero de imagens processadas por vez (tamanho do lote)
# --epochs: n√∫mero total de √©pocas de treinamento
# --data: caminho do arquivo .yaml com o dataset e classes
# --weights: modelo base pr√©-treinado (YOLOv5s)
# --name: nome da pasta onde os resultados ser√£o salvos

# Comando de treinamento
command = [
    "python", "./yolov5/train.py",
    "--img", "640",
    "--batch", "16",
    "--epochs", "60",
    "--data", f"{dataset_dir}/configuration/{yaml_filename}",
    "--weights", "yolov5s.pt",
    "--name", f"{nome_treinamento}"
]

# Fun√ß√£o para executar o comando e monitorar o processo
def executar_treinamento(command, log_file_path):
    with open(log_file_path, "w") as log_file:
        try:
            # Inicia o processo
            process = subprocess.Popen(
                command,
                stdout=log_file,  # Redireciona stdout para o arquivo de log
                stderr=log_file,  # Redireciona stderr para o arquivo de log
                text=True
            )

            print(f"Treinamento {nome_treinamento} iniciado. Acompanhe o progresso no arquivo de log.")

            # Verifica se o processo ainda est√° em execu√ß√£o
            pontos = ""  # String para acumular os pontos
            while process.poll() is None:
                pontos += "."  # Adiciona um ponto a cada itera√ß√£o
                print(f"Treinamento em andamento{pontos}", end="\r")  # Atualiza na mesma linha
                time.sleep(10)  # Aguarda 10 segundos antes de verificar novamente

            # Verifica o c√≥digo de sa√≠da
            if process.returncode == 0:
                print(f"Treinamento {nome_treinamento} conclu√≠do com sucesso!")
            else:
                print(f"Erro durante o treinamento {nome_treinamento}. Verifique o log: {log_file_path}")
        except Exception as e:
            print(f"Erro ao executar o comando: {e}")


# Marca o tempo de in√≠cio do treinamento
inicio = time.time()

# Executa o treinamento
executar_treinamento(command, f'./logs/{log_file_path}')

# Marca o tempo de t√©rmino e calcula a dura√ß√£o
fim = time.time()
duracao = fim - inicio
print(f"Tempo de treinamento (60 √©pocas): {duracao:.2f} segundos")

#### An√°lise dos resultados do treinamento (60 √©pocas)

A imagem gerada pelo YOLOv5 a partir do treinamento com 60 √©pocas mostra a evolu√ß√£o das m√©tricas de perda, precis√£o, recall e mAP. Essa visualiza√ß√£o √© importante para comparar a estabilidade, a converg√™ncia e o poss√≠vel ganho de desempenho em rela√ß√£o ao modelo treinado com 30 √©pocas.


In [None]:
from IPython.display import Image, display

# Exibe o gr√°fico de m√©tricas do treinamento com 60 √©pocas
display(Image(filename=f'./yolov5/runs/train/{nome_treinamento}/results.png', width=1200))


#### Infer√™ncia no conjunto de teste (modelo com 60 √©pocas)

Utilizando agora o modelo treinado com 60 √©pocas, faremos a infer√™ncia nas mesmas imagens de teste, para fins de compara√ß√£o direta com os resultados obtidos anteriormente com 30 √©pocas. O tempo de execu√ß√£o ser√° registrado, e os resultados visuais ser√£o armazenados para an√°lise.


In [None]:
import time

# Par√¢metros utilizados:
# --weights: modelo treinado com 60 √©pocas
# --img: tamanho das imagens de entrada
# --conf: confian√ßa m√≠nima para exibir uma detec√ß√£o
# --source: diret√≥rio com imagens de teste
# --name: nome da pasta de sa√≠da dos resultados

# Marca o in√≠cio da infer√™ncia
inicio = time.time()

# Executa a infer√™ncia
!python ./yolov5/detect.py \
  --weights ./yolov5/runs/train/{nome_treinamento}/weights/best.pt \
  --img 640 \
  --conf 0.25 \
  --source {dataset_dir}/dataset_images/images/test \
  --name {nome_treinamento}_test

# Marca o fim e calcula a dura√ß√£o
fim = time.time()
duracao = fim - inicio

# Exibe o tempo total de infer√™ncia
print(f"Tempo de infer√™ncia no conjunto de teste: {duracao:.2f} segundos")


#### Visualiza√ß√£o das detec√ß√µes (modelo com 60 √©pocas)

A seguir, s√£o exibidas algumas das imagens do conjunto de teste processadas pelo modelo treinado com 60 √©pocas. A ideia √© comparar visualmente a qualidade das detec√ß√µes em rela√ß√£o ao modelo anterior e observar se houve ganho percept√≠vel em precis√£o ou consist√™ncia.


In [None]:
import glob
from IPython.display import Image, display

# Lista os arquivos resultantes da infer√™ncia
resultado_imgs = glob.glob(f'./yolov5/runs/detect/{nome_treinamento}_test/*.jpg')

# Exibe at√© 4 imagens
for img_path in resultado_imgs[:4]:
    display(Image(filename=img_path, width=500))


#### Conclus√£o preliminar do modelo treinado com 60 √©pocas

Com base na execu√ß√£o realizada, o modelo YOLOv5 treinado com 60 √©pocas apresentou os seguintes resultados:

- O tempo total de treinamento foi de aproximadamente **268 segundos**, tamb√©m utilizando a GPU do Colab.
- O tempo de infer√™ncia no conjunto de teste foi de **7,72 segundos**, com m√©dia de aproximadamente **24,4 ms por imagem** para infer√™ncia e **18,5 ms** para NMS.
- A an√°lise do gr√°fico `results.png` mostra uma converg√™ncia ainda mais est√°vel das perdas (loss), com quedas suaves e cont√≠nuas, e sem sinais de sobreajuste (overfitting).
- As m√©tricas **precision** e **recall** alcan√ßaram valores pr√≥ximos de 1.0, com boa estabilidade ao longo das √©pocas.
- A m√©trica **mAP@0.5** se manteve pr√≥xima de 1.0 nas √∫ltimas √©pocas, enquanto a **mAP@0.5:0.95** apresentou evolu√ß√£o e menor oscila√ß√£o em rela√ß√£o ao modelo anterior.
- O modelo identificou corretamente **7 de 8 imagens** no conjunto de teste, incluindo um caso com **dupla detec√ß√£o correta (Carro e Moto)**, resultando em uma taxa pr√°tica de acerto de **87,5%**.
- Apenas uma imagem n√£o apresentou detec√ß√£o, mantendo a consist√™ncia geral e sugerindo boa capacidade de generaliza√ß√£o.

Esses resultados indicam um desempenho superior ao modelo de 30 √©pocas, tanto em termos quantitativos quanto qualitativos, e posicionam o modelo de 60 √©pocas como refer√™ncia para compara√ß√£o com as demais abordagens previstas na Entrega 2.


### Compara√ß√£o entre modelos: 30 vs 60 √©pocas


Ap√≥s o treinamento e a avalia√ß√£o dos dois modelos YOLOv5 adaptados, √© poss√≠vel estabelecer uma compara√ß√£o baseada em m√©tricas quantitativas e qualitativas.

### Tempo de treinamento

- **30 √©pocas**: aproximadamente 192 segundos
- **60 √©pocas**: aproximadamente 268 segundos  
‚Üí A duplica√ß√£o das √©pocas resultou em um tempo 39% maior, o que √© esperado e aceit√°vel no contexto.

### Tempo de infer√™ncia

- **30 √©pocas**: 13,35 segundos (‚âà26,9 ms/infer√™ncia + 21,6 ms/NMS)
- **60 √©pocas**: 7,72 segundos (‚âà24,4 ms/infer√™ncia + 18,5 ms/NMS)  
‚Üí O modelo de 60 √©pocas foi ligeiramente mais r√°pido, indicando otimiza√ß√£o na arquitetura gerada.

### Detec√ß√£o nas imagens de teste

- **30 √©pocas**:
  - 6 de 8 imagens corretamente detectadas
  - 2 imagens sem detec√ß√£o
- **60 √©pocas**:
  - 7 de 8 imagens corretamente detectadas
  - Uma das imagens apresentou detec√ß√£o de **duas classes corretamente (Carro e Moto)**  
‚Üí Houve melhora clara na cobertura e sensibilidade do modelo.

### M√©tricas gr√°ficas (resultados.png)

- **30 √©pocas**:
  - mAP@0.5: pr√≥ximo de 0.9
  - mAP@0.5:0.95: ~0.6
- **60 √©pocas**:
  - mAP@0.5: estabilizado em 1.0
  - mAP@0.5:0.95: pr√≥xima de 0.7 com menos flutua√ß√µes  
‚Üí Indica melhor generaliza√ß√£o e menor varia√ß√£o nas m√©tricas.

### Conclus√£o

O modelo treinado com **60 √©pocas apresentou resultados superiores** em praticamente todos os aspectos: detec√ß√£o pr√°tica, estabilidade gr√°fica e precis√£o nas m√©tricas. Apesar do tempo de treinamento maior, os ganhos justificam seu uso como vers√£o final do modelo para a pr√≥xima fase do projeto.

Essas observa√ß√µes ser√£o fundamentais na Entrega 2, onde este modelo ser√° comparado com outras abordagens, como a YOLO tradicional e uma CNN treinada do zero.


### Conclus√£o da Entrega 1

Nesta primeira etapa do projeto, foi implementado um sistema de detec√ß√£o de objetos utilizando o modelo YOLOv5 adaptado, treinado com um dataset customizado de imagens de **carros** e **motos** rotulado manualmente.

Dois experimentos foram realizados: um com **30 √©pocas** e outro com **60 √©pocas**. Ambos os modelos foram treinados e avaliados com base em m√©tricas quantitativas, desempenho pr√°tico na infer√™ncia e an√°lise visual dos resultados.

Os principais achados foram:

- O modelo com **60 √©pocas apresentou desempenho superior**, com maior taxa de acerto e m√©tricas mais est√°veis, mesmo com um tempo de treinamento apenas moderadamente maior.
- A **diferen√ßa nas curvas de mAP e perda** entre os dois modelos indica um ganho relevante em generaliza√ß√£o e refinamento da detec√ß√£o.
- As imagens de teste revelaram **melhor cobertura e confian√ßa** nas detec√ß√µes do modelo com mais √©pocas, inclusive detectando m√∫ltiplas classes em uma √∫nica imagem.

A estrutura do notebook, os tempos de execu√ß√£o, as sa√≠das visuais e os resultados num√©ricos obtidos nesta etapa ser√£o utilizados como base de compara√ß√£o na pr√≥xima fase do projeto.

## Transi√ß√£o para a Entrega 2

A partir da pr√≥xima etapa, ser√£o avaliadas outras abordagens de vis√£o computacional aplicadas ao mesmo problema, com o objetivo de comparar diferentes t√©cnicas de detec√ß√£o e classifica√ß√£o de imagens.

As abordagens previstas s√£o:

1. **YOLO tradicional (pr√©-treinado)** ‚Äî aplicado sem ajuste no dataset customizado;
2. **CNN treinada do zero** ‚Äî com foco na tarefa de classifica√ß√£o entre carro e moto.

Essas abordagens ser√£o analisadas com os mesmos crit√©rios definidos na Entrega 1:

- Precis√£o e desempenho do modelo
- Tempo de treinamento e infer√™ncia
- Facilidade de uso e integra√ß√£o
- Qualidade dos resultados visuais

A seguir, ser√° iniciada a prepara√ß√£o para a implementa√ß√£o dessas duas novas abordagens.


# Compara√ß√£o entre Abordagens de Vis√£o Computacional (YOLOv5, YOLO Tradicional e CNN)  
### Referente √† Entrega 2 do Projeto PBL - Fase 6


Nesta segunda etapa, o objetivo √© comparar diferentes abordagens de vis√£o computacional aplicadas ao mesmo conjunto de dados utilizado na Entrega 1. A proposta √© identificar vantagens e limita√ß√µes entre t√©cnicas de detec√ß√£o e classifica√ß√£o baseadas em redes neurais.

As abordagens implementadas s√£o:

1. YOLOv5 Adaptado (j√° treinado na Entrega 1)
2. YOLO Tradicional (modelo pr√©-treinado, sem ajustes)
3. CNN desenvolvida do zero (classifica√ß√£o entre duas classes)

A an√°lise comparativa ser√° baseada em crit√©rios como precis√£o, tempo de infer√™ncia, facilidade de implementa√ß√£o e aplicabilidade pr√°tica.


### Refer√™ncia: Resultado da Entrega 1 (YOLOv5 Adaptado - 60 √©pocas)


Nesta etapa, utilizaremos como refer√™ncia comparativa o modelo YOLOv5 treinado com 60 √©pocas, desenvolvido na Entrega 1.

Esse modelo obteve os seguintes resultados:

- Tempo de treinamento: **268 segundos**
- Tempo de infer√™ncia: **7,72 segundos**
- Detec√ß√£o correta em **7 de 8 imagens** do conjunto de teste
- **mAP@0.5**: ~1.0
- **mAP@0.5:0.95**: ~0.7

Abaixo est√° o gr√°fico de m√©tricas gerado durante o treinamento deste modelo.

In [None]:
from IPython.display import Image, display

# Exibir gr√°fico de m√©tricas
print("Gr√°fico de desempenho do modelo YOLOv5 (60 √©pocas):")
display(Image(filename=f'./yolov5/runs/train/{nome_treinamento}/results.png', width=1200))


## 1. Aplica√ß√£o da YOLOv5 Tradicional (Pr√©-treinada)

Nesta abordagem, utilizamos o modelo `yolov5s.pt` fornecido pela Ultralytics, sem ajustes no dataset customizado.

Este modelo j√° foi treinado em um grande conjunto de dados p√∫blicos (COCO dataset), o que lhe permite detectar diversas classes gen√©ricas. O objetivo aqui √© avaliar se ele √© capaz de identificar **carros** e **motos** em nosso conjunto de teste, mesmo sem ter sido adaptado para essas imagens espec√≠ficas.

Esta etapa tamb√©m permite comparar como um modelo gen√©rico se comporta frente a um modelo customizado, como o desenvolvido na Entrega 1.

In [None]:
import time

nome_treinamento = "yolo_tradicional"

# Par√¢metros utilizados:
# --weights: define o modelo YOLOv5 a ser utilizado (pr√©-treinado 'yolov5s.pt')
# --img: tamanho da imagem de entrada (640x640 pixels)
# --conf: n√≠vel m√≠nimo de confian√ßa para considerar uma detec√ß√£o
# --source: diret√≥rio com as imagens do conjunto de teste
# --name: nome da pasta onde os resultados da infer√™ncia ser√£o salvos (dentro de runs/detect/)

# Marca o in√≠cio da execu√ß√£o
inicio = time.time()

# Executa a infer√™ncia com o modelo pr√©-treinado
!python ./yolov5/detect.py \
  --weights yolov5s.pt \
  --img 640 \
  --conf 0.25 \
  --source {dataset_dir}/dataset_images/images/test \
  --name {nome_treinamento}_test

# Marca o fim da execu√ß√£o e calcula a dura√ß√£o
fim = time.time()
print(f"Tempo de infer√™ncia com YOLO pr√©-treinado: {fim - inicio:.2f} segundos")


### Visualiza√ß√£o dos resultados da YOLOv5 Tradicional

Abaixo est√£o algumas imagens do conjunto de teste processadas pelo modelo pr√©-treinado YOLOv5s. O objetivo √© observar quais objetos foram detectados, como foram classificados e se h√° consist√™ncia nas detec√ß√µes para as classes de interesse (carro e moto).


In [None]:
from IPython.display import Image, display
import glob

# Local dos resultados gerados pelo YOLO pr√©-treinado
imagens_yolo_tradicional = glob.glob(f'./yolov5/runs/detect/{nome_treinamento}_test/*.jpg')

# Exibir at√© 4 imagens
for img_path in imagens_yolo_tradicional[:4]:
    display(Image(filename=img_path, width=500))


### An√°lise de desempenho do modelo YOLOv5 Tradicional (Pr√©-treinado)


Ao aplicar o modelo YOLOv5s pr√©-treinado (sem re-treinamento) sobre as imagens do conjunto de teste, foram observadas as seguintes caracter√≠sticas e comportamentos:

#### üîπ Detec√ß√µes realizadas
- O modelo foi capaz de detectar **carros** e **motos**, que s√£o classes presentes no dataset COCO (base de treinamento do YOLOv5 pr√©-treinado).
- Em algumas imagens, foi capaz de detectar **mais de um objeto da mesma classe**, como m√∫ltiplos carros ou motos, demonstrando uma boa capacidade de identifica√ß√£o em ambientes com m√∫ltiplas ocorr√™ncias.
- Algumas imagens apresentaram **detec√ß√µes incorretas ou irrelevantes**, como a classifica√ß√£o de "train" ou "truck", indicando limita√ß√µes no foco da aplica√ß√£o.

#### üîπ Acertos e limita√ß√µes por imagem
- **Imagem 073**: Detec√ß√£o de 3 carros e 1 moto, indicando boa sensibilidade.
- **Imagem 074**: Detec√ß√£o incorreta como "train", devido √† vista traseira incomum do fusca.
- **Imagem 075**: Detec√ß√£o correta de um carro.
- **Imagem 076**: Detec√ß√£o como "truck" (possivelmente confundido com o design do Tesla Cybertruck).
- **Imagem 077**: Detec√ß√£o correta de uma moto.
- **Imagem 078**: Detec√ß√£o de 4 motos, indicando alta sensibilidade, mas poss√≠vel excesso.
- **Imagem 079**: Detec√ß√£o correta de uma moto.
- **Imagem 080**: Nenhuma detec√ß√£o (moto tipo Vespa, possivelmente fora do padr√£o aprendido).

#### üîπ Tempo de infer√™ncia
- O tempo total de infer√™ncia foi de aproximadamente **7,84 segundos** para processar as 8 imagens do conjunto de teste.
- A m√©dia de tempo por imagem foi de aproximadamente **23,8 ms de infer√™ncia** e **18,7 ms de NMS**, o que representa uma performance adequada para aplica√ß√µes em tempo real ou embarcadas.

#### üîπ Robustez e generaliza√ß√£o
- O modelo demonstrou **capacidade de generalizar** bem para contextos diversos, sendo capaz de detectar objetos mesmo em imagens n√£o padronizadas.
- A presen√ßa de falsos positivos e detec√ß√µes de classes fora do escopo do projeto refor√ßa o car√°ter **gen√©rico** do modelo.

Esses resultados demonstram que o modelo YOLOv5 pr√©-treinado, mesmo sem ajustes, consegue fornecer **resultados relevantes** em ambientes variados, desde que as classes estejam contempladas em seu conjunto de treinamento original.


### Conclus√£o parcial ‚Äì YOLOv5 Tradicional (Pr√©-treinado)

O modelo YOLOv5s pr√©-treinado, utilizado sem re-treinamento, apresentou um desempenho satisfat√≥rio ao ser aplicado diretamente sobre as imagens do conjunto de teste do projeto.

Mesmo sem ter sido treinado com o dataset espec√≠fico, o modelo foi capaz de detectar corretamente diversas ocorr√™ncias das classes "car" e "motorcycle", mostrando uma boa generaliza√ß√£o para objetos presentes em seu dataset original (COCO).

Al√©m disso, o modelo demonstrou:
- **Capacidade de identificar m√∫ltiplos objetos por imagem**, o que √© relevante em ambientes complexos.
- **Tempo de infer√™ncia adequado** (7,84 segundos para 8 imagens), tornando-o vi√°vel para aplica√ß√µes pr√°ticas.
- **Alguns falsos positivos ou classifica√ß√µes irrelevantes**, como "train" e "truck", esperados em um modelo gen√©rico.

Por outro lado, a detec√ß√£o incorreta de objetos incomuns (como o Tesla Cybertruck ou a traseira aberta de um fusca) e a aus√™ncia de detec√ß√£o em casos menos padronizados (como a moto Vespa) indicam **limita√ß√µes relacionadas √† representatividade do dataset de origem** e √† falta de especializa√ß√£o no dom√≠nio do projeto.

Em resumo, o YOLO pr√©-treinado √© uma ferramenta pr√°tica e eficaz para uso geral, oferecendo bons resultados iniciais mesmo sem personaliza√ß√£o. No entanto, **pode n√£o atender com a precis√£o exigida em contextos espec√≠ficos**, como os esperados por um cliente com necessidades claramente definidas.


## 2. Classifica√ß√£o com CNN do Zero (Carro vs Moto)



Nesta etapa, ser√° implementada uma rede neural convolucional simples, treinada do zero para classificar imagens entre duas categorias: "carro" e "moto".

Diferente do modelo YOLO, que realiza detec√ß√£o de objetos, a CNN ser√° respons√°vel apenas pela **classifica√ß√£o da imagem como um todo**, com base em caracter√≠sticas visuais.

Para isso, utilizaremos as mesmas imagens da Entrega 1, reestruturando o dataset para seguir o padr√£o esperado por bibliotecas como `ImageDataGenerator` (Keras) ou `ImageFolder` (PyTorch).

A estrutura esperada do diret√≥rio de dados √© a seguinte:

```
üì¶ 1TIAOR20242_FASE6_CAP1
‚îÇ‚îÄ‚îÄ üìÅ dataset_cnn           # Pasta principal para classifica√ß√£o com CNN
‚îÇ   ‚îú‚îÄ‚îÄ üìÅ train             # Imagens utilizadas para o treinamento (64 imagens por classe)
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ carro         # Imagens da classe "carro"
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ moto          # Imagens da classe "moto"
‚îÇ   ‚îú‚îÄ‚îÄ üìÅ val               # Imagens utilizadas para valida√ß√£o (8 imagens por classe)
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ carro         # Imagens da classe "carro"
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ moto          # Imagens da classe "moto"
‚îÇ   ‚îú‚îÄ‚îÄ üìÅ test              Imagens utilizadas para avalia√ß√£o final (8 imagens por classe)
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ carro         # Imagens da classe "carro"
‚îÇ   ‚îÇ   ‚îú‚îÄ‚îÄ üìÅ moto          # Imagens da classe "moto"
```

Com essa organiza√ß√£o, √© poss√≠vel carregar as imagens automaticamente com os respectivos r√≥tulos, simplificando o processo de prepara√ß√£o do dataset para a CNN.

### Verifica√ß√£o e montagem do Google Drive

Antes de carregar o dataset da CNN, verificamos se o Google Drive est√° montado no ambiente do Google Colab.

Essa etapa √© essencial, pois o ambiente pode ter sido reiniciado e a conex√£o com o Drive perdida desde a execu√ß√£o da Entrega 1.


In [None]:
import os

# Verifica se o ambiente √© Google Colab ou local
try:
    # Verifica se est√° no Google Colab
    from google.colab import drive
    print("‚úÖ Executando no Google Colab")

    # Verifica se o Google Drive j√° est√° montado
    if not os.path.exists('/content/drive/MyDrive'):
        print("üîÑ Google Drive n√£o est√° montado. Montando agora...")
        drive.mount('/content/drive')
    else:
        drive.mount('/content/drive', force_remount=True)
        print("‚úÖ Google Drive j√° est√° montado.")

    # Caminho no Google Drive
    dataset_dir = "/content/drive/MyDrive/1TIAOR20242_FASE6_CAP1/dataset_cnn"

except ImportError:
    # Caso n√£o esteja no Colab, executa localmente
    print("‚úÖ Executando localmente")

    # Caminho local
    dataset_dir = os.path.abspath("../dataset_cnn")

# Exemplo de uso do caminho
print(f"Caminho dos Datasets: {dataset_dir}")

### Carregamento do dataset a partir do Google Drive

Com o dataset j√° estruturado na pasta `dataset_cnn` dentro do Google Drive, vamos utilizar a biblioteca `ImageDataGenerator` da Keras para carregar e preparar os dados para treinamento, valida√ß√£o e teste.

O carregamento ser√° feito com base na estrutura de subpastas (`carro/` e `moto/`) j√° organizadas dentro dos diret√≥rios `train`, `val` e `test`.

O caminho completo do dataset no Google Drive deve ser:
```
/content/drive/MyDrive/1TIAOR20242_FASE6_CAP1/dataset_cnn/
```

Cada subpasta dentro de `train/`, `val/` e `test/` representa o r√≥tulo da classe correspondente.

In [None]:
import os

# Fun√ß√£o para validar as subpastas
def validar_subpastas(dataset_dir):
    subpastas_necessarias = ['test', 'val', 'train']
    subpastas_existentes = os.listdir(dataset_dir) if os.path.exists(dataset_dir) else []

    # Verifica se todas as subpastas necess√°rias est√£o presentes
    subpastas_faltando = [pasta for pasta in subpastas_necessarias if pasta not in subpastas_existentes]

    if subpastas_faltando:
        print("\033[91m‚ùå ERRO: As seguintes subpastas est√£o faltando no diret√≥rio:\033[0m")
        for pasta in subpastas_faltando:
            print(f"  - {pasta}")
        print("\033[93m‚ö†Ô∏è Verifique o caminho do dataset e a estrutura esperada.\033[0m")
    else:
        print("\033[92m‚úÖ Todas as subpastas necess√°rias est√£o presentes:\033[0m")
        for pasta in subpastas_necessarias:
            print(f"  - {pasta}")

# Valida as subpastas
validar_subpastas(dataset_dir)

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Tamanhos e par√¢metros
image_size = (224, 224)
batch_size = 16

# Pr√©-processamento b√°sico: reescala os pixels para o intervalo [0, 1]
datagen = ImageDataGenerator(rescale=1./255)

# Carregamento dos dados
train_generator = datagen.flow_from_directory(
    directory=f"{dataset_dir}/train",
    target_size=image_size,
    batch_size=batch_size,
    class_mode='binary'  # classifica√ß√£o bin√°ria
)

val_generator = datagen.flow_from_directory(
    directory=f"{dataset_dir}/val",
    target_size=image_size,
    batch_size=batch_size,
    class_mode='binary'
)

test_generator = datagen.flow_from_directory(
    directory=f"{dataset_dir}/test",
    target_size=image_size,
    batch_size=batch_size,
    class_mode='binary',
    shuffle=False  # importante para avalia√ß√£o
)


## Defini√ß√£o da CNN (Rede Neural Convolucional)

A rede definida a seguir tem como objetivo classificar imagens entre duas categorias: "carro" e "moto".

Trata-se de uma arquitetura simples, ideal para bases de dados menores como a utilizada neste projeto. A rede √© composta por:

- Tr√™s blocos de camadas convolucionais + max pooling;
- Camada de flatten (achatar os filtros);
- Duas camadas densas (fully connected), sendo a √∫ltima com ativa√ß√£o sigmoide para classifica√ß√£o bin√°ria.

A perda ser√° calculada com `binary_crossentropy`, e a m√©trica principal ser√° a **acur√°cia**.


In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from tensorflow.keras.optimizers import Adam

# Arquitetura da CNN
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)),
    MaxPooling2D(2, 2),

    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),

    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D(2, 2),

    Flatten(),

    Dense(128, activation='relu'),
    Dropout(0.3),

    Dense(1, activation='sigmoid')  # Sa√≠da bin√°ria: 0 ou 1
])

# Compila√ß√£o do modelo
model.compile(
    optimizer=Adam(learning_rate=0.0001),
    loss='binary_crossentropy',
    metrics=['accuracy']
)

# Resumo do modelo
model.summary()


### Treinamento do modelo CNN



Com os dados devidamente organizados e carregados, o modelo convolucional ser√° treinado por um n√∫mero definido de √©pocas.

Durante o treinamento, ser√£o observadas as m√©tricas de acur√°cia e perda (**loss**) tanto para o conjunto de **treinamento** quanto para o de **valida√ß√£o**, com o objetivo de identificar a evolu√ß√£o do aprendizado da rede e eventuais ind√≠cios de overfitting.

Como o conjunto de dados √© relativamente pequeno, utilizaremos um n√∫mero moderado de √©pocas, evitando o risco de sobreajuste. Os resultados ser√£o registrados para posterior an√°lise comparativa com as abordagens baseadas em YOLO.


In [None]:
print("üîç Dimens√£o do batch de treino:", train_generator.image_shape)
print("üî¢ Classes detectadas:", train_generator.class_indices)


In [None]:
# Par√¢metros
epochs = 30

# Treinamento do modelo
history = model.fit(
    train_generator,
    validation_data=val_generator,
    epochs=epochs,
    verbose=1
)

In [None]:
import matplotlib.pyplot as plt

def plot_training_history(history):
    acc = history.history['accuracy']
    val_acc = history.history['val_accuracy']
    loss = history.history['loss']
    val_loss = history.history['val_loss']
    epochs_range = range(len(acc))

    plt.figure(figsize=(14, 5))

    plt.subplot(1, 2, 1)
    plt.plot(epochs_range, acc, label='Acur√°cia Treino')
    plt.plot(epochs_range, val_acc, label='Acur√°cia Valida√ß√£o')
    plt.legend(loc='lower right')
    plt.title('Acur√°cia durante o treinamento')

    plt.subplot(1, 2, 2)
    plt.plot(epochs_range, loss, label='Perda Treino')
    plt.plot(epochs_range, val_loss, label='Perda Valida√ß√£o')
    plt.legend(loc='upper right')
    plt.title('Perda durante o treinamento')

    plt.show()

plot_training_history(history)


## COMPARATIVO DOS MODELOS