# Identificação de rachaduras utilizando o modelo Yolo v8

### Autor: Luiz Fernando da Silva Borges


## 1. Yolo v8

O YOLOv8, ou You Only Look Once versão 8, é um algoritmo avançado de detecção de objetos. Ele é um aprimoramento dos modelos YOLO que tiveram sua arquitetura Darknet modificada, expandindo seus recursos. O YOLOv8 incorpora técnicas como treinamento em multi-escalas e aprimoramento de dados para melhorar sua precisão e gerenciar oclusões. Seu objetivo é encontrar um equilíbrio entre precisão e velocidade, tornando-o adequado para tarefas de detecção de objetos em tempo real. O YOLOv8 é amplamente utilizado em pesquisas e aplicações de visão computacional devido ao seu desempenho competitivo e tempos de inferência rápidos.

## 2. Dataset



Para o retreinamento do modelo Yolo v8 foi utilizado um banco de imagens com rachaduras em paredes de concreto. O dataset foi disponibilizado pela Roboflow e pode ser encontrado [aqui](https://universe.roboflow.com/university-bswxt/crack-bphdr/dataset/2). O dataset contém 4100 imagens de rachaduras em paredes de contreto já anotadas no formato Yolo.

## 3. Retreinamento do modelo

A fim de tornarmos o modelo Yolo v8 capaz de reconhecer rachaduras, foi necessário retreiná-lo com o dataset disponibilizado pela Roboflow. Para isso, foi utilizado o código disponibilizado pelo repositório [ultralytics/yolov5]

In [1]:
# Instalando YOLOv8
!pip install ultralytics  

Defaulting to user installation because normal site-packages is not writeable


In [2]:
# Importando os dados de https://universe.roboflow.com/university-bswxt/crack-bphdr/dataset/2
!pip install roboflow

Defaulting to user installation because normal site-packages is not writeable


In [3]:
YOUR_API_KEY =  "YOUR_API_KEY" # Coloque sua chave de API aqui, que pode ser encontrada em https://app.roboflow.com/account/api-key

In [4]:
from roboflow import Roboflow

rf = Roboflow(api_key=YOUR_API_KEY)
project = rf.workspace("university-bswxt").project("crack-bphdr")
dataset = project.version(2).download("yolov8")

# Após baixar os dados, lembre de mudar em /content/crack-2/data.yaml os paths de 'test', 'train', 'val'

loading Roboflow workspace...
loading Roboflow project...
Dependency ultralytics<=8.0.20 is required but found version=8.0.109, to fix: `pip install ultralytics<=8.0.20`
Downloading Dataset Version Zip in crack-2 to yolov8: 100% [142154958 / 142154958] bytes


Extracting Dataset Version Zip to crack-2 in yolov8:: 100%|██████████| 8070/8070 [00:00<00:00, 9159.94it/s] 


In [8]:
# Treinando o modelo
!yolo train data=/home/pi/modulo_6/git_modulo_6/Questoes-Trabalhos-Inteli-M6-Luiz-Borges/ponderada3/crack-2/data.yaml model=yolov8n.pt epochs=10 lr0=0.01    

New https://pypi.org/project/ultralytics/8.0.112 available 😃 Update with 'pip install -U ultralytics'
Ultralytics YOLOv8.0.109 🚀 Python-3.10.6 torch-2.0.1+cu117 CPU
[34m[1myolo/engine/trainer: [0mtask=detect, mode=train, model=yolov8n.pt, data=/home/pi/modulo_6/git_modulo_6/Questoes-Trabalhos-Inteli-M6-Luiz-Borges/ponderada3/crack-2/data.yaml, epochs=10, patience=50, batch=16, imgsz=640, save=True, save_period=-1, cache=False, device=None, workers=8, project=None, name=None, exist_ok=False, pretrained=False, optimizer=SGD, verbose=True, seed=0, deterministic=True, single_cls=False, rect=False, cos_lr=False, close_mosaic=0, resume=False, amp=True, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, split=val, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, show=False, save_txt=False, save_conf=False, save_crop=False, show_labels=True, show_conf=True, vid_stride=1, line_width=None, visualize=False, augment=False,

## 3. Resultados

Durante a o treinamento do modelo de reconhecimento de rachaduras empregado neste projeto, várias métricas de eficácia foram coletadas. Estas métricas tem o objetivo de mensurar a habilidade do modelo treinado em reconhecer padrões de rachaduras em imagens que não participaram de seu conjunto de treinamento, com o objetivo de não enviesar sua avaliação. Abaixo, a representação gráfica dessas métricas, bem como alguns exemplos de imagens de rachaduras que foram identificadas, com seus respectivos níveis de confiança de identificação, serão exibidas. 

Abaixo, encontra-se um exemplo de imagens do conjunto de teste tendo suas rachaduras reconhecidas pelo modelo, e seus respectivos níveis de confiança de classificação representados na região de interesse traçada.

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/predicoes_yolov8_rachaduras.png" width=70%> 
</p>

Tais testes foram obtidos por meio da separação randômica de 80% das imagens do banco de imagens de rachaduras para o treinamento e 20% para o teste do modelo. Portanto, considerando as 4.100 imagens do banco de imagens de rachaduras, as avaliações discutidas abaixo são com base no uso do modelo treinado com 3.280 imagens de rachaduras aplicados para o reconhecimento de 820 imagens previamente categorizadas como contendo uma rachadura.

Os resultados abaico podem não ser os mesmos que os presentes nas pastas gerados durante o último treinamento pois variáveis aleatórias são utilizadas durante o treinamento, como por exemplo na escolha dos dados dos conjuntos de treino e teste. Visando eliminar esta variável, os dados do último treinamento foram registrados na pasta /resultados_treinamento_yolov8.

### 3.1. Acurácia

A matriz de confusão normalizada abaixo representa uma visão geral da acurácia do modelo treinado para a tarefa de detecção de rachaduras. Ela mostra a parcela de verdadeiros positivos (rachaduras que foram corretamente identificadas como tais), verdadeiros negativos (fotos onde não havia rachaduras e, portanto, nenhuma rachadura foi identificada), falsos positivos (imagens que não continham rachaduras mas que o modelo identificou como imagem que continha uma rachadura) e, por fim, falsos negativos (imagens que continham rachaduras que não foram identificadas como tal pelo modelo). A matriz de confusão normalizada foi escolhida pois permite analisar proporção de cada tipo de possibilidade de predição relativa ao número de predições possíveis. 

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/matriz_confusao_normalizada.png" width=70%>
</p>

Com a análise da matriz de confusão gerada durante o treinamento do modelo apresentado, é possível notar que este foi capaz de identificar imagens com rachaduras com 80% de acurácia. Ou seja, das 820 imagens com categorização conhecida como contendo uma rachadura, 656 foram identificadas corretamente pelo modelo como contendo uma rachadura e 164 imagens contendo uma rachadura não foram identificadas pelo modelo.

### 3.2. Curva precisão-confiabilidade

Na curva de precisão-confiabilidade representada abaixo, temos a demonstração que um valor maior de precisão implica em uma taxa menor de falsos positivos, isto é, imagens que não contém rachaduras mas que são classificadas como tal. Desta forma, o modelo teria uma menor chance de identificar rachaduras em áreas que não as apresentam. 

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/precisao_confiabilidade.png" width=70%>
</p>

No contexto deste projeto, o limitar entre a precisão e confiabilidade pode ser escolhido admitindo a premissa de que é mais maléfico deixar de identificar uma rachadura como tal do que não identificar uma rachadura. 

### 3.3. Curva precisão-sensibilidade 

Esta curva demonstra como o aumento do limiar de detecção afeta a precisão e a sensibilidade simultaneamente. Uma maior taxa de precisão indicaria uma taxa menor de alarmes falsos, enquanto uma maior sensibilidade, implica no aumento do sucesso do modelo na identificação de imagens que contenham rachaduras. 

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/precisao_sensibilidade.png" width=70%>
</p>

Como discutido na curva de precisão e confiabilidade, o limitar entre a precisão e sensibilidade pode ser escolhido admitindo a premissa de que é mais maléfico deixar de identificar uma rachadura como tal do que não identificar uma rachadura. 

### 3.4. Curva sensibilidade-confiança

Também conhecida como curva de recall ou revocação, a curva abaixo estabelece uma relação entre o limiar para a detecção de rachaduras e a confiabilidade, ou assertividade, que o modelo tem ao dizer que uma determinada imagem contem uma rachadura. Desta forma, é possível observar a variação na confiabilidade do modelo na detecção das rachaduras de acordo com diferentes limiares. Um valor de confiabilidade maior implicará em uma taxa reduzida de falsos negativos. Nesta configuração, o modelo treinado dificilmente deixará de classificar uma imagem como contendo uma rachadura. Por outro lado, uma sensibilidade muito grande pode aumentar a presença de falsos positivos.

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/sensibilidade_confianca.png" width=70%>
</p>

No caso da curva de sensibilidade para o modelo treinado, o limiar foi escolhido pelas próprias configurações do modelo. Este limitar se demostrou ser o do vértice presente na região entre 60 e 80% de sensibilidade e confiança.

### 3.5 Curva F1-confiança
 
Para a curva do Score F1, representa-se a variação do score F1 ao longo de vários limiares. O Score F1 é calculado levando em consideração a otimização entre a acurácia e a sensibilidade do modelo. A avaliação deste tipo de métrica é importante no cenário onde treinamos modelos que possuem classes desbalanceadas. Para oferecer uma métrica que considere a proporção das classes oferecidas, a Pontuação F1 combina a precisão e sensibilidade em uma média harmônica. Desta forma, a maximização desta métrica significa a maximização de ambas as métricas.

<p align="center">
<img src="../ponderada3/resultados_treinamento_yolov8/f1_confianca.png" width=70%>
</p>

Acima, está a representação da relação entre a Pontuação F1 e confiabilidade do modelo treinado.

### 3.6. Aplicação do modelo em tempo real

Para testar as capacidades do modelo treinado de reconhecer rachaduras em suscetivos frames de vídeo sendo capturados por uma webcam, o método predict do modelo foi aplicado, inserindo como parâmetro a fonte de vídeo correspondente da webcam (0). 

In [None]:
#Import the libraries
from ultralytics import YOLO #import the YOLO model
import cv2 #import opencv

model = YOLO("../resultado_treinamento_yolov8/model.pt") #load the model
model.predict(source="0", show = True, conf=0.5) #predict only images with a confidence of 50% and show the image

O resultado desta predição pode ser visto no vídeo abaixo:

In [6]:
from IPython.display import HTML

HTML("""
    <video alt="test" controls>
        <source src="./resultados_treinamento_yolov8/demonstracao_yolov8_rachaduras_reduced.mp4" type="video/mp4">
    </video>
""")

## 4. Conclusão

O modelo treinado foi capaz de identificar rachaduras em imagens com 80% de acurácia. A partir da análise das curvas de precisão-confiabilidade, precisão-sensibilidade, sensibilidade-confiança e F1-confiança, foi possível determinar o limiar de detecção do modelo treinado. Este limiar foi escolhido pelas próprias configurações do modelo, sendo o do vértice presente na região entre 60 e 80% de sensibilidade e confiança. Com a demonstração da aplicação do modelo em tempo real, foi possível observar que o modelo treinado é capaz de identificar rachaduras em imagens capturadas por uma webcam.