# Desafio Pr√°tico de Machine Learning
***
> Solu√ß√£o feita por Alysson Machado de Oliveira Barbosa

### Instru√ß√µes do Desafio
***

1. Escreva um algoritmo em Python que realize o treinamento de um modelo para a detec√ß√£o de torres de energia e linhas de energia em imagens.
2. Siga as instru√ß√µes do reposit√≥rio para extra√ß√£o de r√≥tulos no formato [COCO dataset](https://cocodataset.org/#home). Utilize imagens de tamanho 640 x 360.
3. Respeite a divis√£o da base de dados quanto aos conjuntos de treino, valida√ß√£o e teste.
4. Atente-se a um c√≥digo limpo, organizado, documentado e com ideias claras da solu√ß√£o proposta.
5. Caso mais de um modelo seja produzido, comente sobre os resultados obtidos, explicitando qual deles funcionou melhor e o porqu√™.
6. Na falta de uma GPU para o treinamento, recomenda-se o uso do Kaggle ou do Google Colab

![imagem-capa](imagens-ilustrativas/imagem-capa.jpeg)
> Segmenta√ß√£o por inst√¢ncia de torres de energia e linhas de for√ßa.

## Abordagem do Problema
***

* ```Arquitetura Utilizada```: **YoloV8**.

A YOLOv8 √© um modelo de rede neural utilizado para resolver problemas de segmenta√ß√£o por inst√¢ncia e detec√ß√£o de objetos de forma simult√¢nea. YOLO, que significa "*You Only Look Once*", √© uma abordagem de detec√ß√£o de objetos em tempo real que opera diretamente em uma imagem inteira, em vez de dividir a imagem em regi√µes menores, como outros m√©todos. O YOLOv8 √© uma vers√£o aprimorada que utiliza uma arquitetura de rede neural convolucional profunda para detectar e segmentar objetos em uma imagem, atribuindo r√≥tulos e coordenadas de caixa delimitadora a cada objeto encontrado. Essa abordagem oferece uma detec√ß√£o r√°pida e eficiente de objetos em tempo real, sendo amplamente utilizado em aplica√ß√µes de vigil√¢ncia, automa√ß√£o industrial, ve√≠culos aut√¥nomos e outras √°reas onde a detec√ß√£o de objetos √© essencial.

* ```Servidor para treinar o modelo```: **Google Colab (GPU Tesla T4)**.

## An√°lise do Dataset
****

* ```Dataset utilizado```: [TTPLA: An Aerial-Image Dataset for Detection and Segmentation of Transmission Towers and Power Lines](https://github.com/R3ab/ttpla_dataset).

O dataset TTPLA cont√©m imagens a√©reas de torres e linhas de transmiss√£o. Cada imagem possui anota√ß√µes de segmenta√ß√£o poligonal dos objetos em an√°lise, organizada em arquivos ```.json``` no formato [Coco Dataset](https://cocodataset.org/#home).

## Prepara√ß√£o dos Dados
***

#### 1. Redimensionamento das imagens

O dataset original foi obtido atrav√©s do Google Drive, disponibilizado pelos criadores no GitHub, na qual o mesmo pode ser obtidos [clicando aqui](https://drive.google.com/uc?export=download&confirm=no_antivirus&id=1Yz59yXCiPKS0_X4K3x9mW22NLnxjvrr0). Esse dataset foi adicionada a pasta ```dataset-original```. 

Em seguida, o script localizado em ```scripts/resize_image_and_annotation.py``` foi modificado para que fosse poss√≠vel redimensionar as imagens do dataset para um tamanho de 640x360.   

A partir do script ```scripts/resize_image_and_annotation.py```, foi utilizado o seguinte c√≥digo na linha de comando para que uma nova pasta fosse gerada com os c√≥digos redimensionados:

```
python resize_image_and_annotation-final.py -t dataset-original/
```

A nova pasta com as imagens redimensionadas foi renomeada para ```dados-redimensionados/```.


#### 2. Remo√ß√£o de dados rotulados em vazio

Para evitar que problemas fossem obtidos durante a etapa de treinamento, imagens que cont√™m regi√µes sem r√≥tulo definido foram removidas. Foi utilizado o script localizado em ```scripts/remove_void.py``` para resolver esse problema, atrav√©s do seguinte c√≥digo de comando:

```
python remove_void.py -t dados-redimensionados/
```

A nova pasta com os arquivos ```.json``` corrigidos foi renomeada para ```jsons-corrigidos/```.

#### 3. Divis√£o do dataset em treinamento/valida√ß√£o/teste

Utilizando a sugest√£o de divis√£o dos dados, armazenados em arquivos ```.txt``` em estratos de treinamento, valida√ß√£o e teste, em uma aproxima√ß√£o respectiva de 70%, 10% e 20%, respectivamente, localizada na pasta ```guia-estratificacao-arquivos/```, o script ```scripts/split_jsons.py``` foi utilizado para resolver esse problema. O seguinte c√≥digo de comando foi utilizado:

```
python split_jsons.py -t jsons-corrigidos/
```

A nova pasta com os arquivos ```.json``` estratificados foi renomeada para ```jsons-estratificados/```.

#### 4. Remo√ß√£o de imagens com rotula√ß√µes problem√°ticas

Para verificar se todas as imagens est√£o de fato no padr√£o [Coco Dataset](https://cocodataset.org/#home), para serem utilizadas no padr√£o de treinamento de uma arquitetura Yolo, por exemplo, o seguinte script localizado em ```scripts/labelme2coco_2.py``` foi utilizado para realizar essa verifica√ß√£o. O procedimento consistiu em modificar esse script definido pelos criadores do dataset, que tinha o objetivo prim√°rio de alterar os r√≥tulos para o padr√£o da arquitetura ```YoloAct```, para que ele retornasse o caminho relativo da imagem que fazia o c√≥digo n√£o conseguir realizar essa convers√£o, de modo que o mesmo n√£o fosse compilado devido a uma mensagem de erro. Dessa forma, todas as imagens problem√°ticas (em torno de 16 imagens) foram exclu√≠das.

```
python labelme2coco_2.py jsons-estratificados/jsons-treinamento
python labelme2coco_2.py jsons-estratificados/jsons-validacao
python labelme2coco_2.py jsons-estratificados/jsons-teste
```

#### 5. Upload do dataset no RoboFlow para ser utilizado no Google Colab

Devido a limita√ß√µes t√©cnicas em meu computador pessoal, o Google Colab foi o servidor escolhido para treinar o modelo de detec√ß√£o e segmenta√ß√£o por inst√¢ncia no YoloV8 utilizando o dataset pr√©-processado TTPLA. No Google Colab, uma GPU do tipos Tesla T4 foi utilizada.

O dataset pr√©-processado foi colocado no RoboFlow por tr√™s motivos:
1. Facilidade para baix√°-lo utilizando c√≥digo em Python pelo Google Colab;
2. F√°cil reuso toda vez que uma nova sess√£o no servidor do Google Colab for criada;
3. Convers√£o f√°cil do dataset organizado no estilo do [Coco Dataset](https://cocodataset.org/#home) para o estilo do YoloV8;

O dataset pr√©-processado para cumprir com os requisitos do ICTS podem ser baixados pelo link: 
* [https://universe.roboflow.com/alysson-machado/ttpla-qx1sw](https://universe.roboflow.com/alysson-machado/ttpla-qx1sw).

![marcacao-exemplo1](imagens-ilustrativas/marcacao-exemplo1.jpeg)
> Imagen marcada e pr√©-processada no formato solicitado pelo desafio do ICTS.

![marcacao-exemplo2](imagens-ilustrativas/marcacao-exemplo2.jpeg)
> Imagen marcada e pr√©-processada no formato solicitado pelo desafio do ICTS.

## Prepara√ß√£o do Ambiente de Treinamento
***

In [1]:
# verificando a disponibilidade de GPU do Google Colab
!nvidia-smi

Sun Jun 18 18:04:39 2023       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.85.12    Driver Version: 525.85.12    CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   39C    P8     9W /  70W |      0MiB / 15360MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Proces

In [2]:
# verificando o diret√≥rio atual de trabalho do Google Colab
import os
HOME = os.getcwd()
print(HOME)

/content


In [3]:
# instalando pelo pip a arquitetura da YoloV8
!pip install ultralytics==8.0.28
# limpando a c√©lula do Jupyter com as informa√ß√µes de instala√ß√£o do pacote
from IPython import display
display.clear_output()
# verificando o status da instala√ß√£o do pacote e compatibilidade com o servidor
import ultralytics
ultralytics.checks()

Ultralytics YOLOv8.0.28 üöÄ Python-3.10.12 torch-2.0.1+cu118 CUDA:0 (Tesla T4, 15102MiB)
Setup complete ‚úÖ (2 CPUs, 12.7 GB RAM, 24.1/78.2 GB disk)


In [4]:
# importando a arquitetura YoloV8 do pacote ultralytics
from ultralytics import YOLO
from IPython.display import display, Image

## Baixando o Dataset Pr√©-processado no Servidor do Jupyter
***

In [5]:
# criando um diret√≥rio para baixar o dataset importado do roboflow
!mkdir {HOME}/datasets
%cd {HOME}/datasets

# instalando os pacotes do roboflow para fazer a conex√£o com a API
!pip install roboflow --quiet
from roboflow import Roboflow

# conectando com a API do RoboFlow para baixar o dataset pr√©-processado 
# OBS: por motivos did√°ticos, deixarei explicita a chave de acesso para a API 
# de download do dataset que fiz upload para o site, mas normalmente eu n√£o constumo
# upar essa informa√ß√£o sens√≠vel em reposit√≥rios abertos
rf = Roboflow(api_key="xhUBoRw9sdlgzMz1Zw0Y")
project = rf.workspace("alysson-machado").project("ttpla-qx1sw")
dataset = project.version(1).download("yolov8")

/content/datasets
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m56.3/56.3 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m58.8/58.8 kB[0m [31m7.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m67.8/67.8 kB[0m [31m7.8 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m54.5/54.5 kB[0m [31m8.2 MB/s[0m eta [36m0:00:00[0m
[?25h  Building wheel for wget (setup.py) ... [?25l[?25hdone
loading Roboflow workspace...
loading Roboflow project...
D

Extracting Dataset Version Zip to TTPLA-1 in yolov8:: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 4780/4780 [00:02<00:00, 2204.34it/s]


## Treinando a Arquitetura da YoloV8
***

In [6]:
%cd {HOME}
# detalhes da linha de comando:
# 'task=segment' -> informar a arquitetura que os dados de treinamento est√£o organizados no padr√£o de segmenta√ß√£o
# 'mode=train' -> informar que a arquitetura pr√©-treinada vai ser retreinada utilizando transfer√™ncia de aprendizado
# 'model=yolov8x-seg.pt' -> informar que a arquitetura a ser retreinada √© do tipo x, da mais robusta
# 'data={dataset.location}/data.yaml' -> passa a informa√ß√£o da localiza√ß√£o do dataset formatado
# 'epochs=30' -> define a quantidade de √©pocas de treinamento 
# 'imgsz=640' -> informa que a arquitetura a ser retreinada √© para o padr√£o 640x360

!yolo task=segment mode=train model=yolov8x-seg.pt data={dataset.location}/data.yaml epochs=30 imgsz=640

/content
Downloading https://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8x-seg.pt to yolov8x-seg.pt...
100% 137M/137M [00:07<00:00, 18.3MB/s]
Ultralytics YOLOv8.0.28 üöÄ Python-3.10.12 torch-2.0.1+cu118 CUDA:0 (Tesla T4, 15102MiB)
[34m[1myolo/engine/trainer: [0mtask=segment, mode=train, model=yolov8x-seg.pt, data=/content/datasets/TTPLA-1/data.yaml, epochs=30, patience=50, batch=16, imgsz=640, save=True, cache=False, device=None, workers=8, project=None, name=None, exist_ok=False, pretrained=False, optimizer=SGD, verbose=True, seed=0, deterministic=True, single_cls=False, image_weights=False, rect=False, cos_lr=False, close_mosaic=10, resume=False, overlap_mask=True, mask_ratio=4, dropout=0.0, val=True, save_json=False, save_hybrid=False, conf=None, iou=0.7, max_det=300, half=False, dnn=False, plots=True, source=None, show=False, save_txt=False, save_conf=False, save_crop=False, hide_labels=False, hide_conf=False, vid_stride=1, line_thickness=3, visualize=False, au

O modelo treinado foi adicionado a pasta ```modelo-treinado/```.

## An√°lise do Modelo Treinado
***

Diversos gr√°ficos para os dados de treinamento e valida√ß√£o foram adicionadas a pasta ```metricas-avaliativas/``` para melhor an√°lise. Nesses gr√°ficos, √© contemplado em mais detalhes a performace da capacidade de detec√ß√£o de objetos e segmenta√ß√£o, utilizando m√©tricas avaliativos como precis√£o, sensibilidade e F1-score.

![metricas](metricas-avaliativas/dados-treinamento/results.png)

Com base nos resultados obtidos, o modelo treinado apresenta alguns pontos fortes e pontos fracos. No lado positivo, o modelo alcan√ßa uma precis√£o (```precision```) relativamente alta para detec√ß√£o de torres (0.85) e uma precis√£o moderada para detec√ß√£o de linhas de energia (0.61). Al√©m disso, a perda de caixa (```box loss```) e a perda de segmenta√ß√£o (```seg loss```) s√£o consistentemente reduzidas durante o treinamento, sugerindo que o modelo est√° aprendendo a localizar e segmentar com efici√™ncia esses elementos nas imagens a√©reas.

Por outro lado, existem algumas √°reas que podem ser melhoradas. Primeiramente, a perda de classifica√ß√£o (```cls loss```) e a perda de deslocamento de caracter√≠sticas (```dfl loss```) est√£o relativamente altas em compara√ß√£o com as outras perdas. Isso pode indicar que o modelo est√° tendo dificuldade em classificar corretamente as torres e linhas de energia, bem como em realizar ajustes finos de localiza√ß√£o. Al√©m disso, as m√©tricas de recall (```recall```) para ambos os objetos s√£o baixas, indicando que o modelo est√° deixando de detectar algumas inst√¢ncias de torres e linhas de energia.

Para melhorar o modelo, algumas sugest√µes podem ser consideradas. Primeiramente, √© recomend√°vel aumentar o tamanho do conjunto de treinamento, adicionando mais exemplos de torres e linhas de energia em diferentes contextos e condi√ß√µes de ilumina√ß√£o. Isso ajudar√° o modelo a generalizar melhor para casos mais diversos. Al√©m disso, ajustar os hiperpar√¢metros do modelo, como a taxa de aprendizado e o tamanho do lote, pode levar a melhorias adicionais no desempenho. Tamb√©m pode ser √∫til explorar t√©cnicas de aumento de dados, como rota√ß√µes e espelhamentos, para fornecer ao modelo uma maior variedade de exemplos durante o treinamento. Por fim, realizar uma an√°lise mais detalhada dos falsos positivos e falsos negativos durante a valida√ß√£o pode ser √∫til para melhorar a qualidade geral das detec√ß√µes.

In [7]:
# listando as imagens com as m√©tricas quantitativas e qualitativas obtidas a respeito do treinamento
# mais detalhes dessas m√©tricas avaliativas est√£o dispon√≠veis na pasta 'metricas-avaliativas/'
!ls {HOME}/runs/segment/train/

args.yaml					    train_batch0.jpg
BoxF1_curve.png					    train_batch1.jpg
BoxP_curve.png					    train_batch2100.jpg
BoxPR_curve.png					    train_batch2101.jpg
BoxR_curve.png					    train_batch2102.jpg
confusion_matrix.png				    train_batch2.jpg
events.out.tfevents.1687111713.32e5e3524560.1712.0  val_batch0_labels.jpg
MaskF1_curve.png				    val_batch0_pred.jpg
MaskP_curve.png					    val_batch1_labels.jpg
MaskPR_curve.png				    val_batch1_pred.jpg
MaskR_curve.png					    val_batch2_labels.jpg
results.csv					    val_batch2_pred.jpg
results.png					    weights


## Infer√™ncias nos Dados de Teste e em V√≠deos
***

In [None]:
# realizando uma predi√ß√£o em um v√≠deo de exemplo baixado do YouTube
%cd {HOME}
!yolo task=segment mode=predict model={HOME}/runs/segment/train/weights/best.pt conf=0.25 source='/content/video-example.mp4' save=true

In [None]:
# realizando uma predi√ß√£o em um v√≠deo de exemplo baixado do YouTube
%cd {HOME}
!yolo task=segment mode=predict model={HOME}/runs/segment/train/weights/best.pt conf=0.25 source='/content/video-example2.mp4' save=true

In [None]:
# realizando uma predi√ß√£o em um v√≠deo de exemplo baixado do YouTube
%cd {HOME}
!yolo task=segment mode=predict model={HOME}/runs/segment/train/weights/best.pt conf=0.25 source='/content/video-example3.mp4' save=true

In [None]:
# realizando a predi√ß√£o nos dados selecionados como teste
%cd {HOME}
!yolo task=segment mode=predict model={HOME}/runs/segment/train/weights/best.pt conf=0.25 source={dataset.location}/test/images save=true

#### 1. V√≠deos de Exemplo

A seguir, √© poss√≠vel analisar os resultados obtidos com a predi√ß√£o feita nos tr√™s v√≠deos selecionados. Os v√≠deos est√£o localizados na pasta ```resultados-videos/``` e tamb√©m os coloquei no YouTube para maior facilidade de an√°lise:

* Primeiro V√≠deo: [https://youtu.be/QyB5Sq-Rt_A](https://youtu.be/QyB5Sq-Rt_A)
* Segundo V√≠deo: [https://youtu.be/5booA-m-5Ns](https://youtu.be/5booA-m-5Ns)
* Terceiro V√≠deo: [https://youtu.be/KNTggwp_2WI](https://youtu.be/KNTggwp_2WI)

#### 2. Imagens do Conjunto de Teste

A seguir, √© poss√≠vel visualizar o resultado de algumas imagens dispon√≠veis no conjunto de teste. Mais imagens podem ser visualizadas na pasta ```resultados-teste/```.

|     |     |
| ----------- | ----------- |
| ![Imagem 1](resultados-teste/13_00263.rf.31bff92f2ab0cea9e341544b6749bbdc.jpg)  | ![Imagem 2](resultados-teste/16_3450.rf.2bdf90684515866182ec4c154579e982.jpg)  |
| ![Imagem 3](resultados-teste/19_00563.rf.00e9332d2073d6b790cfcdc05693d95d.jpg)  | ![Imagem 4](resultados-teste/19_00934.rf.54bf10bc96f149536fb23f9e7fa65df5.jpg)  |
| ![Imagem 5](resultados-teste/31_7785.rf.8a631e630477fea86c5d5ea8d32d1d45.jpg)  | ![Imagem 6](resultados-teste/33_7020.rf.e2d7ef6a43ad603718d17ef6e69df2a9.jpg)  |
