# Analise e Exploração de Imagens com OpenCV

### OpenCV (Open Source Computer Vision Library), se traduzirmos significa algo como biblioteca de visão computacional de código aberto. Foi desenvolvida pela Intel, é uma biblioteca multiplataforma, código aberto, para o desenvolvimento de aplicativos na área de visão computacional, podendo ser utilizada bastando seguir o modelo de licença BSD Intel.

Lendo uma imagem de um diretório: 
O Google Colab já tem o opencv, basta apenas importar a biblioteca imshow para conseguir visualizar a imagem.

In [40]:
import numpy as np
import cv2
from google.colab.patches import cv2_imshow

In [45]:
#cv2.imread é a função para abrir uma imagem, passando o nome da imagem e o parametro da cor -  será aberto em escala de cinza (0)
img = cv2.imread('0001.JPG',0) 

In [None]:
cv2_imshow(img) #exibir a imagem
# cv2.imshow(img) usar esses comandos caso use o pc, o colab já entrega o imshow
# cv2.waitKey(0)
# cv2.destroyAllWindows()

In [None]:
#Salvar a imagem em disco
cv2.imwrite('001_grey.JPG',img) #salvou a imagem renomeada e  salvou em escala cinza (matriz) 

#Preparando o dataset para o treinamento da rede neural

Após anotação das imagens com o CVAT (https://cvat.org/), é hora de subir os arquivos para o drive e divir o dataset entre treino e teste para ser usado no modelo.

In [2]:
#Conexão com o google drive
from google.colab import drive
drive.mount('/content/gdrive')

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).


In [3]:
!mkdir data/ #cria o diretorio data para armazenar o dataset no ambiente do Colab

!cp /content/gdrive/MyDrive/datasets/canoapolinesia.zip /content/data/ #copia o dataset gerado manualmente do google drive para o Colab

%cd data/
!unzip datasetcanoa.zip #descompacta o arquivo de imagem .zip dentro do /data do Colab

%cd ..

cp: cannot stat '/content/gdrive/MyDrive/datasets/canoapolinesia.zip': No such file or directory
/data
unzip:  cannot find or open datasetcanoa.zip, datasetcanoa.zip.zip or datasetcanoa.zip.ZIP.
/


Script em python para trabalhar com o dataset do drive que já está com as anotações dos boundingboxes. 

In [None]:
#importando as bibliotecas para trabalhar na divisão do dataset

import os
import numpy as np
import shutil
from shutil import copy
import os
import ntpath

#variaveis para receber o split do dataset em treino e teste
inputdir = 'data/canoapolinesia'
train = 'data/train/'
test = 'data/test/'

#condição que valida se o diretorio train existe, caso não, ele cria com a função os.makedirs
if not os.path.exists(train):
    os.makedirs(train)

if not os.path.exists(test):
    os.makedirs(test)

allFileImages = []

#loop para varrer o dataset e preencher o array allFileImages avaliando também se as fotos terminam com a extensão jpg
for file in os.listdir(inputdir):
    if file.endswith(".JPG"):
        allFileImages.append(os.path.join(inputdir, file))

np.random.shuffle(allFileImages)

#Função para escolher 80% do data set para o conjunto de treino e 20% restante para teste
train_FileNames, test_FileNames = np.split(np.array(allFileImages),[int(len(allFileImages)*0.80)])

train_FileNames = [ntpath.basename(name) for name in train_FileNames]
test_FileNames = [ntpath.basename(name) for name in test_FileNames]

for img in train_FileNames:
    shutil.copyfile(os.path.join(inputdir, img), os.path.join(train, img))
    shutil.copyfile(os.path.join(inputdir, '{}.txt'.format(img[:-4])), os.path.join(train, '{}.txt'.format(img[:-4])))

for img in test_FileNames:
    shutil.copyfile(os.path.join(inputdir, img), os.path.join(test, img))
    shutil.copyfile(os.path.join(inputdir, '{}.txt'.format(img[:-4])), os.path.join(test, '{}.txt'.format(img[:-4])))

#imprime na tela a quantidade geral do dataset e a quantidade de cada conjunto, treino e teste.
print(len(allFileImages))
print(len(train_FileNames))
print(len(test_FileNames))

In [None]:
#verificar quantos arquivos em cada divisão
!ls data/train/*.jpg | wc -l
!ls data/test/*.jpg | wc -l

In [None]:
#verificando quantos arquivos notados tenho para cada divisão. Esse numero precisa bater com a quantidade de imagens!
!ls data/train/*.txt | wc -l
!ls data/test/*.txt | wc -l

In [None]:
#zipando os arquivos
%cd data/
!zip -r yolov4-dataset_train.zip train/
!zip -r yolov4-dataset_test.zip test/

In [None]:
#cópia o dataset gerado para o google drive. Deve-se criar a pasta datasets antes no drive.
cp yolov4-dataset_train.zip /content/gdrive/MyDrive/datasets/
!cp yolov4-dataset_test.zip /content/gdrive/MyDrive/datasets/

##Configuração do YOLOV4 - DARKNET no Colab de acordo com a orientação do Alexey repo (https://github.com/AlexeyAB/darknet)


### Validando o ambiente de execução em GPU
Clique no menu Ambiente de execução -> Alterar o tipo de ambiente de execução e selecione GPU.

In [11]:
# clone darknet repo
!git clone https://github.com/AlexeyAB/darknet

fatal: destination path 'darknet' already exists and is not an empty directory.


In [6]:
# change makefile to have GPU and OPENCV enabled
%cd darknet
!sed -i 's/OPENCV=0/OPENCV=1/' Makefile
!sed -i 's/GPU=0/GPU=1/' Makefile
!sed -i 's/CUDNN=0/CUDNN=1/' Makefile
!sed -i 's/CUDNN_HALF=0/CUDNN_HALF=1/' Makefile

/darknet


In [7]:
# verificando o CUDA
!/usr/local/cuda/bin/nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Oct_12_20:09:46_PDT_2020
Cuda compilation tools, release 11.1, V11.1.105
Build cuda_11.1.TC455_06.29190527_0


In [8]:
# Checando qual GPU  foi disponibilizada 
!nvcc --version
!nvidia-smi

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Mon_Oct_12_20:09:46_PDT_2020
Cuda compilation tools, release 11.1, V11.1.105
Build cuda_11.1.TC455_06.29190527_0
Wed Sep  7 22:45:51 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.32.03    Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|   0  Tesla P100-PCIE...  Off  | 00000000:00:04.0 Off |                    0 |
| N/A   37C    P0    26W / 250W |      0MiB / 16280MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+------------

In [None]:
# make darknet (builds darknet so that you can then use the darknet executable file to run or train object detectors)
!make

#Baixando a rede pré treinada 

Modelo treinado indicado pelo Alexey, A maioria das aplicações de machine learning para detecção de objetos em imagens fazem uso de modelos pré-treinados, ou seja, usam somente os pesos (weights) desses modelos treinados por alguem e realizam suas previsões.

Usar modelos pré-treinados acelera muito a aplicação desse tipo de coisa, pois afinal, não é necessário possuir um grande conjunto de imagens e nem perder horas e horas treinando o seu próprio modelo.

Na implementação do YOLOV4 foi utilizado o dataset do coco Microsoft, que possui mais de 80 classes.

In [13]:
%cd /content/darknet

[Errno 2] No such file or directory: '/content/darknet'
/darknet


In [12]:
#exemplo de uma rede já treinada
!wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.weights

--2022-09-07 22:49:07--  https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.weights
Resolving github.com (github.com)... 140.82.121.3
Connecting to github.com (github.com)|140.82.121.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/ba4b6380-889c-11ea-9751-f994f5961796?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20220907%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20220907T224907Z&X-Amz-Expires=300&X-Amz-Signature=47488cc84e17ffd070349e43133382116ce15049c3d96b9b8db8443f6eefcead&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=75388965&response-content-disposition=attachment%3B%20filename%3Dyolov4.weights&response-content-type=application%2Foctet-stream [following]
--2022-09-07 22:49:07--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/75388965/ba4b6380-889c-11ea-9751-f994f5961

Funções pré definidas para facilitar a visualização de imagen no ambiente do colab, indicadas pelo Alexey.




In [14]:
# define helper functions
def imShow(path):
  import cv2
  import matplotlib.pyplot as plt
  %matplotlib inline

  image = cv2.imread(path)
  height, width = image.shape[:2]
  resized_image = cv2.resize(image,(3*width, 3*height), interpolation = cv2.INTER_CUBIC)

  fig = plt.gcf()
  fig.set_size_inches(18, 10)
  plt.axis("off")
  plt.imshow(cv2.cvtColor(resized_image, cv2.COLOR_BGR2RGB))
  plt.show()

# use this to upload files
def upload():
  from google.colab import files
  uploaded = files.upload() 
  for name, data in uploaded.items():
    with open(name, 'wb') as f:
      f.write(data)
      print ('saved file', name)

# use this to download a file  
def download(path):
  from google.colab import files
  files.download(path)

#Detectando os objetos Remo, Remador e Canoa com o YOLO


In [16]:
#montando o drive no ambiente do colab
%cd ..
from google.colab import drive
drive.mount('/content/gdrive')

/
Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).


In [22]:
#Listar o conteúdo do meu google drive
!ls  /content/gdrive/MyDrive/datasets

backup		   images     yolov4-dataset_test.zip
datasetcanoa.zip   obj.data   yolov4-dataset_train.zip
generate_test.py   obj.names  yolov4-obj.cfg
generate_train.py  weight


In [23]:
#abrindo o darknet
%cd /darknet

/darknet


In [24]:
# copy over both datasets into the root directory of the Colab VM (comment out test.zip if you are not using a validation dataset)
!cp /content/gdrive/MyDrive/datasets/yolov4-dataset_train.zip data/
!cp /content/gdrive/MyDrive/datasets/yolov4-dataset_test.zip data/

In [None]:
# unzip the datasets and their contents so that they are now in /darknet/data/ folder
!unzip data/yolov4-dataset_train.zip -d data/
!unzip data/yolov4-dataset_test.zip -d data/

Configurando a rede


In [26]:
# upload the obj.names and obj.data files to cloud VM from Google Drive
!cp /content/gdrive/MyDrive/datasets/obj.names data/
!cp /content/gdrive/MyDrive/datasets/obj.data data/

In [27]:
# baixando o arquivo cfg para o drive e alterando o nome caso esteja rodando pela orimeira vez
!mv cfg/yolov4-custom.cfg cfg/yolov4-obj.cfg
!cp cfg/yolov4-obj.cfg /content/gdrive/MyDrive/datasets/yolov4-obj.cfg

In [28]:
# Copiando o arquivo de configuração do Yolov4 para o colab
!cp /content/gdrive/MyDrive/datasets/yolov4-obj.cfg ./cfg

In [29]:
# upload the generate_train.py and generate_test.py script to cloud VM from Google Drive
!cp /content/gdrive/MyDrive/datasets/generate_train.py ./
!cp /content/gdrive/MyDrive/datasets/generate_test.py ./

In [30]:
!python generate_train.py
!python generate_test.py

In [31]:
!ls data

9k.tree      imagenet.labels.list      test
coco9k.map   imagenet.shortnames.list  test.txt
coco.names   labels		       train
dog.jpg      obj.data		       train.txt
eagle.jpg    obj.names		       voc.names
giraffe.jpg  openimages.names	       yolov4-dataset_test.zip
goal.txt     person.jpg		       yolov4-dataset_train.zip
horses.jpg   scream.jpg


In [32]:
%cd /content/darknet

[Errno 2] No such file or directory: '/content/darknet'
/darknet


In [33]:
# verify that the newly generated train.txt and test.txt can be seen in our darknet/data folder
!ls data/

9k.tree      imagenet.labels.list      test
coco9k.map   imagenet.shortnames.list  test.txt
coco.names   labels		       train
dog.jpg      obj.data		       train.txt
eagle.jpg    obj.names		       voc.names
giraffe.jpg  openimages.names	       yolov4-dataset_test.zip
goal.txt     person.jpg		       yolov4-dataset_train.zip
horses.jpg   scream.jpg


Baixando uma rede pré treinada para inicializar os pesos, pois caso tenha que treinar a rede do 0 irá demorar muito e o resultado pode ser ruim. O Alexey frisa bastante para usar a rede pré treinada para garantir bons resultados. 

In [None]:
!wget https://github.com/AlexeyAB/darknet/releases/download/darknet_yolo_v3_optimal/yolov4.conv.137

Criando um link simbolico com o drive para salvar os pesos da rede


In [None]:
# delete backup folder
!rm /content/darknet/backup -r

# create Symlinks so we can save trained weight in our Google Drive
# create folder weight/backup in your Drive to store trained weights

!ln -s /content/gdrive/MyDrive/datasets/weight/backup /content/darknet

Treinado o modelo passando os arquivos configurados e a rede pré treinada

In [None]:
!./darknet detector train  data/obj.data cfg/yolov4-custom.cfg yolov4.conv.137 -dont_show -map

In [None]:
# show chart.png of how custom object detector did with training
imShow('chart.png')

Continuando o treinamento caso o Colab derrube

In [None]:
# Caso o colab derrube a sessão, continuar daqui, onde fica salvo o ultimo peso no arquivo last.weights
!./darknet detector train data/obj.data cfg/yolov4-custom.cfg /content/gdrive/MyDrive/datasets/weight/backup/yolov4-obj_last.weights -dont_show

#Realizando Inferencia

Checking the Mean Average Precision (mAP) of Your Model
If you didn't run the training with the '-map- flag added then you can still find out the mAP of your model after training. Run the following command on any of the saved weights from the training to see the mAP value for that specific weight's file. I would suggest to run it on multiple of the saved weights to compare and find the weights with the highest mAP as that is the most accurate one!

NOTE: If you think your final weights file has overfitted then it is important to run these mAP commands to see if one of the previously saved weights is a more accurate model for your classes.

In [None]:
!./darknet detector map data/obj.data cfg/yolov4-obj.cfg /content/gdrive/MyDrive/datasets/weight/backup/yolov4-custom_1000.weights

#Teste de validação com uma imagem nova (que o modelo não conhece)

In [None]:
# need to set our custom cfg to test mode 
%cd cfg
!sed -i 's/batch=64/batch=1/' yolov4-obj.cfg
!sed -i 's/subdivisions=16/subdivisions=1/' yolov4-obj.cfg
%cd ..

In [None]:
# rodando o modelo e lendo uma imagem salva no /data do darknet ou pode passar o local do drive
# o parametro -thresh 0.3 significa que serão mostradas detecções de objetos acimda de 30% de acerto.
!./darknet detector test data/obj.data cfg/yolov4-obj.cfg /content/gdrive/MyDrive/datasets/weight/backup/yolov4-custom_last.weights /darknet/data/002.JPG -thresh 0.3
imShow('predictions.JPG')

#Estrategias que podem ser usadas para melhorar esse trabalho e resolver outros problemas:
* Data augumentation no conjunto de treino pra aumentar a taxa de acerto da rede - Obs: não alterar o conjunto de teste. 
* Deletar as imagens não anotadas do dataset (Essa ação pode corrigir o erro da biblioteca imShow que não está plotando as imagens e seus respectivos boudingboxes).
* Utilizar o a instalação local do CVAT com Docker. Otimiza o tempo das anotações e garante baixo custo e disponibilidade enquanto voce tiver disco.)
* Instancia do Google Colab Pro - Durante esse trabalho não foi possivel rodar a rede com agilidade e sem interrupções até o licenciamento do Colab para o Pro. 