# YOLOv4 - Como criar sua própria base de imagens

O nosso conjunto de imagens customizado para fazer o treinamento com o YOLO deve conter:

* Imagens dos objetos que queremos reconhecer, já catalogadas (com os arquivos annotation)
* Arquivos obj.data e obj.names
* Arquivo .cfg customizado
* Arquivo train.txt (test.txt é opcional)

Há duas maneiras principais para reunir as imagens
* Baixar de um dataset ou repositório como o Open Images Dataset, um dataset da Google que disponibiliza imagens para mais de 600 classes diferentes.
A maneira mais prática atualmente para baixar as imagens do Open Images Dataset é usar a ferramenta [OIDv4 Toolkit](https://github.com/EscVM/OIDv4_ToolKit).
* A segunda maneira consiste em baixar manualmente as imagens do objeto e catalogá-las utilizando alguma ferramenta de anotação (annotation tool) para obter os txt com as anotações. Esse é um processo manual e que pode ser bastante demorado, portanto recomendamos verificar se a classe escolhida não está no Dataset do Google. Se você não encontrou no Open Images Dataset o objeto que deseja detectar então é necessário baixar manualmente. Por ser um método mais demorado e cansativo nós recomendamos fazer somente caso não tiver outra maneira de conseguir facilmente baixar essa imagens.

# Coletando e catalogando as imagens do objeto para treinamento

## Etapa 1 - Clonando o repositório da ferramenta

In [1]:
!git clone https://github.com/EscVM/OIDv4_ToolKit.git

Cloning into 'OIDv4_ToolKit'...
remote: Enumerating objects: 422, done.[K
remote: Total 422 (delta 0), reused 0 (delta 0), pack-reused 422 (from 1)[K
Receiving objects: 100% (422/422), 34.08 MiB | 14.64 MiB/s, done.
Resolving deltas: 100% (146/146), done.


## Etapa 2 - Acessando o diretório da ferramenta

In [2]:
ls

[0m[01;34mOIDv4_ToolKit[0m/  [01;34msample_data[0m/


In [3]:
cd OIDv4_ToolKit/

/content/OIDv4_ToolKit


In [4]:
ls

classes.txt  [0m[01;34mimages[0m/  LICENSE  main.py  [01;34mmodules[0m/  README.md  requirements.txt


## Etapa 3 - Instalando todas as bibliotecas necessárias

In [None]:
!pip3 install -r requirements.txt

## Etapa 4 - Fazendo o download das imagens

### Conjunto de imagens de Treinamento

- https://storage.googleapis.com/openimages/web/index.html

In [6]:
# Carregar imagens da base de dados
# Carregando imangens para treino das classes Apple, Coffee_cup, Horse
# limit: Quantidade de imagens
# multiclasses: salva tudo na mesma pasta
!python main.py downloader --classes Apple Coffee_cup Horse --type_csv train --limit 500 --multiclasses 1

[92m
		   ___   _____  ______            _    _    
		 .'   `.|_   _||_   _ `.         | |  | |   
		/  .-.  \ | |    | | `. \ _   __ | |__| |_  
		| |   | | | |    | |  | |[ \ [  ]|____   _| 
		\  `-'  /_| |_  _| |_.' / \ \/ /     _| |_  
		 `.___.'|_____||______.'   \__/     |_____|
	[0m
[92m
             _____                    _                 _             
            (____ \                  | |               | |            
             _   \ \ ___  _ _ _ ____ | | ___   ____  _ | | ____  ____ 
            | |   | / _ \| | | |  _ \| |/ _ \ / _  |/ || |/ _  )/ ___)
            | |__/ / |_| | | | | | | | | |_| ( ( | ( (_| ( (/ /| |    
            |_____/ \___/ \____|_| |_|_|\___/ \_||_|\____|\____)_|    
                                                          
        [0m
    [INFO] | Downloading ['Apple', 'Coffee cup', 'Horse'] together.[0m
[91m   [ERROR] | Missing the class-descriptions-boxable.csv file.[0m
[94m[DOWNLOAD] | Do you want to download the missing file? 

### Conjunto de imagens de Validação

In [7]:
!python main.py downloader --classes Apple Coffee_cup Horse --type_csv test --limit 100 --multiclasses 1

[92m
		   ___   _____  ______            _    _    
		 .'   `.|_   _||_   _ `.         | |  | |   
		/  .-.  \ | |    | | `. \ _   __ | |__| |_  
		| |   | | | |    | |  | |[ \ [  ]|____   _| 
		\  `-'  /_| |_  _| |_.' / \ \/ /     _| |_  
		 `.___.'|_____||______.'   \__/     |_____|
	[0m
[92m
             _____                    _                 _             
            (____ \                  | |               | |            
             _   \ \ ___  _ _ _ ____ | | ___   ____  _ | | ____  ____ 
            | |   | / _ \| | | |  _ \| |/ _ \ / _  |/ || |/ _  )/ ___)
            | |__/ / |_| | | | | | | | | |_| ( ( | ( (_| ( (/ /| |    
            |_____/ \___/ \____|_| |_|_|\___/ \_||_|\____|\____)_|    
                                                          
        [0m
    [INFO] | Downloading ['Apple', 'Coffee cup', 'Horse'] together.[0m
[91m   [ERROR] | Missing the test-annotations-bbox.csv file.[0m
[94m[DOWNLOAD] | Do you want to download the missing file? [Y/n]

## Etapa 5 - Convertendo os arquivos de anotação

### 1. Colocar as classes no arquivo classes.txt

In [8]:
!cat classes.txt

Apple
Orange
Light switch


In [9]:
# Copiar isso no classes.txt
!echo -e 'Apple\nCoffee cup\nHorse' > classes.txt

### 2. Baixar o arquivo converter_annotations.py e adicione-o ao diretório

In [10]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [11]:
!unzip /content/gdrive/MyDrive/YOLO/recursos/TreinamentoYOLO.zip -d /content/

Archive:  /content/gdrive/MyDrive/YOLO/recursos/TreinamentoYOLO.zip
   creating: /content/TreinamentoYOLO/
  inflating: /content/__MACOSX/._TreinamentoYOLO  
  inflating: /content/TreinamentoYOLO/.DS_Store  
  inflating: /content/__MACOSX/TreinamentoYOLO/._.DS_Store  
  inflating: /content/TreinamentoYOLO/converter_annotations.py  
  inflating: /content/__MACOSX/TreinamentoYOLO/._converter_annotations.py  
  inflating: /content/TreinamentoYOLO/gerar_test.py  
  inflating: /content/__MACOSX/TreinamentoYOLO/._gerar_test.py  
  inflating: /content/TreinamentoYOLO/gerar_train.py  
  inflating: /content/__MACOSX/TreinamentoYOLO/._gerar_train.py  


In [12]:
ls

classes.txt  [0m[01;34mimages[0m/  LICENSE  main.py  [01;34mmodules[0m/  [01;34mOID[0m/  README.md  requirements.txt


In [13]:
# Copiando para a pasta do YOLO
!cp /content/TreinamentoYOLO/converter_annotations.py ./

### 3. Executar o arquivo de conversão



In [14]:
# Executar arquivo para converter as anotações e colocar no formato aceito pelo YOLO
!python converter_annotations.py

Subdiretorio atual: test
Convertendo os annotations para a classe:  Apple_Coffee cup_Horse
100% 300/300 [00:04<00:00, 66.29it/s]
Subdiretorio atual: train
Convertendo os annotations para a classe:  Apple_Coffee cup_Horse
100% 1500/1500 [00:24<00:00, 60.37it/s]


## Etapa 6 - Compactar o dataset

In [40]:
cd OID/Dataset/train/

/content/OIDv4_ToolKit/OID/Dataset/train


In [41]:
ls

[0m[01;34mobj[0m/


In [None]:
!zip -r ../../../obj.zip obj -x obj/Label/*

In [43]:
ls

[0m[01;34mobj[0m/


In [44]:
cd ../../../../

/content


In [45]:
ls

[0m[01;34mgdrive[0m/  [01;34m__MACOSX[0m/  [01;34mOIDv4_ToolKit[0m/  [01;34msample_data[0m/  [01;34mTreinamentoYOLO[0m/


In [46]:
cd OIDv4_ToolKit/

/content/OIDv4_ToolKit


In [48]:
!cp ./obj.zip /content/gdrive/MyDrive/YOLO/recursos

cp: cannot create regular file '/content/gdrive/MyDrive/YOLO/recursos/obj.zip': Operation not permitted


In [49]:
ls

classes.txt               [0m[01;34mimages[0m/  main.py   obj.zip  README.md
converter_annotations.py  LICENSE  [01;34mmodules[0m/  [01;34mOID[0m/     requirements.txt


In [None]:
!zip -r ../../../../valid.zip valid -x valid/Label/*

In [None]:
cd /content/

/content


In [None]:
ls

[0m[01;34mgdrive[0m/  [01;34m__MACOSX[0m/  [01;34mOIDv4_ToolKit[0m/  [01;34msample_data[0m/  [01;34mTreinamentoYOLO[0m/  valid.zip


In [25]:
!cp ./valid.zip /content/gdrive/MyDrive/YOLO/


cp: cannot stat './valid.zip': No such file or directory


# Editando os arquivos de configuração necessários para o treinamento

In [50]:
ls

classes.txt               [0m[01;34mimages[0m/  main.py   obj.zip  README.md
converter_annotations.py  LICENSE  [01;34mmodules[0m/  [01;34mOID[0m/     requirements.txt


In [51]:
pwd

'/content/OIDv4_ToolKit'

In [52]:
!git clone https://github.com/AlexeyAB/darknet

Cloning into 'darknet'...
remote: Enumerating objects: 15900, done.[K
remote: Counting objects: 100% (55/55), done.[K
remote: Compressing objects: 100% (42/42), done.[K
remote: Total 15900 (delta 27), reused 21 (delta 13), pack-reused 15845 (from 2)[K
Receiving objects: 100% (15900/15900), 14.51 MiB | 14.90 MiB/s, done.
Resolving deltas: 100% (10693/10693), done.


In [53]:
cd darknet/

/content/OIDv4_ToolKit/darknet


In [None]:
!make

## Etapa 7 - Definindo os arquivos de configuração

### Modificações no .cfg

In [56]:
!cp cfg/yolov4.cfg /content/gdrive/MyDrive/YOLO/recursos/yolov4_custom.cfg


cp: cannot create regular file '/content/gdrive/MyDrive/YOLO/recursos/yolov4_custom.cfg': Operation not permitted


### Modificações no obj.names e obj.data

In [57]:
!touch obj.names
!touch obj.data

In [None]:
!cp obj.names /content/gdrive/My\ Drive/Cursos\ -\ recursos/YOLO/recursos/obj.names
!cp obj.data /content/gdrive/My\ Drive/Cursos\ -\ recursos/YOLO/recursos/obj.data

## Etapa 8 - Gerando o arquivo train.txt e test.txt

In [58]:
pwd

'/content/OIDv4_ToolKit/darknet'

In [59]:
cd ..

/content/OIDv4_ToolKit


In [None]:
cd OIDv4_ToolKit/

In [None]:
!unzip obj.zip -d ./data

In [None]:
!unzip /content/valid.zip -d ./data

In [63]:
pwd

'/content/OIDv4_ToolKit'

In [64]:
!python /content/TreinamentoYOLO/gerar_train.py

In [None]:
!python /content/TreinamentoYOLO/gerar_test.py

In [None]:
cd data

In [None]:
pwd

In [None]:
!cp train.txt /content/gdrive/My\ Drive/Cursos\ -\ recursos/YOLO/recursos/train.txt

In [None]:
!cp test.txt /content/gdrive/My\ Drive/Cursos\ -\ recursos/YOLO/recursos/test.txt