# Começando

Este notebook foi executado utilizando o serviço gratuito Google Colaboratory. As instruções fornecidas a seguir vão te ajudar a montar o ambiente necessário para que essa aplicação seja clonada/baixada e executada em sua máquina, como também uma explicação sucinta de algumas funcionalidades.

# Modificando o ambiente

O Colab utiliza como default o ensorflow na versão 2.0. Para algumas bibliotecas, como por exemplo a que será utilizada nesta implementação, a versão 2.0 apresenta inúmeras incompatibilidades de versão, portanto para evitar problemas futuros, a versão utilizada do tensorflow será a 1.15.2. Pensando em problemas deste genêro, o colab desenvolveu o comando mágico: **%tensorflow_version 1.x**, em que modifica todo o ambiente de execução para atuar em uma versão estável do tensorflow 1.15.2. 

In [1]:
%tensorflow_version 1.x
import tensorflow
print(tensorflow.__version__)

TensorFlow 1.x selected.
1.15.2


# Instalação

Instalando a biblioteca que será utilizada para criação do modelo. 

In [2]:
!pip install imageai

Collecting imageai
[?25l  Downloading https://files.pythonhosted.org/packages/09/99/4023e191a343fb23f01ae02ac57a5ca58037c310e8d8c62f87638a3bafc7/imageai-2.1.5-py3-none-any.whl (180kB)
[K     |█▉                              | 10kB 25.7MB/s eta 0:00:01[K     |███▋                            | 20kB 2.1MB/s eta 0:00:01[K     |█████▍                          | 30kB 2.8MB/s eta 0:00:01[K     |███████▎                        | 40kB 3.1MB/s eta 0:00:01[K     |█████████                       | 51kB 2.5MB/s eta 0:00:01[K     |██████████▉                     | 61kB 2.8MB/s eta 0:00:01[K     |████████████▊                   | 71kB 3.0MB/s eta 0:00:01[K     |██████████████▌                 | 81kB 3.3MB/s eta 0:00:01[K     |████████████████▎               | 92kB 3.5MB/s eta 0:00:01[K     |██████████████████▏             | 102kB 3.4MB/s eta 0:00:01[K     |████████████████████            | 112kB 3.4MB/s eta 0:00:01[K     |█████████████████████▊          | 122kB 3.4MB/s eta 0:

# Acessando os dados

Existem algumas formas de acessar arquivos pessoais atravéz dos notebooks do colab, as duas principais são: importação direta utilizando a memória em disco disponibilizada pelo Colab, e a outra forma seria conecta o notebook a algum drive. Para este trabalho será utilizada a segunda abordagem, visto que minha conta drive fornece memória suficiente para armazenar todas as informações relevantes deste trabalho, a operação é apresentada na célula a seguir. Note que será utilizado uma conta drive diferente da conta em que este notebook está hospedado, pontanto sempre que se quiser referenciar algum arquivo/pasta o caminho absoluto deve ser utilizado. Caso o seu objetivo seja reproduzir este tutorial, faça o download da base de dados, através deste link: [apple_detection_dataset.zip](https://github.com/OlafenwaMoses/AppleDetection/releases/download/v1/apple_detection_dataset.zip), descompacte e faça o upload do dataset para alguma conta drive de sua preferência, fique atento para qual caminho você está salvando a pasta, para utilizar nos próximos passos. Vale ressaltar que o caminho raiz setado na função **mount**, é o que será utilizado para acessar o drive que possui o dataset, no meu caso, setei como caminho raiz '/content/drive', a partir deste ponto qualquer pasta do drive pode ser acessada exatamente igual como utilizada em um sistema de arquivos comum. 

In [3]:
from google.colab import drive
drive.mount('/content/drive')
#Clique no link a seguir para dar permissão ao colab para utilizar a conta drive, em seguida copie o código de autorização e cole no input requerido

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3aietf%3awg%3aoauth%3a2.0%3aoob&response_type=code&scope=email%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdocs.test%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive%20https%3a%2f%2fwww.googleapis.com%2fauth%2fdrive.photos.readonly%20https%3a%2f%2fwww.googleapis.com%2fauth%2fpeopleapi.readonly

Enter your authorization code:
··········
Mounted at /content/drive


# Criação e configuração do modelo

A classe que será utilizada para instanciação do modelo é a **DetectionModelTrainer**, que permite modificar o tipo de modelo para YOLOv3. Em seguida, o tipo do modelo deve ser informado, para isto será utilizado a função **setModelTypeAsYOLOv3**. Logo após, o diretório deve ser informado através da função **setDataDirectory** com o parâmetro obrigatório: **data_directory**, note que o caminho a ser passado neste parâmetro deve corresponder ao caminho referente a localização do dataset no drive que você fez upload, fique atento para informar o caminho raiz correto que você inseriu nos passos anteriores. Por fim, antes de iniciar o treinamento, algumas configurações devem ser inseridas através da função **setTrainConfig** que possui os seguintes parâmetros:


* **object_names_array (obrigatório):** Lista com o nome das classes, para este tutorial são duas: apple, damaged_apple.  

* **batch_size (opcional):** Tamanho do batch, neste caso escolhi 8.

* **num_experiments (obrigatório):** Número de épocas que o modelo irá treinar, neste caso escolhi 50.

* **train_from_pretrained_model (opcional):** Caminho para um modelo YOLOv3 pré-treinado, neste caso utilizarei os pesos disponíveis neste link: [pretrained-yolov3.h5](https://github.com/OlafenwaMoses/ImageAI/releases/download/essential-v4/pretrained-yolov3.h5)

Finalmente, após configurado o modelo pode ser treinado chamando a função: **trainModel**



In [6]:
from imageai.Detection.Custom import DetectionModelTrainer #importação da classe

trainer = DetectionModelTrainer() #Instanciação do modelo
trainer.setModelTypeAsYOLOv3() #Setando o tipo de modelo para YOLOv3
trainer.setDataDirectory(data_directory="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset") #Informando o diretório do dataset, observe que este é o meu caminho, seu deverá ser diferente.
trainer.setTrainConfig(object_names_array=["apple", "damaged_apple"], batch_size=8, num_experiments=50, train_from_pretrained_model="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/pretrained-yolov3.h5") #setando as congirações
trainer.trainModel() #Iniciando o treinamento

Generating anchor boxes for training images and annotation...
Average IOU for 9 anchors: 0.78
Anchor Boxes generated.
Detection configuration saved in  /content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/json/detection_config.json
Training on: 	['apple', 'damaged_apple']
Training with Batch Size:  8
Number of Experiments:  50
Training with transfer learning from pretrained Model




Epoch 1/50

Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


# Carregando o modelo

Depois que o treinamento começa, é criado uma pasta chamada json que contém um arquivo de configuração .json referente ao modelo e também é criado uma pasta chamada models que guarda os pesos de cada época. Após o treinamento para carregar o modelo de volta utilize a classe **CustomObjectDetection**, crie uma instância, set o modelo de acordo com o que foi utilizado, no nosso caso: YOLOv3. Em seguida informe o diretório que o modelo (arquivo .h5) estar, por meio da função **setModelPath** passando como argumento do parâmetro **detection_model_path**, tenha em mente que como o modelo salvou os pesos de todas as épocas, logo você tem a liberdade de escolher qualquer época para analisar,  utilizando o critério que preferir, para este trabalho analisei apenas o **loss**, portanto escolhi a época 47, com **loss = 7.5500**, visto que foi a época que obteve menor **loss**. Por fim, deve ser informado qual o diretório que o arquivo de configuração se encontra, usando a função **setJsonPath**, por meio do parâmetro **configuration_json**. Agora a função **loadModel** pode ser chamada para carregar o modelo.

In [8]:
from imageai.Detection.Custom import CustomObjectDetection
import os

detector = CustomObjectDetection() #Criando a instância do modelo
detector.setModelTypeAsYOLOv3() #setando o tipo do modelo
detector.setModelPath(detection_model_path="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/models/detection_model-ex-047--loss-0007.550.h5") #informando o diretório que se encontra o modelo, lembre de alterar este caminho para o correspondente em seu drive 
detector.setJsonPath(configuration_json="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/json/detection_config.json") #informando o diretório que se encontra o arquivo de configuração, lembre de alterar este caminho para o correspondente em seu drive 
detector.loadModel()

# Analisando a saída do detector

A classe **CustomObjectDetection** fornece um método bastante simples e eficiente para fazer as detecções em uma determinada imagem, que se chama: **detectObjectsFromImage**, que possui os seguintes parâmetros:

- **input_image:** deve-se informar o caminho da imagem que se quer detectar os objetos
- **minimum_percentage_probability:** que determina a integridade dos resultados da detecção. A redução do valor mostra mais objetos, enquanto o aumento do valor garante a detecção de objetos com a maior precisão. Acredito que funciona como Intersection over Union(IoU).
- **output_image_path:** deve-se informar o caminho que a imagem detectada deve ser salva.

O retorno desta função é um array de dicionários, onde cada objeto tem sua saída representada por um dict contendo as seguintes informações:

- Nome da classe detectada
- O percentual de probabilidade, acredito que seja uma espécie de nível de confiança
- E as coordenadas do objeto detectado

In [9]:
detections = detector.detectObjectsFromImage(input_image="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/image.jpg", minimum_percentage_probability=60, output_image_path="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/predict-image.jpg")

for detection in detections:
    print(detection["name"], " : ", detection["percentage_probability"], " : ", detection["box_points"])

damaged_apple  :  91.38688445091248  :  [163, 105, 443, 324]
apple  :  98.62603545188904  :  [12, 0, 192, 61]
apple  :  99.37939643859863  :  [200, 1, 363, 69]
apple  :  99.67042803764343  :  [371, 0, 568, 60]
apple  :  92.88690090179443  :  [21, 13, 254, 173]
apple  :  97.8295087814331  :  [275, 17, 476, 173]
apple  :  96.79529666900635  :  [1, 86, 160, 311]
apple  :  94.382643699646  :  [453, 107, 624, 318]
apple  :  97.9244589805603  :  [493, 13, 628, 132]


# Avaliando o modelo

Para avaliar o modelo será utilizado a métrica mean Average Precision(mAP). O mAP é a média de average precisions. O average precision deve ser calculado para cada classe, e o mesmo é calculado da seguinte forma:


![](https://miro.medium.com/max/1400/1*q6S0m6R6mQA1J6K30HZkvw.jpeg)

Na imagem abaixo é apresentado um exemplo de como calcular o average precision, onde basicamente é o cálculo da área sob a curva em uma projeção de precisão e recall para cada classe para cada imagem.

![](https://miro.medium.com/max/1400/1*TAuQ3UOA8xh_5wI5hwLHcg.jpeg)

Para maiores infomações de como o mAP funciona, consulte este [link](https://medium.com/@jonathan_hui/map-mean-average-precision-for-object-detection-45c121a31173).

Para avaliar o modelo, será utilizado a classe **DetectionModelTrainer**. Como de constume antes deve ser informado o tipo do modelo, o diretório do dataset e por fim pode-se chamar a função **evaluateModel** que vai avaliar o modelo com a métrica mAP, que possui os seguintes parâmetros: 
- **model_path:** caminho para o modelo
- **json_path:** caminho para o arquivo de configuração
- **iou_threshold:** qual o limiar para considerar uma predição como true positive
- **object_threshold:** é usado para definir a pontuação mínima de confiança para a avaliação do mAP 
- **nms_threshold:** é usado para definir o valor mínimo de supressão não máxima para a avaliação do mAP. Este valor está relacionado a quantidade de detecções sobrepostas que serão aceitas

In [10]:
from imageai.Detection.Custom import DetectionModelTrainer

trainer = DetectionModelTrainer()
trainer.setModelTypeAsYOLOv3()
trainer.setDataDirectory(data_directory="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/")
metrics = trainer.evaluateModel(model_path="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/models/detection_model-ex-029--loss-0008.706.h5", json_path="/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/json/detection_config.json", iou_threshold=0.5, object_threshold=0.3, nms_threshold=0.4)
print(metrics)

Starting Model evaluation....




Model File:  /content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/models/detection_model-ex-029--loss-0008.706.h5 

Using IoU :  0.5
Using Object Threshold :  0.3
Using Non-Maximum Suppression :  0.4
apple: 0.8272
damaged_apple: 0.6550
mAP: 0.7411
[{'model_file': '/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/models/detection_model-ex-029--loss-0008.706.h5', 'using_iou': 0.5, 'using_object_threshold': 0.3, 'using_non_maximum_suppression': 0.4, 'average_precision': {'apple': 0.8272384006477047, 'damaged_apple': 0.6550435058758989}, 'map': 0.7411409532618018}]


# Detectando as imagens de teste

Por fim, para uma melhor análise dos resultados obtidos, a célula a seguir percorre todas as imagens de um determinado diretório e as manda para detecção, exatamente como foi explicado anteriormente, só que agora aplicado a um conjunto de imagens.

In [None]:
from os import listdir

dir_images_teste = '/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/apple_dataset/validation/images/'
dir_images_teste_result = '/content/drive/My Drive/2020.1/VisaoComputacional/trabalho-final-apples-yolo/images_predict/'
dir_images = listdir(dir_images_teste)
for j in dir_images:
  detections = detector.detectObjectsFromImage(input_image=dir_images_teste + j, minimum_percentage_probability=60, output_image_path= dir_images_teste_result + j)