# Universidade Federal do ABC - UFABC
## Centro de Matemática, Computação e Cognição - CMCC

## Disciplina: Visão Computacional e Processamento de Imagens

Responsável: Prof. Dr. Francisco Zampirolli

Estudante: [Bruno Aristimunha](https://github.com/bruAristimunha).

Santo André, Terceiro Quadrimestre de 2019

### Projeto Final da Disciplina

# Classificação de Grão de Pólen.

## Introdução <a id='introducao'></a>

Os grãos de pólen são importantes marcadores geológicos e geográficos presentes em todo o globo. Suas aplicações são diversas, mas dentre as mais comuns podemos citar o uso para a perícia investigativa, o mapeamento do clima em função de milhares de anos e estudos alérgicos, além da produção de alimentos à base de mel. Em todas as áreas citadas, para que se obtenha resultados significativos de análises robustas, faz-se necessário o levantamento estatístico da distribuição dos tipos de pólen presentes em uma amostra.

Considerando a diversidade, as semelhanças interespécies e características microscópicas, o reconhecimento de cada espécie demanda uma ampla e longa formação botânica. O processo de aquisição está exposto a seguir na Figura 1.
![aquisicao](https://raw.githubusercontent.com/bruAristimunha/pollenData/master/figs/capture-pipeline.png)
#### Figura 01: Processo de aquisição dos grãos de pólen. Inicialmente a amostra é capturada em uma lâmina, há ampliação da imagem no microscópio posteriormente, busca-se focalizar o grão e estudar sua morfologia, classificando a espécie.

O processo não trivial de aquisição da imagem demanda tempo, custos em materiais, além de técnica e anos de experiência para classificação. Ademais, dependendo do material usado para aquisição pode haver visualizações distintas para a mesma espécie de pólen. A Figura 2 mostra a diferença entre metodologias de captura de imagens.

In [1]:
from skimage import io
import matplotlib.pyplot as plt
url1 = "https://raw.githubusercontent.com/bruAristimunha/pollenData/master/figs/solvent2.png"
url2 = "https://raw.githubusercontent.com/bruAristimunha/pollenData/master/figs/solvent1.png"

fig = plt.figure(figsize=(20,20))

image1 = io.imread(url1)
image2 = io.imread(url2)

plt.subplot(221).imshow(image1)
plt.subplot(222).imshow(image2)
plt.show()


<Figure size 2000x2000 with 2 Axes>

#### Figura 02: A diferença entre solventes gera uma coloração totalmente distinta quando visualizada no microscópio, empecilhos como esses dificultam a generalização da classificação do biólogo.






O restante desse texto é organizado como segue. Na Seção [2](#Trabalhos_Relacionados) nós revisamos a literatura sobre a classificação de grão de pólen, com apanhando histórico até os trabalhos mais recentes. Na Seção [3](#Metodologia) nós descrevemos a metodologia proposta que foi empregada. Então, na Seção [4](#Resultados) nós discutimos os discutimos encontrados com a literatura. Considerações e trabalhos futuros estão contidos na Seção [5](#Conclusao).


## Trabalho Relacionados <a id='Trabalhos_Relacionados'></a>

   

## Metodologia <a id='Metodologia'></a>

O aprendizado profundo é o conjunto de técnicas comumente utilizadas em visão computacional para busca de
representações hierárquicas de dados. Métodos de camadas convolucionais, permitem solucionar inúmeros problemas da visão computacional pela sua invariância translacional e conectividade local. Em outras palavras, empregamos esse conjunto de técnicas para buscar padrões de formação desconhecidos a priori pelo classificador, que só será descoberto durante o aprendizado.

## Dados/imagens

Será utilizado um banco de imagens de polens nativos do Mato Grosso do Sul. Por se tratar de um objeto de geometria tridimensional, as diferentes angulações influenciam tanto na classificação do especialista quanto em algoritmos tradicionais de classificação, portanto cada grão possui 35 imagens distintas.

In [None]:
#Divisão do Conjunto de Imagem
import split_folders

#Bibliotecas empregadas na análise
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras import optimizers
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Dropout, Flatten, Dense, GlobalAveragePooling2D
from tensorflow.keras import backend as K
from tensorflow.keras.callbacks import ModelCheckpoint, LearningRateScheduler, TensorBoard, EarlyStopping


In [3]:

#model
img_width, img_height = 299, 299
#data_generate
seed = 42


## Processamento de imagens


IV. MÉTODO PROPOSTO


A Figura 1 ilustra as etapas da metodologia proposta para classificação das imagens de grãos de pólen por meio de aprendizado supervisionado. Inicialmente, para cada imagem de um conjunto de dados de grãos de pólen, o processo de extração de recurso é iniciado pela computação de vários descritores de imagem que incluem recursos de baixo nível, como cor e textura. 


Para este procedimento, Matrizes de Co-Ocorrência de Nível Cinza (GLCM), Padrões Binários Locais (LBP), Correlogramas de Cores Automáticas (ACC) e o Descritor Local de Weber (WLD), que foram detalhados na Seção II, foram usados ​​para gerar um “Banco de dados descritor”. Depois que os descritores são extraídos, o processo de aprendizado da máquina é iniciado. Primeiro, um subconjunto de recursos do conjunto de descritores é escolhido para formar o descritor final de cada imagem do conjunto de dados. Em seguida, o conjunto de dados é dividido em conjuntos de treinamento e teste para o processo de validação cruzada. Para cada conjunto de dados testado neste trabalho, uma validação cruzada de 5 vezes foi aplicada, de tal forma que 80% das imagens (4 dobras) são consideradas como o conjunto de treinamento e a dobra restante (20%) como o conjunto de teste. Essa divisão é feita de tal forma que pelo menos uma amostra de cada classe esteja presente em cada dobra. Depois de dividir o conjunto de dados, o processo de treinamento é iniciado. Aqui, diferentes classificadores de imagem foram treinados separadamente com seus respectivos parâmetros de ajuste. Por sua vez, cada conjunto de parâmetros ótimos foi encontrado executando um procedimento de busca de grade sobre cada espaço respectivo de hiperparâmetros para que a precisão máxima (para um dado conjunto de dados) possa ser obtida para cada classificador. Neste trabalho, foram testados três classificadores: Support Vector Machines (SVM) [57], Random Forests [18] e Logistic Regression [17]. No que diz respeito aos parâmetros ótimos para cada um dos classificadores supracitados, o SVM foi utilizado com um kernel da Função de Base Radial (RBF) com parâmetros C = 10 e γ = 10; para o classificador Random Forests, o número de árvores foi definido em 4200; e para a Regressão Logística, o parâmetro C foi fixado em 10000 junto com o algoritmo de regularização L2. Os classificadores treinados então formam um conjunto, de modo que todos detalhados na Seção II foram usados ​​para gerar um “banco de dados de descritores”. Depois que os descritores são extraídos, o processo de aprendizado da máquina é iniciado. Primeiro, um subconjunto de recursos do conjunto de descritores é escolhido para formar o descritor final de cada imagem do conjunto de dados. Em seguida, o conjunto de dados é dividido em conjuntos de treinamento e teste para o processo de validação cruzada. Para cada conjunto de dados testado neste trabalho, uma validação cruzada de 5 vezes foi aplicada, de tal forma que 80% das imagens (4 dobras) são consideradas como o conjunto de treinamento e a dobra restante (20%) como o conjunto de teste. Essa divisão é feita de tal forma que pelo menos uma amostra de cada classe esteja presente em cada dobra. Depois de dividir o conjunto de dados, o processo de treinamento é iniciado. Aqui, diferentes classificadores de imagem foram treinados separadamente com seus respectivos parâmetros de ajuste. Por sua vez, cada conjunto de parâmetros ótimos foi encontrado executando um procedimento de busca de grade sobre cada espaço respectivo de hiperparâmetros para que a precisão máxima (para um dado conjunto de dados) possa ser obtida para cada classificador. Neste trabalho, foram testados três classificadores: Support Vector Machines (SVM) [57], Random Forests [18] e Logistic Regression [17]. No que diz respeito aos parâmetros ótimos para cada um dos classificadores supracitados, o SVM foi utilizado com um kernel da Função de Base Radial (RBF) com parâmetros C = 10 e γ = 10; para o classificador Random Forests, o número de árvores foi definido em 4200; e para a Regressão Logística, o parâmetro C foi fixado em 10000 junto com o algoritmo de regularização L2. Os classificadores formados formam então um conjunto para que





O conjunto de dados possui [$23$](http://palinovic.weebly.com/bancos-de-imagens.html) imagens de espécies, cada espécie com um total de $35$ registros, totalizando $805$ imagens. Cada espécie de pólen possui uma taxonomia associada, desse modo, para instância possuímos cinco rótulos, sendo eles: classe, ordem, gênero, família e espécie. Ressaltamos que o balanceamento no conjunto ocorre apenas em nível de espécies. 
 

Para validação do método, em nível de espécie, realizamos a divisão: treino, validação e teste, com as porcentagens: $60$, $20$ e $20$, respectivamente.


No conjunto de treino e validação, optou-se pelo aumento de dados empregando rotações de 45º, traçando um paralelo com a literatura botânica, que emprega rotações de 45º na captura de imagens. Além disso, geramos imagens mudando a faixa de altura e largura em uma fração de $10\%$; usando cisalhamento em $0.1^{\circ}$ no sentido anti-horário; ampliamos e reduzimos em aleatoriamente entre $\{0.9, 1.25\}$; giramos a imagem na horizontal, e na vertical; variamos a intensidade brilho aleatoriamente entre $\{0.5, 1.5\}$; e preenchemos eventuais valores faltantes nas figuras com método de reflexão. Por se tratar de um objeto de geometria tridimensional levantou-se a hipótese de que essas transformações auxiliam na generalização dos métodos. Das $480$ imagens de treino obtivemos um total de $6235$ derivadas, no conjunto de validação, das $160$ alcançamos um total de $2240$.



In [4]:
import pandas as pd
rotulo = pd.read_csv('rotulo.csv')
columns = rotulo.drop(['caminho','species','split'],1).columns

train = rotulo[rotulo['split']=='train/'].drop("split",1)
val = rotulo[rotulo['split']=='val/'].drop("split",1)
test = rotulo[rotulo['split']=='test/'].drop("split",1)

In [5]:
len(columns)

73

In [6]:
lr=1E-3
momentum= 0.9
batch_size = 32
epochs = 30

In [7]:
train_datagen = ImageDataGenerator(
           rotation_range=45,
           width_shift_range=0.1,
           height_shift_range=0.1,
           shear_range=0.01,
           zoom_range=[0.9,1.25],
           horizontal_flip=True,
           vertical_flip=True,
           fill_mode='reflect',
           data_format='channels_last',
           brightness_range=[0.5, 1.5])

test_datagen = ImageDataGenerator()


### VGG

### Xception 

### Inception 

### MobileNet

### NasNet

### ResNet

### DenseNet

In [18]:
from tensorflow.keras.applications import DenseNet121, DenseNet169, InceptionResNetV2, InceptionV3, MobileNet, MobileNetV2, NASNetMobile, ResNet50, VGG16, VGG19, Xception

from tensorflow.keras.layers import Dense
#DenseNet121, DenseNet169, InceptionResNetV2, InceptionV3, MobileNet,          MobileNetV2,  

models = [
           ResNet50, 
          VGG16, VGG19, Xception]
#'DenseNet121', 'DenseNet169', InceptionResNetV2', 'InceptionV3', 'MobileNet',
               #'MobileNetV2', ,
models_name = [
               'ResNet50', 
               'VGG16', 'VGG19', 'Xception']


img_width, img_height = 299, 299

### Transferência de Aprendizado



In [9]:
#!ls ../data/
!rm ../data/pollen23e_aug/train/*
!mkdir ../data/pollen23e_aug/valid
!mkdir ../data/pollen23e_aug/train


/bin/sh: 1: rm: Argument list too long
mkdir: cannot create directory ‘../data/pollen23e_aug/valid’: File exists
mkdir: cannot create directory ‘../data/pollen23e_aug/train’: File exists


Os experimentos foram executados com a técnica de Ajuste Fino - AF, em que os pesos dos modelos foram inicializados com a rede já previamente treinados no banco de imagens ImageNet. Para todas arquiteturas usamos o método de otimização gradiente descendente estocástico com a taxa de aprendizado de $10^{-3}$ com momento de $0.9$, e ao final de todo modelo conectamos uma camada achatada e uma camada totalmente conectada para predição com ativação Softmax. 

Em todos os modelos, dado limitação de tempo, exploramos $10$ épocas de treinamento, com tamanho de batch de $128$. No melhor modelo analisamos o seu comportamento em $100$ épocas.


In [10]:
batch_size = 16

In [16]:
models_name

['InceptionResNetV2',
 'InceptionV3',
 'MobileNet',
 'MobileNetV2',
 'NASNetMobile',
 'ResNet50',
 'VGG16',
 'VGG19',
 'Xception']

In [19]:
for enum, model in enumerate(models):

    train_generator = train_datagen.flow_from_dataframe(
                            dataframe = train,
                            directory =   '../data/pollen23e_split_multi/train',
                            x_col="caminho",
                            y_col=columns,
                            target_size = (299,299),
                            batch_size = batch_size,
                            save_to_dir = '../data/pollen23e_aug_multi/train',
                            save_prefix='aug', 
                            save_format='png',
                            class_mode = "other",
                            follow_links = True,
                            seed = seed)

    validation_generator = train_datagen.flow_from_dataframe(
                            dataframe = val,
                            directory =   '../data/pollen23e_split_multi/val',
                            x_col="caminho",
                            y_col=columns,
                            class_mode = "other",
                            target_size = (299,299),
                            save_to_dir = '../data/pollen23e_aug_multi/val',
                            save_prefix='aug', 
                            save_format='png',
                            follow_links = True,
                            seed = seed)



    
    # Save the model according to the conditions
    checkpoint = ModelCheckpoint("../checkpoints_multi/"+models_name[enum], 
                                 monitor='val_loss', verbose=1, 
                                 save_weights_only=False, 
                                 mode='auto', 
                                 save_best_only=True)
    
    model = models[enum](weights     = "imagenet", 
                         include_top = False, 
                         input_shape = (img_width, img_height, 3))
    
    #Adicionando um camada adicional
    x = model.output
    x = Flatten()(x)
    predictions = Dense(len(columns),  activation='sigmoid')(x)
    
    # Camada final
    model = Model(model.input,predictions)
    # compile the model
    model.compile(loss = "binary_crossentropy", 
                  optimizer = optimizers.SGD(lr=lr, momentum=momentum),
                  metrics=["accuracy"])

    
    history_acc = model.fit_generator(
                train_generator,
                steps_per_epoch = train_generator.samples/batch_size,
                epochs = epochs,
                callbacks = [checkpoint],
                validation_data = validation_generator,
                validation_steps = validation_generator.samples/batch_size)
    
    model.save("../models/"+models_name[enum]+".h5")    
    


Found 480 validated image filenames.
Found 160 validated image filenames.
Found 161 validated image filenames.




Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.2/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5
Epoch 1/30
Epoch 00001: val_loss improved from inf to 0.23832, saving model to ../checkpoints_multi/ResNet50
Epoch 2/30
Epoch 00002: val_loss improved from 0.23832 to 0.18793, saving model to ../checkpoints_multi/ResNet50
Epoch 3/30
Epoch 00003: val_loss improved from 0.18793 to 0.16334, saving model to ../checkpoints_multi/ResNet50
Epoch 4/30
Epoch 00004: val_loss improved from 0.16334 to 0.13355, saving model to ../checkpoints_multi/ResNet50
Epoch 5/30
Epoch 00005: val_loss improved from 0.13355 to 0.12539, saving model to ../checkpoints_multi/ResNet50
Epoch 6/30
Epoch 00006: val_loss improved from 0.12539 to 0.11686, saving model to ../checkpoints_multi/ResNet50
Epoch 7/30
Epoch 00007: val_loss improved from 0.11686 to 0.10240, saving model to ../checkpoints_multi/ResNet50
Epoch 8/30
Epoch 00008: val_loss improved from 0.10240 to 0.08975,

Epoch 29/30
Epoch 00029: val_loss did not improve from 0.04159
Epoch 30/30
Epoch 00030: val_loss did not improve from 0.04159
Found 480 validated image filenames.
Found 160 validated image filenames.
Found 161 validated image filenames.
Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg16_weights_tf_dim_ordering_tf_kernels_notop.h5
Epoch 1/30
Epoch 00001: val_loss improved from inf to 0.20863, saving model to ../checkpoints_multi/VGG16
Epoch 2/30
Epoch 00002: val_loss improved from 0.20863 to 0.20325, saving model to ../checkpoints_multi/VGG16
Epoch 3/30
Epoch 00003: val_loss improved from 0.20325 to 0.19733, saving model to ../checkpoints_multi/VGG16
Epoch 4/30
Epoch 00004: val_loss improved from 0.19733 to 0.18226, saving model to ../checkpoints_multi/VGG16
Epoch 5/30
Epoch 00005: val_loss improved from 0.18226 to 0.16677, saving model to ../checkpoints_multi/VGG16
Epoch 6/30
Epoch 00006: val_loss did not improve from 0.16677
Epoch 7/30


Epoch 00026: val_loss did not improve from 0.07102
Epoch 27/30
Epoch 00027: val_loss did not improve from 0.07102
Epoch 28/30
Epoch 00028: val_loss did not improve from 0.07102
Epoch 29/30
Epoch 00029: val_loss did not improve from 0.07102
Epoch 30/30
Epoch 00030: val_loss did not improve from 0.07102
Found 480 validated image filenames.
Found 160 validated image filenames.
Found 161 validated image filenames.
Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.1/vgg19_weights_tf_dim_ordering_tf_kernels_notop.h5
Epoch 1/30
Epoch 00001: val_loss improved from inf to 0.20693, saving model to ../checkpoints_multi/VGG19
Epoch 2/30
Epoch 00002: val_loss improved from 0.20693 to 0.19998, saving model to ../checkpoints_multi/VGG19
Epoch 3/30
Epoch 00003: val_loss improved from 0.19998 to 0.19405, saving model to ../checkpoints_multi/VGG19
Epoch 4/30
Epoch 00004: val_loss improved from 0.19405 to 0.18099, saving model to ../checkpoints_multi/VGG19
Epoch 

Epoch 24/30
Epoch 00024: val_loss did not improve from 0.07666
Epoch 25/30
Epoch 00025: val_loss did not improve from 0.07666
Epoch 26/30
Epoch 00026: val_loss improved from 0.07666 to 0.07643, saving model to ../checkpoints_multi/VGG19
Epoch 27/30
Epoch 00027: val_loss did not improve from 0.07643
Epoch 28/30
Epoch 00028: val_loss did not improve from 0.07643
Epoch 29/30
Epoch 00029: val_loss did not improve from 0.07643
Epoch 30/30
Epoch 00030: val_loss did not improve from 0.07643
Found 480 validated image filenames.
Found 160 validated image filenames.
Found 161 validated image filenames.
Downloading data from https://github.com/fchollet/deep-learning-models/releases/download/v0.4/xception_weights_tf_dim_ordering_tf_kernels_notop.h5
Epoch 1/30
Epoch 00001: val_loss improved from inf to 0.22312, saving model to ../checkpoints_multi/Xception
Epoch 2/30
Epoch 00002: val_loss improved from 0.22312 to 0.21001, saving model to ../checkpoints_multi/Xception
Epoch 3/30
Epoch 00003: val_los

Epoch 21/30
Epoch 00021: val_loss improved from 0.08606 to 0.08531, saving model to ../checkpoints_multi/Xception
Epoch 22/30
Epoch 00022: val_loss improved from 0.08531 to 0.08060, saving model to ../checkpoints_multi/Xception
Epoch 23/30
Epoch 00023: val_loss improved from 0.08060 to 0.07861, saving model to ../checkpoints_multi/Xception
Epoch 24/30
Epoch 00024: val_loss improved from 0.07861 to 0.07697, saving model to ../checkpoints_multi/Xception
Epoch 25/30
Epoch 00025: val_loss improved from 0.07697 to 0.07594, saving model to ../checkpoints_multi/Xception
Epoch 26/30
Epoch 00026: val_loss improved from 0.07594 to 0.07171, saving model to ../checkpoints_multi/Xception
Epoch 27/30
Epoch 00027: val_loss improved from 0.07171 to 0.07038, saving model to ../checkpoints_multi/Xception
Epoch 28/30
Epoch 00028: val_loss improved from 0.07038 to 0.06732, saving model to ../checkpoints_multi/Xception
Epoch 29/30
Epoch 00029: val_loss did not improve from 0.06732
Epoch 30/30
Epoch 00030: 

In [1]:
pred=model.predict_generator(test_generator,
steps=STEP_SIZE_TEST,
verbose=1)

NameError: name 'test_generator' is not defined

In [4]:

test_datagen = ImageDataGenerator()
test_generator = test_datagen.flow_from_dataframe(
                            dataframe = test,
                            directory =   '../data/pollen23e_split_multi/test',
                            x_col="caminho",
                            y_col=columns,
                            save_to_dir = '../data/pollen23e_aug_multi/test',
                            target_size = (299,299),
                            batch_size = batch_size,
                            class_mode = 'other',
                            follow_links = True,
                            seed = seed)

NameError: name 'ImageDataGenerator' is not defined

## Conclusão <a id='Conclusao'></a>

https://www.google.com/search?q=reprodutibility+in+computer+science+jupyter&oq=reprodutibility+in+computer+science+jupyter&aqs=chrome..69i57j33.9207j0j7&sourceid=chrome&ie=UTF-8


https://keras.io/applications/#resnet

https://github.com/jupyter-guide/ten-rules-jupyter/blob/e7b184c4949d164ce12eb5fdfbc8c8cd487b8a23/example2/0-Workflow.ipynb

https://github.com/nteract/papermill



## Referências

- Gonçalves, Ariadne Barbosa, et al. ["Feature extraction and machine learning for the classification of Brazilian Savannah pollen grains."](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0157044) PloS one 11.6 (2016): e0157044.

- Navares, Ricardo, and José Luis Aznarte. ["Geographical Imputation of Missing Poaceae Pollen Data via Convolutional Neural Networks."](https://www.mdpi.com/2073-4433/10/11/717) Atmosphere 10.11 (2019): 717.

- Menad, Hanane, Farah Ben-Naoum, and Abdelmalek Amine. ["A Thresholding Approach for Pollen Detection in Images Based on Simulated Annealing Algorithm."](https://www.igi-global.com/article/a-thresholding-approach-for-pollen-detection-in-images-based-on-simulated-annealing-algorithm/237182) International Journal of Agricultural and Environmental Information Systems (IJAEIS) 10.4 (2019): 18-36.

- Gallardo-Caballero, Ramón, et al. ["Precise Pollen Grain Detection in Bright Field Microscopy Using Deep Learning Techniques."](https://www.mdpi.com/1424-8220/19/16/3583) Sensors 19.16 (2019): 3583.

- Vizgarra, Cristian G., Informaticas Avanzadas, and Jorge Gotay Sardiñas. ["Advances in the Classification of Pollen Grains Images Obtained from Honey Samples of Tetragonisca angustula in the Province of Chaco, Argentina."](https://ijisrt.com/wp-content/uploads/2019/07/IJISRT19JU564.pdf)

- de Geus, André R., et al. ["Large-scale Pollen Recognition with Deep Learning."](https://ieeexplore.ieee.org/abstract/document/8902735) 2019 27th European Signal Processing Conference (EUSIPCO). IEEE, 2019.

- Allen, G. P., et al. ["Machine vision for automated optical recognition and classification of pollen grains or other singulated microscopic objects."](https://ieeexplore.ieee.org/abstract/document/4749537/) 2008 15th International Conference on Mechatronics and Machine Vision in Practice. IEEE, 2008.

- Menad, Hanane, Ben-Naoum, Farah, & Amine, Abdelmalek (2019). ["Deep Convolutional Neural Network for Pollen Grains Classification"](http://ceur-ws.org/Vol-2351/paper_34.pdf). In _JERI_.

- Nguyen, Nhat Rich, Matina Donalson-Matasci, and Min C. Shin. ["Improving pollen classification with less training effort."](https://ieeexplore.ieee.org/abstract/document/6475049/) 2013 IEEE Workshop on Applications of Computer Vision (WACV). IEEE, 2013.

- Sevillano, Víctor, and José L. Aznarte. ["Improving classification of pollen grain images of the POLEN23E dataset through three different applications of deep learning convolutional neural networks."](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0201807) PloS one 13.9 (2018): e0201807.

- Oteros, J., et al. ["Year clustering analysis for modelling olive flowering phenology."](https://link.springer.com/article/10.1007/s00484-012-0581-3) International journal of biometeorology 57.4 (2013): 545-555.

- Holt, K., et al. ["Progress towards an automated trainable pollen location and classifier system for use in the palynology laboratory."](https://www.sciencedirect.com/science/article/pii/S0034666711001205) Review of Palaeobotany and Palynology 167.3-4 (2011): 175-183.

- Valan, Miroslav, et al. ["Automated Taxonomic Identification of Insects with Expert-Level Accuracy Using Effective Feature Transfer from Convolutional Networks."](https://academic.oup.com/sysbio/article/68/6/876/5368535) Systematic biology (2019).

In [None]:
#Biblioteca para impressão do versionamento das bibliotecas importadas. Importante para reprodutibilidade do trabalho
%load_ext watermark
print("\nSistema\n")
%watermark
print("\nBibliotecas\n")
%watermark --iversions