# Minicurso - Introdução à Visão Computacional e Aprendizado Profundo com Python

# Sumário

- Introdução
- Visão Computacional
- Aprendizado Profundo
- Estudo de Caso
- Avaliação dos Resultados
- Conclusões

Uso da **GPU**

In [2]:
# Uso de GPU
!nvidia-smi

Tue Nov  5 16:10:11 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05             Driver Version: 535.104.05   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  NVIDIA A100-SXM4-40GB          Off | 00000000:00:04.0 Off |                    0 |
| N/A   29C    P0              47W / 400W |      2MiB / 40960MiB |      0%      Default |
|                                         |                      |             Disabled |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [3]:
import os
os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"]="0" #aqui tem q escolher uma das gpus, veja a que esta desocupada
tf_device='/gpu:0'

Dataset disponível em: https://www.kaggle.com/datasets/dipuiucse/monkeypoxskinimagedataset

# Estudo de Caso

Estudo de caso que consiste em 4 etapas:

1) Aquisição de um conjunto de imagens de varíola dos macacos, sarampo, catapora e casos normais;
2) Utilização de técnicas de pré-processamento de imagens;
3) Aplicação da técnica de aumento de dados aleatório para aumentar a generalização do modelo de classificação;
4) Treinamento de modelos da CNN para extração de atributos e classificação das imagens.

![title](imagens/classificacao.png)

# Aquisição de Imagens

Para as tarefas envolvendo o aprendizado profundo em qualquer contexto é necessária a
aquisição de imagens que consigam representar as classes de problemas há serem estu-
dados. Com o intuito de trazer um estudo de caso, utilizamos um conjunto de imagens
baseado em imagens de pele disponível publicamente [Bala 2022].

O conjunto de dados é dividido em quatro classes: varíola dos macacos, catapora,
sarampo e saudáveis, contendo 107, 91, 279 e 293 imagens, respectivamente. Esse con-
junto de dados é utilizado apenas para fins educacionais e de pesquisas.

![title](imagens/classes.png)

- a) Varíola dos macacos
- b) Catapora
- c) Sarampo
- d) Outros (saudáveis)

# Aumento de Dados

Nesse processo de classificação, utiliza-se quatro técnicas de aumento de dados:

1) espelhamento aleatório da imagem, nos eixos horizontal e vertical;
2) rotação aleatória da imagem variando de 0° a 90° graus, no sentido horário e anti-horário, esse intervalo foi aplicado para preservar as características da imagem;
3) zoom aleatório variando de 0% a 10%, pois valores mais altos podem causar a perda de partes importantes da imagem, como as amastigotas;
4) contraste da imagem ajustado por um valor de fator de 0,2, o fator de contraste é escolhido aleatoriamente entre [1,0 - fator, 1,0 + fator]. O contraste é ajustado de forma independente para cada canal de cor de cada imagem durante o treinamento.

# Extração de Atributos e Classificação

![title](imagens/tabelamodel.png)

![title](imagens/parametros.png)

Para avaliar a metodologia completa e comprovar a generalização dos modelos
na base de teste são utilizadas algumas métricas que são amplamente difundidas na liter-
atura, temos então as seguintes métricas: Acurácia; Kappa; Recall; Precisão; F1-Score;
Especificidade e AUC.

Acurácia [Story and Congalton 1986](Acc): é a média global dos acertos para o
modelo ao classificar as classes. A Acurácia se da pela Equação 1.

![title](imagens/acc.png)

Kappa [Cohen 1968]: a acurácia pode não ser uma boa métrica de avaliação para
dados que possam conter classes com quantidade de amostras desbalanceados, então para
resolver isso podemos utilizar a métrica Kappa, dada pela Equação 2.

![title](imagens/kappa.png)

Recall (Sensibilidade): taxa real positiva (TPR), taxa de acerto ou sensibilidade,
de um classificador representa as amostras classificadas corretamente para o número total
de amostras positivas [Tharwat 2021]. Ela pode ser obtida pela equação 3.

![title](imagens/recall.png)

Precisão [David L. Olson 2008]: essa métrica verifica quantas observações o mod-
elo classificou de forma correta como pertencente a uma classe. A Precisão se da pela
Equação 4.

![title](imagens/prec.png)

F1-Score [Rijsbergen 1979](F1): a métrica F1-Score é a média harmônica entre
as métricas, Recall e Precisão, ou seja, ela resume as informações dessas duas métricas.
A formula dessa métrica é dada pela Equação 5.

![title](imagens/f1.png)

Especificidade (ESP): é expressa como a razão das amostras negativas correta-
mente classificadas para o número total de amostras negativas. Assim, a especificidade
representa a proporção das amostras negativas corretamente classificadas [Tharwat 2021].
Podemos calculá-la usando a Equação 6.

![title](imagens/esp.png)

A curva ROC (Receiver Operating Characteristics) é um gráfico de linha que
mostra a capacidade de diagnóstico de um classificador, visualizando seu desempenho
com diferentes limiares. A área sob a curva ROC, do inglês Area Under the Curve
(AUC), mede toda a área bidimensional abaixo da curva ROC. Essa curva representa
dois parâmetros: Taxa de Verdadeiro Positivo (TPR) e Taxa de Falso Positivo (FPR)
[Taha and Hanbury 2015].

![title](imagens/roc.png)

In [8]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python Usada Neste Jupyter Notebook:', python_version())

Versão da Linguagem Python Usada Neste Jupyter Notebook: 3.10.12


In [4]:
# Uso da memória RAM
from psutil import virtual_memory
ram_gb = virtual_memory().total / 1e9
print('Esse notebook tem {:.1f} gigabytes de RAM disponível\n'.format(ram_gb))

if ram_gb < 20:
  print('Não está executando com muita RAM')
else:
  print('Você está usando um ambiente de execução com muita RAM!')

Esse notebook tem 89.6 gigabytes de RAM disponível

Você está usando um ambiente de execução com muita RAM!


In [5]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [6]:
cp -R /content/gdrive/MyDrive/Dataset ./

In [39]:
!mkdir modelo

In [7]:
!pip install watermark

Collecting watermark
  Downloading watermark-2.5.0-py2.py3-none-any.whl.metadata (1.4 kB)
Collecting jedi>=0.16 (from ipython>=6.0->watermark)
  Downloading jedi-0.19.1-py2.py3-none-any.whl.metadata (22 kB)
Downloading watermark-2.5.0-py2.py3-none-any.whl (7.7 kB)
Downloading jedi-0.19.1-py2.py3-none-any.whl (1.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m23.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: jedi, watermark
Successfully installed jedi-0.19.1 watermark-2.5.0


## Bibliotecas

In [10]:
# Imports

# Imports para manipulação e visualização de dados
import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

# Imports para manipulação de imagens
import os
import sklearn
from PIL import Image
from sklearn.model_selection import train_test_split

# Imports para cálculo de métricas e utilitários
from sklearn.metrics import cohen_kappa_score, accuracy_score, f1_score, precision_score, recall_score, roc_auc_score
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.model_selection import StratifiedKFold
from sklearn.preprocessing import LabelBinarizer

# Imports para Deep Learning
#import plaidml
#import plaidml.keras
import tensorflow as tf
import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Flatten, Dense, Dropout, GlobalAveragePooling2D
from tensorflow.keras.optimizers import Adam, SGD
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import ReduceLROnPlateau, EarlyStopping, ModelCheckpoint, Callback

# Redes Neurais
from keras.applications.inception_v3 import InceptionV3
from keras.applications.densenet import DenseNet201
from keras.applications.xception import Xception
from keras.applications.inception_resnet_v2 import InceptionResNetV2
from keras.applications.nasnet import NASNetLarge
from keras.applications.resnet_v2 import ResNet152V2
from keras.applications.vgg16 import VGG16
from keras.applications.resnet50 import ResNet50

# As novas versões do Pandas e Matplotlib trazem diversas mensagens de aviso ao desenvolvedor. Vamos desativar isso.
%matplotlib inline

In [11]:
# Versões dos pacotes usados neste jupyter notebook
%reload_ext watermark
%watermark -a "IFSertão" --iversions

Author: IFSertão

sklearn   : 1.5.2
tensorflow: 2.17.0
PIL       : 10.4.0
matplotlib: 3.8.0
platform  : 1.0.8
google    : 2.0.3
pandas    : 2.2.2
keras     : 3.4.1
sys       : 3.10.12 (main, Sep 11 2024, 15:47:36) [GCC 11.4.0]
numpy     : 1.26.4
psutil    : 5.9.5



## Parâmetros

In [12]:
# Dados de entrada
#PATH_IMAGES = 'dataset/Monkeypox_2_classes/Original_Images/Original_Images/'
PATH_IMAGES = 'Dataset'

# Parâmetros do treinamento
BATCH_SIZE = 8
SEED = 42

# K-fold
N_SPLIT = 4

In [13]:
# Parâmetros treinamento
epocas_treinamento = 20
base_learning_rate = 0.0001

epocas_ajuste_fino = 10
total_epocas = epocas_treinamento + epocas_ajuste_fino

# Dataset

In [14]:
#CATEGORIAS = ['Monkey Pox', 'Others']
CATEGORIAS = ['Chickenpox', 'Measles', 'Monkeypox', 'Normal']
NUM_CATEGORIAS = len(CATEGORIAS)
NUM_CATEGORIAS

4

In [15]:
for category in CATEGORIAS:
    print('{} {} images'.format(category, len(os.listdir(os.path.join(PATH_IMAGES, category)))))

Chickenpox 107 images
Measles 91 images
Monkeypox 289 images
Normal 293 images


In [16]:
dataset = []
for category in CATEGORIAS:
    for file in os.listdir(os.path.join(PATH_IMAGES, category)):
        dataset.append(['{}/{}'.format(category, file), category])
dataset = pd.DataFrame(dataset, columns=['arquivo', 'categoria'])
dataset.shape

(780, 2)

In [17]:
dataset

Unnamed: 0,arquivo,categoria
0,Chickenpox/chickenpox88.png,Chickenpox
1,Chickenpox/chickenpox102.png,Chickenpox
2,Chickenpox/chickenpox59.png,Chickenpox
3,Chickenpox/chickenpox53.png,Chickenpox
4,Chickenpox/chickenpox12.png,Chickenpox
...,...,...
775,Normal/normal51.png,Normal
776,Normal/normal88.png,Normal
777,Normal/normal251.png,Normal
778,Normal/normal11.png,Normal


In [18]:
# Definindo X e Y
dataset_x = dataset.arquivo
dataset_y = dataset.categoria

# Leitura dos dados

In [19]:
#Initializing Data Generators
datagen = ImageDataGenerator()

# train_datagen = ImageDataGenerator(rescale = 1.0/255,
#                                     zoom_range = 0.2,
#                                     horizontal_flip = True,
#                                     vertical_flip = True,
#                                     rotation_range = 90,
#                                     brightness_range = (-0.1, 0.1))

In [20]:
# Carrega os dados de treino, validação e testes
def leitura_dados(img_size):
    train_dataset = datagen.flow_from_dataframe(dataframe = train_df,
                                                      directory = PATH_IMAGES,
                                                      x_col = "arquivo",
                                                      y_col = "categoria",
                                                      class_mode = "categorical",
                                                      target_size = img_size,
                                                      batch_size = BATCH_SIZE,
                                                      seed = SEED,
                                                      shuffle = True)

    val_dataset = datagen.flow_from_dataframe(dataframe = val_df,
                                                      directory = PATH_IMAGES,
                                                      x_col = "arquivo",
                                                      y_col = "categoria",
                                                      class_mode = "categorical",
                                                      target_size = img_size,
                                                      batch_size = BATCH_SIZE,
                                                      shuffle = False)

    test_dataset = datagen.flow_from_dataframe(dataframe = test_df,
                                                      directory = PATH_IMAGES,
                                                      x_col = "arquivo",
                                                      y_col = "categoria",
                                                      class_mode = "categorical",
                                                      target_size = img_size,
                                                      batch_size = BATCH_SIZE,
                                                      shuffle = False)

    return train_dataset, val_dataset, test_dataset

# Métricas

In [43]:
# Cria data frame de resultados
colunas_dataframe = ['model', 'kappa', 'accuracy', 'recall', 'precision', 'f1', 'specificity', 'roc']
resultados = pd.DataFrame(columns = colunas_dataframe)

def metrics_multi_class(y_true, y_pred):
    '''
        fonte: https://towardsdatascience.com/multi-class-classification-extracting-performance-metrics-from-the-confusion-matrix-b379b427a872
    '''

    global resultados

    cnf_matrix = confusion_matrix(y_true,y_pred)

    fp = (cnf_matrix.sum(axis=0) - np.diag(cnf_matrix)).astype(float)
    fn = (cnf_matrix.sum(axis=1) - np.diag(cnf_matrix)).astype(float)
    tp = (np.diag(cnf_matrix)).astype(float)
    tn = (cnf_matrix.sum() - (fp + fn + tp)).astype(float)

    weights = np.sum(cnf_matrix, axis=1)
    specificity_array = (tn / (tn + fp))
    specificity = np.sum(specificity_array * weights) / np.sum(weights)

    kappa = cohen_kappa_score(y_true, y_pred)
    accuracy = accuracy_score(y_true, y_pred)
    recall = recall_score(y_true, y_pred, average='weighted') # sensibility
    precision = precision_score(y_true, y_pred, average='weighted')
    f1 = f1_score(y_true, y_pred, average='weighted')

    # ROC
    lb = LabelBinarizer()
    lb.fit(y_true)
    true = lb.transform(y_true)
    pred = lb.transform(y_pred)
    roc = roc_auc_score(true, pred)

    metricas = {'model': models[rede].name,
                'kappa': kappa,
                'accuracy': accuracy,
                'recall': recall,
                'precision': precision,
                'f1': f1,
                'specificity':specificity,
                'roc': roc}

    print(metricas)

    metricas_df = pd.DataFrame([metricas])
    resultados = pd.concat([resultados, metricas_df], ignore_index=True)

In [22]:
import itertools

# Função para a Matriz de Confusão
def plot_confusion_matrix(normalize = False,
                          title = 'Matriz de Confusão',
                          cmap = plt.cm.Blues):

    classes = CATEGORIAS
    cm = confusion_matrix(y_true, y_pred)

    # Se normalize = True, obtemos a matriz de confusão com dados normalizados
    if normalize:
        cm = cm.astype('float') / cm.sum(axis = 1)[:, np.newaxis]
        print("Matriz de Confusão Normalizada")
    else:
        print('Matriz de Confusão Sem Normalização')

    # Mostramos a Matriz de Confusão
    #print(cm)

    # Plot
    plt.imshow(cm, interpolation = 'nearest', cmap = cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation = 45)
    plt.yticks(tick_marks, classes)
    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.

    # Plot do texto
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment = "center",
                 color = "white" if cm[i, j] > thresh else "black")

    plt.ylabel('Label Verdadeiro')
    plt.xlabel('Label Previsto')
    plt.tight_layout()
    plt.show()

# Modelo

In [57]:
# leitura dos pesos pré-treinados da ImageNet
# Não inclui as camadas de classificação no topo, ideal para extração de features
models = [
    VGG16(weights='imagenet', input_shape=(224, 224, 3), include_top=False),
    #DenseNet201(weights = "imagenet", input_shape = (224, 224, 3), include_top = False),
    #InceptionV3(weights='imagenet', input_shape=(224, 224, 3), include_top=False),
    #Xception(weights='imagenet', input_shape=(224, 224, 3), include_top=False),
    InceptionResNetV2(weights='imagenet', input_shape=(224, 224, 3), include_top=False),
    #NASNetLarge(weights='imagenet', input_shape=(224, 224, 3), include_top=False),
    #ResNet152V2(weights='imagenet', input_shape=(224, 224, 3), include_top=False)
]

# Reescala dos valores dos pixels do modelo
processamento_input = [
    keras.applications.vgg16.preprocess_input,
    #keras.applications.densenet.preprocess_input,
    #keras.applications.inception_v3.preprocess_input,
    #keras.applications.xception.preprocess_input,
    keras.applications.inception_resnet_v2.preprocess_input,
    #keras.applications.nasnet.preprocess_input,
    #keras.applications.resnet_v2.preprocess_input
]

In [24]:
# Construir um modelo a partir de redes neurais pré-treinadas
def modelo_base(rede):

    base_model = models[rede]
    img_size = (base_model.input.shape[1], base_model.input.shape[2])

    # Processa as entradas do modelo
    preprocess_input = processamento_input[rede]

    return base_model, img_size, preprocess_input

In [27]:
data_augmentation = keras.Sequential(
    [
        keras.layers.RandomFlip("horizontal_and_vertical"),
        keras.layers.RandomRotation(0.9),
        keras.layers.RandomZoom(0.1),
        keras.layers.RandomContrast(0.2)
    ]
)


In [28]:
# Construir modelo
def build_model():

    # Freeze the base_model
    # Congela a base convolucional antes de compilar e treinar o modelo
    # Evita que os pesos em uma determinada camada sejam atualizados durante o treinamento
    base_model.trainable = False

    # Arquitetura do modelo básico
    # base_model.summary()

    # Adiciona o cabeçalho de classificação
    # Converter as features do shape `base_model.output_shape[1:] para vectores
    global_average_layer = keras.layers.GlobalAveragePooling2D()

    # Aplica uma camada densa para converter essas features em uma única previsão por imagem
    # Os números > 0.5 preveem a classe 1, os números <= 0.5 preveem a classe 0
    prediction_layer = keras.layers.Dense(4, activation="softmax", name='predictions') # Função de ativação sigmoid adicionada

    # Modelo encadeando as camadas de aumento de dados, reescalonamento, base_model e extrator de features
    img_shape = img_size + (3,)
    inputs = keras.Input(shape = img_shape)
    x = data_augmentation(inputs)
    x = preprocess_input(x)
    x = base_model(x, training=False)
    x = global_average_layer(x)
    x = keras.layers.Dropout(0.2)(x)
    outputs = prediction_layer(x)
    model = keras.Model(inputs, outputs)

    return model

In [37]:
# Compile o modelo antes de treiná-lo
def compile_model(learning_rate):

    # Compilar modelo
    # Não especifiquei o batch_size, pois os dados já estão em conjuntos (batchs)
    model.compile(optimizer = Adam(learning_rate = learning_rate), loss = keras.losses.CategoricalCrossentropy(), metrics = ['categorical_accuracy'])

    # model.summary()

In [41]:
# Definimos um checkpoint para verificar regularmente se a perda em validação diminuiu
# Se a performance melhorar em validação salvamos o modelo
# Podemos ainda optar por salvar o modelo a cada número de épocas
# callbacks
# Redução gradual da taxa de aprendizado (Reduce on Plateau)
def get_callbacks():
    return [
        EarlyStopping(monitor='val_loss', patience=10, verbose=1),
        ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=5, min_lr=1e-7, verbose=1),
        ModelCheckpoint(
            filepath='modelo/{}.weights.h5'.format(models[rede].name),  # Nome do arquivo com .weights.h5
            verbose=1,
            save_best_only=True,
            save_weights_only=True
        )
    ]

In [31]:
# Treinamento do modelo
def treinamento_model(qnt_epocas, epoca_inicial):

    history = model.fit(train_dataset,
                        epochs = qnt_epocas,
                        initial_epoch = epoca_inicial,
                        validation_data = val_dataset,
                        verbose=1,
                        callbacks = get_callbacks())

    return history

In [32]:
# Curvas de aprendizado da precisão / perda de treinamento e validação ao usar o modelo
def aprendizado_treinamento():

    metricas_graficos = ["loss", "categorical_accuracy"]

    fig, ax = plt.subplots(len(metricas_graficos), 1, figsize=(10, len(metricas_graficos)*6))
    ax = ax.ravel()
    dados_x = np.arange(1, epocas_treinamento+1, 1)

    for i, met in enumerate(metricas_graficos):
        ax[i].plot(dados_x, history.history[met], label='Training ' + met)
        ax[i].plot(dados_x, history.history["val_" + met], label='Validation ' + met)
        ax[i].set_title("Training and Validation %s in model %s" %(met, models[rede].name))
        ax[i].set_xlabel("epochs")
        ax[i].set_ylabel(met)

        if (i != 0): # loss function
            ax[i].legend(loc='lower right')
        else:
            ax[i].legend(loc='upper right')

    return metricas_graficos

In [33]:
# LIMIAR PARA AJUSTE FINO (OPCIONAL)
# Definir as camadas inferiores como não treináveis
def limiar_ajuste_fino():

    # Exibe a quantidade de camadas do modelo base
    # print("Número de camadas no modelo base: ", len(base_model.layers))

    # Ajuste fino desta camada em diante
    fine_tune_at = 100

    # Congele todas as camadas antes da camada 'fine_tune_at'
    for layer in base_model.layers[:fine_tune_at]:
        layer.trainable = False

In [34]:
# Ajuste fino
def ajuste_fino():

    # Foi treinado apenas algumas camadas do modelo.
    # Os pesos da rede pré-treinada não foram atualizados durante o treinamento.
    # Uma maneira de aumentar ainda mais o desempenho é treinar (ou "ajustar") os pesos das camadas superiores
    # do modelo pré-treinado junto com o treinamento do classificador adicionado (camada de classificação adicionada)
    # Descongelar as camadas superiores do modelo (descongelar base_model)
    base_model.trainable = True

    # Limiar ajuste fino (OPCIONAL)
    limiar_ajuste_fino()

    # É necessário recompilar o modelo (para que essas alterações tenham efeito)
    # É importante usar uma taxa de aprendizado mais baixa neste estágio,
    # pois está usando um modelo muito maior e deseja readaptar os pesos pré-treinados
    compile_model(base_learning_rate/10)

    # Retomar o treinamento melhorará sua precisão em alguns pontos percentuais
    # history.epoch[-1] é a última época do ultimo treinamento
    history_fine = treinamento_model(total_epocas, history.epoch[-1]+1)

    return history_fine

In [35]:
# Curvas de aprendizado da precisão / perda de treinamento e validação ao ajustar as últimas camadas do modelo
def aprendizado_ajuste_fino():

    fig, ax = plt.subplots(len(metricas_graficos), 1, figsize=(12, len(metricas_graficos)*6))
    ax = ax.ravel()
    dados_x = np.arange(1, len(history.history['loss']) + len(history_fine.history['loss'])+1, 1)

    for i, met in enumerate(metricas_graficos):
        dados_treino = history.history[met] + history_fine.history[met]
        dados_validacao = history.history["val_" + met] + history_fine.history["val_" + met]

        ax[i].plot(dados_x, dados_treino, label='Training ' + met)
        ax[i].plot(dados_x, dados_validacao, label='Validation ' + met)
        ax[i].plot([epocas_treinamento, epocas_treinamento], plt.ylim(), label='Start Fine Tuning')
        ax[i].set_title("Training and Validation %s in model %s" %(met, models[rede].name))
        ax[i].set_xlabel("epochs")
        ax[i].set_ylabel(met)

        if (i != 0): # loss function
            ax[i].legend(loc='lower right')
        else:
            ax[i].legend(loc='upper right')

# Treinamento K-fold

In [None]:
# k-fold
kfold = StratifiedKFold(n_splits = N_SPLIT, shuffle = True, random_state = SEED)

# Contador de iterações do k-fold
iteracao = 1

# K-fold treino e teste de cada divisão
for train_idx, test_idx in list(kfold.split(dataset_x, dataset_y)):

    print("\n======================================================")
    print("Iteração {} de {}".format(iteracao, N_SPLIT))
    print("======================================================")

    train_df = dataset.iloc[train_idx]
    test_temp = dataset.iloc[test_idx]

    # dividir o teste em validação e teste
    val_df, test_df = train_test_split(test_temp, test_size = 0.60, random_state = SEED) # 10% validação e 15% teste

    for rede in range(len(models)): # Todos os modelos

        print('\nExecutando modelo {}'.format(models[rede].name))

        # Modelo base
        base_model, img_size, preprocess_input = modelo_base(rede)

        # Leitura dos dados
        train_dataset, val_dataset, test_dataset = leitura_dados(img_size)

        # Construir modelo
        model = build_model()

        # Compilar Modelo
        compile_model(base_learning_rate)

        # Treinamento do modelo
        history = treinamento_model(epocas_treinamento, 0)

        # Curvas de aprendizado da precisão / perda de treinamento e validação ao usar o modelo
        # metricas_graficos = aprendizado_treinamento()

        # Ajuste fino
        history_fine = ajuste_fino()

        # Curvas de aprendizado da precisão / perda de treinamento e validação ao ajustar as últimas camadas do modelo
        # aprendizado_ajuste_fino()

        # Carrega o melhor modelo
        model.load_weights('modelo/{}.weights.h5'.format(models[rede].name))

        # Obtemos os rótulos verdadeiros
        y_true = np.array(test_dataset.classes)

        # Obtemos os rótulos previstos
        previsoes = model.predict(test_dataset, verbose = 1)
        y_pred = previsoes.argmax(axis=1)

        # Calcula métricas Multiclasse
        metrics_multi_class(y_true, y_pred)

        # Plota matriz de confusão
        # plot_confusion_matrix()

        # Gera o relatório de classificação
        # report = classification_report(y_true, y_pred, target_names = CATEGORIAS)
        # print(report)

        # Limpa a sessão
        keras.backend.clear_session()

    iteracao = iteracao + 1


Iteração 1 de 4

Executando modelo vgg16
Found 585 validated image filenames belonging to 4 classes.
Found 78 validated image filenames belonging to 4 classes.
Found 117 validated image filenames belonging to 4 classes.
Epoch 1/20
[1m 1/74[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m1:58[0m 2s/step - categorical_accuracy: 0.2500 - loss: 8.5020

  self._warn_if_super_not_called()


[1m69/74[0m [32m━━━━━━━━━━━━━━━━━━[0m[37m━━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.2484 - loss: 4.4681
Epoch 1: val_loss improved from inf to 3.89523, saving model to modelo/vgg16.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 27ms/step - categorical_accuracy: 0.2497 - loss: 4.4308 - val_categorical_accuracy: 0.2821 - val_loss: 3.8952 - learning_rate: 1.0000e-04
Epoch 2/20
[1m69/74[0m [32m━━━━━━━━━━━━━━━━━━[0m[37m━━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.3612 - loss: 2.9379
Epoch 2: val_loss improved from 3.89523 to 3.34788, saving model to modelo/vgg16.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 22ms/step - categorical_accuracy: 0.3598 - loss: 2.9519 - val_categorical_accuracy: 0.3590 - val_loss: 3.3479 - learning_rate: 1.0000e-04
Epoch 3/20
[1m71/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.3469 - loss: 3.0080
Epoch 3: val_loss improved from 3.

  self._warn_if_super_not_called()


[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 29ms/step - categorical_accuracy: 0.3461 - loss: 1.5760
Epoch 1: val_loss improved from inf to 1.15025, saving model to modelo/inception_resnet_v2.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m27s[0m 131ms/step - categorical_accuracy: 0.3474 - loss: 1.5728 - val_categorical_accuracy: 0.4615 - val_loss: 1.1502 - learning_rate: 1.0000e-04
Epoch 2/20
[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 31ms/step - categorical_accuracy: 0.5102 - loss: 1.1887
Epoch 2: val_loss improved from 1.15025 to 0.95390, saving model to modelo/inception_resnet_v2.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 55ms/step - categorical_accuracy: 0.5112 - loss: 1.1869 - val_categorical_accuracy: 0.6667 - val_loss: 0.9539 - learning_rate: 1.0000e-04
Epoch 3/20
[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 29ms/step - categorical_accuracy: 0.5965 - loss: 1.0687
Epoc

  self._warn_if_super_not_called()


[1m69/74[0m [32m━━━━━━━━━━━━━━━━━━[0m[37m━━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.3399 - loss: 4.4300
Epoch 1: val_loss improved from inf to 3.57555, saving model to modelo/vgg16.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 27ms/step - categorical_accuracy: 0.3403 - loss: 4.4051 - val_categorical_accuracy: 0.3590 - val_loss: 3.5755 - learning_rate: 1.0000e-04
Epoch 2/20
[1m69/74[0m [32m━━━━━━━━━━━━━━━━━━[0m[37m━━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.3359 - loss: 2.9792
Epoch 2: val_loss improved from 3.57555 to 2.69202, saving model to modelo/vgg16.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 21ms/step - categorical_accuracy: 0.3370 - loss: 2.9848 - val_categorical_accuracy: 0.4359 - val_loss: 2.6920 - learning_rate: 1.0000e-04
Epoch 3/20
[1m69/74[0m [32m━━━━━━━━━━━━━━━━━━[0m[37m━━[0m [1m0s[0m 17ms/step - categorical_accuracy: 0.3993 - loss: 2.7904
Epoch 3: val_loss improved from 2.

  self._warn_if_super_not_called()


[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 28ms/step - categorical_accuracy: 0.3663 - loss: 1.3603
Epoch 1: val_loss improved from inf to 0.83668, saving model to modelo/inception_resnet_v2.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m27s[0m 131ms/step - categorical_accuracy: 0.3697 - loss: 1.3562 - val_categorical_accuracy: 0.7692 - val_loss: 0.8367 - learning_rate: 1.0000e-04
Epoch 2/20
[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 30ms/step - categorical_accuracy: 0.6859 - loss: 0.9313
Epoch 2: val_loss improved from 0.83668 to 0.67615, saving model to modelo/inception_resnet_v2.weights.h5
[1m74/74[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 53ms/step - categorical_accuracy: 0.6856 - loss: 0.9309 - val_categorical_accuracy: 0.7692 - val_loss: 0.6761 - learning_rate: 1.0000e-04
Epoch 3/20
[1m73/74[0m [32m━━━━━━━━━━━━━━━━━━━[0m[37m━[0m [1m0s[0m 29ms/step - categorical_accuracy: 0.7088 - loss: 0.8323
Epoc

In [None]:
resultados

Unnamed: 0,model,kappa,accuracy,recall,precision,f1,specificity,roc
0,vgg16,0.583439,0.706897,0.706897,0.702102,0.703548,0.897338,0.762178
1,densenet201,0.877727,0.913793,0.913793,0.916971,0.912457,0.970356,0.930163
2,inception_v3,0.837971,0.887931,0.887931,0.895229,0.882963,0.947585,0.893466
3,xception,0.851631,0.896552,0.896552,0.899266,0.892744,0.959144,0.903801
4,inception_resnet_v2,0.851409,0.896552,0.896552,0.902625,0.895572,0.951747,0.909487
5,NASNet,0.817361,0.87069,0.87069,0.872278,0.871355,0.959452,0.89847
6,resnet152v2,0.839762,0.887931,0.887931,0.895675,0.880491,0.957969,0.901108
7,vgg16,0.536401,0.681034,0.681034,0.665325,0.662627,0.867409,0.730334
8,densenet201,0.938889,0.956897,0.956897,0.959172,0.957162,0.984142,0.964816
9,inception_v3,0.891227,0.922414,0.922414,0.928263,0.923501,0.983071,0.941804


In [None]:
# Resultados de todas as iterações
resultados.to_csv('resultados/resultados.csv', index=False, header=True)

In [None]:
# Média dos resultados
def resultados_mean():
    df_mean = pd.DataFrame(columns = colunas_dataframe)

    for i in range(len(models)):
        lista_media = []
        lista_media.append(models[i].name)
        lista_media = lista_media + list(resultados.loc[resultados['model'] == models[i].name].mean())

        series_mean = pd.Series(lista_media, index = df_mean.columns)
        df_mean = df_mean.append(series_mean, ignore_index=True)

    return df_mean

In [None]:
# Média dos resultados
media_resultados = resultados_mean()
media_resultados.to_csv('resultados/media_resultados.csv', index=False, header=True)
media_resultados

Unnamed: 0,model,kappa,accuracy,recall,precision,f1,specificity,roc
0,vgg16,0.625934,0.738756,0.738756,0.734326,0.732399,0.902497,0.786575
1,densenet201,0.938787,0.956859,0.956859,0.958326,0.95657,0.984412,0.964807
2,inception_v3,0.910828,0.937425,0.937425,0.941352,0.936449,0.978653,0.947726
3,xception,0.926172,0.948238,0.948238,0.949189,0.947181,0.981243,0.952721
4,inception_resnet_v2,0.959792,0.971983,0.971983,0.973556,0.971721,0.986887,0.975235
5,NASNet,0.914701,0.939655,0.939655,0.940904,0.93967,0.981379,0.952254
6,resnet152v2,0.929374,0.950394,0.950394,0.952849,0.948568,0.982783,0.957696


In [None]:
# Desvio Padrão dos resultados
def resultados_std():
    df_std = pd.DataFrame(columns = colunas_dataframe)

    for i in range(len(models)):
        lista_std = []
        lista_std.append(models[i].name)
        lista_std = lista_std + list(resultados.loc[resultados['model'] == models[i].name].std())

        series_std = pd.Series(lista_std, index = df_std.columns)
        df_std = df_std.append(series_std, ignore_index=True)

    return df_std

In [None]:
# Desvio padrão dos resultados
desvio_resultados = resultados_std()
desvio_resultados.to_csv('resultados/std_resultados.csv', index=False, header=True)
desvio_resultados

Unnamed: 0,model,kappa,accuracy,recall,precision,f1,specificity,roc
0,vgg16,0.078694,0.052791,0.052791,0.061289,0.059553,0.026416,0.049387
1,densenet201,0.04343,0.030639,0.030639,0.029255,0.031252,0.010231,0.024804
2,inception_v3,0.057878,0.03998,0.03998,0.036968,0.041949,0.021323,0.040092
3,xception,0.060452,0.042192,0.042192,0.04132,0.043654,0.016482,0.0378
4,inception_resnet_v2,0.072485,0.050451,0.050451,0.047453,0.050931,0.02351,0.044017
5,NASNet,0.075072,0.053142,0.053142,0.052652,0.05289,0.017011,0.0424
6,resnet152v2,0.0616,0.042994,0.042994,0.039532,0.046607,0.016703,0.038788


# Resultados

![title](imagens/result.png)

![title](imagens/curvasssss.png)

![title](imagens/matriz_confusao.png)

![title](imagens/gradcam.png)

# Conclusões