## **PROCESSAMENTO E ANÁLISE DE IMAGENS - TRABALHO PRÁTICO**
**Aluna:** Carolina Lima

---


#*Introdução*
A classificação automática e precisa de frutas é uma tarefa um tanto quanto desafiadora, especialmente quando há semelhanças entre algumas variedades, como maçãs, peras e pêssegos. Neste contexto, foram escolhidos dois métodos baseados em redes neurais convolucionais para reconhecimento e classificação automática de frutas para serem avaliados em função de sua precisão, acurácia e tempo.
Em seguida, um terceiro método foi proposto visando melhorias no tempo de treinamento e mantendo a acurácia.

#*Base de dados*
A base de dados escolhida consiste em um conjunto de imagens de diferentes variedades de frutas, acompanhadas de rótulos ou etiquetas que indicam a qual categoria cada imagem pertence (por exemplo: maçã, laranja, banana, etc.). Essas imagens foram capturadas em ambientes variados e podem incluir variações de ângulo, iluminação e tamanho. A fim de reconhecer automaticamente e classificar diferentes tipos de frutas com base em características visuais extraídas das imagens, esse conjunto de dados foi utilizado para treinar os algoritmos presentes neste trabalho. Você pode encontrar o dataset utilizado  neste [link](https://drive.google.com/drive/folders/1e-mxCW6vBm9RrST9yctB8R8UHm1RnB4H?usp=sharing).


#*Vídeo explicando o código:* [link](https://youtu.be/5O4QoLhojUY)

#*Apresentação: [link](https://drive.google.com/file/d/12TTb0j1hQkVg6zETPb4ru9lsD90qAq2z/view?usp=sharing)*
---

#**Conexão com o Google Drive**


Esse trecho de código importa a função 'drive' do módulo 'google.colab' e monta o Google Drive no ambiente de trabalho.

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


#**Bibliotecas utilizadas em ambos os classificadores**


Abaixo, importamos todas as bibliotecas necessárias para rodar o projeto.

**Descrição de cada importação:**

1. **import os:** fornece uma maneira de interagir com o sistema operacional, permitindo a manipulação de caminhos de arquivo, execução de comandos do sistema e outras operações relacionadas ao sistema operacional.

2. **import PIL:** é usada para manipulação e processamento de imagens em Python. Ela oferece várias funcionalidades para abrir, editar e salvar imagens, bem como para realizar operações de processamento de imagem.

3. **import random:** fornece funções para geração de números aleatórios em Python. Ele é comumente usado para embaralhar listas, selecionar itens aleatórios de uma sequência e realizar outras operações que envolvam aleatoriedade.

4. **import pathlib:** fornece classes e funções para manipulação de caminhos de arquivo e diretório em uma maneira orientada a objetos. Ele facilita a criação, manipulação e navegação em caminhos de forma mais legível e portável.

5. **import numpy as np:** fornece suporte para arrays multidimensionais e funções matemáticas de alto desempenho, tornando-o essencial para a manipulação e análise de dados numéricos.

6. **import pandas as pd:** usada para análise e manipulação de dados em Python. Ela oferece estruturas de dados poderosas, como o DataFrame, e funções para carregar, limpar, transformar e analisar dados de forma eficiente.

7. **import seaborn as sns:** biblioteca de visualização de dados em Python baseada no matplotlib. Ele fornece uma interface de alto nível para criar gráficos estatísticos atraentes e informativos.

8. **import tensorflow as tf:** biblioteca popular de aprendizado de máquina e deep learning em Python. O tensorflow é importado como tf para facilitar o uso de suas funções e classes.

9. **import matplotlib.pyplot as plt:** fornece funções para criação de gráficos e visualizações em Python. Ela é amplamente utilizada para criar gráficos de linha, gráficos de dispersão, histogramas, gráficos de barras e muitos outros tipos de gráficos.

10. **import matplotlib.image as mpimg:** módulo que fornece funções para ler, exibir e salvar imagens usando a biblioteca matplotlib.

11. **from tensorflow import keras:** API de alto nível para construir e treinar modelos de aprendizado de máquina e deep learning. Ele é importado do pacote tensorflow para facilitar o uso das funções e classes do keras.

12. **from tensorflow.keras import layers:** módulo do keras que contém várias camadas comuns usadas na construção de modelos de redes neurais.

13. **from tensorflow.keras.models import Sequential:** lasse do keras que permite construir modelos de redes neurais sequenciais, onde as camadas são empilhadas uma após a outra.

14. **from sklearn.model_selection import train_test_split:** A função train_test_split do sklearn é usada para dividir conjuntos de dados em subconjuntos de treinamento e teste. É comumente usada para avaliar o desempenho de modelos de aprendizado de máquina.

15. **from tensorflow.keras.utils import load_img, img_to_array:** As funções load_img e img_to_array do keras.utils são usadas para carregar imagens de arquivos e converter imagens em arrays numpy, respectivamente.

16. **from tensorflow.keras.preprocessing.image import ImageDataGenerator:** A classe ImageDataGenerator do keras.preprocessing.image é usada para criar instâncias de geradores de dados de imagem que podem aumentar, redimensionar, normalizar e pré-processar imagens para treinamento de modelos de aprendizado de máquina.

17. **from tensorflow.keras.models import load_model:** a importação da função load_model permite carregar um modelo previamente salvo em um arquivo. Essa função é útil quando você deseja carregar um modelo treinado e usá-lo para fazer previsões ou continuar o treinamento.

18. **from tensorflow.keras import layers:** a importação da classe layers permite acessar diversas camadas disponíveis no TensorFlow Keras. Essas camadas são usadas para construir modelos de redes neurais, incluindo camadas convolucionais, de pooling, de ativação, de dropout, entre outras.

19. **from tensorflow.keras.layers import Activation, Dropout, Flatten, Dense, Conv2D, MaxPooling2D:** esas importações são comumente usadas na construção de modelos de CNNs para processamento de imagens. Elas fornecem funcionalidades essenciais para carregar, pré-processar e processar imagens, além de permitir a definição de camadas específicas usadas em redes neurais convolucionais.








In [None]:
import os
import PIL
import time
import random
import pathlib
import numpy as np
import pandas as pd
import seaborn as sns
import tensorflow as tf
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from tensorflow import keras
import warnings
warnings.filterwarnings("ignore")
from tensorflow.keras import layers
from tensorflow.keras.models import load_model
from tensorflow.keras.models import Sequential
from sklearn.model_selection import train_test_split
from tensorflow.keras.utils import load_img, img_to_array
from tensorflow.keras.preprocessing.image import ImageDataGenerator, img_to_array, load_img
from tensorflow.keras.layers import Activation, Dropout, Flatten, Dense, Conv2D, MaxPooling2D

#**Classificador A: Criação e treinamento do modelo**

In [None]:
# definine o caminho do diretório onde as imagens de treinamento estão localizadas
data_dir = pathlib.Path("/content/drive/MyDrive/Colab Notebooks/dataset/train")

# conta o número total de imagens no diretório de treinamento
image_count = len(list(data_dir.glob('*/*.jpg')))

print(image_count)

# cria uma lista de caminhos para as imagens de uma categoria específica
apricot = list(data_dir.glob('Peach/*'))

# abre a primeira imagem da lista apricot usando a biblioteca PIL
PIL.Image.open(str(apricot[0]))

In [None]:
# define o número de amostras que serão processadas em cada iteração durante o treinamento do modelo
batch_size = 32

#
img_height = 180
img_width = 180

"""
Essa função lê as imagens do diretório (data_dir) e gera um conjunto de dados TensorFlow com base na estrutura de pastas

Args:
    validation_split: indica que 20% dos dados serão reservados para validação
    subset:           especifica que estamos criando um conjunto de dados para treinamento
    seed:             define uma semente para garantir a reprodutibilidade dos resultados
    image_size:       define o tamanho das imagens após o redimensionamento.
    batch_size:       define o tamanho do lote para o conjunto de treinamento

Returns:
    retorna um objeto tf.data.Dataset que contém os dados de treinamento do conjunto de imagens
"""
train_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="training",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)

"""
Essa função lê as imagens do diretório (data_dir) e gera um conjunto de dados TensorFlow com base na estrutura de pastas

Args:
    validation_split: indica que 20% dos dados serão reservados para validação
    subset:           especifica que estamos criando um conjunto de dados para treinamento
    seed:             define uma semente para garantir a reprodutibilidade dos resultados
    image_size:       define o tamanho das imagens após o redimensionamento.
    batch_size:       define o tamanho do lote para o conjunto de treinamento

Returns:
    retorna um objeto tf.data.Dataset que contém os dados de validação do conjunto de imagens
"""
val_ds = tf.keras.utils.image_dataset_from_directory(
  data_dir,
  validation_split=0.2,
  subset="validation",
  seed=123,
  image_size=(img_height, img_width),
  batch_size=batch_size)

# contém uma lista de nomes de classe associados às categorias das imagens no conjunto de dados de treinamento train_ds
class_names = train_ds.class_names
print(class_names)

In [None]:
# estabelece o valor AUTOTUNE como uma constante especial fornecida pela biblioteca TensorFlow para otimizar o desempenho do carregamento de dados
AUTOTUNE = tf.data.AUTOTUNE

"""
As variáveis train_ds e val_ds estão sendo modificadas para aplicar algumas transformações.
Primeiro, o método cache() é chamado para armazenar em cache os dados do conjunto de treinamento
em memória, o que pode acelerar o carregamento subsequente dos dados.
Em seguida, o método shuffle(1000) é aplicado para embaralhar os exemplos de treinamento aleatoriamente,
com um tamanho de buffer de embaralhamento de 1000.
Por fim, o método prefetch(buffer_size=AUTOTUNE) é usado para pré-carregar os dados em um buffer,
permitindo uma sobreposição de processamento entre a obtenção dos dados e o treinamento do modelo.
"""

train_ds = train_ds.cache().shuffle(1000).prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

"""
É criada uma camada de normalização usando a classe Rescaling do TensorFlow.
Essa camada será usada para normalizar os valores dos pixels das imagens,
dividindo-os por 255, o que resulta em valores no intervalo [0, 1].
"""
normalization_layer = layers.Rescaling(1./255)

# aplica a camada de normalização às imagens de entrada, normalizando seus valores de pixel
normalized_ds = train_ds.map(lambda x, y: (normalization_layer(x), y))

"""
É criado um iterador para a variável normalized_ds usando a função iter(), e em seguida,
o método next() é aplicado para obter um único lote de imagens e rótulos do conjunto de dados normalizado.
"""
image_batch, labels_batch = next(iter(normalized_ds))

# seleciona a primeira imagem do lote
first_image = image_batch[0]


# print(np.min(first_image), np.max(first_image))

In [None]:
# número de classes ou categorias diferentes nas quais as imagens devem ser classificadas
num_classes = 33

"""
Cria uma sequência de camadas para aplicar técnicas de aumento de dados nas imagens de treinamento
aplicando transformações aleatórias, como virar, girar, traduzir e ajustar o contraste das imagens.

Args:
    layers.RandomFlip():        faz um flip vertical aleatório nas imagens de entrada.
                                Ela recebe as dimensões da imagem de entrada (altura, largura, canais) e,
                                durante o treinamento, aleatoriamente decide se deve ou não aplicar o flip vertical.
    layers.RandomFlip():        faz um flip horizontal aleatório nas imagens de entrada.
                                Assim como a camada anterior, ela decide aleatoriamente durante o treinamento se
                                deve ou não aplicar o flip horizontal.
    layers.RandomTranslation(): faz uma translação aleatória nas imagens de entrada. Ela recebe fatores de translação
                                para a altura e largura, que determinam o intervalo no qual as imagens serão transladadas.
    layers.RandomRotation():    faz uma rotação aleatória nas imagens de entrada. O argumento factor especifica o intervalo
                                em que as imagens serão rotacionadas, em radianos. Durante o treinamento, a camada decide
                                aleatoriamente a quantidade de rotação a ser aplicada.
   layers.RandomContrast():     faz um ajuste aleatório no contraste das imagens de entrada. O argumento factor especifica o
                                intervalo de ajuste do contraste. Durante o treinamento, a camada decide aleatoriamente
                                o fator de ajuste a ser aplicado.

 Returns:                       objeto 'Sequential' que representa a sequência de camadas de aumento de dados no modelo.
"""
data_augmentation = keras.Sequential(
  [
    layers.RandomFlip("vertical",
                      input_shape=(img_height,
                                  img_width,
                                  3)),
    layers.RandomFlip("horizontal"),
    layers.RandomTranslation(height_factor=(-0.2, 0.2), width_factor=(-0.2, 0.2), fill_mode="reflect"),
    layers.RandomRotation(factor=(-0.2, 0.2)),
    layers.RandomContrast(factor=[1.0, 3.0], seed=123 )

  ]
)

"""
Um modelo de rede neural é definido utilizando a API Sequencial do Keras.
Ele é construído em camadas, onde cada camada é adicionada sequencialmente ao modelo.

Args:
    data_augmentation:         camada de pré-processamento que aplica uma série de transformações de aumento de dados às imagens
    layers.Rescaling():        camada de normalização que dimensiona os valores dos pixels das imagens de entrada para o intervalo [0, 1].
    layers.Conv2D():           camada convolucional com 16 filtros de tamanho 3x3.
    layers.MaxPooling2D():     camada de pooling que realiza a operação de pooling máximo para reduzir a dimensão espacial das saídas da camada convolucional.
    layers.Dropout():          camada de dropout que desativa aleatoriamente uma fração de 40% dos neurônios de entrada durante o treinamento.
    layers.Flatten():          camada que transforma os mapas de características 2D em um vetor 1D, permitindo a transição das camadas convolucionais para as camadas densas.
    layers.Dense():            camada densa com 128 neurônios e função de ativação sigmoidal.
    layers.Dense():            camada de saída do modelo, com um número de neurônios igual ao número de classes do problema.

Returns: Um modelo de rede neural convolucional
"""
model = Sequential([
  data_augmentation,
  layers.Rescaling(1./255),
  # relu introduz a não linearidade
  # padding=same A opção padding='same' faz com que o preenchimento seja adicionado às bordas da imagem para manter o tamanho da saída igual ao tamanho da entrada
  layers.Conv2D(16, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Dropout(0.4),
  layers.Conv2D(32, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Dropout(0.4),
  layers.Conv2D(64, 3, padding='same', activation='relu'),
  layers.MaxPooling2D(),
  layers.Dropout(0.2),
  layers.Flatten(),
  layers.Dense(128, activation='sigmoid'),
  layers.Dense(num_classes)
])

In [None]:
"""
Define um objeto de otimizador usando o algoritmo RMSprop

Args:
    learning_rate: taxa de aprendizado que controla o tamanho dos passos que o otimizador toma durante o treinamento. É um valor positivo geralmente na faixa de 0.001 a 0.1.
    rho:           valor de decaimento (decay) do RMSprop. Fator que controla a média móvel exponencial das estimativas do segundo momento do gradiente. É um valor entre 0 e 1.
    momentum:      valor que acelera o processo de treinamento, adicionando um momento aos gradientes calculados. É um valor entre 0 e 1.
    epsilon:       pequeno valor adicionado ao denominador para estabilidade numérica. Geralmente é um valor como 1e-07.
    centered:      booleano que indica se a média do gradiente deve ser subtraída. Quando definido como True, a média é subtraída; quando definido como False, apenas a média móvel exponencial é usada.
    name:          nome do otimizador.

Returns:           objeto de otimizador que será usado para otimizar o modelo durante o treinamento
"""
optimizer = tf.keras.optimizers.legacy.RMSprop(
    learning_rate=0.0005,
    rho=0.9,
    momentum=0.0,
    epsilon=1e-07,
    centered=False,
    name="RMSprop",
)

"""
A função model.compile() é usada para configurar o modelo para o treinamento, especificando o otimizador, a função de perda e as métricas a serem utilizadas durante o treinamento e a avaliação
Args:
    optimizer: objeto optimizer definidoo anteriormente (RMSprop).
    loss:      função de perda CategoricalCrossentropy, que é a função apropriada para problemas de classificação com múltiplas classes.
    metrics:   métrica de acurácia.

Returns:
    Após chamar model.compile(), o modelo está pronto para ser treinado usando o método model.fit().
"""
model.compile(optimizer=optimizer,
              loss=tf.keras.losses.CategoricalCrossentropy(),
              metrics=['accuracy'])

# resumo do modelo, mostrado a arquitetura da rede neural e o número de parâmetros treináveis em cada camada
model.summary()

In [None]:
# marca o início do tempo de execução do treinamento
inicio = time.time()

# número de épocas de treinamento
epochs=10

"""
 Executa o treinamento do modelo.
 Ele recebe o conjunto de treinamento (train_ds) e o conjunto de validação (val_ds) como entrada,
 além de especificar o tamanho do lote (batch_size) e o número de épocas (epochs).
"""
history = model.fit(
  train_ds,
  validation_data=val_ds,
  batch_size = 32,
  epochs=epochs
)

# marca o fim do tempo de execução do treinamento
fim = time.time()

# calcula e imprime a duração total do treinamento em segundos
print(fim - inicio)

#**Classificador A: Plot de gráfico**

In [None]:
# gráfico para verificar precisão e perda do modelo
pd.DataFrame(history_1.history).plot()

#**Classificador A: Testes**

*teste 1*

In [None]:
# carrega uma imagem específica localizada no caminho referente às imagens para teste
sample_path = pathlib.Path("/content/drive/MyDrive/Colab Notebooks/dataset/test/5233.jpg")

"""
Função tf.keras.utils.load_img() para carregar um objeto 'Image' do PIL

Args:
    sample_path: caminho onde a imagem está localizada
    target_size: redimensiona a imagem para um tamanho específico
    img_height e img_width: dimensões especificadas.

Returns:
    Objeto 'Image' do PIL contendo a imagem carregada e redimensionada.
"""
img = tf.keras.utils.load_img(
    sample_path, target_size=(img_height, img_width)
)

# converte o objeto em img em um array numpy
img_array = tf.keras.utils.img_to_array(img)

# expande as dimensões do array, adicionando uma nova dimensão no índice 0
img_array = tf.expand_dims(img_array, 0)

# faz previsões usando o modelo treinado em uma img_array
predictions = model.predict(img_array)

# calcula as probabilidades associadas às previsões feitas pelo modelo
score = tf.nn.softmax(predictions[0])

# exibe a classe prevista para a imagem e a confiança associada a essa previsão
print(
    "This image most likely belongs to {} with a {:.2f} percent confidence."
    .format(class_names[np.argmax(score)], 100 * np.max(score))
)

# carrega e exibe a imagem localizada no caminho especificado
PIL.Image.open(sample_path)

*teste 2*

In [None]:
sample_path = pathlib.Path("/content/drive/MyDrive/Colab Notebooks/dataset/test/5021.jpg")

img = tf.keras.utils.load_img(
    sample_path, target_size=(img_height, img_width)
)

img_array = tf.keras.utils.img_to_array(img)
img_array = tf.expand_dims(img_array, 0)


predictions = model.predict(img_array)
score = tf.nn.softmax(predictions[0])

print(
    "This image most likely belongs to {} with a {:.2f} percent confidence."
    .format(class_names[np.argmax(score)], 100 * np.max(score))
)

*teste 3*

In [None]:
sample_path = pathlib.Path("/content/drive/MyDrive/Colab Notebooks/dataset/test/4882.jpg")

img = tf.keras.utils.load_img(
    sample_path, target_size=(img_height, img_width)
)

img_array = tf.keras.utils.img_to_array(img)
img_array = tf.expand_dims(img_array, 0)


predictions = model.predict(img_array)
score = tf.nn.softmax(predictions[0])

print(
    "This image most likely belongs to {} with a {:.2f} percent confidence."
    .format(class_names[np.argmax(score)], 100 * np.max(score))
)

# **Classificador B: Criação e treinamento do modelo**

In [None]:
# definine o caminho do diretório onde as imagens de treinamento estão localizadas
trainDirectory = '/content/drive/MyDrive/Colab Notebooks/dataset/train'

imageHeight = 100
imageWidth = 100
thickness = 3
inputShape = (imageHeight, imageWidth, thickness)

In [None]:
"""
Aplicação de técnicas de aumento de imagem para aumentar a variabilidade dos dados de treinamento,
o que pode ajudar a melhorar o desempenho do modelo e sua capacidade de generalização

Args:
    rescale:            redimensiona os valores dos pixels das imagens dividindo-os por 255, normalizando-os para a faixa [0, 1].
    vertical_flip:      inverte as imagens verticalmente.
    horizontal_flip:    inverte as imagens horizontalmente.
    rotation_range:     rotaciona aleatoriamente as imagens dentro da faixa especificada (em graus).
    width_shift_range:  desloca aleatoriamente a largura (direção horizontal) das imagens por uma fração da largura total.
    height_shift_range: desloca aleatoriamente a altura (direção vertical) das imagens por uma fração da altura total.
    zoom_range:         aplica zoom aleatoriamente nas imagens por um fator especificado.
    validation_split:   especifica a fração dos dados a serem utilizados para validação.
"""
imageDataGenerator = ImageDataGenerator(rescale=1./255,
                                vertical_flip=True,
                                horizontal_flip=True,
                                rotation_range=40,
                                width_shift_range=0.2,
                                height_shift_range=0.2,
                                zoom_range=0.1,
                                validation_split=0.2)

# redimensiona os valores de pixel para ficar entre 0 e 1 usando rescale=1./255
testDataGenerator = ImageDataGenerator(rescale=1./255)

"""
Flow_from_directory() é um método das classes ImageDataGenerator e DirectoryIterator na biblioteca Keras para carregar
aumentar dados de imagem de um diretório durante o treinamento ou previsão do modelo.
Args:
    diretório:   caminho para o diretório que contém as imagens.
    target_size: tamanho para o qual as imagens devem ser redimensionadas.
    color_mode:  modo de cor das imagens ('rgb' ou 'grayscale').
    batch_size:  número de imagens em cada lote.
    shuffle:     se deseja embaralhar a ordem das imagens.
    class_mode:  tipo de rótulo a ser usado ('categorical', 'binary', 'sparse' ou None).
    subconjunto: se deve carregar um subconjunto das imagens ('treinamento' ou 'validação').
"""

trainGenerator = imageDataGenerator.flow_from_directory(trainDirectory,
                                                 shuffle=True,
                                                 batch_size=32,
                                                 subset='training',
                                                 target_size=(100, 100))

validGenerator = imageDataGenerator.flow_from_directory(trainDirectory,
                                                 shuffle=True,
                                                 batch_size=16,
                                                 subset='validation',
                                                 target_size=(100, 100))



In [None]:
"""
Este código define um modelo de rede neural convolucional usando a classe Sequential do Keras.

Estrutura:
  Duas camadas convolucionais com 64 filtros cada, função de ativação ReLU e tamanho do filtro 5x5.
  Uma camada de pooling com tamanho de pool 2x2 para reduzir a dimensionalidade.
  Uma camada de dropout com taxa de 25% para regularização.
  Duas camadas convolucionais com 128 filtros cada, função de ativação ReLU e tamanho do filtro 3x3.
  Uma camada de pooling com tamanho de pool 2x2 e stride 2x2 para reduzir a dimensionalidade.
  Uma camada de dropout com taxa de 25% para regularização.
  Uma camada de achatamento para converter os mapas de características em um vetor unidimensional.
  Uma camada densa (totalmente conectada) com 256 unidades e função de ativação ReLU.
  Uma camada de dropout com taxa de 50% para regularização.
  Uma camada densa de saída com 33 unidades (correspondendo ao número de classes) e função de ativação softmax para classificação multiclasse.
"""
model = Sequential()
model.add(Conv2D(64, (5, 5), activation='relu', padding='Same', input_shape=inputShape))
model.add(Conv2D(64, (5, 5), activation='relu', padding='Same'))
model.add(MaxPooling2D((2, 2)))
model.add(Dropout(0.25))

model.add(Conv2D(128, (3, 3), activation='relu', padding='Same'))
model.add(Conv2D(128, (3, 3), activation='relu', padding='Same'))
model.add(MaxPooling2D((2, 2), strides=(2, 2)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(33, activation='softmax'))

# o modelo é compilado com a função de perda "categorical_crossentropy", otimizador Adam com taxa de aprendizado 1e-4 e métricas de avaliação de precisão.
model.compile(loss='categorical_crossentropy', optimizer=tf.keras.optimizers.Adam(1e-4), metrics=['accuracy'])

# exibe um resumo da arquitetura do modelo
model.summary()

In [None]:
"""
O código cria um objeto EarlyStopping que é um retorno de chamada (callback) do Keras. Esse retorno de chamada é usado durante o treinamento do modelo para interromper
o treinamento prematuramente se determinadas condições não forem atendidas.

Args:
    monitor:              indica a métrica a ser monitorada durante o treinamento, no caso, a acurácia da validação.
    patience:             especifica o número de épocas que o treinamento pode continuar sem melhorias na métrica monitorada antes de parar.
    mode':                indica se o objetivo é maximizar ou minimizar a métrica monitorada. Neste caso, como se trata de uma acurácia, o objetivo é maximizá-la.
    restore_best_weights: indica se os melhores pesos do modelo devem ser restaurados após o treinamento, com base na melhor época de validação.
"""
early = tf.keras.callbacks.EarlyStopping(monitor='val_accuracy', patience=3, mode='max',
                                     restore_best_weights=True)

"""
Realiza o treinamento do modelo utilizando os geradores de dados trainGenerator e validGenerator.
Ele utiliza o método fit do modelo para ajustar os pesos com base nos dados de treinamento
e avaliar o desempenho nos dados de validação.

Args:
    trainGenerator:   gerador de dados para o treinamento.
    validation_data:  gerador de dados para a validação.
    steps_per_epoch:  número de passos (batches) por época durante o treinamento, que é calculado dividindo o número total de amostras de treinamento pelo tamanho do lote (batch size).
    validation_steps: número de passos (batches) por época durante a validação, que é calculado dividindo o número total de amostras de validação pelo tamanho do lote (batch size).
    callbacks:        lista de retornos de chamada (callbacks) a serem aplicados durante o treinamento, neste caso, apenas o retorno de chamada early definido anteriormente.
    epochs:           número de épocas de treinamento.

    O histórico do treinamento é armazenado na variável history
"""

history = model.fit(trainGenerator, validation_data=validGenerator,
                   steps_per_epoch=trainGenerator.n//trainGenerator.batch_size,
                    validation_steps=validGenerator.n//validGenerator.batch_size,
                    callbacks=[early],
                   epochs=12)


In [None]:
# salva o modelo treinado em um arquivo
model.save('model_CNN_saved')

In [None]:
# carrega o modelo salvo
model = load_model('model_CNN_saved')

"""
# cria um dicionário chamado fruitMap que mapeia os rótulos de classe codificados
com inteiros usados ​​no conjunto de dados de treinamento para seus nomes de frutas correspondentes.
# isso é feito iterando sobre o atributo class_indices do objeto trainGenerator, que é um dicionário
que mapeia os nomes de classe de string para seus rótulos codificados por números inteiros.
"""
fruitMap = dict([(v, k) for k, v in trainGenerator.class_indices.items()])
fruitMap

In [None]:
# aplica a função softmax às previsões de saída do modelo CNN pré-treinado
score = tf.nn.softmax(predictions[0])
score

# **Classificador B: Plot de gráfico**

In [None]:
# plotando os dados para ver a precisão e perda do modelo

pd.DataFrame(history_1.history).plot()

# **Classificador B: Testes**

*teste 1*

In [None]:
# carrega imagem do sistema de arquivos
samplePath = pathlib.Path("../input/fruit-recognition/test/test/5021.jpg")

# carrega uma imagem do caminho especificado em samplePath e redimensiona a imagem para o tamanho de (100, 100). A imagem carregada é retornada como um objeto do tipo PIL.Image.Image
image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

# exibe a imagem usando a função imshow()
plt.imshow(image)

# converte a imagem em array e normaliza os valores de pixel entre 0 e 1 usando a divisão por 255
image = np.array(image)
image = image / 255.0

# contém a imagem remodelada como um array numpy com as dimensões (1, imageWidth, imageHeight, 3)
image = image.reshape(1,imageWidth,imageHeight, 3)

# faz uma previsão na imagem de entrada usando a função predict()
# a saída de predict() é um array de probabilidades de classes previstas, onde cada elemento do array corresponde a um rótulo de classe diferente
predictions = model.predict(image)
predictions

# printa o rótulo da classe predita e a pontuação de confiança correspondente para a imagem de entrada, usando a matriz de pontuação obtida da função softmax aplicada às probabilidades da classe predita
score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))


#np.argmax(): retorna o índice do elemento máximo no array de pontuações que corresponde à classe prevista com a maior probabilidade
#np.max():    retorna o valor máximo de probabilidade no array de previsões
#             fornece o score de confiança para a classe prevista, multiplicando o valor máximo de probabilidade por 100

*teste 2*

In [None]:
samplePath = pathlib.Path("../input/fruit-recognition/test/test/4882.jpg")

image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

plt.imshow(image)

image = np.array(image)
image = image / 255.0

image = image.reshape(1,imageWidth,imageHeight, 3)

predictions = model.predict(image)
predictions

score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))

*teste 3*

In [None]:
samplePath = pathlib.Path("../input/fruit-recognition/test/test/5233.jpg")

image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

plt.imshow(image)

image = np.array(image)
image = image / 255.0

image = image.reshape(1,imageWidth,imageHeight, 3)

predictions = model.predict(image)
predictions

score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))

# **Nova cnnC**

In [None]:
# número de classes ou categorias diferentes nas quais as imagens devem ser classificadas
num_classes = 33

"""
Modelo de rede neural convolucional simples composta por várias camadas

    Camada Conv2D:    Tem 5 filtros (ou canais) e um tamanho de kernel de 3x3. Aplica a função de ativação ReLU aos mapas de recursos resultantes. Essa camada é responsável por extrair características das imagens de entrada.
    Camada MaxPool2D: Realiza a operação de max pooling com um pool size de 2x2. Reduz a dimensionalidade dos mapas de recursos, mantendo as características mais proeminentes.
    Camada Flatten:   Transforma os mapas de recursos 2D em um vetor 1D. Prepara os dados para a próxima camada totalmente conectada.
    Camada Dense:     É uma camada totalmente conectada que mapeia o vetor 1D de entrada para a quantidade de classes no conjunto de dados (representado por len(class_names)). Usa a função de ativação softmax para gerar probabilidades de cada classe.

Returns: Um modelo de rede neural convolucional
"""
md = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(filters=5,
                          kernel_size = 3,
                          activation = "relu",
                          input_shape = (100,100,3)),
    tf.keras.layers.MaxPool2D(pool_size =2,
                             padding='valid'),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(len(class_names), activation="softmax")
])

'''
Define as configurações de compilação para o modelo.

  loss:      A função de perda utilizada durante o treinamento é a categorical cross-entropy.
  optimizer: O otimizador escolhido para ajustar os pesos do modelo durante o treinamento é o Adam.
  metrics:   A métrica de desempenho escolhida para avaliar o modelo durante o treinamento é a acurácia.
'''
md.compile(loss="categorical_crossentropy",
               optimizer = tf.keras.optimizers.Adam(),
               metrics = ['accuracy'])

In [None]:
md.summary()

In [None]:
early = tf.keras.callbacks.EarlyStopping(monitor='val_accuracy', patience=3, mode='max',
                                     restore_best_weights=True)
epochs=5

inicio = time.time()

# faz o fit do modelo nos dados de treinamento
history_1 = md.fit(train_ds,
                       epochs =5,
                       validation_data= val_ds)
fim = time.time()

print(fim - inicio)

# **cnnC: Testes**

*teste 1*

In [None]:
# carrega imagem do sistema de arquivos
samplePath = pathlib.Path("../input/fruit-recognition/test/test/0083.jpg")

# carrega uma imagem do caminho especificado em samplePath e redimensiona a imagem para o tamanho de (100, 100). A imagem carregada é retornada como um objeto do tipo PIL.Image.Image
image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

# exibe a imagem usando a função imshow()
plt.imshow(image)

# converte a imagem em array e normaliza os valores de pixel entre 0 e 1 usando a divisão por 255
image = np.array(image)
image = image / 255.0

# contém a imagem remodelada como um array numpy com as dimensões (1, imageWidth, imageHeight, 3)
image = image.reshape(1,imageWidth,imageHeight, 3)

# faz uma previsão na imagem de entrada usando a função predict()
# a saída de predict() é um array de probabilidades de classes previstas, onde cada elemento do array corresponde a um rótulo de classe diferente
predictions = model.predict(image)
predictions

# printa o rótulo da classe predita e a pontuação de confiança correspondente para a imagem de entrada, usando a matriz de pontuação obtida da função softmax aplicada às probabilidades da classe predita
score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))


#np.argmax(): retorna o índice do elemento máximo no array de pontuações que corresponde à classe prevista com a maior probabilidade
#np.max():    retorna o valor máximo de probabilidade no array de previsões
#             fornece o score de confiança para a classe prevista, multiplicando o valor máximo de probabilidade por 100

*teste 2*

In [None]:
# carrega imagem do sistema de arquivos
samplePath = pathlib.Path("../input/fruit-recognition/test/test/0001.jpg")

# carrega uma imagem do caminho especificado em samplePath e redimensiona a imagem para o tamanho de (100, 100). A imagem carregada é retornada como um objeto do tipo PIL.Image.Image
image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

# exibe a imagem usando a função imshow()
plt.imshow(image)

# converte a imagem em array e normaliza os valores de pixel entre 0 e 1 usando a divisão por 255
image = np.array(image)
image = image / 255.0

# contém a imagem remodelada como um array numpy com as dimensões (1, imageWidth, imageHeight, 3)
image = image.reshape(1,imageWidth,imageHeight, 3)

# faz uma previsão na imagem de entrada usando a função predict()
# a saída de predict() é um array de probabilidades de classes previstas, onde cada elemento do array corresponde a um rótulo de classe diferente
predictions = model.predict(image)
predictions

# printa o rótulo da classe predita e a pontuação de confiança correspondente para a imagem de entrada, usando a matriz de pontuação obtida da função softmax aplicada às probabilidades da classe predita
score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))


#np.argmax(): retorna o índice do elemento máximo no array de pontuações que corresponde à classe prevista com a maior probabilidade
#np.max():    retorna o valor máximo de probabilidade no array de previsões
#             fornece o score de confiança para a classe prevista, multiplicando o valor máximo de probabilidade por 100

*teste 3*

In [None]:
# carrega imagem do sistema de arquivos
samplePath = pathlib.Path("../input/fruit-recognition/test/test/0010.jpg")

# carrega uma imagem do caminho especificado em samplePath e redimensiona a imagem para o tamanho de (100, 100). A imagem carregada é retornada como um objeto do tipo PIL.Image.Image
image = tf.keras.preprocessing.image.load_img(
    samplePath, target_size=(100, 100)
)

# exibe a imagem usando a função imshow()
plt.imshow(image)

# converte a imagem em array e normaliza os valores de pixel entre 0 e 1 usando a divisão por 255
image = np.array(image)
image = image / 255.0

# contém a imagem remodelada como um array numpy com as dimensões (1, imageWidth, imageHeight, 3)
image = image.reshape(1,imageWidth,imageHeight, 3)

# faz uma previsão na imagem de entrada usando a função predict()
# a saída de predict() é um array de probabilidades de classes previstas, onde cada elemento do array corresponde a um rótulo de classe diferente
predictions = model.predict(image)
predictions

# printa o rótulo da classe predita e a pontuação de confiança correspondente para a imagem de entrada, usando a matriz de pontuação obtida da função softmax aplicada às probabilidades da classe predita
score = tf.nn.softmax(predictions[0])
print("This image is {} with a {:.2f} %".format(fruitMap[np.argmax(score)],100 * np.max(predictions)))


#np.argmax(): retorna o índice do elemento máximo no array de pontuações que corresponde à classe prevista com a maior probabilidade
#np.max():    retorna o valor máximo de probabilidade no array de previsões
#             fornece o score de confiança para a classe prevista, multiplicando o valor máximo de probabilidade por 100

# **cnnC: Plot de gráfico**

In [None]:
# plotando os dados para ver a precisão e perda do modelo
pd.DataFrame(history_1.history).plot()