In [None]:
from tensorflow.keras import models, layers, activations, initializers

model = models.Sequential([
    
    layers.Input(shape=(461,345,3)),
    
    layers.Conv2D(64, activation='relu', kernel_size=(3,3),strides=(1,1),padding='same'),
    layers.MaxPooling2D((2,2)),
    
    layers.Conv2D(32, activation='relu', kernel_size=(3,3),strides=(1,1),padding='same'),
    layers.MaxPooling2D((2,2)),
    
    layers.Conv2D(16, activation='relu', kernel_size=(3,3),strides=(1,1),padding='same'),
    layers.MaxPooling2D((2,2)),
    
    layers.GlobalAveragePooling2D(),
    
    layers.Dense(80, activation=activations.relu, kernel_initializer=initializers.RandomNormal()),
    layers.Dropout(0.2,),
    layers.Dense(50, activation=activations.relu, kernel_initializer=initializers.RandomNormal()),
    layers.Dense(2, activation=activations.softmax, kernel_initializer=initializers.RandomNormal())
])

In [6]:
from tensorflow.keras import optimizers, losses, metrics

lr = 0.001

model.compile(
    optimizer = optimizers.Adam(
        learning_rate = lr
    ),
    loss = losses.SparseCategoricalCrossentropy(),
    metrics = [ metrics.sparse_categorical_accuracy ]
)

In [7]:
from tensorflow.keras import utils

path = './Data'
batch_size = 100

train = utils.image_dataset_from_directory(
    directory= path,
    shuffle = True,
    seed = 1,
    subset = 'training',
    validation_split = 0.2,
    image_size = (461,345),
    batch_size = batch_size
)

test = utils.image_dataset_from_directory(
    directory= path,
    shuffle = True,
    seed = 1,
    subset = 'validation',
    validation_split = 0.2,
    image_size = (461,345),
    batch_size = batch_size
)

Found 2000 files belonging to 2 classes.
Using 1600 files for training.
Found 2000 files belonging to 2 classes.
Using 400 files for validation.


In [8]:
from tensorflow.keras import callbacks

patience = 5
epochs = 100
model_path = "./model.keras"

model.fit(
    train,
    validation_data = test,
    epochs = epochs,
    verbose = True,

    callbacks = [
        callbacks.EarlyStopping(
            monitor = 'val_loss',
            patience = patience,
            verbose = True
        ),
        callbacks.ModelCheckpoint(
            filepath = model_path,
            save_weights_only = False,
            monitor = 'loss',
            mode = 'min',
            save_best_only = True
        )
    ]
)

Epoch 1/100
[1m14/16[0m [32m━━━━━━━━━━━━━━━━━[0m[37m━━━[0m [1m36s[0m 18s/step - loss: 1.5465 - sparse_categorical_accuracy: 0.5320

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe3 in position 137: invalid continuation byte

Relu: 
    A função ReLU produz o máximo entre sua entrada e zero. Para entradas positivas, a saída da função é igual à entrada. Para saídas estritamente negativas, a saída da função é igual a zero.

Softmax:
    Converte as pontuações brutas (logits) da camada final de uma rede neural em uma distribuição de probabilidade sobre as diferentes classes possíveis. 
    O que a Softmax faz?
    Converte em Probabilidades: A principal função da Softmax é transformar um vetor de números reais em um vetor de probabilidades. Cada valor de saída estará entre 0 e 1.
    Normalização: A soma de todas as probabilidades de saída é exatamente igual a 1. Isso permite interpretar cada valor como a probabilidade da imagem de entrada pertencer a uma classe específica.
    Tomada de Decisão: Em tarefas como reconhecimento de imagem, onde o modelo precisa prever se uma imagem contém um gato, cachorro ou pássaro, a Softmax na camada de saída indica a confiança do modelo em cada uma dessas opções, facilitando a escolha da classe mais provável. 

Sigmoid:
    É usada principalmente na camada de saída para tarefas de classificação binária, transformando os resultados em probabilidades entre 0 e 1. Embora tenha sido popular em camadas ocultas no passado, ela foi amplamente substituída por funções mais eficientes, como a ReLU, devido ao problema do gradiente evanescente (vanishing gradient). 