In [76]:
# REORGANIZANDO DADOS
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import os # permite operações no sistema de arquivos e a manipulação de diretórios
import shutil # peermite copiar e excluir arquivos


""" 
    Dataset: https://www.kaggle.com/datasets/aksha05/flower-image-dataset/data
    
    ================================DETALHES==================================
    Esse dataset não veio separando as classes em pastas, o que dificulta como  ia vai identificar cada classe,
    então eu reorganizei em pastas com um código em python, o nome da classe estava no arquivo JPG antes do _ . 
        Por exemplo : daises_0010.jpg, daises_0011.jpg, gardenias_0002.jpg
"""

# Caminho para a pasta com as imagens
dataset_path = 'flowers'
# Caminho para onde as subpastas serão criadas (opcional, se quiser em outro local)
output_path = 'flowers_reorganized'  # Modifique conforme necessário

# Criar a pasta de saída se ela não existir
if not os.path.exists(output_path):
    os.makedirs(output_path)

# Lista de arquivos na pasta, pega todos os arquivos de flowers
image_files = os.listdir(dataset_path)

# Criação das subpastas e movimentação dos arquivos
for image_file in image_files:

    """ 
        Se image_file for "daisies_001.jpg", a função split('_') vai gerar a lista ['daisies', '001.jpg'].
        [0]: Esse índice acessa o primeiro elemento da lista gerada pela função split(). No exemplo acima, o primeiro elemento é 'daisies'.
    """
    # Extrai a classe do nome do arquivo

    class_name = image_file.split('_')[0]
    
    # Cria a pasta da classe se ela não existir
    class_folder = os.path.join(output_path, class_name)
    if not os.path.exists(class_folder):
        os.makedirs(class_folder)
    
    # Move o arquivo para a pasta correspondente
    src_path = os.path.join(dataset_path, image_file)
    dst_path = os.path.join(class_folder, image_file)
    
    # Move o arquivo para a nova subpasta
    shutil.move(src_path, dst_path)

print("Reorganização concluída!")


Reorganização concluída!


In [77]:
""" 
    ========================== OBJETIVOS DA IA ==============================

    ACURACY : VALOR PRÓXIMO A 1
        Interpretação: A acurácia mede a proporção de previsões corretas do modelo em relação ao total de previsões feitas. O valor ideal seria 1 (ou 100%), o que significa que o modelo acertou todas as previsões.
        Em problemas de classificação, uma acurácia de 1 (ou 100%) significa que o modelo está fazendo previsões perfeitas.
    LOSS (PERDA) : VALOR PRÓXIMO A 0
        Interpretação: A função de perda (loss function) calcula a diferença entre as previsões do modelo e os valores reais (verdadeiros). Quanto menor for o valor da perda, melhor o modelo está se ajustando aos dados.
        Um valor de 0 indica que o modelo está fazendo previsões perfeitas, ou seja, sem erro. Na prática, o valor de perda não é geralmente 0, mas deve ser o menor possível.

    ========================== DICAS ==============================

    ALFA (TAXA DE APRENDIZADO) : 
        VALOR ALTO : Comportamento: Se o valor de alfa for muito alto, o modelo pode fazer grandes atualizações nos pesos em cada iteração. Isso pode levar a uma convergência instável, onde o modelo "salta" para frente e para trás sem realmente encontrar o ponto ótimo.

        VALOR BAIXO : Se o valor de alfa for muito baixo, o modelo fará atualizações muito pequenas nos pesos, o que pode levar a um processo de treinamento muito lento. Isso pode aumentar o tempo de treinamento e, em alguns casos, pode fazer com que o modelo demore mais para alcançar o ponto ótimo.

        IDEAL: Ajuste dinâmico: Muitas vezes, usa-se um learning rate scheduler ou técnicas como learning rate annealing ou Adam, que ajustam automaticamente a taxa de aprendizado durante o treinamento, começando com uma taxa de aprendizado relativamente alta e diminuindo ao longo das iterações.


"""



In [78]:
# importa várias partes da biblioteca Keras, que é um módulo de alto nível da biblioteca TensorFlow para a construção e treinamento de redes neurais. 
from tensorflow.keras import models, layers, activations, optimizers, utils, losses, initializers, metrics, callbacks # type: ignore


epochs = 100
batch_size = 32 # tamanho da separação do sgd. Cada vez que roda ele atualiza os pessos da rede, entt ele vai atualizar os pesos 32 vezes, mtt pequeno é mais rápido porém mais instável.
patience = 10 # quanto o earlystop vai esperar para parar, nesse caso são 5 epochs
learning_rate = 0.0001 # alfa do SGD
model_path = 'model/model.keras' # onde ele vai salvar o modelo, o 'dump'

""" 

    models: Construção e gerenciamento de modelos.
    layers: Criação de camadas para a rede neural (conv, dense, etc.).
    activations: Funções de ativação usadas nas camadas (ReLU, Softmax, etc.).
    optimizers: Otimizadores usados para treinar o modelo (Adam, SGD, etc.).
    utils: Funções auxiliares, como o carregamento de dados.
    losses: Funções de perda para calcular o erro do modelo (crossentropy, MSE, etc.).
    initializers: Inicialização dos pesos das camadas.
    metrics: Métricas para avaliação do desempenho do modelo (acurácia, precisão, recall, etc.).
    callbacks: Funções para controlar o treinamento (early stopping, checkpoint, etc.).

"""

' \n\n    models: Construção e gerenciamento de modelos.\n    layers: Criação de camadas para a rede neural (conv, dense, etc.).\n    activations: Funções de ativação usadas nas camadas (ReLU, Softmax, etc.).\n    optimizers: Otimizadores usados para treinar o modelo (Adam, SGD, etc.).\n    utils: Funções auxiliares, como o carregamento de dados.\n    losses: Funções de perda para calcular o erro do modelo (crossentropy, MSE, etc.).\n    initializers: Inicialização dos pesos das camadas.\n    metrics: Métricas para avaliação do desempenho do modelo (acurácia, precisão, recall, etc.).\n    callbacks: Funções para controlar o treinamento (early stopping, checkpoint, etc.).\n\n'

In [86]:
num_classes = 10  # Define corretamente o número de classes

model = models.Sequential([ # Modelo sequencial, onde as camadas são empilhadas
    # diminuir para fazer covuluções sem dar milhões de parâmetros
    layers.Resizing(56, 56), # colocando todas as imagens do mesmo tamanho, nn corta a imagem apenas diminui a resolução    
    layers.Rescaling(1.0/255), # deixar todos os valores dos pixels entre 0 e 1
    layers.RandomRotation((-0.2 , 0.2)), # leve rotação para cada imagem, rotacionar deixa mais lento mas aumenta a precisão


    # ============== COVULAÇÃO ==============

    # 32 filtros 3 por 3, tenho 32 imagens 54 por 54
    layers.Conv2D(64, (3, 3), activation = 'relu', kernel_initializer = initializers.RandomNormal()), # valor aleatório com distribuição normal 
    
    layers.MaxPooling2D((4, 4)), # 32 imagens 27 por 27, pooling pega cada 4 quadradinhos e pega o valor máximo de cada quadradinho, isso diminui a lentidão

    layers.Conv2D(64, (4, 4), activation = 'relu', kernel_initializer = initializers.RandomNormal()),
                  
    layers.MaxPooling2D((4, 4)),
                  
    layers.Flatten(), # vai pegar tds as imagens 9 x 8 e transformar num vetor gigante

    # layers.Dropout(0.5), # desativa 20% dos dados na camad
    
    # ==================== CAMADAS =====================
                  
    # primeira camada
    # Adiciona uma camada densa com 128 neurônios
    layers.Dense(256, activation = layers.LeakyReLU(alpha=0.01), kernel_initializer = initializers.RandomNormal()),

    layers.Dropout(0.2), # desativa 20% dos dados na camada

    #  2 camada (camda oculta) 
    layers.Dense(256, activation = layers.LeakyReLU(alpha=0.00), kernel_initializer = initializers.RandomNormal()),

    layers.Dropout(0.2), # desativa 20% dos dados na camada
    layers.Dense(128, activation = layers.LeakyReLU(alpha=0.01), kernel_initializer = initializers.RandomNormal()),

    layers.Dense(128, activation = layers.LeakyReLU(alpha=0.01), kernel_initializer = initializers.RandomNormal()),

    layers.Dense(128, activation = layers.LeakyReLU(alpha=0.01), kernel_initializer = initializers.RandomNormal()),

    layers.Dropout(0.2), # desativa 20% dos dados na camada
    layers.Dense(64, activation = layers.LeakyReLU(alpha=0.001), kernel_initializer = initializers.RandomNormal()),

    # camada de saída
    layers.Dense(num_classes, activation='softmax')  # Ajustado para múltiplas classes
])

"""  
    ====================== Explicações ==========================
    camada Dense:
    Função: A camada Dense é uma camada totalmente conectada, ou seja, cada neurônio da camada anterior está conectado a todos os neurônios da camada atual.
        Aplicação: Essa camada é usada principalmente em redes neurais feedforward (como redes densas ou MLP - Multi-Layer Perceptron), onde os dados são passados por todas as camadas de forma sequencial.
        Entrada/saída: A entrada para uma camada Dense pode ser de qualquer dimensão, mas é geralmente um vetor unidimensional (por exemplo, uma série de características de um dado ou um vetor achatado de uma imagem).
    Camada Conv2d: 
        função: A camada Conv2D realiza uma operação matemática chamada convolução em duas dimensões (como imagens ou qualquer dado que tenha altura e largura, como uma matriz 2D). Ela é usada para detectar padrões, bordas, texturas ou outras características em uma imagem, ou qualquer tipo de entrada que tenha duas dimensões.

        Uso: camadas Conv2D e MaxPooling2D são usadas para operar em dados de duas dimensões (como imagens). Se você estiver lidando com imagens, onde as entradas são matrizes 2D (como imagens RGB).

        # Como funciona:

            Filtros (ou Kernels): A camada Conv2D usa um conjunto de filtros (ou kernels) que deslizam sobre a imagem de entrada. Cada filtro é uma pequena matriz que tem a função de "examinar" uma região da imagem para extrair informações, como bordas, texturas, etc.

            Deslizamento (Stride): Quando o filtro desliza pela imagem (ou qualquer dado 2D), ele se move de acordo com um valor chamado "stride". Isso determina o quão longe o filtro se move a cada vez (por exemplo, se o stride for 1, o filtro move uma célula por vez).

            Padding: A operação de convolução pode ser feita com ou sem "padding" (preenchimento). O padding é quando a imagem de entrada é "esticada" com pixels extras (geralmente zero) ao redor, para garantir que o filtro possa ser aplicado nas bordas da imagem sem perder informações.

            Saída (Feature Map): O resultado da convolução é uma nova matriz, chamada de feature map, que contém as informações extraídas pela convolução, como padrões e características encontradas na imagem.
        # Para que serve:

            Extração de características: A principal função da convolução é extrair características (como bordas, formas, cores, texturas, etc.) de imagens ou outros dados 2D. Em uma rede neural, essas características extraídas podem ser usadas para tarefas como classificação, detecção e segmentação.
            
            Redução de dimensões: Como a convolução reduz a resolução da imagem (dependendo do stride e do padding), isso ajuda a reduzir a complexidade computacional e extrair apenas as informações mais importantes da imagem.

"""



In [87]:
model.compile(
    optimizer = optimizers.Adam( # adam é um algoritmo keras
        learning_rate = learning_rate
    ),
    # loss=losses.CategoricalCrossentropy(), # mais de uma classe, quando nn é um int a classe
    loss=losses.SparseCategoricalCrossentropy(), # quando é int a classe
    # metrics = [metrics.BinaryAccuracy(), metrics.Precision(), metrics.Recall() ] # para uma classe só, 1 ou 0
    metrics=['accuracy']  # Usa accuracy normal para multiclasse
)


In [81]:
train = utils.image_dataset_from_directory(
    output_path,
    validation_split = 0.2,
    subset= 'training',
    shuffle=True,
    seed=42,
    image_size=(244,244),
    batch_size = batch_size
)

test = utils.image_dataset_from_directory(
    output_path,
    validation_split = 0.2,
    subset= 'validation',
    shuffle=True,
    seed=42,
    image_size=(244,244),
    batch_size = batch_size
)

print(train.class_names)

# Se as imagens forem RGB, o formato precisa ser (batch_size, altura, largura, 3). Para conferir:

Found 733 files belonging to 10 classes.
Using 587 files for training.
Found 733 files belonging to 10 classes.
Using 146 files for validation.
['bougainvillea', 'daisies', 'garden', 'gardenias', 'hibiscus', 'hydrangeas', 'lilies', 'orchids', 'peonies', 'tulip']


In [88]:

    
model.fit(
    train,
    validation_data = test,
    epochs = epochs,
    callbacks = [
        callbacks.EarlyStopping(
            monitor = 'val_loss',
            patience = patience
        ),
        callbacks.ModelCheckpoint(
            filepath = model_path,
            save_weights_only = False,
            monitor = 'loss',
            mode = 'min',
            save_best_only = True
        )
    ]
)

Epoch 1/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 87ms/step - accuracy: 0.0893 - loss: 2.3027 - val_accuracy: 0.1233 - val_loss: 2.3020
Epoch 2/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 78ms/step - accuracy: 0.1344 - loss: 2.3021 - val_accuracy: 0.1096 - val_loss: 2.3017
Epoch 3/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 87ms/step - accuracy: 0.1140 - loss: 2.3016 - val_accuracy: 0.1096 - val_loss: 2.3012
Epoch 4/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 89ms/step - accuracy: 0.1407 - loss: 2.2999 - val_accuracy: 0.1096 - val_loss: 2.3000
Epoch 5/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 86ms/step - accuracy: 0.1363 - loss: 2.2976 - val_accuracy: 0.1096 - val_loss: 2.2972
Epoch 6/100
[1m19/19[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 87ms/step - accuracy: 0.1473 - loss: 2.2924 - val_accuracy: 0.1164 - val_loss: 2.2906
Epoch 7/100
[1m19/19[0m [

<keras.src.callbacks.history.History at 0x23ff601c470>