##‚ö°Importa√ß√£o das Bibliotecas

O cl√°ssico "setup do projeto", onde a gente importa todos os pacotes que vai usar mais pra frente.

In [None]:
import os
import pandas as pd
import numpy as np
import random
import shutil
from shutil import copyfile
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
from matplotlib.offsetbox import (TextArea, DrawingArea, OffsetImage,
                                  AnnotationBbox)
import matplotlib.patches as mpatches

##‚ö†Ô∏è Observa√ß√£o sobre o uso do dataset

Existem duas formas de acessar o dataset:

‚úÖ Via opendatasets: Ideal para Google Colab. Permite baixar diretamente do Kaggle com od.download(url) ‚Äî √© necess√°rio fornecer suas credenciais do Kaggle (usu√°rio + API key).

üîí Via caminho local (ex: /kaggle/input/...): Funciona apenas dentro dos notebooks do Kaggle, pois os dados j√° est√£o inclu√≠dos no ambiente e n√£o precisam ser baixados manualmente.

‚ûï Use opendatasets no Colab ou Jupyter local.
‚ûñ Use caminho local apenas se estiver rodando o notebook dentro da plataforma Kaggle.

Nesse exemplo, os autores usaram o caminho direto do Kaggle, mas quando N√ìS fizermos isso no colab, precisamos importar com o opendatasets‚úå

In [None]:
base_dir  = '/kaggle/input/agricultural-crops-image-classification/Agricultural-crops/'
os.chdir(base_dir)

## üóÇÔ∏è Inspe√ß√£o Inicial das Classes do Dataset

* Detecta todas as pastas no diret√≥rio base (cada uma representa uma classe).

* Conta quantas imagens existem em cada classe.

* Armazena os nomes das classes e a primeira imagem de cada uma pra uso posterior.

* Organiza tudo num DataFrame do pandas, ordenando pela quantidade de imagens por classe.

üí° Isso √© √∫til pra identificar se o dataset est√° balanceado ou se h√° classes com muito mais imagens que outras (desequil√≠brio de classes).

In [None]:
# to list every directory name (label name)
directories_list = tf.io.gfile.listdir(base_dir)

# get number of labels
len_labels = len(directories_list)
print(f"Total Class Labels = {len_labels}")

vis_images = []; vis_labels =[]
length_file_list = []; label_list = []

for item in directories_list:

    # get each label directory
    item_dir = os.path.join(base_dir, item)
    # get list of images of each label
    item_files = os.listdir(item)
    # number of images per label
    len_per_label = len(os.listdir(item))

    length_file_list.append(len_per_label)
    label_list.append(item)

    # get first image of each label (for visualisation purpose)
    vis_images.append(os.path.join(item_dir, item_files[0]))
    # get respective label name (for visualisation purpose)
    vis_labels.append(item)

df_temp = pd.DataFrame({'Labels':label_list, 'Number of Images':length_file_list}).\
sort_values(by='Number of Images', ascending=False)
df_temp

 üñºÔ∏è Visualizando uma Imagem de Cada Classe

 Visualiza√ß√£o das primeiras imagens do dataset, uma pra cada classe.

 * Cria uma figura com subplots organizados em grade para exibir uma imagem de cada classe.

* Usa as listas vis_images e vis_labels (criadas l√° atr√°s) pra carregar a primeira imagem representativa de cada categoria.

* Remove ticks dos eixos, adiciona o r√≥tulo de cada imagem e um t√≠tulo geral.

üëÄ Isso √© √≥timo pra ter uma visualiza√ß√£o r√°pida da variedade de classes e garantir que os dados est√£o organizados corretamente.

üß† Tamb√©m ajuda a identificar poss√≠veis problemas como r√≥tulos trocados, imagens em branco, ou qualidade baixa de amostras.

In [None]:
plt.figure(figsize=(10,10))
for i in range(len(vis_labels)):
    plt.subplot(6,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    img = mpimg.imread(vis_images[i])
    plt.imshow(img)
    plt.xlabel(vis_labels[i])
    plt.suptitle(f"Classifying {len_labels} Types of Image Labels",fontsize=18, fontweight='bold')
plt.show()

## üîÄ Fun√ß√£o para Dividir os Dados em Treino e Valida√ß√£o

 √â um modo manual de dividir o dataset em treino e valida√ß√£o ‚Äî e com uma vantagem extra: ela ignora arquivos corrompidos (com tamanho 0 bytes)e ignora eles! üéØ

* Usa random.sample pra sortear uma fra√ß√£o dos arquivos (SPLIT_SIZE) pro treino.

* Coloca o restante no conjunto de valida√ß√£o.

* Copia os arquivos para os diret√≥rios respectivos: TRAINING_DIR e VALIDATION_DIR.

üîí A semente aleat√≥ria (random.seed(42)) garante que a divis√£o seja reprodut√≠vel ‚Äî ou seja, sempre vai gerar o mesmo resultado.

üí° Essa abordagem funciona bem quando o dataset j√° est√° separado por pastas de classe, e voc√™ quer gerar divis√µes manuais sem usar ImageDataGenerator.flow_from_directory() ainda.

In [None]:
def split_data(SOURCE_DIR, TRAINING_DIR, VALIDATION_DIR, SPLIT_SIZE):

    selected_file_names = []
    all_file_names = os.listdir(SOURCE_DIR)
    for file_name in all_file_names:
        file_path = os.path.join(SOURCE_DIR, file_name)
        size = os.path.getsize(file_path)
        if size != 0:
              selected_file_names.append(file_name)
        else:
              print(f"{file_name} is zero length, so ignoring.")

    random.seed(42)
    selected_train_files = random.sample(selected_file_names, int(SPLIT_SIZE * len(selected_file_names)))
    selected_val_files = [x for x in selected_file_names if x not in selected_train_files]

    for file_name in selected_train_files:
        source = os.path.join(SOURCE_DIR, file_name)
        destination = os.path.join(TRAINING_DIR, file_name)
        copyfile(source, destination)

    for file_name in selected_val_files:
        source = os.path.join(SOURCE_DIR, file_name)
        destination = os.path.join(VALIDATION_DIR, file_name)
        copyfile(source, destination)

## üóÇÔ∏è Fun√ß√£o para Criar Pastas de Treino e Valida√ß√£o Organizadas por Classe

Essa fun√ß√£o √© como o ‚Äúmodo autom√°tico‚Äù pra preparar as pastinhas de treino e valida√ß√£o pra cada classe. Ela organiza tudo bonitinho e ainda chama a fun√ß√£o split_data().

* Percorre cada classe (cada pasta dentro do dataset).

* Cria pastas espec√≠ficas pra treino e valida√ß√£o, organizadas assim:

    * root_path/_MODELLING/training/<classe>/
    * root_path/_MODELLING/validation/<classe>/

* Chama a fun√ß√£o split_data() pra distribuir as imagens entre treino e valida√ß√£o, com o split_size definido (padr√£o = 90% treino, 10% valida√ß√£o).

üßπ Antes de rodar essa fun√ß√£o, certifique-se de que os diret√≥rios _MODELLING/training e validation n√£o existem ainda, sen√£o o os.makedirs() pode lan√ßar erro.

üí° Muito √∫til pra deixar os dados prontos pra ImageDataGenerator.flow_from_directory(), que espera justamente essa estrutura por pastas.

In [None]:
def create_train_val_dirs(root_path, split_size = 0.9):
    for item in directories_list:
        source_dir = os.path.join(base_dir, item)
        training_dir = os.path.join(root_path, f'_MODELLING/training/{item}')
        validation_dir = os.path.join(root_path, f'_MODELLING/validation/{item}')

        # Create EMPTY directory
        os.makedirs(training_dir)
        os.makedirs(validation_dir)

        split_data(source_dir, training_dir, validation_dir, split_size)
    print(f"Created training and validation directories containing images at split size of {split_size}")

## üöß Criando as Pastas com os Dados de Treino e Valida√ß√£o

* Executa a fun√ß√£o create_train_val_dirs() que:

* Cria as pastas para treino e valida√ß√£o.

* Copia as imagens da pasta original (base_dir) para as novas pastas organizadas por classe.

* Divide os dados com 90% para treino e 10% para valida√ß√£o (split_size = 0.9).

üìÇ As imagens ficar√£o organizadas em
* /kaggle/working/_MODELLING/training/ e
* /kaggle/working/_MODELLING/validation/, prontos pra serem lidos por geradores de imagens.

‚ö†Ô∏è Essa c√©lula pode demorar um pouco dependendo do tamanho do dataset, j√° que ela est√° copiando arquivos de forma individual.

In [None]:
create_train_val_dirs('/kaggle/working', split_size = 0.9)

## üñºÔ∏è Visualiza√ß√£o de Data Augmentation com ImageDataGenerator

‚ú® Ela demonstra como o ImageDataGenerator transforma (aumenta) as imagens de forma autom√°tica, usando t√©cnicas de data augmentation.üé®

* Carrega uma imagem de uma classe espec√≠fica.

* Aplica quatro tipos diferentes de transforma√ß√£o usando o ImageDataGenerator:

* Rota√ß√£o da imagem

* Deslocamento horizontal

* Zoom in/out

* Espelhamento horizontal

* Exibe 3 varia√ß√µes da imagem para cada tipo de transforma√ß√£o.

üîÅ Isso ajuda o modelo a generalizar melhor, pois ele "v√™" diferentes vers√µes de uma mesma imagem durante o treino.

üß™ Ideal pra verificar se o augmentation est√° funcionando como esperado antes de aplicar no pipeline de treinamento.

In [None]:
def show_ImageDataGenerator(vis_images, vis_labels, image_index):
    #Loads image in from the set image path
    class_label = vis_labels[image_index]
    img = tf.keras.preprocessing.image.load_img(vis_images[image_index], target_size= (250,250))
    img_tensor = tf.keras.preprocessing.image.img_to_array(img)
    img_tensor = np.expand_dims(img_tensor, axis=0)

    #Creates our batch of one image
    def show_image(datagen, param):
        pic = datagen.flow(img_tensor, batch_size =1)
        plt.figure(figsize=(10,3.5))
        #Plots our figures
        for i in range(1,4):
            plt.subplot(1, 3, i)
            batch = pic.next()
            image_ = batch[0].astype('uint8')
            plt.imshow(image_)
        plt.suptitle(f"Class: {class_label} \n Image Generator ({param})",fontsize=18, fontweight='bold')

        plt.show()

    datagen = ImageDataGenerator(rotation_range=30)
    show_image(datagen, "rotation_range=30")

    datagen = ImageDataGenerator(width_shift_range=0.2)
    show_image(datagen, "width_shift_range=0.2")

    datagen = ImageDataGenerator(zoom_range=0.2)
    show_image(datagen, "zoom_range=0.2")

    datagen = ImageDataGenerator(horizontal_flip=True)
    show_image(datagen, "horizontal_flip=True")

show_ImageDataGenerator(vis_images, vis_labels, image_index = 0)

## üîÑ Aplicando Data Augmentation em Outra Imagem

* Executa novamente a fun√ß√£o show_ImageDataGenerator, agora usando a quarta imagem (√≠ndice 3) da lista vis_images.

* Exibe as transforma√ß√µes de data augmentation (rota√ß√£o, deslocamento, zoom e espelhamento) aplicadas a essa nova imagem.

üéØ Isso serve pra explorar como o ImageDataGenerator afeta diferentes tipos de imagem no dataset ‚Äî uma √≥tima pr√°tica pra garantir que as transforma√ß√µes est√£o mantendo a coer√™ncia visual das classes.

In [None]:
show_ImageDataGenerator(vis_images, vis_labels, image_index = 3)

## üîÑ Fun√ß√£o para Criar os Geradores de Imagem (Treino e Valida√ß√£o)

Aqui definimos uma fun√ß√£o super importante: criar os geradores de imagem para treino e valida√ß√£o, com data augmentation no treino e normaliza√ß√£o simples na valida√ß√£o.

* Cria dois ImageDataGenerator:

* Um com v√°rias transforma√ß√µes (rota√ß√£o, deslocamento, zoom, flip) para aumentar a variedade no conjunto de treino.

* Outro apenas com rescale=1./255 para normalizar as imagens de valida√ß√£o.

* Usa flow_from_directory() para gerar batches de imagens automaticamente a partir da estrutura de pastas:

    *<TRAINING_DIR>/<classe1>/
    *<TRAINING_DIR>/<classe2>/
...
* Retorna dois geradores que ser√£o usados no model.fit() mais adiante.

‚ö†Ô∏è Aten√ß√£o: class_mode='binary' s√≥ funciona se houver duas classes. Se tiver mais, √© melhor usar class_mode='categorical'.

üìê target_size=(150, 150) define o tamanho para o qual todas as imagens ser√£o redimensionadas.

In [None]:
def train_val_generators(TRAINING_DIR, VALIDATION_DIR):

    # Instantiate the ImageDataGenerator class (don't forget to set the arguments to augment the images)
    train_datagen = ImageDataGenerator(rescale=1./255,
                                     rotation_range=30,
                                     width_shift_range=0.2,
                                     height_shift_range=0.2,
                                     shear_range=0.2,
                                     zoom_range=0.2,
                                     horizontal_flip=True,
                                     fill_mode='nearest')

    # Pass in the appropriate arguments to the flow_from_directory method
    train_generator = train_datagen.flow_from_directory(directory=TRAINING_DIR,
                                                      batch_size=32,
                                                      class_mode='binary',
                                                      target_size=(150, 150))

    # Instantiate the ImageDataGenerator class (don't forget to set the rescale argument)
    validation_datagen = ImageDataGenerator(rescale=1./255)

    # Pass in the appropriate arguments to the flow_from_directory method
    validation_generator = validation_datagen.flow_from_directory(directory=VALIDATION_DIR,
                                                                batch_size=32,
                                                                class_mode='binary',
                                                                target_size=(150, 150))
    return train_generator, validation_generator

## üìÇ Definindo os Caminhos das Pastas de Treino e Valida√ß√£o

* Usa os.path.join pra montar os caminhos completos das pastas de treino e valida√ß√£o dentro da pasta _MODELLING.

* Imprime o caminho da pasta de valida√ß√£o para confer√™ncia.

üîé Isso garante que as pr√≥ximas fun√ß√µes, como os geradores de imagem, saibam exatamente onde buscar os dados.

‚úÖ Se estiver rodando no Colab, substitua '/kaggle/working' por '/content'.

In [None]:
training_dir = os.path.join('/kaggle/working', '_MODELLING', 'training')
validation_dir = os.path.join('/kaggle/working', '_MODELLING', 'validation')

print(validation_dir)

## üß™ Gerando os Batches de Imagens para Treino e Valida√ß√£o

* Chama a fun√ß√£o train_val_generators() com os diret√≥rios de treino e valida√ß√£o definidos anteriormente.

* Cria dois objetos:

    * train_generator: que aplica data augmentation e fornece imagens em lotes para o treino.

    * validation_generator: que fornece imagens normalizadas para valida√ß√£o, sem transforma√ß√£o.

üì¶ Esses geradores s√£o ideais para uso com model.fit() porque entregam os dados em tempo real (sem precisar carregar tudo na mem√≥ria).

üß† A partir daqui, j√° pode treinar modelos usando essas imagens em fluxo cont√≠nuo!

In [None]:
train_generator, validation_generator = train_val_generators(training_dir, validation_dir)

## üß† Definindo o Modelo 1 ‚Äì CNN Simples do Zero

Define o primeiro modelo de rede neural convolucional (CNN) do projeto ‚Äî feito do zero, usando a API sequencial do Keras.

Define uma CNN simples, com:

* 2 camadas convolucionais + max pooling

* Uma camada Flatten para transformar a imagem em vetor

* Dropout de 50% para evitar overfitting

* Uma camada densa de 1024 neur√¥nios

* Camada de sa√≠da softmax, com n√∫mero de sa√≠das igual ao total de classes (len_labels)

üìè A entrada √© uma imagem RGB de 150x150 pixels (input_shape=(150, 150, 3)).

üßÆ A fun√ß√£o model_1.summary() exibe a arquitetura da rede com o total de par√¢metros trein√°veis.

‚ö†Ô∏è Como √© uma softmax, esse modelo assume classifica√ß√£o multiclasse com classes mutuamente exclusivas.

In [None]:
model_1 = tf.keras.models.Sequential([
    # Note the input shape is the desired size of the image 150x150 with 3 bytes color
    # This is the first convolution
    tf.keras.layers.Conv2D(64, (3,3), activation='relu', input_shape=(150, 150, 3)),
    tf.keras.layers.MaxPooling2D(2, 2),
    # The second convolution
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),
    # Flatten the results to feed into a DNN
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(0.5),
    # 512 neuron hidden layer
    tf.keras.layers.Dense(1024, activation='relu'),
    tf.keras.layers.Dense(len_labels, activation='softmax')
])

# Print the model summary
model_1.summary()

## ‚èπÔ∏è Callback para Parar o Treinamento com 80% de Acur√°cia

Define um callback personalizado ‚Äî um tipo de ‚Äúvigia‚Äù que monitora o treino e interrompe automaticamente quando a acur√°cia chega a 80%. Super √∫til pra evitar overfitting e poupar tempo de computa√ß√£o.

* Cria uma classe myCallback que herda de tf.keras.callbacks.Callback.

* No final de cada √©poca (on_epoch_end), ela checa a acur√°cia (logs['accuracy']).

* Se a acur√°cia passar de 80%, ela:

* Imprime uma mensagem no console;

* Interrompe o treinamento com self.model.stop_training = True.

üß† Esse tipo de callback √© √∫til quando voc√™ quer evitar que o modelo ‚Äúcontinue treinando √† toa‚Äù depois de atingir um desempenho satisfat√≥rio.

‚ö†Ô∏è Funciona apenas se a m√©trica accuracy estiver sendo monitorada no model.compile().

In [None]:
# Define a Callback class that stops training once accuracy reaches 80%
class myCallback(tf.keras.callbacks.Callback):
    def on_epoch_end(self, epoch, logs={}):
        if(logs.get('accuracy')>0.8):
            print("\nReached 80% accuracy so cancelling training!")
            self.model.stop_training = True
callbacks = myCallback()

## ‚öôÔ∏è Compilando o Modelo 1 (CNN Simples)

Aqui √© onde o modelo CNN √© compilado, ou seja, configurado com otimizador, fun√ß√£o de perda e m√©trica antes de ser treinado.

* Otimizador: Usa o Adam, um dos otimizadores mais eficientes e populares para deep learning.

* Taxa de aprendizado (learning_rate=0.001) define o ‚Äútamanho do passo‚Äù durante o ajuste dos pesos.

* Fun√ß√£o de perda: sparse_categorical_crossentropy ‚Äî ideal quando os r√≥tulos das classes s√£o n√∫meros inteiros (ex: 0, 1, 2...) e n√£o one-hot encoded.

* M√©trica: accuracy, para acompanhar a porcentagem de classifica√ß√µes corretas durante o treino e valida√ß√£o.

üß† Lembrando: sparse_categorical_crossentropy espera que os r√≥tulos estejam em formato inteiro, diferente de categorical_crossentropy que exige one-hot (vetores bin√°rios).

In [None]:
model_1.compile(optimizer = tf.keras.optimizers.Adam(learning_rate=0.001),
            loss = 'sparse_categorical_crossentropy',
            metrics=['accuracy'])

## üöÄ Treinando o Modelo 1

Agora iniciamos o treinamento do modelo usando os dados gerados pelas pastas e com o callback de parada autom√°tica ativado.

Treina o model_1 usando:

* train_generator: imagens com data augmentation.

* validation_generator: imagens normalizadas (sem transforma√ß√£o).

* Executa por at√© 20 √©pocas, mas pode parar antes se a acur√°cia de treino passar de 80%, gra√ßas ao callbacks=callbacks.

* Armazena o hist√≥rico do treinamento (loss, accuracy etc) no objeto history_1.

üìà Esse hist√≥rico pode ser usado depois pra gerar gr√°ficos de desempenho com matplotlib.

‚è±Ô∏è O tempo de execu√ß√£o depende do tamanho do dataset e do modelo. Com ImageDataGenerator, as imagens s√£o carregadas e transformadas em tempo real (√≥timo pra mem√≥ria!).

In [None]:
history_1 = model_1.fit(train_generator,
                    epochs=20,
                    validation_data=validation_generator,
                    callbacks=callbacks)

## üìä Visualiza√ß√£o da Performance do Modelo (Acur√°cia & Perda)

Nessa c√©lula, n√£o s√≥ plotamos os gr√°ficos de treino e valida√ß√£o, como ainda calculamos o gradiente (m) da curva, o que √© √≥timo pra entender se o modelo est√° melhorando de forma consistente.

* Define uma fun√ß√£o vis_evaluation() para:

* Plotar dois gr√°ficos lado a lado:

* Acur√°cia de treino e valida√ß√£o

* Perda (loss) de treino e valida√ß√£o

* Calcular o gradiente da curva (m) ‚Äî a taxa de varia√ß√£o da m√©trica ao longo das √©pocas (tipo: "o quanto melhorou por √©poca").

* Exibir essas informa√ß√µes visualmente com legendas e anota√ß√µes autom√°ticas nos gr√°ficos.

Depois:

* Extrai o hist√≥rico salvo durante o model.fit() com history_1.history

* Chama a fun√ß√£o para visualizar os resultados do modelo 1 (CNN b√°sica)

üìà Esse tipo de visualiza√ß√£o ajuda a identificar overfitting (ex: acur√°cia de treino sobe, mas a de valida√ß√£o n√£o) ou underfitting (quando ambas s√£o ruins).

üß† O gradiente ("m") mostra se o modelo est√° melhorando de forma consistente ou se estagnou.

In [None]:
def vis_evaluation(history_dict, model_name):
    fig, axs = plt.subplots(nrows=1, ncols=2, figsize=(15, 6))
    epochs = range(1, len(history_dict['accuracy'])+1)

    def get_gradient(y_arr, epochs):
        return round((y_arr[-1] - y_arr[0]) / (epochs[-1] - epochs[0]),2)

    def vis_sub_evaluation(n, Accuracy, train_acc, val_acc, epochs):
        axs[n].plot(epochs, train_acc, label=f'Training {Accuracy}', ls='--')
        axs[n].plot(epochs, val_acc, label=f'Validation {Accuracy}', ls='dotted')

        axs[n].set_title(f'Training and Validation {Accuracy}')
        axs[n].set_xlabel('Epochs')
        axs[n].set_ylabel(Accuracy)

        handles, labels = axs[n].get_legend_handles_labels()
        m_patch = mpatches.Patch(color='grey',label='m: gradient')
        handles.append(m_patch)
        axs[n].legend(handles=handles)

        def annotate_box(train_acc):
            return AnnotationBbox(TextArea(f"m = {get_gradient(train_acc, epochs)}"), (epochs[-1], train_acc[-1]),
                            xybox=(20, 20),
                            xycoords='data',
                            boxcoords="offset points",
                            arrowprops=dict(arrowstyle="->"))
        axs[n].add_artist(annotate_box(train_acc))
        axs[n].add_artist(annotate_box(val_acc))

    train_acc = history_dict['accuracy']
    val_acc = history_dict['val_accuracy']
    vis_sub_evaluation(0, 'Accuracy', train_acc, val_acc, epochs)

    train_loss = history_dict['loss']
    val_loss = history_dict['val_loss']
    vis_sub_evaluation(1, 'Loss', train_loss, val_loss, epochs)

    plt.suptitle(f"Performance Evaluation of {model_name}",fontsize=18, fontweight='bold')
    plt.show()

history_dict_1 = history_1.history
vis_evaluation(history_dict_1, 'Basic CNN')

## üöÄ Carregando a Base do Modelo Pr√©-Treinado (VGG16)

Entramos no territ√≥rio do Transfer Learning com VGG16 ‚Äî e essa c√©lula prepara o modelo pr√©-treinado para ser usado como base na nossa rede.

* Carrega a arquitetura VGG16 pr√©-treinada no ImageNet, sem o topo (as camadas densas finais): include_top=False.

* Define que nenhuma camada do modelo ser√° trein√°vel (layer.trainable = False), ou seja, a rede ser√° usada apenas como extratora de caracter√≠sticas visuais.

* Conta e imprime o n√∫mero total de par√¢metros e quantos s√£o trein√°veis (neste caso, deve dar zero trein√°veis).

üì¶ Transfer Learning = usar o "conhecimento visual" de um modelo j√° treinado em um grande dataset (como ImageNet) e aplicar em outro problema.

üîí Congelar as camadas impede que os pesos da VGG sejam alterados ‚Äî √≥timo pra economizar tempo e evitar overfitting com datasets pequenos.

In [None]:
from tensorflow.keras.applications import VGG16

pre_trained_model = VGG16(include_top=False,weights='imagenet', input_shape=(150, 150, 3))
for layer in pre_trained_model.layers:
    layer.trainable = False

total_params = pre_trained_model.count_params()
num_trainable_params = sum([w.shape.num_elements() for w in pre_trained_model.trainable_weights])

print(f"There are {total_params:,} total parameters in this model.")
print(f"There are {num_trainable_params:,} trainable parameters in this model.")

## üîç Explorando a Sa√≠da do Modelo Pr√©-Treinado

Mostra como termina a VGG16 (a √∫ltima camada convolucional) e confirma o tipo do objeto que foi carregado.

* Armazena a √∫ltima sa√≠da do modelo VGG16 congelado na vari√°vel last_output.

* Essa sa√≠da √© o que ser√° usado como entrada para o "topo personalizado", que ser√° adicionado na pr√≥xima etapa.

* Imprime o tipo do objeto carregado (tensorflow.keras.Model), confirmando que ele √© um modelo funcional do Keras.

üìê A sa√≠da da VGG16 (sem o topo) √© um tensor 3D com v√°rias ativa√ß√µes (mapas de caracter√≠sticas) ‚Äî isso alimentar√° as camadas densas que v√™m a seguir.

üîå Esse last_output ser√° conectado via Functional API ao novo "topo" que voc√™ vai construir.

In [None]:
last_output = pre_trained_model.output
print('last layer output: ', last_output)

# Print the type of the pre-trained model
print(f"The pretrained model has type: {type(pre_trained_model)}")

## üß± Construindo o Modelo Final com Transfer Learning

Fun√ß√£o que monta o modelo completo de Transfer Learning, usando a VGG16 congelada como base e adicionando um topo personalizado.

* Achata (Flatten) a sa√≠da da VGG16 pra transformar os mapas de ativa√ß√£o num vetor 1D.

* Adiciona:

    * Uma camada densa com 1024 unidades e ReLU.

    * Um dropout de 30% pra evitar overfitting.

    * Uma camada final Dense com ativa√ß√£o softmax, com n√∫mero de sa√≠das igual ao total de classes (len_labels).

* Cria um modelo final com a entrada original da VGG e a nova sa√≠da personalizada.

‚öôÔ∏è A fun√ß√£o retorna o modelo completo, pronto pra compilar e treinar.

üß† Isso √© o ‚Äúmelhor dos dois mundos‚Äù: aproveita o poder da VGG pra extrair padr√µes visuais e usa um classificador pr√≥prio pra sua tarefa.

In [None]:
from tensorflow.keras import Model

def transfer_learning(last_output, pre_trained_model):
    # Flatten da sa√≠da da VGG
    x = tf.keras.layers.Flatten()(last_output)
    # Camada densa com 1024 neur√¥nios e ativa√ß√£o ReLU
    x = tf.keras.layers.Dense(1024, activation='relu')(x)
    # Dropout para reduzir overfitting
    x = tf.keras.layers.Dropout(0.3)(x)
    # Camada de sa√≠da com softmax para classifica√ß√£o multiclasse
    x = tf.keras.layers.Dense(len_labels, activation='softmax')(x)

    # Modelo final unindo entrada da VGG16 e novo topo
    model = Model(inputs=pre_trained_model.input, outputs=x)

    return model


## üß¨ Criando e Resumindo o Modelo com Transfer Learning (Modelo 2)

O  modelo 2 est√° oficialmente criado! Essa c√©lula chama a fun√ß√£o que definimos e imprime o resumo da arquitetura completa ‚Äî VGG16 como base + seu topo customizado.

Chama a fun√ß√£o transfer_learning() usando:

* last_output: a sa√≠da da VGG16 (camadas convolucionais).

* pre_trained_model: o modelo base congelado.

Gera um modelo completo (model_2) com a entrada da VGG16 e uma nova "cabe√ßa" de classifica√ß√£o.

Exibe um resumo com:

* Quantidade de camadas

* Formato das sa√≠das

* Total de par√¢metros

* Quantos s√£o trein√°veis (neste caso, s√≥ as camadas do topo)

üìå As camadas da VGG16 est√£o congeladas (n√£o trein√°veis), ent√£o s√≥ o ‚Äútopo‚Äù √© atualizado durante o treinamento.

üìà Ideal pra quando voc√™ quer boas representa√ß√µes visuais sem precisar treinar uma CNN do zero ‚Äî especialmente √∫til com datasets pequenos.

In [None]:
model_2 = transfer_learning(last_output, pre_trained_model)
model_2.summary()

## ‚öôÔ∏è Compilando o Modelo 2 (Transfer Learning com VGG16)

Agora o modelo 2 (com VGG16) est√° sendo preparado pro combate! ‚öîÔ∏è
Essa c√©lula faz a mesma etapa de compila√ß√£o que foi feita no modelo 1, s√≥ que agora aplicada ao modelo de Transfer Learning.

* Usa o otimizador Adam, com taxa de aprendizado de 0.001.

* Define a fun√ß√£o de perda como sparse_categorical_crossentropy, j√° que os r√≥tulos s√£o inteiros.

* Monitora a acur√°cia como m√©trica principal.

‚úÖ Mesmo padr√£o de compila√ß√£o usado no modelo 1 ‚Äî assim a compara√ß√£o entre eles ser√° justa.

üß† Lembra que s√≥ as camadas do ‚Äútopo‚Äù do modelo s√£o trein√°veis aqui, ent√£o o treinamento deve ser mais r√°pido e menos propenso a overfitting.

In [None]:
model_2.compile(optimizer = tf.keras.optimizers.Adam(learning_rate=0.001),
            loss = 'sparse_categorical_crossentropy',
            metrics=['accuracy'])

## üöÄ Treinando o Modelo 2 (Transfer Learning com VGG16)

üß†üî•Essa c√©lula d√° o start oficial no treinamento do modelo 2, agora usando a arquitetura VGG16 como base com o seu topo customizado. E ainda com o callback de parada autom√°tica ativado!

* Inicia o treinamento do model_2, que usa a VGG16 como extratora de caracter√≠sticas e um topo denso customizado como classificador.

* Treina por at√© 20 √©pocas, mas pode parar antes automaticamente se atingir 80% de acur√°cia (gra√ßas ao callbacks).

* Usa os mesmos geradores train_generator e validation_generator definidos anteriormente.

* Armazena o hist√≥rico do treinamento no objeto history_2.

‚ö° Como s√≥ o topo do modelo √© trein√°vel, esse modelo costuma treinar mais r√°pido e atingir boa performance com menos √©pocas.

üìä Esse hist√≥rico ser√° usado na pr√≥xima etapa para comparar os dois modelos visualmente.

In [None]:
history_2 = model_2.fit(train_generator,
                    validation_data = validation_generator,
                    epochs = 20,
                    callbacks=callbacks)

## üìä Visualiza√ß√£o da Performance do Modelo 2 (Transfer Learning)

Fechamos com chave de ouro o ciclo de treinamento do modelo 2 ‚Äî ela visualiza o desempenho do modelo baseado em VGG16, do mesmo jeitinho que fez com o modelo 1 üåü

* Extrai o hist√≥rico do treinamento (history_2.history) e armazena no dicion√°rio history_dict_2.

* Chama a fun√ß√£o vis_evaluation() para gerar:

* Gr√°fico de acur√°cia (treino x valida√ß√£o)

* Gr√°fico de perda (loss) (treino x valida√ß√£o)

* Com anota√ß√µes autom√°ticas mostrando o gradiente de melhoria (‚Äúm‚Äù).

üìà Isso permite comparar visualmente a performance do modelo 2 com o modelo 1, e verificar qual teve melhor generaliza√ß√£o, menor perda e estabilidade nas curvas.

üß† Uma curva de valida√ß√£o mais est√°vel e com menor perda geralmente indica menos overfitting ‚Äî ponto forte dos modelos com Transfer Learning.

In [None]:
history_dict_2 = history_2.history
vis_evaluation(history_dict_2, 'Transfer Learning')