# üåº Transfer Learning com VGG16 no Oxford Flowers 102 (Google Colab)

In [None]:
# TRANSFER LEARNING E FINE-TUNING COM VGG16 - OXFORD FLOWERS 102

## üîÅ 1. Instala√ß√£o de depend√™ncias
# Instala as bibliotecas TensorFlow e TensorFlow Datasets.
# -q: Garante uma instala√ß√£o "silenciosa", sem exibir muitas mensagens no terminal.
!pip install tensorflow tensorflow_datasets -q

## üì• 2. Carregando o Oxford Flowers 102
import tensorflow_datasets as tfds # Importa a biblioteca para carregar datasets do TensorFlow

# Carrega o dataset 'oxford_flowers102'.
# with_info=True: Retorna metadados do dataset (como n√∫mero de classes, etc.).
# as_supervised=True: Retorna o dataset no formato (imagem, r√≥tulo).
dataset, info = tfds.load('oxford_flowers102', with_info=True, as_supervised=True)

# Divide o dataset nas partes de treino, valida√ß√£o e teste.
train_ds, val_ds, test_ds = dataset['train'], dataset['validation'], dataset['test']

# Obt√©m o n√∫mero total de classes de flores a partir dos metadados do dataset.
num_classes = info.features['label'].num_classes

## üßπ 3. Pr√©-processamento (tamanho e normaliza√ß√£o)
import tensorflow as tf # Importa o TensorFlow para opera√ß√µes de manipula√ß√£o de imagem

IMG_SIZE = 224 # Define o tamanho que as imagens ter√£o (224x224 pixels), padr√£o para VGG16.
BATCH_SIZE = 32 # Define o n√∫mero de imagens processadas por lote (batch) durante o treinamento.

# Fun√ß√£o para formatar as imagens e r√≥tulos.
def format_image(image, label):
    # Redimensiona a imagem para o tamanho desejado (224x224).
    image = tf.image.resize(image, (IMG_SIZE, IMG_SIZE))
    # Converte os valores dos pixels para float32 e os normaliza para o intervalo [0, 1].
    # (Pixels originais s√£o de 0-255, a normaliza√ß√£o ajuda a rede neural a aprender melhor).
    image = tf.cast(image, tf.float32) / 255.0
    # Converte o r√≥tulo num√©rico para um vetor one-hot encoded (ex: 5 -> [0,0,0,0,1,0,...]).
    # Isso √© necess√°rio para a fun√ß√£o de perda 'categorical_crossentropy'.
    return image, tf.one_hot(label, num_classes)

# Aplica a fun√ß√£o de pr√©-processamento aos datasets e configura o pipeline de dados.
# .map(format_image): Aplica a fun√ß√£o format_image a cada elemento do dataset.
# .shuffle(1000): Embaralha o dataset de treino para garantir que os lotes sejam diversos. O n√∫mero 1000 √© o tamanho do buffer de embaralhamento.
# .batch(BATCH_SIZE): Agrupa os elementos em lotes do tamanho especificado.
# .prefetch(1): Permite que os dados sejam pr√©-carregados enquanto o modelo est√° treinando, otimizando a performance.
train_ds = train_ds.map(format_image).shuffle(1000).batch(BATCH_SIZE).prefetch(1)
val_ds = val_ds.map(format_image).batch(BATCH_SIZE).prefetch(1)
test_ds = test_ds.map(format_image).batch(BATCH_SIZE).prefetch(1)

## üß† 4. Modelo com Transfer Learning (VGG16)
# Importa as classes necess√°rias do Keras.
from tensorflow.keras.applications import VGG16 # Para carregar o modelo VGG16 pr√©-treinado.
from tensorflow.keras.models import Model # Para criar um modelo funcional a partir de camadas.
from tensorflow.keras.layers import Flatten, Dense, Dropout, Input # Camadas comuns para redes neurais.
from tensorflow.keras.optimizers import Adam # Otimizador Adam para ajustar os pesos do modelo.

# Carrega o modelo VGG16 pr√©-treinado no dataset ImageNet.
# weights='imagenet': Usa os pesos aprendidos no ImageNet.
# include_top=False: Exclui as camadas totalmente conectadas finais (cabe√ßalho de classifica√ß√£o) do modelo original.
# input_shape: Define a forma de entrada esperada (altura, largura, canais de cor).
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(IMG_SIZE, IMG_SIZE, 3))

# Congela todas as camadas do modelo base VGG16.
# Isso significa que os pesos dessas camadas N√ÉO ser√£o atualizados durante o treinamento inicial.
# Estamos usando a VGG16 como um extrator de caracter√≠sticas fixo.
base_model.trainable = False

# Constr√≥i o novo cabe√ßalho de classifica√ß√£o que ser√° adicionado ao modelo base.
# Flatten(): Transforma a sa√≠da 3D da VGG16 (mapas de caracter√≠sticas) em um vetor 1D.
x = Flatten()(base_model.output)
# Dense(256, activation='relu'): Uma camada totalmente conectada com 256 neur√¥nios e fun√ß√£o de ativa√ß√£o ReLU.
x = Dense(256, activation='relu')(x)
# Dropout(0.5): Desativa aleatoriamente 50% dos neur√¥nios durante o treinamento para evitar overfitting.
x = Dropout(0.5)(x)
# Dense(num_classes, activation='softmax'): A camada de sa√≠da, com 'num_classes' neur√¥nios.
# 'softmax' √© usada para classifica√ß√£o multiclasse, resultando em probabilidades para cada classe.
output = Dense(num_classes, activation='softmax')(x)

# Cria o modelo final combinando a VGG16 (congelada) com o novo cabe√ßalho de classifica√ß√£o.
model = Model(inputs=base_model.input, outputs=output)

# Compila o modelo.
# optimizer=Adam(): O otimizador Adam √© usado para ajustar os pesos das camadas trein√°veis.
# loss='categorical_crossentropy': Fun√ß√£o de perda para problemas de classifica√ß√£o multiclasse com r√≥tulos one-hot.
# metrics=['accuracy']: Monitora a acur√°cia (precis√£o) durante o treinamento.
model.compile(optimizer=Adam(), loss='categorical_crossentropy', metrics=['accuracy'])

print("Treinando modelo com Transfer Learning (camadas congeladas)...")
# Treina o modelo.
# train_ds: Dataset de treino.
# validation_data=val_ds: Dataset de valida√ß√£o para monitorar o desempenho em dados n√£o vistos.
# epochs=10: N√∫mero de vezes que o modelo ir√° percorrer todo o dataset de treino.
history_tl = model.fit(train_ds, validation_data=val_ds, epochs=10)

## üîì 5. Fine-Tuning (descongelando camadas finais)
# Descongela todas as camadas do modelo base para prepar√°-las para o fine-tuning.
base_model.trainable = True

# Congela novamente todas as camadas do modelo base, EXCETO as √∫ltimas 4.
# A ideia √© que as camadas mais profundas (finais) do VGG16 possam ser ajustadas aos dados espec√≠ficos das flores,
# enquanto as camadas iniciais (que capturam caracter√≠sticas gen√©ricas) permanecem fixas.
for layer in base_model.layers[:-4]:
    layer.trainable = False

# Recompila o modelo com uma taxa de aprendizado muito menor para o fine-tuning.
# Uma taxa de aprendizado menor evita "desaprender" o conhecimento pr√©-existente e permite ajustes finos.
model.compile(optimizer=Adam(1e-5), loss='categorical_crossentropy', metrics=['accuracy'])

print("Treinando modelo com Fine-Tuning (√∫ltimas camadas descongeladas)...")
# Continua o treinamento do modelo por mais 5 √©pocas.
# Agora, tanto o cabe√ßalho de classifica√ß√£o quanto as √∫ltimas 4 camadas da VGG16 ser√£o ajustados.
history_ft = model.fit(train_ds, validation_data=val_ds, epochs=5)

## üìä 6. Avalia√ß√£o no conjunto de teste
# Avalia o desempenho final do modelo no conjunto de teste (dados totalmente novos).
# Isso d√° uma estimativa realista de como o modelo se comportar√° em dados do mundo real.
loss, acc = model.evaluate(test_ds)
print(f"Acur√°cia final no conjunto de teste: {acc:.4f}")

## üìà 7. Gr√°ficos comparativos
import matplotlib.pyplot as plt # Importa a biblioteca para criar gr√°ficos

# Fun√ß√£o para plotar os hist√≥ricos de acur√°cia de treino e valida√ß√£o.
def plot_history(hist1, hist2, title):
    # Combina os hist√≥ricos de acur√°cia de valida√ß√£o das duas fases (transfer learning e fine-tuning).
    plt.plot(hist1.history['val_accuracy'] + hist2.history['val_accuracy'], label='Val Accuracy')
    # Combina os hist√≥ricos de acur√°cia de treino das duas fases.
    plt.plot(hist1.history['accuracy'] + hist2.history['accuracy'], label='Train Accuracy')
    plt.title(title) # Define o t√≠tulo do gr√°fico.
    plt.xlabel('Epochs') # R√≥tulo do eixo X.
    plt.ylabel('Accuracy') # R√≥tulo do eixo Y.
    plt.legend() # Mostra a legenda das linhas.
    plt.grid() # Adiciona uma grade ao gr√°fico.
    plt.show() # Exibe o gr√°fico.

# Chama a fun√ß√£o para plotar os resultados combinados.
plot_history(history_tl, history_ft, "Transfer Learning + Fine-Tuning - VGG16")