In [None]:
import os
import shutil
import random
import zipfile
import tarfile
import numpy as np
import pandas as pd
import seaborn as sns
import tensorflow as tf
import matplotlib.pyplot as plt
import warnings

# Configura√ß√µes de exibi√ß√£o e filtros de avisos
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' # Silencia logs informativos do TF
warnings.filterwarnings("ignore", category=FutureWarning)
warnings.filterwarnings("ignore", message=".*metadata.*") # Silencia avisos de metadados de imagens

print("Ambiente configurado com sucesso.")

In [None]:
#Nota: Em MLOps, esta etapa seria automatizada por um script de data ingestion.

# Cria a estrutura de diret√≥rios para os modelos pr√©-treinados
import os

model_dirs = [
    '/tmp/model-balanced/variables',
    '/tmp/history-balanced',
    '/tmp/model-imbalanced/variables',
    '/tmp/history-imbalanced',
    '/tmp/model-augmented/variables',
    '/tmp/history-augmented'
]

for dir_path in model_dirs:
    os.makedirs(dir_path, exist_ok=True)

print("Estrutura de diret√≥rios criada. Iniciando downloads...\n")

# Defini√ß√£o dos links e destinos
# Datasets originais
#!wget https://storage.googleapis.com/mlep-public/course_1/week2/kagglecatsanddogs_3367a.zip
#!wget https://storage.googleapis.com/mlep-public/course_1/week2/CUB_200_2011.tar

# Modelos pr√©-treinados
# O par√¢metro -P define o diret√≥rio de destino

!wget -q -P /tmp/model-balanced/ https://storage.googleapis.com/mlep-public/course_1/week2/model-balanced/saved_model.pb
!wget -q -P /tmp/model-balanced/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-balanced/variables/variables.data-00000-of-00001
!wget -q -P /tmp/model-balanced/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-balanced/variables/variables.index
!wget -q -P /tmp/history-balanced/ https://storage.googleapis.com/mlep-public/course_1/week2/history-balanced/history-balanced.csv

!wget -q -P /tmp/model-imbalanced/ https://storage.googleapis.com/mlep-public/course_1/week2/model-imbalanced/saved_model.pb
!wget -q -P /tmp/model-imbalanced/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-imbalanced/variables/variables.data-00000-of-00001
!wget -q -P /tmp/model-imbalanced/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-imbalanced/variables/variables.index
!wget -q -P /tmp/history-imbalanced/ https://storage.googleapis.com/mlep-public/course_1/week2/history-imbalanced/history-imbalanced.csv

!wget -q -P /tmp/model-augmented/ https://storage.googleapis.com/mlep-public/course_1/week2/model-augmented/saved_model.pb
!wget -q -P /tmp/model-augmented/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-augmented/variables/variables.data-00000-of-00001
!wget -q -P /tmp/model-augmented/variables/ https://storage.googleapis.com/mlep-public/course_1/week2/model-augmented/variables/variables.index
!wget -q -P /tmp/history-augmented/ https://storage.googleapis.com/mlep-public/course_1/week2/history-augmented/history-augmented.csv

print("\n‚úÖ Downloads conclu√≠dos!")

In [None]:
# Defini√ß√£o de caminhos
cats_and_dogs_zip = 'kagglecatsanddogs_3367a.zip'
caltech_birds_tar = 'CUB_200_2011.tar'

base_dir = '/tmp/data'

In [None]:
# Extra√ß√£o dos arquivos compactados
with zipfile.ZipFile(cats_and_dogs_zip, 'r') as my_zip:
  my_zip.extractall(base_dir)
with tarfile.open(caltech_birds_tar, 'r') as my_tar:
  my_tar.extractall(base_dir)

In [None]:
#Mapeamento dos diret√≥rios de C√£es e Gatos (j√° v√™m organizados)
base_dogs_dir = os.path.join(base_dir, 'PetImages/Dog')
base_cats_dir = os.path.join(base_dir, 'PetImages/Cat')

print(f"Existem {len(os.listdir(base_dogs_dir))} imagens de c√£es")
print(f"Existem {len(os.listdir(base_cats_dir))} imagens de gatos")

In [None]:
raw_birds_dir = '/tmp/data/CUB_200_2011/images'
base_birds_dir = os.path.join(base_dir, 'PetImages/Bird')

os.makedirs(base_birds_dir, exist_ok=True)

moved_count = 0
skipped_count = 0

for subdir in os.listdir(raw_birds_dir):
    subdir_path = os.path.join(raw_birds_dir, subdir)

    if not os.path.isdir(subdir_path):
        continue

    for image in os.listdir(subdir_path):
        src = os.path.join(subdir_path, image)

        # Novo nome = nome da esp√©cie + nome original da imagem
        new_name = f"{subdir}__{image}"
        dst = os.path.join(base_birds_dir, new_name)

        if not os.path.exists(dst):
            shutil.move(src, dst)
            moved_count += 1
        else:
            skipped_count += 1

print(f"P√°ssaros movidos com sucesso: {moved_count}")
print(f"P√°ssaros ignorados (nome duplicado): {skipped_count}")
print(f"Total de imagens em Bird/: {len(os.listdir(base_birds_dir))}")

In [None]:
from IPython.display import Image, display

# Exibe uma amostra de cada classe para valida√ß√£o visual
# Isso √© importante para detectar problemas como imagens corrompidas ou mal rotuladas

print("Exemplo de uma imagem de gato:")
display(Image(filename=f"{os.path.join(base_cats_dir, os.listdir(base_cats_dir)[0])}"))
print("\nExemplo de uma imagem de c√£o:")
display(Image(filename=f"{os.path.join(base_dogs_dir, os.listdir(base_dogs_dir)[0])}"))
print("\nExemplo de uma imagem de passaro:")
display(Image(filename=f"{os.path.join(base_birds_dir, os.listdir(base_birds_dir)[0])}"))

In [None]:
# Estrutura de diret√≥rios para organiza√ß√£o do dataset
# Padr√£o MLOps: /train/{classe} e /eval/{classe}
# Isso facilita o uso de geradores de dados do TensorFlow/Keras

train_eval_dirs = ['train/cats', 'train/dogs', 'train/birds', 
                   'eval/cats', 'eval/dogs', 'eval/birds']

# Cria os diret√≥rios de forma segura (evita erro se j√° existirem)
for dir in train_eval_dirs:
    if not os.path.exists(os.path.join(base_dir, dir)):
        os.makedirs(os.path.join(base_dir, dir))

print("Estrutura de diret√≥rios criada com sucesso.")

In [None]:
# define a fun√ß√£o para mover uma parte das imagens do diretorio original para os diretorios de treino e avalia√ß√£o
def move_to_destination(origin, destination, percentage_split):
    """
    Move uma porcentagem das imagens de um diret√≥rio de origem para um destino.
    
    Par√¢metros:
    -----------
    origin : str
        Caminho do diret√≥rio de origem contendo as imagens
    destination : str
        Caminho do diret√≥rio de destino
    percentage_split : float
        Porcentagem de imagens a mover (ex: 0.7 = 70%)
    
    Comportamento:
    --------------
    - Calcula quantas imagens mover baseado no percentual
    - Ordena os arquivos para garantir reprodutibilidade
    - Move (n√£o copia) as imagens, economizando espa√ßo em disco
    
    Exemplo:
    --------
    Se origin tem 1000 imagens e percentage_split=0.7:
    - Move as primeiras 700 imagens (ordenadas alfabeticamente)
    - Deixa 300 no diret√≥rio original
    """
    num_images = int(len(os.listdir(origin))*percentage_split)
    # zip() combina a lista de nomes com um contador
    # sorted() garante ordem consistente (importante para reprodutibilidade)
    for image_name, image_number in zip(sorted(os.listdir(origin)), range(num_images)):
        shutil.move(os.path.join(origin, image_name), destination)

In [None]:
def move_to_destination(origin, destination, percentage_split):
    """
    Move uma porcentagem das imagens de um diret√≥rio de origem para um destino.
    
    Par√¢metros:
    -----------
    origin : str
        Caminho do diret√≥rio de origem contendo as imagens
    destination : str
        Caminho do diret√≥rio de destino
    percentage_split : float
        Porcentagem de imagens a mover (ex: 0.7 = 70%)
    
    Comportamento:
    --------------
    - Calcula quantas imagens mover baseado no percentual
    - Ordena os arquivos para garantir reprodutibilidade
    - Move (n√£o copia) as imagens, economizando espa√ßo em disco
    - IDEMPOTENTE: ignora arquivos que j√° existem no destino
    
    Exemplo:
    --------
    Se origin tem 1000 imagens e percentage_split=0.7:
    - Move as primeiras 700 imagens (ordenadas alfabeticamente)
    - Deixa 300 no diret√≥rio original
    """
    # Lista apenas arquivos (ignora subdiret√≥rios)
    files = [f for f in os.listdir(origin) if os.path.isfile(os.path.join(origin, f))]
    
    num_images = int(len(files) * percentage_split)
    
    moved = 0
    skipped = 0
    
    for image_name in sorted(files)[:num_images]:
        src = os.path.join(origin, image_name)
        dst = os.path.join(destination, image_name)
        
        # Verifica se o arquivo j√° existe no destino
        if not os.path.exists(dst):
            shutil.move(src, dst)
            moved += 1
        else:
            # Se j√° existe, remove da origem para manter consist√™ncia
            if os.path.exists(src):
                os.remove(src)
            skipped += 1
    
    return moved, skipped

In [None]:
# Limpeza de dados: Remove arquivos problem√°ticos que podem quebrar o treinamento

# 1. Remove arquivos vazios (0 bytes)
# Imagens corrompidas frequentemente aparecem como arquivos de tamanho zero

!find /tmp/data/ -size 0 -exec rm {} +

# 2. Remove arquivos que n√£o s√£o JPG
# Garante que apenas imagens v√°lidas sejam usadas no pipeline
# O dataset pode conter arquivos .db, .txt, etc. que causam erros no TensorFlow

!find /tmp/data/ -type f ! -name "*.jpg" -exec rm {} +

In [None]:
# Relat√≥rio final: Contagem de imagens por classe e conjunto
# Importante para detectar desbalanceamento de classes

print("=" * 50)
print("CONJUNTO DE TREINO")
print("=" * 50)
print(f"Gatos:    {len(os.listdir(os.path.join(base_dir, 'train/cats')))} imagens")
print(f"C√£es:     {len(os.listdir(os.path.join(base_dir, 'train/dogs')))} imagens")
print(f"P√°ssaros: {len(os.listdir(os.path.join(base_dir, 'train/birds')))} imagens")

print("\n" + "=" * 50)
print("CONJUNTO DE AVALIA√á√ÉO")
print("=" * 50)
print(f"Gatos:    {len(os.listdir(os.path.join(base_dir, 'eval/cats')))} imagens")
print(f"C√£es:     {len(os.listdir(os.path.join(base_dir, 'eval/dogs')))} imagens")
print(f"P√°ssaros: {len(os.listdir(os.path.join(base_dir, 'eval/birds')))} imagens")

# Dica MLOps: Se houver grande desbalanceamento (ex: 10x mais c√£es que gatos),
# considere t√©cnicas como class_weight, oversampling ou data augmentation

In [None]:
"""
SIMULA√á√ÉO DE CEN√ÅRIO REAL: Dataset Desbalanceado

Contexto MLOps:
---------------
Em produ√ß√£o, √© comum ter datasets desbalanceados onde algumas classes t√™m muito
menos exemplos que outras. Exemplos reais:
- Detec√ß√£o de fraudes (99% transa√ß√µes normais, 1% fraudes)
- Diagn√≥stico m√©dico (doen√ßas raras vs. casos comuns)
- Controle de qualidade (produtos defeituosos s√£o minoria)

Neste experimento:
------------------
Simulamos um cen√°rio onde parte das imagens de c√£es e p√°ssaros foi "perdida"
(deletada, corrompida, ou n√£o coletada):
- Gatos: 100% dos dados (classe majorit√°ria)
- C√£es: apenas 20% dos dados originais
- P√°ssaros: apenas 10% dos dados originais

Objetivo:
---------
Comparar o desempenho de modelos treinados em datasets balanceados vs. desbalanceados
e avaliar t√©cnicas de mitiga√ß√£o (class weights, oversampling, data augmentation).
"""

# Cria√ß√£o da estrutura de diret√≥rios para o dataset desbalanceado
imbalanced_dirs = [f'imbalanced/{dir_path}' for dir_path in train_eval_dirs]

for dir_path in imbalanced_dirs:
    full_path = os.path.join(base_dir, dir_path)
    if not os.path.exists(full_path):
        os.makedirs(full_path)

print("Estrutura de diret√≥rios 'imbalanced' criada.\n")


# Fun√ß√£o auxiliar para copiar (n√£o mover) uma porcentagem das imagens
def copy_with_limit(origin, destination, percentage_split):
    """
    Copia uma porcentagem das imagens de origem para destino.
    
    Diferen√ßa da fun√ß√£o anterior (move_to_destination):
    ----------------------------------------------------
    - Usa shutil.COPY em vez de shutil.MOVE
    - Preserva os dados originais intactos
    - Permite criar m√∫ltiplas vers√µes do dataset (balanced, imbalanced, augmented)
    
    Par√¢metros:
    -----------
    origin : str
        Diret√≥rio de origem
    destination : str
        Diret√≥rio de destino
    percentage_split : float
        Porcentagem de imagens a copiar (0.1 = 10%, 1.0 = 100%)
    """
    num_images = int(len(os.listdir(origin)) * percentage_split)
    
    for image_name, image_number in zip(sorted(os.listdir(origin)), range(num_images)):
        shutil.copy(os.path.join(origin, image_name), destination)


# Cria√ß√£o do dataset desbalanceado - TREINO
print("Criando conjunto de TREINO desbalanceado...")
print("  - Gatos: 100% (baseline)")
print("  - C√£es: 20% (classe minorit√°ria)")
print("  - P√°ssaros: 10% (classe muito minorit√°ria)\n")

copy_with_limit(
    os.path.join(base_dir, 'train/cats'), 
    os.path.join(base_dir, 'imbalanced/train/cats'), 
    1.0  # 100% dos gatos
)
copy_with_limit(
    os.path.join(base_dir, 'train/dogs'), 
    os.path.join(base_dir, 'imbalanced/train/dogs'), 
    0.2  # 20% dos c√£es
)
copy_with_limit(
    os.path.join(base_dir, 'train/birds'), 
    os.path.join(base_dir, 'imbalanced/train/birds'), 
    0.1  # 10% dos p√°ssaros
)

# Cria√ß√£o do dataset desbalanceado - AVALIA√á√ÉO
print("Criando conjunto de AVALIA√á√ÉO desbalanceado (mesmas propor√ß√µes)...\n")

copy_with_limit(
    os.path.join(base_dir, 'eval/cats'), 
    os.path.join(base_dir, 'imbalanced/eval/cats'), 
    1.0
)
copy_with_limit(
    os.path.join(base_dir, 'eval/dogs'), 
    os.path.join(base_dir, 'imbalanced/eval/dogs'), 
    0.2
)
copy_with_limit(
    os.path.join(base_dir, 'eval/birds'), 
    os.path.join(base_dir, 'imbalanced/eval/birds'), 
    0.1
)

In [None]:
# Relat√≥rio de distribui√ß√£o do dataset desbalanceado
# Importante para calcular class_weights e avaliar estrat√©gias de balanceamento

print("=" * 60)
print("DATASET DESBALANCEADO - CONJUNTO DE TREINO")
print("=" * 60)

train_cats_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/train/cats')))
train_dogs_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/train/dogs')))
train_birds_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/train/birds')))

print(f"Gatos:    {train_cats_imb:>6} imagens (100%)")
print(f"C√£es:     {train_dogs_imb:>6} imagens ( 20%)")
print(f"P√°ssaros: {train_birds_imb:>6} imagens ( 10%)")
print(f"{'‚îÄ' * 60}")
print(f"Total:    {train_cats_imb + train_dogs_imb + train_birds_imb:>6} imagens")

# C√°lculo da raz√£o de desbalanceamento (imbalance ratio)
# M√©trica importante para decidir estrat√©gia de mitiga√ß√£o
max_class = train_cats_imb
imbalance_ratio_dogs = max_class / train_dogs_imb
imbalance_ratio_birds = max_class / train_birds_imb

print(f"\nRaz√£o de desbalanceamento:")
print(f"  Gatos/C√£es:     {imbalance_ratio_dogs:.1f}:1")
print(f"  Gatos/P√°ssaros: {imbalance_ratio_birds:.1f}:1")

print("\n" + "=" * 60)
print("DATASET DESBALANCEADO - CONJUNTO DE AVALIA√á√ÉO")
print("=" * 60)

eval_cats_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/eval/cats')))
eval_dogs_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/eval/dogs')))
eval_birds_imb = len(os.listdir(os.path.join(base_dir, 'imbalanced/eval/birds')))

print(f"Gatos:    {eval_cats_imb:>6} imagens (100%)")
print(f"C√£es:     {eval_dogs_imb:>6} imagens ( 20%)")
print(f"P√°ssaros: {eval_birds_imb:>6} imagens ( 10%)")
print(f"{'‚îÄ' * 60}")
print(f"Total:    {eval_cats_imb + eval_dogs_imb + eval_birds_imb:>6} imagens")

In [None]:
from tensorflow.keras import layers, models, optimizers

def create_model():
    """
    Cria uma CNN (Convolutional Neural Network) para classifica√ß√£o de imagens.
    
    Arquitetura:
    ------------
    Modelo sequencial com 4 blocos convolucionais + classificador denso
    
    Blocos Convolucionais:
    - Bloco 1: 32 filtros 3x3 ‚Üí MaxPooling 2x2 (extrai features b√°sicas: bordas, texturas)
    - Bloco 2: 64 filtros 3x3 ‚Üí MaxPooling 2x2 (features intermedi√°rias: formas)
    - Bloco 3: 64 filtros 3x3 ‚Üí MaxPooling 2x2 (padr√µes mais complexos)
    - Bloco 4: 128 filtros 3x3 ‚Üí MaxPooling 2x2 (features de alto n√≠vel)
    
    Classificador:
    - Flatten: Converte feature maps 3D em vetor 1D
    - Dense(512): Camada totalmente conectada com 512 neur√¥nios
    - Dense(3): Camada de sa√≠da com 3 classes (cats, dogs, birds)
    
    Par√¢metros:
    -----------
    - Input shape: (150, 150, 3) - imagens RGB de 150x150 pixels
    - Activation: ReLU nas camadas ocultas, Softmax na sa√≠da
    - Loss: SparseCategoricalCrossentropy (para labels inteiros: 0, 1, 2)
    - Optimizer: Adam (learning rate padr√£o = 0.001)
    - Metrics: SparseCategoricalAccuracy (acur√°cia de classifica√ß√£o)
    
    Returns:
    --------
    model : tf.keras.Model
        Modelo compilado e pronto para treinamento
    """
    
    # Defini√ß√£o da arquitetura sequencial
    model = models.Sequential([
        # Bloco Convolucional 1: Extra√ß√£o de features b√°sicas
        layers.Conv2D(32, (3,3), activation='relu', input_shape=(150, 150, 3)),
        layers.MaxPooling2D((2,2)),
        
        # Bloco Convolucional 2: Features intermedi√°rias
        layers.Conv2D(64, (3,3), activation='relu'),
        layers.MaxPooling2D((2,2)),
        
        # Bloco Convolucional 3: Padr√µes mais complexos
        layers.Conv2D(64, (3,3), activation='relu'),
        layers.MaxPooling2D((2,2)),
        
        # Bloco Convolucional 4: Features de alto n√≠vel
        layers.Conv2D(128, (3,3), activation='relu'),
        layers.MaxPooling2D((2,2)),
        
        # Classificador
        layers.Flatten(),
        layers.Dense(512, activation='relu'),
        layers.Dense(3, activation='softmax')
    ])

    # Compila√ß√£o do modelo
    model.compile(
        loss=tf.keras.losses.SparseCategoricalCrossentropy(),
        optimizer=optimizers.Adam(),
        metrics=[tf.keras.metrics.SparseCategoricalAccuracy()]
    )

    return model

In [None]:
# Instancia√ß√£o do modelo para o experimento com dataset desbalanceado
imbalanced_model = create_model()

# Exibe a arquitetura e contagem de par√¢metros
print("=" * 70)
print("ARQUITETURA DO MODELO - EXPERIMENTO IMBALANCED")
print("=" * 70)
print(imbalanced_model.summary())
print("\n‚ö†Ô∏è  Nota: Este modelo ser√° treinado com o dataset DESBALANCEADO")
print("   (sem class weights ou t√©cnicas de balanceamento)")

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

"""
Data Generators: Pipeline de carregamento e pr√©-processamento de imagens

Vantagens do ImageDataGenerator:
---------------------------------
1. Carregamento sob demanda (n√£o precisa carregar tudo na mem√≥ria)
2. Normaliza√ß√£o autom√°tica dos pixels
3. Suporte a data augmentation (rota√ß√£o, zoom, flip, etc.)
4. Integra√ß√£o nativa com model.fit()

Configura√ß√£o atual:
-------------------
- rescale=1./255: Normaliza pixels de [0, 255] para [0, 1]
  (Redes neurais convergem melhor com valores pequenos)
- SEM data augmentation (ser√° adicionado em experimentos futuros)
"""

# Generator para TREINO: apenas normaliza√ß√£o
train_datagen = ImageDataGenerator(rescale=1./255)

# Generator para VALIDA√á√ÉO: apenas normaliza√ß√£o (nunca aplicar augmentation em eval!)
test_datagen = ImageDataGenerator(rescale=1./255)

# Configura√ß√£o do fluxo de dados de TREINO
train_generator = train_datagen.flow_from_directory(
    '/tmp/data/imbalanced/train',  # Diret√≥rio raiz (cont√©m subpastas cats, dogs, birds)
    target_size=(150, 150),         # Redimensiona todas as imagens para 150x150
    batch_size=32,                  # N√∫mero de imagens por batch (ajustar conforme mem√≥ria)
    class_mode='sparse'             # Labels como inteiros (0, 1, 2) em vez de one-hot
)

# Configura√ß√£o do fluxo de dados de VALIDA√á√ÉO
validation_generator = test_datagen.flow_from_directory(
    '/tmp/data/imbalanced/eval',
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse'
)


In [None]:
# Valida√ß√£o do mapeamento de classes
print("=" * 70)
print("MAPEAMENTO DE CLASSES (Class Indices)")
print("=" * 70)
print(f"Treino:    {train_generator.class_indices}")
print(f"Valida√ß√£o: {validation_generator.class_indices}")
print("\nInterpreta√ß√£o:")
print("  - O n√∫mero representa o label que o modelo vai prever")
print("  - Exemplo: se o modelo prever '1', significa 'dog'")
print("=" * 70)

# Informa√ß√µes adicionais sobre os generators
print(f"\nTotal de imagens de treino: {train_generator.samples}")
print(f"Total de imagens de valida√ß√£o: {validation_generator.samples}")
print(f"N√∫mero de batches por √©poca (treino): {len(train_generator)}")
print(f"N√∫mero de batches por √©poca (valida√ß√£o): {len(validation_generator)}")

In [None]:
# Load pretrained model and history
imbalanced_history = pd.read_csv('/tmp/history-imbalanced/history-imbalanced.csv')
imbalanced_model = tf.keras.models.load_model('/tmp/model-imbalanced')  

print("‚úÖ Modelo e hist√≥rico carregados com sucesso!")
print(f"√âpocas treinadas: {len(imbalanced_history)}")

In [None]:
def get_training_metrics(history):
    """
    Extrai m√©tricas de treinamento de um objeto History ou DataFrame.
    
    Par√¢metros:
    -----------
    history : keras.callbacks.History ou pd.DataFrame
        Hist√≥rico de treinamento do modelo
    
    Retorna:
    --------
    acc, val_acc, loss, val_loss : listas ou pd.Series
        M√©tricas de acur√°cia e loss para treino e valida√ß√£o
    """
    
    if not isinstance(history, pd.core.frame.DataFrame):
        history = history.history
    
    acc = history['sparse_categorical_accuracy']
    val_acc = history['val_sparse_categorical_accuracy']
    
    loss = history['loss']
    val_loss = history['val_loss']
    
    return acc, val_acc, loss, val_loss

In [None]:
def plot_train_eval(history):
    """
    Plota curvas de acur√°cia e loss para treino vs. valida√ß√£o.
    
    Visualiza√ß√£o essencial em MLOps para detectar:
    - Overfitting: treino continua melhorando, valida√ß√£o piora
    - Underfitting: ambos n√£o melhoram
    - Converg√™ncia: ambos estabilizam em valores pr√≥ximos
    
    Par√¢metros:
    -----------
    history : keras.callbacks.History ou pd.DataFrame
        Hist√≥rico de treinamento do modelo
    """
    acc, val_acc, loss, val_loss = get_training_metrics(history)
    
    # Gr√°fico de Acur√°cia

    acc_plot_data = pd.DataFrame({
        "training accuracy": acc, 
        "evaluation accuracy": val_acc
    })
    
    plt.figure(figsize=(12, 5))  # Cria figura com 2 subplots lado a lado
    
    # Subplot 1: Acur√°cia
    plt.subplot(1, 2, 1)
    sns.lineplot(data=acc_plot_data)
    plt.title('Training vs Evaluation Accuracy')
    plt.xlabel('Epoch')
    plt.ylabel('Sparse Categorical Accuracy')
    plt.legend(['Training', 'Evaluation'])
    plt.grid(True, alpha=0.3)
    
    # Subplot 2: Loss
    plt.subplot(1, 2, 2)

    loss_plot_data = pd.DataFrame({
        "training loss": loss, 
        "evaluation loss": val_loss
    })
    sns.lineplot(data=loss_plot_data)
    plt.title('Training vs Evaluation Loss')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend(['Training', 'Evaluation'])
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()


# Chama a fun√ß√£o para plotar
plot_train_eval(imbalanced_history)

In [None]:
from sklearn.metrics import (
    confusion_matrix, 
    ConfusionMatrixDisplay, 
    accuracy_score, 
    balanced_accuracy_score,
    classification_report
)

"""
AVALIA√á√ÉO DO MODELO IMBALANCED

Objetivo:
---------
Avaliar o desempenho do modelo treinado com dataset desbalanceado usando:
1. Accuracy Score (m√©trica padr√£o, mas enganosa em datasets desbalanceados)
2. Balanced Accuracy Score (compensa o desbalanceamento)
3. Confusion Matrix (visualiza erros por classe)
4. Propor√ß√£o de erros por classe (identifica classes problem√°ticas)

Por que shuffle=False?
----------------------
Para calcular m√©tricas, precisamos que a ordem das predi√ß√µes corresponda
exatamente √† ordem dos labels verdadeiros. Com shuffle=True, essa correspond√™ncia
seria perdida.
"""

# Cria generator SEM shuffle para manter correspond√™ncia entre predi√ß√µes e labels
val_gen_no_shuffle = test_datagen.flow_from_directory(
    '/tmp/data/imbalanced/eval',  # Dataset desbalanceado
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse',
    shuffle=False  # CR√çTICO: mant√©m ordem para c√°lculo de m√©tricas
)

# Extrai os labels verdadeiros do generator
y_true = val_gen_no_shuffle.classes

print("Gerando predi√ß√µes no conjunto de valida√ß√£o...")
print("(Isso pode levar alguns minutos dependendo do tamanho do dataset)\n")

# Gera predi√ß√µes para todo o conjunto de valida√ß√£o
predictions_imbalanced = imbalanced_model.predict(val_gen_no_shuffle)

# Converte probabilidades (softmax) em classes preditas
# predictions_imbalanced shape: (n_samples, 3) ‚Üí valores entre 0 e 1
# y_pred_imbalanced shape: (n_samples,) ‚Üí valores 0, 1, ou 2
y_pred_imbalanced = np.argmax(predictions_imbalanced, axis=1)

print("=" * 70)
print("M√âTRICAS DE AVALIA√á√ÉO - MODELO IMBALANCED")
print("=" * 70)

# Accuracy Score: % de predi√ß√µes corretas (enganosa em datasets desbalanceados)
acc_score = accuracy_score(y_true, y_pred_imbalanced)
print(f"Accuracy Score:          {acc_score:.4f} ({acc_score*100:.2f}%)")

# Balanced Accuracy Score: m√©dia das acur√°cias por classe (melhor para imbalance)
balanced_acc = balanced_accuracy_score(y_true, y_pred_imbalanced)
print(f"Balanced Accuracy Score: {balanced_acc:.4f} ({balanced_acc*100:.2f}%)")

print("\n‚ö†Ô∏è  Nota: Em datasets desbalanceados, Balanced Accuracy √© mais confi√°vel")
print("   que Accuracy padr√£o, pois d√° peso igual a todas as classes.\n")

In [None]:
# Calcula e plota a Confusion Matrix
imbalanced_cm = confusion_matrix(y_true, y_pred_imbalanced)

plt.figure(figsize=(8, 6))
ConfusionMatrixDisplay(
    imbalanced_cm, 
    display_labels=['birds', 'cats', 'dogs']
).plot(values_format="d", cmap='Blues')
plt.title('Confusion Matrix - Modelo Imbalanced\n(Dataset de Valida√ß√£o Desbalanceado)')
plt.tight_layout()
plt.show()

print("\n" + "=" * 70)
print("INTERPRETA√á√ÉO DA CONFUSION MATRIX")
print("=" * 70)
print("Linhas: Classes verdadeiras (ground truth)")
print("Colunas: Classes preditas pelo modelo")
print("Diagonal: Predi√ß√µes corretas")
print("Fora da diagonal: Erros de classifica√ß√£o\n")

# Calcula propor√ß√£o de erros por classe
# F√≥rmula: (soma dos erros da linha) / (total de exemplos da classe)
misclassified_birds = (imbalanced_cm[0, 1] + imbalanced_cm[0, 2]) / np.sum(imbalanced_cm, axis=1)[0]
misclassified_cats = (imbalanced_cm[1, 0] + imbalanced_cm[1, 2]) / np.sum(imbalanced_cm, axis=1)[1]
misclassified_dogs = (imbalanced_cm[2, 0] + imbalanced_cm[2, 1]) / np.sum(imbalanced_cm, axis=1)[2]

print("=" * 70)
print("PROPOR√á√ÉO DE ERROS POR CLASSE")
print("=" * 70)
print(f"P√°ssaros (birds): {misclassified_birds*100:.2f}% de erros")
print(f"Gatos (cats):     {misclassified_cats*100:.2f}% de erros")
print(f"C√£es (dogs):      {misclassified_dogs*100:.2f}% de erros")

# Identifica a classe com maior taxa de erro
classes = ['birds', 'cats', 'dogs']
errors = [misclassified_birds, misclassified_cats, misclassified_dogs]
worst_class = classes[np.argmax(errors)]
worst_error = max(errors) * 100

print(f"\n‚ö†Ô∏è  Classe mais problem√°tica: {worst_class} ({worst_error:.2f}% de erros)")
print("   Isso √© esperado em datasets desbalanceados: classes minorit√°rias")
print("   t√™m menos exemplos para aprender, resultando em mais erros.\n")

# Classification Report (m√©tricas detalhadas por classe)
print("=" * 70)
print("CLASSIFICATION REPORT (Precision, Recall, F1-Score por classe)")
print("=" * 70)
print(classification_report(
    y_true, 
    y_pred_imbalanced, 
    target_names=['birds', 'cats', 'dogs'],
    digits=4
))

In [None]:
"""
EXPERIMENTO DE CONTROLE: Modelo Baseline Ing√™nuo

Contexto MLOps:
---------------
Para demonstrar o problema do desbalanceamento, criamos um "modelo" que sempre
prediz a classe majorit√°ria (cats). Isso mostra como a m√©trica Accuracy pode
ser enganosa em datasets desbalanceados.

Resultado esperado:
-------------------
- Accuracy alta (porque a maioria das imagens s√£o gatos)
- Balanced Accuracy baixa (porque erra 100% das outras classes)

Li√ß√£o:
------
Sempre use m√∫ltiplas m√©tricas em MLOps. Accuracy sozinha pode esconder problemas graves.
"""

print("=" * 70)
print("EXPERIMENTO: Modelo que sempre prediz 'CATS'")
print("=" * 70)
print("Objetivo: Demonstrar por que Accuracy sozinha √© enganosa\n")

# Cria array de predi√ß√µes: tudo = 1 (cats)
all_cats = np.ones(y_true.shape)

# Calcula m√©tricas
acc_all_cats = accuracy_score(y_true, all_cats)
balanced_acc_all_cats = balanced_accuracy_score(y_true, all_cats)

print(f"Accuracy Score:          {acc_all_cats:.4f} ({acc_all_cats*100:.2f}%)")
print(f"Balanced Accuracy Score: {balanced_acc_all_cats:.4f} ({balanced_acc_all_cats*100:.2f}%)")

print("\n" + "‚ö†Ô∏è " * 35)
print("AN√ÅLISE CR√çTICA:")
print(f"  - Um modelo 'burro' que sempre chuta 'cats' tem {acc_all_cats*100:.2f}% de accuracy!")
print(f"  - Mas Balanced Accuracy revela a verdade: apenas {balanced_acc_all_cats*100:.2f}%")
print("  - Isso acontece porque o dataset tem muito mais gatos que outras classes")
print("\nCONCLUS√ÉO MLOps:")
print("  ‚úÖ Sempre use Balanced Accuracy, F1-Score, ou Recall por classe")
print("  ‚ùå NUNCA confie apenas em Accuracy para datasets desbalanceados")
print("‚ö†Ô∏è " * 35 + "\n")

In [None]:
"""
COMPARA√á√ÉO: Avalia√ß√£o do mesmo modelo em dataset BALANCEADO

Objetivo:
---------
Avaliar como o modelo imbalanced se comporta quando testado em um dataset
balanceado (distribui√ß√£o igual de cats, dogs, birds).

Hip√≥tese:
---------
O modelo deve ter desempenho pior em classes minorit√°rias (dogs, birds),
pois foi treinado com poucos exemplos dessas classes.
"""

print("=" * 70)
print("AVALIA√á√ÉO EM DATASET BALANCEADO (para compara√ß√£o)")
print("=" * 70)

# Cria generator para o dataset balanceado de valida√ß√£o
val_gen_balanced = test_datagen.flow_from_directory(
    '/tmp/data/eval',  # Dataset balanceado original
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse',
    shuffle=False
)

# Extrai labels verdadeiros
y_true_balanced = val_gen_balanced.classes

print("Gerando predi√ß√µes no conjunto de valida√ß√£o BALANCEADO...\n")

# Gera predi√ß√µes
predictions_balanced = imbalanced_model.predict(val_gen_balanced)
y_pred_balanced = np.argmax(predictions_balanced, axis=1)

# Calcula m√©tricas
acc_balanced = accuracy_score(y_true_balanced, y_pred_balanced)
balanced_acc_balanced = balanced_accuracy_score(y_true_balanced, y_pred_balanced)

print(f"Accuracy Score:          {acc_balanced:.4f} ({acc_balanced*100:.2f}%)")
print(f"Balanced Accuracy Score: {balanced_acc_balanced:.4f} ({balanced_acc_balanced*100:.2f}%)")

# Confusion Matrix
cm_balanced = confusion_matrix(y_true_balanced, y_pred_balanced)

plt.figure(figsize=(8, 6))
ConfusionMatrixDisplay(
    cm_balanced, 
    display_labels=['birds', 'cats', 'dogs']
).plot(values_format="d", cmap='Greens')
plt.title('Confusion Matrix - Modelo Imbalanced\n(Dataset de Valida√ß√£o BALANCEADO)')
plt.tight_layout()
plt.show()

print("\n" + "=" * 70)
print("COMPARA√á√ÉO: Imbalanced vs Balanced Evaluation Set")
print("=" * 70)
print(f"Balanced Accuracy (eval imbalanced): {balanced_acc:.4f}")
print(f"Balanced Accuracy (eval balanced):   {balanced_acc_balanced:.4f}")
print(f"Diferen√ßa: {abs(balanced_acc - balanced_acc_balanced):.4f}")
print("\nüí° Insight: A diferen√ßa mostra o impacto do desbalanceamento no desempenho real.")
print("=" * 70)

In [None]:
"""
EXPERIMENTO 2: MODELO TREINADO COM DATASET BALANCEADO

Objetivo:
---------
Treinar o mesmo modelo (mesma arquitetura) com um dataset balanceado
(distribui√ß√£o igual de cats, dogs, birds) e comparar com o modelo imbalanced.

Hip√≥tese:
---------
O modelo balanceado deve ter:
- Balanced Accuracy maior
- Desempenho mais uniforme entre as classes
- Menos vi√©s para a classe majorit√°ria

Configura√ß√£o:
-------------
- Arquitetura: Id√™ntica ao modelo imbalanced (para compara√ß√£o justa)
- Dataset: /tmp/data/train e /tmp/data/eval (balanceados)
- Sem data augmentation (ser√° adicionado no Experimento 3)
"""

# Instancia um novo modelo com a mesma arquitetura
balanced_model = create_model()

# Configura√ß√£o dos data generators (apenas normaliza√ß√£o, sem augmentation)
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

# Generator de treino - dataset BALANCEADO
train_generator = train_datagen.flow_from_directory(
    '/tmp/data/train',  # Dataset balanceado
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse'
)

# Generator de valida√ß√£o - dataset BALANCEADO
validation_generator = test_datagen.flow_from_directory(
    '/tmp/data/eval',  # Dataset balanceado
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse'
)

print("=" * 70)
print("CONFIGURA√á√ÉO DO EXPERIMENTO - MODELO BALANCEADO")
print("=" * 70)
print(f"Treino - Total de imagens: {train_generator.samples}")
print(f"Treino - Distribui√ß√£o: {train_generator.class_indices}")
print(f"\nValida√ß√£o - Total de imagens: {validation_generator.samples}")
print(f"Valida√ß√£o - Distribui√ß√£o: {validation_generator.class_indices}")
print("=" * 70)

In [None]:
"""
CARREGAMENTO DO MODELO PR√â-TREINADO BALANCEADO

Nota:
-----
Em vez de treinar do zero (o que levaria ~30-60 minutos), carregamos
um modelo j√° treinado com o dataset balanceado.

Em produ√ß√£o MLOps, voc√™ faria:
- Treinar com model.fit()
- Salvar com model.save()
- Versionar com MLflow ou DVC
- Registrar m√©tricas e hiperpar√¢metros
"""

# Carrega o hist√≥rico de treinamento (CSV com m√©tricas por √©poca)
balanced_history = pd.read_csv('/tmp/history-balanced/history-balanced.csv')

# Carrega o modelo treinado (SavedModel format)
balanced_model = tf.keras.models.load_model('/tmp/model-balanced')

print("‚úÖ Modelo balanceado e hist√≥rico carregados com sucesso!")
print(f"√âpocas treinadas: {len(balanced_history)}")
print(f"Melhor val_accuracy: {balanced_history['val_sparse_categorical_accuracy'].max():.4f}")
print(f"Melhor val_loss: {balanced_history['val_loss'].min():.4f}")

In [None]:
"""
AVALIA√á√ÉO DO MODELO BALANCEADO

Processo:
---------
1. Cria generator sem shuffle (para manter correspond√™ncia labels/predi√ß√µes)
2. Gera predi√ß√µes para todo o conjunto de valida√ß√£o
3. Calcula m√©tricas (Accuracy, Balanced Accuracy)
4. Plota Confusion Matrix
"""

# Cria generator SEM shuffle para avalia√ß√£o
val_gen_no_shuffle = test_datagen.flow_from_directory(
    '/tmp/data/eval',  # Dataset balanceado
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse',
    shuffle=False  # CR√çTICO: mant√©m ordem para m√©tricas
)

# Extrai labels verdadeiros
y_true = val_gen_no_shuffle.classes

print("Gerando predi√ß√µes no conjunto de valida√ß√£o balanceado...")
print("(Isso pode levar alguns minutos)\n")

# Gera predi√ß√µes
predictions_balanced = balanced_model.predict(val_gen_no_shuffle)

# Converte probabilidades (softmax) em classes preditas
y_pred_balanced = np.argmax(predictions_balanced, axis=1)

print("=" * 70)
print("M√âTRICAS DE AVALIA√á√ÉO - MODELO BALANCEADO")
print("=" * 70)

# Accuracy Score
acc_balanced = accuracy_score(y_true, y_pred_balanced)
print(f"Accuracy Score:          {acc_balanced:.4f} ({acc_balanced*100:.2f}%)")

# Balanced Accuracy Score
balanced_acc_balanced = balanced_accuracy_score(y_true, y_pred_balanced)
print(f"Balanced Accuracy Score: {balanced_acc_balanced:.4f} ({balanced_acc_balanced*100:.2f}%)")

print("\nüí° Nota: Com dataset balanceado, Accuracy e Balanced Accuracy")
print("   devem ser pr√≥ximas (diferen√ßa < 2-3%).\n")

# Confusion Matrix
balanced_cm = confusion_matrix(y_true, y_pred_balanced)

plt.figure(figsize=(8, 6))
ConfusionMatrixDisplay(
    balanced_cm, 
    display_labels=['birds', 'cats', 'dogs']
).plot(values_format="d", cmap='Greens')
plt.title('Confusion Matrix - Modelo Balanceado\n(Dataset de Valida√ß√£o Balanceado)')
plt.tight_layout()
plt.show()

# An√°lise de erros por classe
misclassified_birds = (balanced_cm[0, 1] + balanced_cm[0, 2]) / np.sum(balanced_cm, axis=1)[0]
misclassified_cats = (balanced_cm[1, 0] + balanced_cm[1, 2]) / np.sum(balanced_cm, axis=1)[1]
misclassified_dogs = (balanced_cm[2, 0] + balanced_cm[2, 1]) / np.sum(balanced_cm, axis=1)[2]

print("\n" + "=" * 70)
print("PROPOR√á√ÉO DE ERROS POR CLASSE")
print("=" * 70)
print(f"P√°ssaros (birds): {misclassified_birds*100:.2f}% de erros")
print(f"Gatos (cats):     {misclassified_cats*100:.2f}% de erros")
print(f"C√£es (dogs):      {misclassified_dogs*100:.2f}% de erros")

# Calcula desvio padr√£o dos erros (quanto mais baixo, mais uniforme)
errors = [misclassified_birds, misclassified_cats, misclassified_dogs]
error_std = np.std(errors)

print(f"\nDesvio padr√£o dos erros: {error_std:.4f}")
print("üí° Quanto menor o desvio, mais uniforme o desempenho entre classes.")

# Classification Report
print("\n" + "=" * 70)
print("CLASSIFICATION REPORT")
print("=" * 70)
print(classification_report(
    y_true,
    y_pred_balanced,
    target_names=['birds', 'cats', 'dogs'],
    digits=4
))

In [None]:
augmented_history = pd.read_csv('/tmp/history-augmented/history-augmented.csv')
augmented_model = tf.keras.models.load_model('/tmp/model-augmented')

In [None]:
"""
EXPERIMENTO 3: TREINAMENTO COM DATA AUGMENTATION

Objetivo:
---------
Combater overfitting atrav√©s de data augmentation (aumento artificial do dataset).

O que √© Data Augmentation?
---------------------------
T√©cnica que aplica transforma√ß√µes aleat√≥rias nas imagens de treino para criar
varia√ß√µes artificiais, for√ßando o modelo a aprender features mais robustas.

Transforma√ß√µes aplicadas:
--------------------------
- rotation_range=50: Rota√ß√£o aleat√≥ria de at√© 50 graus
- width_shift_range=0.15: Deslocamento horizontal de at√© 15%
- height_shift_range=0.15: Deslocamento vertical de at√© 15%
- shear_range=0.2: Distor√ß√£o de cisalhamento de at√© 20%
- zoom_range=0.2: Zoom in/out de at√© 20%
- horizontal_flip=True: Espelhamento horizontal aleat√≥rio

Por que isso funciona?
-----------------------
- Aumenta artificialmente o tamanho do dataset
- For√ßa o modelo a aprender features invariantes a transforma√ß√µes
- Reduz overfitting (modelo n√£o "decora" as imagens exatas)
- Melhora generaliza√ß√£o para imagens em condi√ß√µes variadas

IMPORTANTE:
-----------
Data augmentation √© aplicado APENAS no treino, NUNCA na valida√ß√£o/teste!
"""

# Instancia um novo modelo com a mesma arquitetura
augmented_model = create_model()

# Generator de TREINO com data augmentation
train_datagen = ImageDataGenerator(
    rescale=1./255,              # Normaliza√ß√£o (sempre necess√°ria)
    rotation_range=50,           # Rota√ß√£o: simula diferentes √¢ngulos de captura
    width_shift_range=0.15,      # Shift horizontal: simula descentramento
    height_shift_range=0.15,     # Shift vertical: simula descentramento
    shear_range=0.2,             # Cisalhamento: simula perspectivas diferentes
    zoom_range=0.2,              # Zoom: simula diferentes dist√¢ncias
    horizontal_flip=True         # Espelhamento: dobra o dataset (gato da esquerda = gato da direita)
)

# Generator de VALIDA√á√ÉO sem augmentation (apenas normaliza√ß√£o)
test_datagen = ImageDataGenerator(rescale=1./255)

# Cria os generators
train_generator = train_datagen.flow_from_directory(
    '/tmp/data/train',
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse'
)

validation_generator = test_datagen.flow_from_directory(
    '/tmp/data/eval',
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse'
)

print("=" * 70)
print("CONFIGURA√á√ÉO DO EXPERIMENTO - MODELO COM DATA AUGMENTATION")
print("=" * 70)
print("Transforma√ß√µes aplicadas no TREINO:")
print("  - Rota√ß√£o: at√© 50¬∞")
print("  - Deslocamento: at√© 15% (horizontal e vertical)")
print("  - Cisalhamento: at√© 20%")
print("  - Zoom: at√© 20%")
print("  - Espelhamento horizontal: Sim")
print("\nValida√ß√£o: APENAS normaliza√ß√£o (sem augmentation)")
print("=" * 70)

In [None]:
from tensorflow.keras.preprocessing.image import img_to_array, array_to_img, load_img
import random

def display_transformations(gen, title="Transforma√ß√µes Aplicadas"):
    """
    Visualiza exemplos de transforma√ß√µes aplicadas por um ImageDataGenerator.
    
    Par√¢metros:
    -----------
    gen : ImageDataGenerator
        Generator configurado com transforma√ß√µes
    title : str
        T√≠tulo para o conjunto de transforma√ß√µes
    
    Utilidade MLOps:
    ----------------
    Permite validar visualmente se as transforma√ß√µes s√£o realistas.
    Transforma√ß√µes muito extremas podem gerar imagens irreconhec√≠veis,
    prejudicando o treinamento em vez de ajudar.
    """
    train_birds_dir = "/tmp/data/train/birds"
    
    # Seleciona uma imagem aleat√≥ria de p√°ssaro
    bird_images = os.listdir(train_birds_dir)
    random_index = random.randint(0, len(bird_images) - 1)
    sample_image_path = os.path.join(train_birds_dir, bird_images[random_index])
    
    # Carrega e prepara a imagem
    sample_image = load_img(sample_image_path, target_size=(150, 150))
    sample_array = img_to_array(sample_image)
    sample_array = sample_array[None, :]  # Adiciona dimens√£o de batch
    
    print("=" * 70)
    print(title)
    print("=" * 70)
    print(f"Imagem original: {bird_images[random_index]}\n")
    
    # Exibe a imagem original
    print("IMAGEM ORIGINAL:")
    display(sample_image)
    
    # Gera e exibe 4 transforma√ß√µes aleat√≥rias
    print("\nTRANSFORMA√á√ïES GERADAS:")
    for iteration, array in zip(range(4), gen.flow(sample_array, batch_size=1)):
        array = np.squeeze(array)  # Remove dimens√£o de batch
        img = array_to_img(array)
        print(f"\nTransforma√ß√£o #{iteration + 1}:")
        display(img)
    
    print("\n" + "=" * 70 + "\n")


# Visualiza transforma√ß√µes MODERADAS (usadas no treinamento)
print("üîç AN√ÅLISE: Transforma√ß√µes Moderadas (Configura√ß√£o de Treino)")
print("Objetivo: Verificar se as transforma√ß√µes mant√™m as imagens reconhec√≠veis\n")

sample_gen_moderate = ImageDataGenerator(
    rescale=1./255,
    rotation_range=50,
    width_shift_range=0.25,
    height_shift_range=0.25,
    shear_range=0.2,
    zoom_range=0.25,
    horizontal_flip=True
)

display_transformations(sample_gen_moderate, "TRANSFORMA√á√ïES MODERADAS")

print("‚úÖ An√°lise: As imagens transformadas ainda s√£o reconhec√≠veis?")
print("   - Se SIM: Configura√ß√£o adequada para treinamento")
print("   - Se N√ÉO: Reduzir intensidade das transforma√ß√µes\n")

In [None]:
"""
COMPARA√á√ÉO: Transforma√ß√µes EXTREMAS (n√£o recomendadas)

Objetivo:
---------
Demonstrar o que acontece quando data augmentation √© muito agressivo.

Problema:
---------
Transforma√ß√µes extremas podem:
- Gerar imagens irreconhec√≠veis (at√© para humanos)
- Confundir o modelo em vez de ajudar
- Introduzir artefatos que n√£o existem em dados reais
- Prejudicar o desempenho em vez de melhorar

Regra de ouro:
--------------
Se um humano n√£o consegue reconhecer a classe na imagem transformada,
o modelo tamb√©m ter√° dificuldade.
"""

print("‚ö†Ô∏è  AN√ÅLISE: Transforma√ß√µes Extremas (N√ÉO recomendadas)")
print("Objetivo: Demonstrar os limites do data augmentation\n")

# Generator com transforma√ß√µes MUITO agressivas
sample_gen_extreme = ImageDataGenerator(
    rescale=1./255,
    rotation_range=90,           # Rota√ß√£o de at√© 90¬∞ (imagem de cabe√ßa para baixo)
    width_shift_range=0.3,       # Deslocamento de 30% (pode cortar partes importantes)
    height_shift_range=0.3,      # Deslocamento de 30%
    shear_range=0.5,             # Cisalhamento extremo (distorce muito a forma)
    zoom_range=0.5,              # Zoom de 50% (pode perder contexto)
    vertical_flip=True,          # Espelhamento vertical (animais de cabe√ßa para baixo)
    horizontal_flip=True
)

display_transformations(sample_gen_extreme, "TRANSFORMA√á√ïES EXTREMAS (N√ÉO USAR)")

print("‚ùå An√°lise: As imagens transformadas est√£o irreconhec√≠veis?")
print("   - vertical_flip=True: Animais de cabe√ßa para baixo (n√£o realista)")
print("   - rotation_range=90: Pode gerar orienta√ß√µes imposs√≠veis")
print("   - shear_range=0.5: Distorce demais a forma original")
print("\nüí° Li√ß√£o MLOps:")
print("   Data augmentation deve simular VARIA√á√ïES REALISTAS, n√£o criar")
print("   imagens artificiais que nunca ocorreriam em produ√ß√£o.\n")

In [None]:
"""
CARREGAMENTO DO MODELO PR√â-TREINADO COM DATA AUGMENTATION

Nota:
-----
Carregamos um modelo j√° treinado com data augmentation para economizar tempo.

Expectativa:
------------
- Menor overfitting (gap menor entre train e eval)
- Curvas de treino mais "ruidosas" (devido √†s transforma√ß√µes aleat√≥rias)
- Melhor generaliza√ß√£o para imagens em condi√ß√µes variadas
"""

# Carrega o hist√≥rico de treinamento
augmented_history = pd.read_csv('/tmp/history-augmented/history-augmented.csv')

# Carrega o modelo treinado
augmented_model = tf.keras.models.load_model('/tmp/model-augmented')

print("‚úÖ Modelo com data augmentation e hist√≥rico carregados com sucesso!")
print(f"√âpocas treinadas: {len(augmented_history)}")
print(f"Melhor val_accuracy: {augmented_history['val_sparse_categorical_accuracy'].max():.4f}")
print(f"Melhor val_loss: {augmented_history['val_loss'].min():.4f}")

In [None]:
"""
AVALIA√á√ÉO DO MODELO TREINADO COM DATA AUGMENTATION

Hip√≥tese:
---------
O modelo com augmentation deve ter:
- Melhor generaliza√ß√£o (menor gap entre train e eval)
- Desempenho similar ou melhor que o modelo balanceado
- Maior robustez a varia√ß√µes nas imagens de teste
"""

# Cria generator SEM shuffle para avalia√ß√£o
val_gen_no_shuffle = test_datagen.flow_from_directory(
    '/tmp/data/eval',
    target_size=(150, 150),
    batch_size=32,
    class_mode='sparse',
    shuffle=False
)

# Extrai labels verdadeiros
y_true = val_gen_no_shuffle.classes

print("Gerando predi√ß√µes no conjunto de valida√ß√£o...")
print("(Isso pode levar alguns minutos)\n")

# Gera predi√ß√µes
predictions_augmented = augmented_model.predict(val_gen_no_shuffle)
y_pred_augmented = np.argmax(predictions_augmented, axis=1)

print("=" * 70)
print("M√âTRICAS DE AVALIA√á√ÉO - MODELO COM DATA AUGMENTATION")
print("=" * 70)

# Accuracy Score
acc_augmented = accuracy_score(y_true, y_pred_augmented)
print(f"Accuracy Score:          {acc_augmented:.4f} ({acc_augmented*100:.2f}%)")

# Balanced Accuracy Score
balanced_acc_augmented = balanced_accuracy_score(y_true, y_pred_augmented)
print(f"Balanced Accuracy Score: {balanced_acc_augmented:.4f} ({balanced_acc_augmented*100:.2f}%)")

# Confusion Matrix
augmented_cm = confusion_matrix(y_true, y_pred_augmented)

plt.figure(figsize=(8, 6))
ConfusionMatrixDisplay(
    augmented_cm,
    display_labels=['birds', 'cats', 'dogs']
).plot(values_format="d", cmap='Purples')
plt.title('Confusion Matrix - Modelo com Data Augmentation\n(Dataset de Valida√ß√£o Balanceado)')
plt.tight_layout()
plt.show()

# An√°lise de erros por classe
misclassified_birds_aug = (augmented_cm[0, 1] + augmented_cm[0, 2]) / np.sum(augmented_cm, axis=1)[0]
misclassified_cats_aug = (augmented_cm[1, 0] + augmented_cm[1, 2]) / np.sum(augmented_cm, axis=1)[1]
misclassified_dogs_aug = (augmented_cm[2, 0] + augmented_cm[2, 1]) / np.sum(augmented_cm, axis=1)[2]

print("\n" + "=" * 70)
print("PROPOR√á√ÉO DE ERROS POR CLASSE")
print("=" * 70)
print(f"P√°ssaros (birds): {misclassified_birds_aug*100:.2f}% de erros")
print(f"Gatos (cats):     {misclassified_cats_aug*100:.2f}% de erros")
print(f"C√£es (dogs):      {misclassified_dogs_aug*100:.2f}% de erros")

# Classification Report
print("\n" + "=" * 70)
print("CLASSIFICATION REPORT")
print("=" * 70)
print(classification_report(
    y_true,
    y_pred_augmented,
    target_names=['birds', 'cats', 'dogs'],
    digits=4
))

In [None]:
"""
VISUALIZA√á√ÉO DAS CURVAS DE TREINAMENTO - MODELO COM AUGMENTATION

An√°lise esperada:
-----------------
- Curvas de treino mais "ruidosas" (devido √†s transforma√ß√µes aleat√≥rias)
- Gap menor entre train e eval (menos overfitting)
- Converg√™ncia pode ser mais lenta (modelo precisa aprender features mais robustas)
"""

print("=" * 70)
print("CURVAS DE TREINAMENTO - MODELO COM DATA AUGMENTATION")
print("=" * 70)

plot_train_eval(augmented_history)

print("\nüí° Observa√ß√µes esperadas:")
print("   - Curva de treino mais 'ruidosa' (varia√ß√µes entre √©pocas)")
print("   - Gap menor entre treino e valida√ß√£o (menos overfitting)")
print("   - Accuracy de treino pode ser MENOR que no modelo sem augmentation")
print("     (isso √© NORMAL e DESEJ√ÅVEL - significa que o modelo n√£o est√° decorando)")

In [None]:
"""
COMPARA√á√ÉO FINAL: IMBALANCED vs BALANCED vs AUGMENTED

Objetivo:
---------
Quantificar o impacto de cada t√©cnica no desempenho do modelo.

M√©tricas comparadas:
--------------------
- Balanced Accuracy (m√©trica principal para datasets desbalanceados)
- Erro por classe (uniformidade do desempenho)
- Gap train-eval (indicador de overfitting)
"""

print("=" * 70)
print("COMPARA√á√ÉO FINAL: 3 EXPERIMENTOS")
print("=" * 70)

# Cria DataFrame para compara√ß√£o
comparison_data = {
    'Modelo': ['Imbalanced', 'Balanced', 'Augmented'],
    'Balanced Accuracy': [
        balanced_acc,           # Do experimento 1
        balanced_acc_balanced,  # Do experimento 2
        balanced_acc_augmented  # Do experimento 3
    ],
    'Erro Birds (%)': [
        misclassified_birds * 100,
        (balanced_cm[0, 1] + balanced_cm[0, 2]) / np.sum(balanced_cm, axis=1)[0] * 100,
        misclassified_birds_aug * 100
    ],
    'Erro Cats (%)': [
        misclassified_cats * 100,
        (balanced_cm[1, 0] + balanced_cm[1, 2]) / np.sum(balanced_cm, axis=1)[1] * 100,
        misclassified_cats_aug * 100
    ],
    'Erro Dogs (%)': [
        misclassified_dogs * 100,
        (balanced_cm[2, 0] + balanced_cm[2, 1]) / np.sum(balanced_cm, axis=1)[2] * 100,
        misclassified_dogs_aug * 100
    ]
}

comparison_df = pd.DataFrame(comparison_data)
print(comparison_df.to_string(index=False))

# Visualiza√ß√£o gr√°fica
plt.figure(figsize=(14, 5))

# Subplot 1: Balanced Accuracy
plt.subplot(1, 2, 1)
plt.bar(comparison_df['Modelo'], comparison_df['Balanced Accuracy'], 
        color=['#ff6b6b', '#4ecdc4', '#95e1d3'])
plt.title('Balanced Accuracy - Compara√ß√£o dos 3 Modelos')
plt.ylabel('Balanced Accuracy')
plt.ylim([0, 1])
plt.grid(axis='y', alpha=0.3)

# Adiciona valores nas barras
for i, v in enumerate(comparison_df['Balanced Accuracy']):
    plt.text(i, v + 0.02, f'{v:.4f}', ha='center', fontweight='bold')

# Subplot 2: Erro por classe
plt.subplot(1, 2, 2)
x = np.arange(len(comparison_df['Modelo']))
width = 0.25

plt.bar(x - width, comparison_df['Erro Birds (%)'], width, label='Birds', color='#ff6b6b')
plt.bar(x, comparison_df['Erro Cats (%)'], width, label='Cats', color='#4ecdc4')
plt.bar(x + width, comparison_df['Erro Dogs (%)'], width, label='Dogs', color='#95e1d3')

plt.title('Taxa de Erro por Classe - Compara√ß√£o dos 3 Modelos')
plt.ylabel('Taxa de Erro (%)')
plt.xticks(x, comparison_df['Modelo'])
plt.legend()
plt.grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()

# An√°lise final
print("\n" + "=" * 70)
print("CONCLUS√ïES MLOps")
print("=" * 70)

best_model_idx = comparison_df['Balanced Accuracy'].idxmax()
best_model = comparison_df.loc[best_model_idx, 'Modelo']
best_score = comparison_df.loc[best_model_idx, 'Balanced Accuracy']

print(f"üèÜ Melhor modelo: {best_model} (Balanced Accuracy: {best_score:.4f})")
print("\nLi√ß√µes aprendidas:")
print("  1. Desbalanceamento de classes prejudica MUITO o desempenho")
print("  2. Balancear o dataset √© essencial para treinar modelos justos")
print("  3. Data augmentation ajuda a combater overfitting")
print("  4. Balanced Accuracy > Accuracy para datasets desbalanceados")
print("  5. Sempre analise m√©tricas POR CLASSE, n√£o apenas globais")
print("=" * 70)