In [22]:
import time
import matplotlib.pyplot as plt
import tensorflow as tf
import os
import pandas as pd
import numpy as np

from keras.utils import image_dataset_from_directory
from tensorflow import keras 
from tensorflow.keras.utils import to_categorical
from keras import layers
from keras import models
from keras.callbacks import EarlyStopping
from tensorflow.data import Options


import psutil
import subprocess
import platform

### Configura√ß√£o da GPU no TensorFlow

Antes de iniciar o treino do modelo, √© importante garantir que o *TensorFlow* est√° configurado para utilizar a GPU (caso esteja dispon√≠vel). Al√©m disso, ativamos o *memory growth*, que permite ao *TensorFlow* alocar mem√≥ria da GPU conforme necess√°rio, evitando reservar toda a mem√≥ria de uma vez.

In [None]:
# Verificar dispositivos f√≠sicos do tipo 'GPU' dispon√≠veis
gpus = tf.config.list_physical_devices('GPU')

# Se houver GPUs dispon√≠veis, configurar o memory growth
if gpus:
    try:
        for gpu in gpus:
            # Ativar crescimento din√¢mico da mem√≥ria da GPU
            tf.config.experimental.set_memory_growth(gpu, True)
        print("GPU memory growth enabled.")
    except RuntimeError as e:
        # Caso a GPU j√° tenha sido inicializada, n√£o √© poss√≠vel alterar a configura√ß√£o
        print(e)

### Explora√ß√£o da Estrutura de Diretorias

Antes de carregar os dados, √© importante garantir que o caminho para os ficheiros est√° correto e que a estrutura de diretorias est√° bem organizada. O seguinte bloco de c√≥digo permite:

- Definir o caminho base (`root_path`) para o projeto.
- Listar as diretorias existentes na raiz do projeto.
- Verificar se a diretoria do dataset (`garbage-noaug-70-15-15`) existe e visualizar o seu conte√∫do.
- Explorar de forma recursiva a estrutura de diretorias, mostrando ficheiros e pastas com indenta√ß√£o hier√°rquica.

Este passo √© essencial para:
- Validar que os dados est√£o organizados corretamente.
- Evitar erros de caminho ao carregar imagens para treino, valida√ß√£o e teste.

In [None]:
# Caminho local para a pasta raiz do projeto
root_path = "./"  

# Listar diretorias no caminho raiz
print("Diretorias no caminho raiz:")
print(os.listdir(root_path))

# Verificar conte√∫do de um caminho espec√≠fico
specific_path = os.path.join(root_path, "garbage-noaug-70-15-15")
if os.path.exists(specific_path):
    print(f"\n Conte√∫do de {specific_path}:")
    print(os.listdir(specific_path))
else:
    print(f"\n Caminho {specific_path} n√£o existe")

# Fun√ß√£o para listar diretorias com profundidade
def list_dirs(path, indent=0):
    for item in os.listdir(path):
        full_path = os.path.join(path, item)
        if os.path.isdir(full_path):
            print(" " * indent + "üìÅ " + item)
            if indent < 4:
                list_dirs(full_path, indent + 2)
        else:
            print(" " * indent + "üìÑ " + item)

# Explorar estrutura de diretorias
print("\n Estrutura de diretorias:")
list_dirs(root_path, 0)

### Dete√ß√£o e Configura√ß√£o Otimizada de GPU (Apple Silicon / Metal)

Este bloco de c√≥digo trata da dete√ß√£o e configura√ß√£o de dispositivos de acelera√ß√£o como GPUs ou MPS (*Metal Performance Shaders*), especialmente √∫til em Macs com Apple Silicon.

#### Funcionalidades:
- Procura dispositivos GPU dispon√≠veis (*TensorFlow* ‚â• 2.5 reconhece *Metal* como `GPU`).
- Se n√£o encontrar GPU, tenta encontrar dispositivos `MPS` diretamente.
- Ativa `memory growth` para evitar aloca√ß√£o antecipada excessiva de mem√≥ria.
- Verifica e imprime os dispositivos vis√≠veis.
- Executa uma multiplica√ß√£o de matrizes simples para testar a acelera√ß√£o via GPU.

In [None]:
# Improved Metal GPU detection for Apple Silicon
try:
    # First try looking for GPU devices (newer TF versions label Metal as GPU)
    gpus = tf.config.list_physical_devices('GPU')
    if len(gpus) > 0:
        print(f"Found {len(gpus)} GPU device(s)")
        tf.config.experimental.set_visible_devices(gpus[0], 'GPU')
        tf.config.experimental.set_memory_growth(gpus[0], True)
        print("GPU acceleration enabled (Metal)")
    # If no GPU found, try looking specifically for MPS devices
    elif hasattr(tf.config, 'list_physical_devices') and len(tf.config.list_physical_devices('MPS')) > 0:
        mps_devices = tf.config.list_physical_devices('MPS')
        tf.config.experimental.set_visible_devices(mps_devices[0], 'MPS')
        print("MPS (Metal) device enabled")
    else:
        print("No GPU or MPS device found, using CPU")
        
    # Verify what device is being used
    print("\nDevice being used:", tf.config.get_visible_devices())
    
    # Test with a simple operation to confirm GPU usage
    with tf.device('/GPU:0'):
        a = tf.constant([[1.0, 2.0], [3.0, 4.0]])
        b = tf.constant([[5.0, 6.0], [7.0, 8.0]])
        c = tf.matmul(a, b)
        print("Matrix multiplication result:", c)
        print("GPU test successful!")
except Exception as e:
    print(f"Error setting up GPU: {e}")
    print("Falling back to CPU")

### Mixed Precision Training (FP16)

Este bloco de c√≥digo ativa o **mixed precision training**, que usa `float16` (FP16) em vez de `float32` (FP32), sempre que poss√≠vel.

#### Benef√≠cios:
- Maior desempenho em GPUs modernas, como as da arquitetura Volta, Turing, Ampere ou Apple Silicon com suporte a *Metal*.
- Menor uso de mem√≥ria, permitindo treinar modelos maiores.

#### Como funciona:
- Opera√ß√µes matem√°ticas intensas usam `float16`
- A perda (`loss`) e os pesos principais mant√™m-se em `float32` para estabilidade num√©rica

In [26]:
# Enable mixed precision (faster on GPU)
from tensorflow.keras.mixed_precision import set_global_policy
set_global_policy('mixed_float16')  # Use FP16 instead of FP32


### Carregamento e Prepara√ß√£o dos Dados

Este bloco de c√≥digo realiza a prepara√ß√£o do dataset antes do treino do modelo, incluindo carregamento das imagens, redimensionamento, *batching* e otimiza√ß√µes de desempenho.

#### Defini√ß√£o de Caminhos

```python
train_dir = specific_path + "/train"
validation_dir = specific_path + "/valid"
test_dir = specific_path + "/test"
```

Define os caminhos para os diret√≥rios contendo os dados de treino, valida√ß√£o e teste. Espera-se que o `specific_path` aponte para a pasta raiz onde os dados est√£o organizados em subpastas por classe.

#### Configura√ß√µes de Imagem

```python
IMG_SIZE = 128
BATCH_SIZE = 64
```

- `IMG_SIZE`: Redimensiona todas as imagens para 128x128. Apesar das imagens originais serem 640x640, reduzir o tamanho melhora a velocidade de treino e reduz o uso de mem√≥ria.
- `BATCH_SIZE`: Define o n√∫mero de imagens por batch. Um valor de 64 √© eficiente para GPUs com mem√≥ria moderada.

#### Carregamento do Dataset

Carrega as imagens a partir dos diret√≥rios com as seguintes op√ß√µes:

- Redimensionamento para o tamanho especificado.
- Organiza√ß√£o autom√°tica dos dados por classes (com base nas subpastas).
- Convers√£o em batches para serem usados no treino.

S√£o criados tr√™s datasets:

- `train_dataset`: para treino do modelo.
- `validation_dataset`: para avalia√ß√£o durante o treino.
- `test_dataset`: para avalia√ß√£o final.

#### *Prefetching* para Acelera√ß√£o

```python
.prefetch(buffer_size=tf.data.AUTOTUNE)
```

Usa `prefetch` para carregar os dados no background enquanto o modelo treina, o que reduz o tempo de espera entre *batches* e melhora o desempenho.


#### Limitar Dados para Testes R√°pidos

```python
train_dataset_pref = train_dataset_pref.take(100)
```

Limita o n√∫mero de *batches* usados no treino. √ötil durante testes r√°pidos para evitar longos tempos de treino enquanto se afina a arquitetura ou outros detalhes.

#### Otimiza√ß√µes Adicionais

```python
options = Options()
options.experimental_optimization.parallel_batch = False
```

Desativa o batching paralelo autom√°tico (por vezes usado por TensorFlow), o que pode ser necess√°rio em ambientes com recursos limitados ou para evitar conflitos de performance.


In [None]:
# Defini√ß√£o das diretorias de treino, valida√ß√£o e teste
train_dir = specific_path + "/train"
validation_dir = specific_path + "/valid"
test_dir = specific_path + "/test"

# Definir o tamanho das imagens e o tamanho do batch
# (Imagens originais t√™m 640px, mas 128px acelera o treino)
IMG_SIZE = 128
BATCH_SIZE = 64


# Carregar o dataset de treino a partir da diretoria
train_dataset = image_dataset_from_directory(
    train_dir,
    image_size=(IMG_SIZE, IMG_SIZE), # Redimensionar imagens
    batch_size=BATCH_SIZE            # Dividir em batches
)

# Carregar o dataset de valida√ß√£o
validation_dataset = image_dataset_from_directory(
    validation_dir,
    image_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE
)

# Carregar o dataset de teste
test_dataset = image_dataset_from_directory(
    test_dir,
    image_size=(IMG_SIZE, IMG_SIZE),
    batch_size=BATCH_SIZE
)

# Aplicar prefetching para otimizar o carregamento dos dados durante o treino
train_dataset_pref = train_dataset.prefetch(buffer_size=tf.data.AUTOTUNE)
validation_dataset_pref = validation_dataset.prefetch(buffer_size=tf.data.AUTOTUNE)
test_dataset_pref = test_dataset.prefetch(buffer_size=tf.data.AUTOTUNE)

# Limitar o n√∫mero de batches de treino para testes mais r√°pidos
train_dataset_pref = train_dataset_pref.take(100)

# Ajustar op√ß√µes do dataset para evitar paralelismo autom√°tico no batching
options = Options()
options.experimental_optimization.parallel_batch = False
train_dataset_pref = train_dataset_pref.with_options(options)


## Verifica√ß√£o do Balanceamento das Classes

Antes de treinar o modelo, √© importante compreender a distribui√ß√£o de amostras entre as diferentes classes. Um dataset desbalanceado pode afetar negativamente a performance do modelo, especialmente em classes minorit√°rias.

O c√≥digo abaixo calcula o n√∫mero de exemplos por classe no dataset de treino (`train_dataset`), construindo um dicion√°rio com contagens e depois convertendo essa informa√ß√£o num DataFrame para visualiza√ß√£o.


In [None]:
# Check class balance
class_counts = {}
# Itera sobre os batches do dataset de treino
for _, labels in train_dataset:
    for label in labels.numpy():
        if label not in class_counts:
            class_counts[label] = 0
        class_counts[label] += 1

# Cria um DataFrame com a contagem por classe
df = pd.DataFrame({'class': train_dataset.class_names, 'count': [class_counts.get(i, 0) for i in range(len(train_dataset.class_names))]})

# Mostra o DataFrame
print(df)


## Defini√ß√£o da Arquitetura CNN com Normaliza√ß√£o por Batch e Otimizador RMSprop

Nesta sec√ß√£o, √© apresentada a constru√ß√£o manual de uma rede neuronal convolucional (CNN) simples, composta por tr√™s blocos convolucionais seguidos de uma cabe√ßa densa totalmente conectada. Esta arquitetura foi projetada com o objetivo de classificar imagens em m√∫ltiplas categorias, com base no dataset previamente carregado.

O pr√©-processamento inicial das imagens √© feito com a camada `Rescaling`, que normaliza os valores de pixel para o intervalo `[0, 1]`. Esta transforma√ß√£o √© essencial para acelerar a converg√™ncia do modelo e garantir estabilidade num√©rica durante o treino.

### Estrutura dos Blocos Convolucionais

Cada bloco convolucional √© constitu√≠do por:

- Uma camada `Conv2D` com `padding='same'`, que mant√©m as dimens√µes espaciais da imagem,
- Uma camada `BatchNormalization`, que normaliza as ativa√ß√µes antes da fun√ß√£o de ativa√ß√£o, estabilizando e acelerando o treino,
- Uma fun√ß√£o de ativa√ß√£o `ReLU` para introdu√ß√£o de n√£o-linearidade,
- Uma camada `MaxPooling2D`, respons√°vel por reduzir a dimens√£o espacial e extrair as caracter√≠sticas mais salientes da imagem.

S√£o empilhados tr√™s destes blocos, com 32, 64 e 128 filtros, respetivamente, aumentando progressivamente a capacidade de extra√ß√£o de padr√µes visuais.

### Camadas Densas e Classifica√ß√£o

Ap√≥s a extra√ß√£o de caracter√≠sticas, os tensores s√£o achatados (`Flatten`) e processados por uma camada densa (`Dense`) com 256 unidades, seguida de:

- Uma camada `BatchNormalization`,
- Uma fun√ß√£o de ativa√ß√£o `ReLU`,
- Uma camada `Dropout` com taxa de 30%, para reduzir o risco de *overfitting*.

A camada de sa√≠da √© uma `Dense` com ativa√ß√£o `softmax`, que gera uma distribui√ß√£o de probabilidades sobre as classes dispon√≠veis, permitindo assim a decis√£o final do modelo.

### Compila√ß√£o do Modelo

O modelo foi compilado com:

- O otimizador `RMSprop`, utilizando uma taxa de aprendizagem de `1e-3`, adequada para tarefas de classifica√ß√£o com redes convolucionais,
- A fun√ß√£o de perda `categorical_crossentropy`, apropriada para r√≥tulos codificados em one-hot,
- A m√©trica de desempenho `accuracy`, usada para monitorizar a taxa de classifica√ß√µes corretas durante o treino e a valida√ß√£o.

### Resumo da Arquitetura

A arquitetura final do modelo foi visualizada atrav√©s do m√©todo `model.summary()`, que apresenta o n√∫mero total de par√¢metros trein√°veis e a estrutura sequencial das camadas.


In [None]:
# Definir a arquitetura da CNN com BatchNormalization antes da ativa√ß√£o
inputs = keras.Input(shape=(IMG_SIZE, IMG_SIZE, 3))
x = layers.Rescaling(1./255)(inputs)

# Primeira camada convolucional
x = layers.Conv2D(32, 3, padding='same')(x)
x = layers.BatchNormalization()(x)
x = layers.Activation('relu')(x)
x = layers.MaxPooling2D()(x)

# Segunda camada convolucional
x = layers.Conv2D(64, 3, padding='same')(x)
x = layers.BatchNormalization()(x)
x = layers.Activation('relu')(x)
x = layers.MaxPooling2D()(x)

# Terceira camada convolucional
x = layers.Conv2D(128, 3, padding='same')(x)
x = layers.BatchNormalization()(x)
x = layers.Activation('relu')(x)
x = layers.MaxPooling2D()(x)

# Camadas densas
x = layers.Flatten()(x)
x = layers.Dropout(0.3)(x)
x = layers.Dense(256)(x)
x = layers.BatchNormalization()(x)
x = layers.Activation('relu')(x)

# Camada de sa√≠da
outputs = layers.Dense(len(train_dataset.class_names), activation='softmax')(x)

# Criar o modelo
model = keras.Model(inputs=inputs, outputs=outputs)

# Otimizador
optimizer = tf.keras.optimizers.RMSprop(learning_rate=1e-3)

# Compilar o modelo
model.compile(
    optimizer=optimizer,
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

# Resumo do modelo
model.summary()

In [30]:
# timeout callback to stop training after a certain time limit
class TimeoutCallback(tf.keras.callbacks.Callback):
    def __init__(self, max_time_mins=2):
        super().__init__()
        self.max_time_sec = max_time_mins * 60
        self.start_time = time.time()
        
    def on_epoch_end(self, epoch, logs=None):
        elapsed = time.time() - self.start_time
        if elapsed > self.max_time_sec:
            print(f"\nReached time limit ({self.max_time_sec/3600:.1f}h). Stopping training.")
            self.model.stop_training = True

# Maximum 20 minutes of training to prevent overheating
timeout_cb = TimeoutCallback(max_time_mins=20)


In [31]:
# Callback para early stopping
early_stopping = tf.keras.callbacks.EarlyStopping(
    monitor='val_accuracy', 
    patience=5,
    restore_best_weights=True
)

# Callback para salvar o modelo com melhor desempenho
checkpoint_cb = tf.keras.callbacks.ModelCheckpoint(
    "models/model_checkpoint.keras", 
    save_best_only=True,
    monitor="val_accuracy"
)

# Add more callbacks for better training
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(
    monitor='val_loss', factor=0.2, patience=3, min_lr=1e-6)

# Calculate class weights
total = sum(class_counts.values())
class_weight = {i: total/count for i, count in class_counts.items()}


### Controlo de Tempo no Treino com *Callback* Personalizado

Durante o treino de modelos de *deep learning*, √© comum que sess√µes de treino longas causem sobreaquecimento de dispositivos locais, especialmente em ambientes com recursos limitados, como computadores port√°teis ou dispositivos integrados. Para mitigar este problema, foi implementado um **callback personalizado** que permite interromper o treino automaticamente ap√≥s um determinado tempo m√°ximo.

#### Descri√ß√£o da L√≥gica

Foi criada uma classe chamada `TimeoutCallback`, que herda de `tf.keras.callbacks.Callback`. Esta classe √© inicializada com um par√¢metro `max_time_mins`, que define o tempo m√°ximo de treino em minutos. O tempo de in√≠cio √© registado no momento da cria√ß√£o do *callback*.

A l√≥gica de controlo √© aplicada ao final de cada √©poca (`on_epoch_end`). Nesta fase, √© calculado o tempo decorrido desde o in√≠cio do treino. Se o tempo exceder o limite especificado, o treino √© interrompido automaticamente com a instru√ß√£o `self.model.stop_training = True`.

Esta abordagem √© particularmente √∫til em:
- Situa√ß√µes em que o treino √© feito localmente e se pretende evitar uso excessivo do processador/GPU.
- Processos experimentais em que se deseja limitar o tempo de execu√ß√£o.
- Ambientes partilhados com restri√ß√µes de tempo ou energia.

#### Par√¢metros Utilizados

- `max_time_mins=20`: define um tempo m√°ximo de treino de 20 minutos.
- O tempo √© convertido para segundos (`max_time_sec`) para facilitar a compara√ß√£o com o tempo decorrido.
- Ao atingir esse tempo, o treino termina automaticamente com uma mensagem de aviso no terminal.

In [32]:
class ResourceMonitorCallback(tf.keras.callbacks.Callback):
    def __init__(self, check_interval=1):
        super().__init__()
        self.check_interval = check_interval
        self.epoch_count = 0
        self.is_mac = platform.system() == 'Darwin'
        
    def on_epoch_end(self, epoch, logs=None):
        self.epoch_count += 1
        if self.epoch_count % self.check_interval == 0:
            # Get basic info
            cpu_percent = psutil.cpu_percent(interval=0.5)
            memory = psutil.virtual_memory()
            mem_used = f"{memory.percent}% ({memory.used / 1024**3:.1f}GB)"
            
            # Temperature check - simplified
            temp = "N/A"
            if self.is_mac:
                try:
                    # Try thermal level from pmset (no sudo needed)
                    result = subprocess.run(['pmset', '-g', 'therm'], capture_output=True, text=True)
                    if "CPU_Thermal_level" in result.stdout:
                        temp = result.stdout.strip()
                except: pass
            
            # Simplified output
            print(f"\n[Epoch {epoch}] CPU: {cpu_percent}% | Memory: {mem_used}")
            print(f"Thermal: {temp}")
            print(f"GPU: {'Active' if self.is_mac else 'Unknown'}")

# Create monitor that checks every epoch
resource_monitor = ResourceMonitorCallback(check_interval=1)


## Convers√£o dos R√≥tulos para One-Hot Encoding com `tf.data`

Para utilizar a fun√ß√£o de perda `categorical_crossentropy`, √© necess√°rio que os r√≥tulos estejam no formato **one-hot encoded**, ou seja, vetores bin√°rios com um `1` na posi√ß√£o da classe correta e `0` nas restantes. Este bloco de c√≥digo demonstra como realizar essa transforma√ß√£o diretamente no pipeline `tf.data`.

### Obten√ß√£o do N√∫mero de Classes

```python
NUM_CLASSES = len(train_dataset.class_names)
```

√â obtido dinamicamente o n√∫mero total de classes com base nas subpastas do dataset, assumindo que `train_dataset` foi carregado com `image_dataset_from_directory(...)`.

### Defini√ß√£o da Fun√ß√£o de Convers√£o

```python
def one_hot_encode(image, label):
    return image, tf.one_hot(label, depth=NUM_CLASSES)
```

A fun√ß√£o `one_hot_encode` recebe a imagem e o r√≥tulo inteiro, e converte o r√≥tulo para um vetor one-hot com dimens√£o `NUM_CLASSES`.

### Aplica√ß√£o ao Dataset

```python
train_dataset_oh = train_dataset_pref.map(one_hot_encode)
validation_dataset_oh = validation_dataset_pref.map(one_hot_encode)
```

A fun√ß√£o de mapeamento √© aplicada diretamente ao dataset com `.map(...)`, garantindo que todas as batches de treino e valida√ß√£o passem a conter r√≥tulos compat√≠veis com a fun√ß√£o de perda `categorical_crossentropy`.

Este m√©todo √© eficiente e aproveita o paralelismo interno do TensorFlow, mantendo o dataset na forma de `tf.data.Dataset`, ideal para treino em GPU e integra√ß√£o com `model.fit(...)`.



In [34]:
# N√∫mero de classes (pode ser len(class_names))
NUM_CLASSES = len(train_dataset.class_names)

# Fun√ß√£o para converter os r√≥tulos para one-hot
def one_hot_encode(image, label):
    return image, tf.one_hot(label, depth=NUM_CLASSES)

# Aplicar ao dataset
train_dataset_oh = train_dataset_pref.map(one_hot_encode)
validation_dataset_oh = validation_dataset_pref.map(one_hot_encode)



## Estrat√©gias de Regulariza√ß√£o e Otimiza√ß√£o durante o Treino

Durante o processo de treino do modelo, foram aplicadas diversas estrat√©gias para melhorar a performance e evitar *overfitting*:

### *EarlyStopping*

Foi utilizado o *callback* `EarlyStopping` com os seguintes par√¢metros:

- **monitor**: `val_accuracy` ‚Äì o treino √© monitorizado com base na precis√£o da valida√ß√£o.
- **patience**: `5` ‚Äì se a m√©trica monitorizada n√£o melhorar durante 5 √©pocas consecutivas, o treino √© interrompido.
- **restore_best_weights**: `True` ‚Äì garante que os pesos do modelo com melhor desempenho na valida√ß√£o sejam restaurados ap√≥s o t√©rmino do treino.

Esta t√©cnica √© √∫til para evitar *overfitting* e desperd√≠cio de recursos computacionais em √©pocas desnecess√°rias.

### *ModelCheckpoint*

Foi utilizado o *callback* `ModelCheckpoint` para guardar automaticamente o modelo com melhor desempenho de valida√ß√£o:

- **filepath**: `"models/model_checkpoint.keras"` ‚Äì local onde o modelo √© guardado.
- **save_best_only**: `True` ‚Äì guarda apenas o modelo com melhor desempenho.
- **monitor**: `val_accuracy` ‚Äì a m√©trica utilizada para definir o melhor modelo.

Este m√©todo assegura que, mesmo que o treino continue ap√≥s o ponto √≥timo, o melhor modelo est√° sempre dispon√≠vel.

### *ReduceLROnPlateau*

Para ajustar dinamicamente a taxa de aprendizagem, foi aplicado o *callback* `ReduceLROnPlateau`:

- **monitor**: `val_loss` ‚Äì reduz a `learning rate` com base na perda de valida√ß√£o.
- **factor**: `0.2` ‚Äì a `learning rate` √© multiplicada por este fator.
- **patience**: `3` ‚Äì se n√£o houver melhoria na perda durante 3 √©pocas, a taxa de aprendizagem √© reduzida.
- **min_lr**: `1e-6` ‚Äì taxa de aprendizagem m√≠nima permitida.

Esta t√©cnica melhora a converg√™ncia do modelo, especialmente em fases em que a otimiza√ß√£o desacelera.

### C√°lculo dos Pesos das Classes

Para mitigar o desbalanceamento entre classes no *dataset*, foram calculados pesos inversamente proporcionais √† frequ√™ncia de cada classe. O objetivo √© for√ßar o modelo a prestar mais aten√ß√£o √†s classes menos representadas, melhorando a generaliza√ß√£o e o equil√≠brio na predi√ß√£o.

O dicion√°rio `class_weight` associa cada classe ao seu respetivo peso, baseado na f√≥rmula:

```
peso_da_classe_i = total_de_amostras / n√∫mero_de_amostras_na_classe_i
```

Este dicion√°rio pode ser passado diretamente ao m√©todo `model.fit()` durante o treino.


In [None]:
# train the model with early stopping and resource monitoring
history = model.fit(
    train_dataset_oh,
    validation_data=validation_dataset_oh,
    epochs=20,
    class_weight=class_weight,
    callbacks=[early_stopping, reduce_lr, checkpoint_cb, timeout_cb, resource_monitor]
)


# Save the entire model (architecture + weights + optimizer state)
model.save("models/garbage_classifier_model_early_stopping_v2.keras")  
model.save_weights("models/garbage_classifier_early_stopping_v2.weights.h5")
print("Model saved successfully!")

## Monitoriza√ß√£o de Recursos durante o Treino

Com o objetivo de acompanhar o impacto computacional durante o processo de treino, foi implementada uma *callback* personalizada chamada `ResourceMonitorCallback`. Esta classe estende a API de `tf.keras.callbacks.Callback` e permite monitorizar periodicamente o uso de CPU, mem√≥ria e temperatura do sistema, especialmente √∫til para ambientes de treino locais, como port√°teis ou *workstations*.

### Funcionamento

A callback √© ativada no final de cada √©poca (`on_epoch_end`) e realiza as seguintes tarefas:

- **Uso de CPU**: Recolhe a percentagem de utiliza√ß√£o da CPU utilizando a biblioteca `psutil`.
- **Uso de Mem√≥ria**: Calcula a percentagem e a quantidade de mem√≥ria RAM em uso (em GB).
- **Temperatura (macOS)**: Se o sistema for um Mac, tenta obter informa√ß√µes t√©rmicas simplificadas atrav√©s do comando `pmset` (sem necessidade de permiss√µes elevadas).
- **Estado da GPU**: Mostra se h√° atividade reconhecida na GPU, sendo uma estimativa simplificada para sistemas macOS.

### Par√¢metro `check_interval`

O construtor da classe permite configurar o par√¢metro `check_interval`, que define a frequ√™ncia (em n√∫mero de √©pocas) com que a monitoriza√ß√£o √© realizada. Neste projeto, foi definido para verificar **a cada √©poca** (`check_interval=1`), garantindo um controlo cont√≠nuo e detalhado ao longo do treino.

### Benef√≠cios

Esta abordagem permite:
- Detetar sobrecargas de CPU ou mem√≥ria que possam afetar a estabilidade do treino;
- Avaliar a efici√™ncia dos recursos utilizados;
- Observar o comportamento t√©rmico em dispositivos m√≥veis (√∫til em laptops).

In [None]:
# Plot training history with data from the callbacks
accuracy = history.history['accuracy']
val_accuracy = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(1, len(accuracy) + 1) # Adjusted to match the number of epochs

plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.plot(epochs, accuracy, 'bo-', label='Training accuracy')
plt.plot(epochs, val_accuracy, 'ro-', label='Validation accuracy')
plt.title('Training and validation accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(epochs, loss, 'bo-', label='Training loss')
plt.plot(epochs, val_loss, 'ro-', label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.tight_layout()
plt.show()


### Treino do Modelo com Callbacks e Salvamento

Nesta etapa, o modelo √© treinado utilizando diversas estrat√©gias de regulariza√ß√£o e monitoriza√ß√£o para garantir um desempenho robusto e prevenir *overfitting* ou consumo excessivo de recursos.

#### Treinamento com `model.fit()`

O m√©todo `model.fit()` √© invocado com os seguintes par√¢metros:

- `train_dataset_pref`: conjunto de dados de treino, com prefetching e otimiza√ß√µes aplicadas.
- `validation_dataset_pref`: conjunto de valida√ß√£o para monitorizar o desempenho do modelo.
- `epochs=20`: o treino ser√° realizado por um m√°ximo de 20 √©pocas.
- `class_weight=class_weight`: pesos s√£o aplicados √†s classes para corrigir desequil√≠brios no n√∫mero de exemplos por classe.
- `callbacks`: lista de fun√ß√µes auxiliares que atuam durante o treino, incluindo:
  - `early_stopping`: para interromper o treino quando a m√©trica de valida√ß√£o parar de melhorar;
  - `reduce_lr`: para diminuir a taxa de aprendizagem se o desempenho estagnar;
  - `checkpoint_cb`: para salvar o modelo sempre que atinge uma nova melhor performance;
  - `timeout_cb`: para limitar a dura√ß√£o do treino;
  - `resource_monitor`: para monitorar a mem√≥ria e uso de GPU durante o treino.

#### Salvamento do Modelo

Ap√≥s o treino:

- O modelo completo (arquitetura, pesos e estado do otimizador) √© salvo no formato `.keras`, facilitando o reuso ou exporta√ß√£o.
- Os pesos do modelo s√£o tamb√©m salvos separadamente em formato `.h5`, o que pode ser √∫til para carregar apenas os pesos em outra arquitetura id√™ntica.

Estas pr√°ticas asseguram que o melhor modelo obtido durante o treino √© guardado e reutiliz√°vel, tanto em produ√ß√£o como para avalia√ß√£o futura.


In [None]:
# One-hot encode test labels for evaluation
test_dataset_oh = test_dataset.map(one_hot_encode)

# Evaluate on test dataset
test_loss, test_acc = model.evaluate(test_dataset_oh)
print(f"Test accuracy: {test_acc:.4f}")
print(f"Test loss: {test_loss:.4f}")

# Get class names from your dataset
class_names = train_dataset.class_names
print("Classes:", class_names)

# Function to show predictions for a batch of images
plt.figure(figsize=(12, 12))
for images, labels in test_dataset.take(1):
    predictions = model.predict(images)
    pred_classes = np.argmax(predictions, axis=1)
    
    for i in range(24):
        plt.subplot(6, 4, i + 1)
        plt.imshow(images[i].numpy().astype("uint8"))
        
        correct = labels[i] == pred_classes[i]
        color = "green" if correct else "red"
        
        plt.title(f"True: {class_names[labels[i]]}\nPred: {class_names[pred_classes[i]]}", 
                 color=color)
        plt.axis("off")
plt.tight_layout()
plt.show()