# üé≠ Detec√ß√£o de M√°scara Facial com CNN para ESP32-CAM

## Projeto de PDI (Processamento Digital de Imagens)

Este notebook implementa um sistema de detec√ß√£o de m√°scara facial usando **Redes Neurais Convolucionais (CNN)**.

### O que voc√™ vai aprender:
1. Como carregar e visualizar um dataset de imagens
2. Como pr√©-processar imagens para Machine Learning
3. Como criar uma CNN leve e otimizada
4. Como treinar e avaliar o modelo
5. Como converter para TensorFlow Lite (para embarcar na ESP32)

---

## üì¶ 1. Instala√ß√£o das Bibliotecas

Primeiro, vamos instalar todas as bibliotecas necess√°rias. Execute esta c√©lula apenas uma vez.

In [None]:
# Instala as bibliotecas necess√°rias (execute apenas uma vez)
!pip install tensorflow numpy matplotlib scikit-learn opencv-python pillow seaborn

## üìö 2. Importa√ß√£o das Bibliotecas

Aqui importamos todas as bibliotecas que ser√£o usadas no projeto:

- **TensorFlow/Keras**: Framework para criar e treinar a CNN
- **NumPy**: Manipula√ß√£o de arrays num√©ricos
- **Matplotlib/Seaborn**: Visualiza√ß√£o de dados e gr√°ficos
- **OpenCV (cv2)**: Processamento de imagens
- **Scikit-learn**: Divis√£o de dados e m√©tricas

In [None]:
import os
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import cv2
from PIL import Image

# TensorFlow e Keras
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint

# Scikit-learn para divis√£o de dados e m√©tricas
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix

# Configura√ß√µes para visualiza√ß√£o
plt.style.use('ggplot')
%matplotlib inline

# Verificar se TensorFlow est√° usando GPU (se dispon√≠vel)
print(f"TensorFlow vers√£o: {tf.__version__}")
print(f"GPU dispon√≠vel: {tf.config.list_physical_devices('GPU')}")

## üóÇÔ∏è 3. Configura√ß√£o dos Caminhos

Aqui definimos os caminhos para o dataset e os par√¢metros importantes do projeto.

### Par√¢metros Escolhidos:
- **IMG_SIZE = 96x96**: Tamanho ideal para ESP32-CAM (balanceia qualidade vs performance)
- **Grayscale (1 canal)**: Reduz tamanho do modelo em 3x comparado a RGB
- **Batch size = 16**: Pequeno para caber na mem√≥ria limitada

In [None]:
# ============================================
# CONFIGURA√á√ïES DO PROJETO
# ============================================

# Caminho para o dataset
DATASET_PATH = 'dataset_mascaras/data'

# Par√¢metros das imagens
IMG_SIZE = 96          # Tamanho da imagem (96x96 pixels)
IMG_CHANNELS = 1       # 1 = Grayscale, 3 = RGB

# Par√¢metros de treinamento
BATCH_SIZE = 16        # Quantidade de imagens por lote
EPOCHS = 30            # N√∫mero de √©pocas de treinamento
VALIDATION_SPLIT = 0.2 # 20% dos dados para valida√ß√£o
TEST_SPLIT = 0.1       # 10% dos dados para teste

# Classes do problema
CLASSES = ['sem_mascara', 'com_mascara']
NUM_CLASSES = len(CLASSES)

# Seed para reprodutibilidade
RANDOM_SEED = 42
np.random.seed(RANDOM_SEED)
tf.random.set_seed(RANDOM_SEED)

print("‚úÖ Configura√ß√µes carregadas!")
print(f"   üìÅ Dataset: {DATASET_PATH}")
print(f"   üìê Tamanho das imagens: {IMG_SIZE}x{IMG_SIZE}")
print(f"   üé® Canais: {'Grayscale' if IMG_CHANNELS == 1 else 'RGB'}")
print(f"   üì¶ Batch size: {BATCH_SIZE}")
print(f"   üîÑ √âpocas: {EPOCHS}")

## üìä 4. Explora√ß√£o do Dataset

Antes de treinar o modelo, √© importante entender nosso dataset:
- Quantas imagens temos de cada classe?
- Como s√£o as imagens?
- O dataset est√° balanceado?

In [None]:
# Conta quantas imagens temos em cada pasta
with_mask_path = os.path.join(DATASET_PATH, 'with_mask')
without_mask_path = os.path.join(DATASET_PATH, 'without_mask')

# Lista os arquivos de cada classe
with_mask_files = [f for f in os.listdir(with_mask_path) if f.endswith(('.jpg', '.jpeg', '.png'))]
without_mask_files = [f for f in os.listdir(without_mask_path) if f.endswith(('.jpg', '.jpeg', '.png'))]

n_with_mask = len(with_mask_files)
n_without_mask = len(without_mask_files)
total_images = n_with_mask + n_without_mask

print("="*50)
print("üìä ESTAT√çSTICAS DO DATASET")
print("="*50)
print(f"\n‚úÖ Com m√°scara (with_mask):    {n_with_mask} imagens")
print(f"‚ùå Sem m√°scara (without_mask): {n_without_mask} imagens")
print(f"\nüì∏ Total de imagens: {total_images}")
print(f"\n‚öñÔ∏è  Propor√ß√£o: {n_with_mask/total_images*100:.1f}% com m√°scara / {n_without_mask/total_images*100:.1f}% sem m√°scara")

In [None]:
# Visualiza√ß√£o da distribui√ß√£o das classes
fig, axes = plt.subplots(1, 2, figsize=(12, 4))

# Gr√°fico de barras
classes_labels = ['Com M√°scara', 'Sem M√°scara']
counts = [n_with_mask, n_without_mask]
colors = ['#2ecc71', '#e74c3c']

axes[0].bar(classes_labels, counts, color=colors, edgecolor='black')
axes[0].set_title('Distribui√ß√£o das Classes', fontsize=14, fontweight='bold')
axes[0].set_ylabel('Quantidade de Imagens')
for i, (count, label) in enumerate(zip(counts, classes_labels)):
    axes[0].text(i, count + 5, str(count), ha='center', fontweight='bold')

# Gr√°fico de pizza
axes[1].pie(counts, labels=classes_labels, colors=colors, autopct='%1.1f%%',
            startangle=90, explode=(0.05, 0.05))
axes[1].set_title('Propor√ß√£o das Classes', fontsize=14, fontweight='bold')

plt.tight_layout()
plt.savefig('distribuicao_dataset.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nüíæ Gr√°fico salvo como 'distribuicao_dataset.png'")

## üñºÔ∏è 5. Visualiza√ß√£o de Amostras

Vamos ver algumas imagens do dataset para entender como s√£o os dados.

In [None]:
def mostrar_amostras(pasta, titulo, n_amostras=5):
    """
    Mostra amostras de imagens de uma pasta.
    
    Args:
        pasta: Caminho para a pasta com as imagens
        titulo: T√≠tulo para o gr√°fico
        n_amostras: N√∫mero de amostras a mostrar
    """
    arquivos = [f for f in os.listdir(pasta) if f.endswith(('.jpg', '.jpeg', '.png'))][:n_amostras]
    
    fig, axes = plt.subplots(1, n_amostras, figsize=(15, 3))
    fig.suptitle(titulo, fontsize=14, fontweight='bold')
    
    for idx, arquivo in enumerate(arquivos):
        img_path = os.path.join(pasta, arquivo)
        img = Image.open(img_path)
        
        axes[idx].imshow(img)
        axes[idx].axis('off')
        axes[idx].set_title(f'{img.size[0]}x{img.size[1]}', fontsize=10)
    
    plt.tight_layout()
    plt.show()

# Mostra amostras de cada classe
print("\nüé≠ AMOSTRAS COM M√ÅSCARA:\n")
mostrar_amostras(with_mask_path, '‚úÖ Imagens COM M√°scara')

print("\nüò∑ AMOSTRAS SEM M√ÅSCARA:\n")
mostrar_amostras(without_mask_path, '‚ùå Imagens SEM M√°scara')

## üîß 6. Pr√©-processamento das Imagens

Agora vamos preparar as imagens para o treinamento:

1. **Redimensionar** para 96x96 pixels (padr√£o para ESP32-CAM)
2. **Converter para grayscale** (economia de mem√≥ria)
3. **Normalizar** valores de 0-255 para 0-1
4. **Criar labels** (0 = sem m√°scara, 1 = com m√°scara)

### Por que 96x96?
- A ESP32-CAM tem apenas ~520KB de RAM
- Imagens menores = modelo menor = mais r√°pido
- 96x96 √© um bom equil√≠brio entre qualidade e performance

In [None]:
def carregar_e_preprocessar_imagem(caminho_imagem, tamanho=IMG_SIZE, grayscale=True):
    """
    Carrega uma imagem e aplica o pr√©-processamento.
    
    Args:
        caminho_imagem: Caminho para o arquivo da imagem
        tamanho: Tamanho final da imagem (tamanho x tamanho)
        grayscale: Se True, converte para escala de cinza
    
    Returns:
        Imagem pr√©-processada como array numpy
    """
    # L√™ a imagem
    if grayscale:
        img = cv2.imread(caminho_imagem, cv2.IMREAD_GRAYSCALE)
    else:
        img = cv2.imread(caminho_imagem)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    # Redimensiona para o tamanho desejado
    img = cv2.resize(img, (tamanho, tamanho))
    
    # Normaliza para valores entre 0 e 1
    img = img.astype('float32') / 255.0
    
    return img

print("‚úÖ Fun√ß√£o de pr√©-processamento definida!")

In [None]:
def carregar_dataset(dataset_path, img_size=IMG_SIZE, grayscale=True):
    """
    Carrega todo o dataset e aplica pr√©-processamento.
    
    Args:
        dataset_path: Caminho para a pasta do dataset
        img_size: Tamanho das imagens
        grayscale: Se True, converte para grayscale
    
    Returns:
        X: Array com as imagens
        y: Array com as labels (0 = sem m√°scara, 1 = com m√°scara)
    """
    imagens = []
    labels = []
    
    # Carrega imagens SEM m√°scara (label = 0)
    print("üìÇ Carregando imagens SEM m√°scara...")
    pasta_sem_mascara = os.path.join(dataset_path, 'without_mask')
    for arquivo in os.listdir(pasta_sem_mascara):
        if arquivo.endswith(('.jpg', '.jpeg', '.png')):
            caminho = os.path.join(pasta_sem_mascara, arquivo)
            try:
                img = carregar_e_preprocessar_imagem(caminho, img_size, grayscale)
                imagens.append(img)
                labels.append(0)  # 0 = sem m√°scara
            except Exception as e:
                print(f"   ‚ö†Ô∏è Erro ao carregar {arquivo}: {e}")
    
    # Carrega imagens COM m√°scara (label = 1)
    print("üìÇ Carregando imagens COM m√°scara...")
    pasta_com_mascara = os.path.join(dataset_path, 'with_mask')
    for arquivo in os.listdir(pasta_com_mascara):
        if arquivo.endswith(('.jpg', '.jpeg', '.png')):
            caminho = os.path.join(pasta_com_mascara, arquivo)
            try:
                img = carregar_e_preprocessar_imagem(caminho, img_size, grayscale)
                imagens.append(img)
                labels.append(1)  # 1 = com m√°scara
            except Exception as e:
                print(f"   ‚ö†Ô∏è Erro ao carregar {arquivo}: {e}")
    
    # Converte para arrays numpy
    X = np.array(imagens)
    y = np.array(labels)
    
    # Adiciona dimens√£o do canal se grayscale
    if grayscale and len(X.shape) == 3:
        X = X.reshape(X.shape[0], X.shape[1], X.shape[2], 1)
    
    print(f"\n‚úÖ Dataset carregado com sucesso!")
    print(f"   üìä Shape das imagens: {X.shape}")
    print(f"   üìä Shape das labels: {y.shape}")
    
    return X, y

# Carrega o dataset
X, y = carregar_dataset(DATASET_PATH, IMG_SIZE, grayscale=(IMG_CHANNELS == 1))

In [None]:
# Visualiza algumas imagens pr√©-processadas
fig, axes = plt.subplots(2, 5, figsize=(15, 6))
fig.suptitle('Imagens Pr√©-processadas (96x96 Grayscale)', fontsize=14, fontweight='bold')

# √çndices aleat√≥rios para visualiza√ß√£o
indices_sem_mascara = np.where(y == 0)[0][:5]
indices_com_mascara = np.where(y == 1)[0][:5]

# Mostra imagens sem m√°scara (primeira linha)
for i, idx in enumerate(indices_sem_mascara):
    axes[0, i].imshow(X[idx].squeeze(), cmap='gray')
    axes[0, i].axis('off')
    axes[0, i].set_title('Sem M√°scara', color='red', fontsize=10)

# Mostra imagens com m√°scara (segunda linha)
for i, idx in enumerate(indices_com_mascara):
    axes[1, i].imshow(X[idx].squeeze(), cmap='gray')
    axes[1, i].axis('off')
    axes[1, i].set_title('Com M√°scara', color='green', fontsize=10)

plt.tight_layout()
plt.savefig('imagens_preprocessadas.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nüíæ Gr√°fico salvo como 'imagens_preprocessadas.png'")

## ‚úÇÔ∏è 7. Divis√£o dos Dados

Dividimos o dataset em tr√™s partes:

- **Treino (70%)**: Usado para treinar a rede neural
- **Valida√ß√£o (20%)**: Usado para ajustar hiperpar√¢metros e evitar overfitting
- **Teste (10%)**: Usado apenas no final para avaliar o modelo

‚ö†Ô∏è **Importante**: O conjunto de teste NUNCA √© visto durante o treinamento!

In [None]:
# Primeiro, separa conjunto de teste
X_temp, X_test, y_temp, y_test = train_test_split(
    X, y, 
    test_size=TEST_SPLIT, 
    random_state=RANDOM_SEED,
    stratify=y  # Mant√©m a propor√ß√£o das classes
)

# Depois, separa treino e valida√ß√£o
X_train, X_val, y_train, y_val = train_test_split(
    X_temp, y_temp,
    test_size=VALIDATION_SPLIT / (1 - TEST_SPLIT),  # Ajusta a propor√ß√£o
    random_state=RANDOM_SEED,
    stratify=y_temp
)

print("="*50)
print("üìä DIVIS√ÉO DO DATASET")
print("="*50)
print(f"\nüèãÔ∏è Treino:     {len(X_train)} imagens ({len(X_train)/len(X)*100:.1f}%)")
print(f"   - Sem m√°scara: {np.sum(y_train == 0)}")
print(f"   - Com m√°scara: {np.sum(y_train == 1)}")

print(f"\nüìã Valida√ß√£o:  {len(X_val)} imagens ({len(X_val)/len(X)*100:.1f}%)")
print(f"   - Sem m√°scara: {np.sum(y_val == 0)}")
print(f"   - Com m√°scara: {np.sum(y_val == 1)}")

print(f"\nüß™ Teste:      {len(X_test)} imagens ({len(X_test)/len(X)*100:.1f}%)")
print(f"   - Sem m√°scara: {np.sum(y_test == 0)}")
print(f"   - Com m√°scara: {np.sum(y_test == 1)}")

## üß† 8. Cria√ß√£o da CNN (Rede Neural Convolucional)

Agora vamos criar a arquitetura da CNN. √â uma rede **leve e otimizada** para rodar na ESP32-CAM.

### Arquitetura da Rede:

```
Entrada: 96x96x1 (imagem grayscale)
    ‚Üì
Conv2D (8 filtros, 3x3) ‚Üí BatchNorm ‚Üí ReLU ‚Üí MaxPool
    ‚Üì
Conv2D (16 filtros, 3x3) ‚Üí BatchNorm ‚Üí ReLU ‚Üí MaxPool
    ‚Üì
Conv2D (32 filtros, 3x3) ‚Üí BatchNorm ‚Üí ReLU ‚Üí MaxPool
    ‚Üì
Flatten ‚Üí Dense (32) ‚Üí Dropout (0.5)
    ‚Üì
Dense (1) ‚Üí Sigmoid
    ‚Üì
Sa√≠da: 0 (sem m√°scara) ou 1 (com m√°scara)
```

### Por que esta arquitetura?
- **Poucos filtros**: Reduz o tamanho do modelo
- **BatchNormalization**: Acelera o treinamento e estabiliza
- **Dropout**: Previne overfitting com dataset pequeno
- **Sa√≠da sigmoid**: Classifica√ß√£o bin√°ria

In [None]:
def criar_modelo_cnn(input_shape=(IMG_SIZE, IMG_SIZE, IMG_CHANNELS)):
    """
    Cria uma CNN leve otimizada para ESP32-CAM.
    
    Args:
        input_shape: Formato da entrada (altura, largura, canais)
    
    Returns:
        Modelo Keras compilado
    """
    model = models.Sequential([
        # Camada de entrada
        layers.Input(shape=input_shape),
        
        # Bloco Convolucional 1
        layers.Conv2D(8, (3, 3), padding='same'),
        layers.BatchNormalization(),
        layers.Activation('relu'),
        layers.MaxPooling2D((2, 2)),
        
        # Bloco Convolucional 2
        layers.Conv2D(16, (3, 3), padding='same'),
        layers.BatchNormalization(),
        layers.Activation('relu'),
        layers.MaxPooling2D((2, 2)),
        
        # Bloco Convolucional 3
        layers.Conv2D(32, (3, 3), padding='same'),
        layers.BatchNormalization(),
        layers.Activation('relu'),
        layers.MaxPooling2D((2, 2)),
        
        # Camadas Densas (Fully Connected)
        layers.Flatten(),
        layers.Dense(32, activation='relu'),
        layers.Dropout(0.5),  # Previne overfitting
        
        # Camada de sa√≠da (classifica√ß√£o bin√°ria)
        layers.Dense(1, activation='sigmoid')
    ])
    
    # Compila o modelo
    model.compile(
        optimizer=keras.optimizers.Adam(learning_rate=0.001),
        loss='binary_crossentropy',
        metrics=['accuracy']
    )
    
    return model

# Cria o modelo
modelo = criar_modelo_cnn()

# Mostra o resumo da arquitetura
print("\n" + "="*60)
print("üß† ARQUITETURA DA CNN")
print("="*60)
modelo.summary()

In [None]:
# Calcula o tamanho do modelo
num_params = modelo.count_params()
tamanho_estimado_mb = (num_params * 4) / (1024 * 1024)  # 4 bytes por par√¢metro (float32)

print("\n" + "="*50)
print("üìè TAMANHO DO MODELO")
print("="*50)
print(f"\nüî¢ Total de par√¢metros: {num_params:,}")
print(f"üì¶ Tamanho estimado: {tamanho_estimado_mb:.2f} MB (float32)")
print(f"üì¶ Tamanho quantizado: ~{tamanho_estimado_mb/4:.2f} MB (int8)")

if tamanho_estimado_mb < 1:
    print("\n‚úÖ Modelo adequado para ESP32-CAM!")
else:
    print("\n‚ö†Ô∏è Modelo pode ser grande demais. Considere reduzir os filtros.")

## üîÑ 9. Data Augmentation (Aumento de Dados)

Como nosso dataset √© pequeno, usamos **data augmentation** para criar varia√ß√µes das imagens:

- **Rota√ß√£o**: Pequenas rota√ß√µes (-10¬∞ a +10¬∞)
- **Zoom**: Pequeno zoom (90% a 110%)
- **Flip horizontal**: Espelha a imagem
- **Shift**: Pequenos deslocamentos

Isso ajuda o modelo a generalizar melhor e **previne overfitting**.

In [None]:
# Cria geradores de data augmentation
train_datagen = ImageDataGenerator(
    rotation_range=10,           # Rota√ß√£o de -10¬∞ a +10¬∞
    width_shift_range=0.1,       # Deslocamento horizontal
    height_shift_range=0.1,      # Deslocamento vertical
    zoom_range=0.1,              # Zoom de 90% a 110%
    horizontal_flip=True,        # Espelhamento horizontal
    fill_mode='nearest'          # Preenche pixels vazios
)

# Para valida√ß√£o, n√£o aplicamos augmentation
val_datagen = ImageDataGenerator()

print("‚úÖ Data augmentation configurado!")
print("\nüì∑ Transforma√ß√µes aplicadas no treino:")
print("   ‚Ä¢ Rota√ß√£o: ¬±10¬∞")
print("   ‚Ä¢ Shift: ¬±10%")
print("   ‚Ä¢ Zoom: ¬±10%")
print("   ‚Ä¢ Flip horizontal: Sim")

In [None]:
# Visualiza exemplos de data augmentation
fig, axes = plt.subplots(2, 5, figsize=(15, 6))
fig.suptitle('Exemplos de Data Augmentation', fontsize=14, fontweight='bold')

# Pega uma imagem de exemplo
img_exemplo = X_train[0:1]

# Gera 10 varia√ß√µes
augmented_images = [train_datagen.random_transform(img_exemplo[0]) for _ in range(10)]

for i, img in enumerate(augmented_images):
    row = i // 5
    col = i % 5
    axes[row, col].imshow(img.squeeze(), cmap='gray')
    axes[row, col].axis('off')
    axes[row, col].set_title(f'Varia√ß√£o {i+1}', fontsize=10)

plt.tight_layout()
plt.savefig('data_augmentation.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nüíæ Gr√°fico salvo como 'data_augmentation.png'")

## üèãÔ∏è 10. Treinamento do Modelo

Agora vamos treinar a CNN! Usamos duas t√©cnicas importantes:

1. **Early Stopping**: Para o treinamento se a valida√ß√£o n√£o melhorar
2. **Model Checkpoint**: Salva o melhor modelo durante o treinamento

In [None]:
# Callbacks para monitorar o treinamento
callbacks = [
    # Para o treino se a valida√ß√£o n√£o melhorar por 5 √©pocas
    EarlyStopping(
        monitor='val_loss',
        patience=5,
        restore_best_weights=True,
        verbose=1
    ),
    # Salva o melhor modelo
    ModelCheckpoint(
        'melhor_modelo.keras',
        monitor='val_accuracy',
        save_best_only=True,
        verbose=1
    )
]

print("‚úÖ Callbacks configurados!")
print("   ‚Ä¢ EarlyStopping: patience=5")
print("   ‚Ä¢ ModelCheckpoint: salva em 'melhor_modelo.keras'")

In [None]:
# Treina o modelo
print("\n" + "="*60)
print("üèãÔ∏è INICIANDO TREINAMENTO")
print("="*60)
print(f"\n‚è±Ô∏è √âpocas m√°ximas: {EPOCHS}")
print(f"üì¶ Batch size: {BATCH_SIZE}")
print(f"üîÑ Data Augmentation: Ativado\n")

# Cria os geradores
train_generator = train_datagen.flow(X_train, y_train, batch_size=BATCH_SIZE)
val_generator = val_datagen.flow(X_val, y_val, batch_size=BATCH_SIZE)

# Treina!
historico = modelo.fit(
    train_generator,
    epochs=EPOCHS,
    validation_data=val_generator,
    callbacks=callbacks,
    verbose=1
)

print("\n" + "="*60)
print("‚úÖ TREINAMENTO CONCLU√çDO!")
print("="*60)

## üìà 11. Visualiza√ß√£o do Treinamento

Vamos ver como o modelo aprendeu ao longo das √©pocas.

In [None]:
def plotar_historico(historico):
    """
    Plota os gr√°ficos de loss e accuracy durante o treinamento.
    """
    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
    
    # Gr√°fico de Loss
    axes[0].plot(historico.history['loss'], label='Treino', linewidth=2)
    axes[0].plot(historico.history['val_loss'], label='Valida√ß√£o', linewidth=2)
    axes[0].set_title('Loss ao Longo do Treinamento', fontsize=14, fontweight='bold')
    axes[0].set_xlabel('√âpoca')
    axes[0].set_ylabel('Loss')
    axes[0].legend()
    axes[0].grid(True, alpha=0.3)
    
    # Gr√°fico de Accuracy
    axes[1].plot(historico.history['accuracy'], label='Treino', linewidth=2)
    axes[1].plot(historico.history['val_accuracy'], label='Valida√ß√£o', linewidth=2)
    axes[1].set_title('Acur√°cia ao Longo do Treinamento', fontsize=14, fontweight='bold')
    axes[1].set_xlabel('√âpoca')
    axes[1].set_ylabel('Acur√°cia')
    axes[1].legend()
    axes[1].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.savefig('historico_treinamento.png', dpi=150, bbox_inches='tight')
    plt.show()
    
    print("\nüíæ Gr√°fico salvo como 'historico_treinamento.png'")

# Plota o hist√≥rico
plotar_historico(historico)

## üß™ 12. Avalia√ß√£o do Modelo

Agora vamos avaliar o modelo no conjunto de **teste** (dados que ele nunca viu!).

In [None]:
# Avalia no conjunto de teste
print("\n" + "="*60)
print("üß™ AVALIA√á√ÉO NO CONJUNTO DE TESTE")
print("="*60)

test_loss, test_accuracy = modelo.evaluate(X_test, y_test, verbose=0)

print(f"\nüìä Resultados no Conjunto de Teste:")
print(f"   ‚Ä¢ Loss: {test_loss:.4f}")
print(f"   ‚Ä¢ Acur√°cia: {test_accuracy*100:.2f}%")

if test_accuracy >= 0.90:
    print("\nüéâ Excelente! Acur√°cia acima de 90%!")
elif test_accuracy >= 0.80:
    print("\n‚úÖ Bom! Acur√°cia acima de 80%!")
else:
    print("\n‚ö†Ô∏è Acur√°cia abaixo de 80%. Considere mais dados ou ajustes.")

In [None]:
# Faz predi√ß√µes no conjunto de teste
y_pred_prob = modelo.predict(X_test)
y_pred = (y_pred_prob > 0.5).astype(int).flatten()

# Matriz de Confus√£o
cm = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
            xticklabels=['Sem M√°scara', 'Com M√°scara'],
            yticklabels=['Sem M√°scara', 'Com M√°scara'])
plt.title('Matriz de Confus√£o', fontsize=14, fontweight='bold')
plt.xlabel('Predi√ß√£o')
plt.ylabel('Real')
plt.tight_layout()
plt.savefig('matriz_confusao.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nüíæ Gr√°fico salvo como 'matriz_confusao.png'")

In [None]:
# Relat√≥rio de Classifica√ß√£o
print("\n" + "="*60)
print("üìã RELAT√ìRIO DE CLASSIFICA√á√ÉO")
print("="*60)
print(classification_report(y_test, y_pred, target_names=['Sem M√°scara', 'Com M√°scara']))

## üîÆ 13. Testando com Novas Imagens

Vamos criar uma fun√ß√£o para testar o modelo com imagens individuais.

In [None]:
def prever_mascara(caminho_imagem, modelo, mostrar=True):
    """
    Faz a predi√ß√£o para uma √∫nica imagem.
    
    Args:
        caminho_imagem: Caminho para a imagem
        modelo: Modelo treinado
        mostrar: Se True, mostra a imagem com a predi√ß√£o
    
    Returns:
        Predi√ß√£o (0 = sem m√°scara, 1 = com m√°scara) e probabilidade
    """
    # Carrega e pr√©-processa a imagem
    img = carregar_e_preprocessar_imagem(caminho_imagem, IMG_SIZE, grayscale=True)
    img_batch = img.reshape(1, IMG_SIZE, IMG_SIZE, 1)
    
    # Faz a predi√ß√£o
    probabilidade = modelo.predict(img_batch, verbose=0)[0][0]
    predicao = 1 if probabilidade > 0.5 else 0
    
    # Mostra a imagem se solicitado
    if mostrar:
        plt.figure(figsize=(6, 6))
        
        # Carrega a imagem original para visualiza√ß√£o
        img_original = Image.open(caminho_imagem)
        plt.imshow(img_original)
        
        if predicao == 1:
            titulo = f"‚úÖ COM M√ÅSCARA ({probabilidade*100:.1f}%)"
            cor = 'green'
        else:
            titulo = f"‚ùå SEM M√ÅSCARA ({(1-probabilidade)*100:.1f}%)"
            cor = 'red'
        
        plt.title(titulo, fontsize=14, fontweight='bold', color=cor)
        plt.axis('off')
        plt.tight_layout()
        plt.show()
    
    return predicao, probabilidade

print("‚úÖ Fun√ß√£o de predi√ß√£o criada!")

In [None]:
# Testa com algumas imagens do dataset
print("\n" + "="*60)
print("üîÆ TESTANDO PREDI√á√ïES")
print("="*60)

# Testa imagem com m√°scara
img_com_mascara = os.path.join(with_mask_path, with_mask_files[0])
print(f"\nüì∏ Testando: {with_mask_files[0]}")
prever_mascara(img_com_mascara, modelo)

# Testa imagem sem m√°scara
img_sem_mascara = os.path.join(without_mask_path, without_mask_files[0])
print(f"\nüì∏ Testando: {without_mask_files[0]}")
prever_mascara(img_sem_mascara, modelo)

## üíæ 14. Salvando o Modelo

Agora vamos salvar o modelo em diferentes formatos:

1. **Keras (.keras)**: Formato nativo, f√°cil de carregar no Python
2. **TensorFlow Lite (.tflite)**: Formato otimizado para dispositivos embarcados como ESP32

In [None]:
# Salva o modelo no formato Keras
modelo.save('modelo_mascara.keras')
print("‚úÖ Modelo salvo como 'modelo_mascara.keras'")

# Tamb√©m salva os pesos separadamente
modelo.save_weights('pesos_mascara.weights.h5')
print("‚úÖ Pesos salvos como 'pesos_mascara.weights.h5'")

## üì± 15. Convers√£o para TensorFlow Lite

Para rodar na ESP32-CAM, precisamos converter o modelo para **TensorFlow Lite** e **quantizar** (converter de float32 para int8).

### Benef√≠cios da Quantiza√ß√£o:
- Reduz o tamanho do modelo em **~4x**
- Acelera a infer√™ncia na ESP32
- Usa menos mem√≥ria RAM

In [None]:
# Converte para TensorFlow Lite (sem quantiza√ß√£o)
converter = tf.lite.TFLiteConverter.from_keras_model(modelo)
tflite_model = converter.convert()

# Salva o modelo TFLite
with open('modelo_mascara.tflite', 'wb') as f:
    f.write(tflite_model)

tamanho_tflite = len(tflite_model) / 1024
print(f"\n‚úÖ Modelo TFLite salvo!")
print(f"   üì¶ Tamanho: {tamanho_tflite:.2f} KB")

In [None]:
# Convers√£o com quantiza√ß√£o INT8 (otimizado para ESP32)
def representative_dataset():
    """Gera dados representativos para calibra√ß√£o da quantiza√ß√£o."""
    for i in range(min(100, len(X_train))):
        yield [X_train[i:i+1].astype(np.float32)]

# Configura o conversor para quantiza√ß√£o completa
converter_quant = tf.lite.TFLiteConverter.from_keras_model(modelo)
converter_quant.optimizations = [tf.lite.Optimize.DEFAULT]
converter_quant.representative_dataset = representative_dataset
converter_quant.target_spec.supported_ops = [tf.lite.OpsSet.TFLITE_BUILTINS_INT8]
converter_quant.inference_input_type = tf.uint8
converter_quant.inference_output_type = tf.uint8

try:
    tflite_model_quant = converter_quant.convert()
    
    # Salva o modelo quantizado
    with open('modelo_mascara_quant.tflite', 'wb') as f:
        f.write(tflite_model_quant)
    
    tamanho_quant = len(tflite_model_quant) / 1024
    print(f"\n‚úÖ Modelo TFLite Quantizado (INT8) salvo!")
    print(f"   üì¶ Tamanho: {tamanho_quant:.2f} KB")
    print(f"   üìâ Redu√ß√£o: {(1 - tamanho_quant/tamanho_tflite)*100:.1f}%")
except Exception as e:
    print(f"\n‚ö†Ô∏è Quantiza√ß√£o INT8 completa falhou: {e}")
    print("   Usando quantiza√ß√£o h√≠brida...")
    
    converter_hybrid = tf.lite.TFLiteConverter.from_keras_model(modelo)
    converter_hybrid.optimizations = [tf.lite.Optimize.DEFAULT]
    tflite_model_hybrid = converter_hybrid.convert()
    
    with open('modelo_mascara_quant.tflite', 'wb') as f:
        f.write(tflite_model_hybrid)
    
    tamanho_hybrid = len(tflite_model_hybrid) / 1024
    print(f"\n‚úÖ Modelo TFLite com quantiza√ß√£o h√≠brida salvo!")
    print(f"   üì¶ Tamanho: {tamanho_hybrid:.2f} KB")

## üìä 16. Resumo Final

Vamos ver um resumo de tudo que foi feito!

In [None]:
# Resumo final
print("\n" + "="*70)
print("üìä RESUMO DO PROJETO")
print("="*70)

print(f"""
üóÇÔ∏è DATASET:
   ‚Ä¢ Total de imagens: {total_images}
   ‚Ä¢ Com m√°scara: {n_with_mask}
   ‚Ä¢ Sem m√°scara: {n_without_mask}

üñºÔ∏è PR√â-PROCESSAMENTO:
   ‚Ä¢ Tamanho: {IMG_SIZE}x{IMG_SIZE} pixels
   ‚Ä¢ Canais: {'Grayscale' if IMG_CHANNELS == 1 else 'RGB'}
   ‚Ä¢ Normaliza√ß√£o: 0-1

üß† MODELO CNN:
   ‚Ä¢ Camadas convolucionais: 3
   ‚Ä¢ Filtros: 8 ‚Üí 16 ‚Üí 32
   ‚Ä¢ Total de par√¢metros: {modelo.count_params():,}

üìà RESULTADOS:
   ‚Ä¢ Acur√°cia no teste: {test_accuracy*100:.2f}%
   ‚Ä¢ Loss no teste: {test_loss:.4f}

üíæ ARQUIVOS GERADOS:
   ‚Ä¢ modelo_mascara.keras (Keras)
   ‚Ä¢ modelo_mascara.tflite (TensorFlow Lite)
   ‚Ä¢ modelo_mascara_quant.tflite (Quantizado para ESP32)
""")

print("="*70)
print("üéâ PROJETO CONCLU√çDO COM SUCESSO!")
print("="*70)

---

## üöÄ Pr√≥ximos Passos (para a ESP32-CAM)

Quando voc√™ tiver a ESP32-CAM, os pr√≥ximos passos ser√£o:

1. **Converter o modelo para C array** (header file .h)
2. **Configurar o TensorFlow Lite Micro** na ESP32
3. **Capturar imagens da c√¢mera** e pr√©-processar
4. **Rodar infer√™ncia** e mostrar resultado

### Comando para converter TFLite para C array:
```bash
xxd -i modelo_mascara_quant.tflite > modelo_mascara.h
```

---

**Autor:** Projeto de PDI - Detec√ß√£o de M√°scara Facial  
**Data:** Dezembro 2024