# üî¨ Classifica√ß√£o de C√¢ncer de Pele com CNN

Este notebook implementa uma **Rede Neural Convolucional (CNN)** para classificar les√µes de pele usando o dataset **HAM10000**.

## üìä Objetivo

Classificar imagens dermatosc√≥picas em **7 categorias** diferentes de les√µes de pele:
1. **Melanoma (mel)** - Melanoma maligno
2. **Nevos melanoc√≠ticos (nv)** - Nevos melanoc√≠ticos benignos
3. **Carcinoma basocelular (bcc)** - Carcinoma basocelular
4. **Queratose act√≠nica (akiec)** - Queratose act√≠nica / Carcinoma in situ
5. **Queratose benigna (bkl)** - Queratose benigna
6. **Dermatofibroma (df)** - Dermatofibroma
7. **Les√µes vasculares (vasc)** - Les√µes vasculares

## üéØ Abordagem

Vamos usar **apenas as imagens** (an√°lise puramente visual) para a classifica√ß√£o, sem utilizar metadados como idade, sexo ou localiza√ß√£o. Isso permitir√° compara√ß√£o justa com modelos Vision Transformer e VLMs posteriormente.

---
# 1Ô∏è‚É£ Setup e Importa√ß√µes

In [None]:
# Configurar para n√£o exibir warnings desnecess√°rios
import warnings
warnings.filterwarnings('ignore')

# Bibliotecas essenciais
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os
from glob import glob
from PIL import Image

# Scikit-learn para m√©tricas e divis√£o de dados
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.utils.class_weight import compute_class_weight

# TensorFlow e Keras
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import ReduceLROnPlateau, ModelCheckpoint, EarlyStopping

# Configurar seeds para reprodutibilidade
SEED = 42
np.random.seed(SEED)
tf.random.set_seed(SEED)

# Configura√ß√µes de visualiza√ß√£o
plt.style.use('default')
sns.set_palette("husl")
%matplotlib inline

print(f"TensorFlow vers√£o: {tf.__version__}")
print(f"GPU dispon√≠vel: {len(tf.config.list_physical_devices('GPU')) > 0}")

### üìå Configura√ß√µes Globais

In [None]:
# Dimens√µes das imagens (reduzidas para treino mais r√°pido)
IMG_WIDTH = 100
IMG_HEIGHT = 75
IMG_CHANNELS = 3

# Hiperpar√¢metros
BATCH_SIZE = 10
EPOCHS = 50
LEARNING_RATE = 0.001

# N√∫mero de classes
NUM_CLASSES = 7

# Caminhos
BASE_DIR = os.path.join('..', 'data', 'raw')
MODELS_DIR = os.path.join('..', 'models')
os.makedirs(MODELS_DIR, exist_ok=True)

print(f"Diret√≥rio base: {BASE_DIR}")
print(f"Diret√≥rio de modelos: {MODELS_DIR}")
print(f"\nConfigura√ß√µes:")
print(f"  Imagens: {IMG_WIDTH}x{IMG_HEIGHT}x{IMG_CHANNELS}")
print(f"  Batch size: {BATCH_SIZE}")
print(f"  Epochs: {EPOCHS}")
print(f"  Learning rate: {LEARNING_RATE}")

---
# 2Ô∏è‚É£ Carregamento e Prepara√ß√£o dos Dados

Vamos carregar os metadados e criar um mapeamento para as imagens.

In [None]:
# Carregar metadados
metadata_path = os.path.join(BASE_DIR, 'HAM10000_metadata.csv')
df = pd.read_csv(metadata_path)

print(f"üìä Total de imagens: {len(df)}")
print(f"\nüîç Primeiras linhas:")
df.head()

In [None]:
# Criar mapeamento image_id -> caminho completo da imagem
# As imagens est√£o em duas pastas diferentes
image_paths = {}
for folder in ['HAM10000_images_part_1', 'HAM10000_images_part_2']:
    folder_path = os.path.join(BASE_DIR, folder)
    if os.path.exists(folder_path):
        for img_file in glob(os.path.join(folder_path, '*.jpg')):
            image_id = os.path.splitext(os.path.basename(img_file))[0]
            image_paths[image_id] = img_file

print(f"‚úÖ Total de imagens encontradas: {len(image_paths)}")

# Adicionar caminho das imagens ao dataframe
df['image_path'] = df['image_id'].map(image_paths)

# Verificar se todas as imagens foram encontradas
missing = df['image_path'].isna().sum()
if missing > 0:
    print(f"‚ö†Ô∏è ATEN√á√ÉO: {missing} imagens n√£o foram encontradas!")
    df = df.dropna(subset=['image_path'])
else:
    print("‚úÖ Todas as imagens foram encontradas!")

In [None]:
# Dicion√°rio com nomes amig√°veis das classes
class_names = {
    'nv': 'Nevos melanoc√≠ticos',
    'mel': 'Melanoma',
    'bkl': 'Queratose benigna',
    'bcc': 'Carcinoma basocelular',
    'akiec': 'Queratose act√≠nica',
    'vasc': 'Les√µes vasculares',
    'df': 'Dermatofibroma'
}

# Adicionar nome amig√°vel e √≠ndice num√©rico
df['class_name'] = df['dx'].map(class_names)
df['class_idx'] = pd.Categorical(df['dx']).codes

print("\nüìã Mapeamento de classes:")
for idx, (code, name) in enumerate(class_names.items()):
    count = (df['dx'] == code).sum()
    print(f"  {idx}: {code:6s} -> {name:30s} ({count:4d} imagens)")

### üßπ Limpeza de Dados

In [None]:
# Verificar valores faltantes
print("‚ùì Valores faltantes por coluna:")
print(df.isnull().sum())

# Preencher idade faltante com a m√©dia
df['age'].fillna(df['age'].mean(), inplace=True)

print(f"\n‚úÖ Dataset limpo com {len(df)} registros")

---
# 3Ô∏è‚É£ An√°lise Explorat√≥ria de Dados (EDA)

Vamos entender a distribui√ß√£o dos dados antes de treinar o modelo.

### üìä Distribui√ß√£o das Classes

In [None]:
fig, ax = plt.subplots(1, 1, figsize=(12, 6))

# Contar por classe
class_counts = df['class_name'].value_counts()

# Plotar
class_counts.plot(kind='bar', ax=ax, color=sns.color_palette("husl", len(class_counts)))
ax.set_title('Distribui√ß√£o das Classes de Les√µes de Pele', fontsize=16, fontweight='bold')
ax.set_xlabel('Tipo de Les√£o', fontsize=12)
ax.set_ylabel('Quantidade de Imagens', fontsize=12)
ax.set_xticklabels(ax.get_xticklabels(), rotation=45, ha='right')

# Adicionar valores nas barras
for i, v in enumerate(class_counts.values):
    ax.text(i, v + 100, str(v), ha='center', fontweight='bold')

plt.tight_layout()
plt.show()

print("\n‚ö†Ô∏è OBSERVA√á√ÉO IMPORTANTE:")
print("O dataset √© altamente DESBALANCEADO!")
print(f"Classe majorit√°ria: {class_counts.index[0]} ({class_counts.values[0]} imagens)")
print(f"Classe minorit√°ria: {class_counts.index[-1]} ({class_counts.values[-1]} imagens)")
print(f"Raz√£o: {class_counts.values[0] / class_counts.values[-1]:.1f}x")

### üë• Outras Distribui√ß√µes

In [None]:
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

# Distribui√ß√£o de idade
axes[0].hist(df['age'], bins=30, color='skyblue', edgecolor='black')
axes[0].set_title('Distribui√ß√£o de Idade', fontweight='bold')
axes[0].set_xlabel('Idade (anos)')
axes[0].set_ylabel('Frequ√™ncia')

# Distribui√ß√£o por sexo
df['sex'].value_counts().plot(kind='bar', ax=axes[1], color=['lightcoral', 'lightblue', 'lightgray'])
axes[1].set_title('Distribui√ß√£o por Sexo', fontweight='bold')
axes[1].set_xlabel('Sexo')
axes[1].set_ylabel('Quantidade')
axes[1].set_xticklabels(axes[1].get_xticklabels(), rotation=0)

# Distribui√ß√£o por localiza√ß√£o (top 10)
top_locations = df['localization'].value_counts().head(10)
top_locations.plot(kind='barh', ax=axes[2], color='lightgreen')
axes[2].set_title('Top 10 Localiza√ß√µes', fontweight='bold')
axes[2].set_xlabel('Quantidade')
axes[2].set_ylabel('Localiza√ß√£o')

plt.tight_layout()
plt.show()

print("üìù Nota: Embora interessantes, N√ÉO vamos usar esses dados no modelo.")
print("   Vamos classificar APENAS com base nas imagens!")

### üñºÔ∏è Visualiza√ß√£o de Amostras de Cada Classe

In [None]:
# Plotar 5 exemplos de cada classe
n_samples = 5
fig, axes = plt.subplots(NUM_CLASSES, n_samples, figsize=(n_samples * 3, NUM_CLASSES * 3))

for idx, (class_code, class_label) in enumerate(class_names.items()):
    # Pegar amostras aleat√≥rias da classe
    class_df = df[df['dx'] == class_code]
    n_available = min(n_samples, len(class_df))
    class_samples = class_df.sample(n_available, random_state=SEED)
    
    for col, (_, row) in enumerate(class_samples.iterrows()):
        img = Image.open(row['image_path'])
        axes[idx, col].imshow(img)
        axes[idx, col].axis('off')
        
        # Adicionar t√≠tulo apenas na primeira coluna
        if col == 0:
            axes[idx, col].text(-10, img.size[1]//2, class_label, 
                              fontsize=10, fontweight='bold', 
                              rotation=90, va='center', ha='right')

plt.suptitle('Amostras de Cada Classe de Les√£o', fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

---
# 4Ô∏è‚É£ Carregamento e Processamento de Imagens

Agora vamos carregar todas as imagens, redimension√°-las e convert√™-las em arrays numpy.

In [None]:
print(f"‚è≥ Carregando e redimensionando {len(df)} imagens para {IMG_WIDTH}x{IMG_HEIGHT}...")
print("   Isso pode levar alguns minutos...")

# Fun√ß√£o para carregar e redimensionar imagem
def load_and_resize_image(path):
    try:
        img = Image.open(path)
        img = img.resize((IMG_WIDTH, IMG_HEIGHT))
        return np.array(img)
    except Exception as e:
        print(f"Erro ao carregar {path}: {e}")
        return None

# Carregar imagens
df['image_array'] = df['image_path'].apply(load_and_resize_image)

# Remover imagens que falharam
df = df.dropna(subset=['image_array'])

print(f"‚úÖ {len(df)} imagens carregadas com sucesso!")
print(f"   Shape de cada imagem: {df['image_array'].iloc[0].shape}")

In [None]:
# Verificar distribui√ß√£o de tamanhos
shapes = df['image_array'].apply(lambda x: x.shape).value_counts()
print("\nüìê Distribui√ß√£o de shapes:")
print(shapes)

---
# 5Ô∏è‚É£ Divis√£o dos Dados (Train/Validation/Test)

Vamos dividir em:
- **80%** para treinamento  
- **10%** para valida√ß√£o (do conjunto de treino)  
- **20%** para teste

In [None]:
# Preparar features (X) e labels (y)
X = np.array(df['image_array'].tolist())
y = df['class_idx'].values

print(f"üìä Shape dos dados:")
print(f"   X: {X.shape}")
print(f"   y: {y.shape}")

In [None]:
# Primeira divis√£o: Train (80%) e Test (20%)
X_train_full, X_test, y_train_full, y_test = train_test_split(
    X, y, 
    test_size=0.20, 
    random_state=SEED,
    stratify=y
)

# Segunda divis√£o: Train (90% de 80%) e Validation (10% de 80%)
X_train, X_val, y_train, y_val = train_test_split(
    X_train_full, y_train_full,
    test_size=0.10,
    random_state=SEED,
    stratify=y_train_full
)

print(f"\n‚úÖ Divis√£o dos dados:")
print(f"   Treino:     {X_train.shape[0]:5d} imagens ({X_train.shape[0]/len(X)*100:.1f}%)")
print(f"   Valida√ß√£o:  {X_val.shape[0]:5d} imagens ({X_val.shape[0]/len(X)*100:.1f}%)")
print(f"   Teste:      {X_test.shape[0]:5d} imagens ({X_test.shape[0]/len(X)*100:.1f}%)")
print(f"   TOTAL:      {len(X):5d} imagens")

---
# 6Ô∏è‚É£ Normaliza√ß√£o e Encoding

### üî¢ Normaliza√ß√£o das Imagens

Vamos normalizar os pixels para terem **m√©dia 0 e desvio padr√£o 1**. Isso ajuda a rede neural a convergir mais r√°pido.

In [None]:
# Calcular m√©dia e desvio padr√£o do conjunto de treino
X_train_mean = np.mean(X_train)
X_train_std = np.std(X_train)

print(f"üìä Estat√≠sticas do conjunto de treino (antes da normaliza√ß√£o):")
print(f"   M√©dia: {X_train_mean:.2f}")
print(f"   Desvio padr√£o: {X_train_std:.2f}")
print(f"   Min: {X_train.min()}")
print(f"   Max: {X_train.max()}")

# Normalizar todos os conjuntos usando estat√≠sticas do treino
X_train = (X_train - X_train_mean) / X_train_std
X_val = (X_val - X_train_mean) / X_train_std
X_test = (X_test - X_train_mean) / X_train_std

print(f"\nüìä Ap√≥s normaliza√ß√£o:")
print(f"   M√©dia: {X_train.mean():.6f}")
print(f"   Desvio padr√£o: {X_train.std():.6f}")
print(f"\n‚úÖ Normaliza√ß√£o conclu√≠da!")

### üè∑Ô∏è One-Hot Encoding dos Labels

Converter labels num√©ricos (0-6) em vetores one-hot para classifica√ß√£o multiclasse.

In [None]:
# One-hot encoding
y_train_encoded = to_categorical(y_train, num_classes=NUM_CLASSES)
y_val_encoded = to_categorical(y_val, num_classes=NUM_CLASSES)
y_test_encoded = to_categorical(y_test, num_classes=NUM_CLASSES)

print(f"üè∑Ô∏è Exemplo de encoding:")
print(f"   Label original: {y_train[0]}")
print(f"   One-hot encoded: {y_train_encoded[0]}")
print(f"\n‚úÖ Encoding conclu√≠do!")

### ‚öñÔ∏è Calcular Class Weights

Como o dataset √© muito desbalanceado, vamos calcular **pesos para cada classe**. Classes minorit√°rias ter√£o peso maior.

In [None]:
# Calcular pesos das classes
class_weights = compute_class_weight(
    class_weight='balanced',
    classes=np.unique(y_train),
    y=y_train
)

# Converter para dicion√°rio
class_weight_dict = {i: weight for i, weight in enumerate(class_weights)}

print("‚öñÔ∏è Pesos das classes (quanto maior, mais importante):")
for idx, (code, name) in enumerate(class_names.items()):
    count = (y_train == idx).sum()
    weight = class_weight_dict[idx]
    print(f"   Classe {idx} ({code:6s}): peso = {weight:.2f} ({count:4d} imagens)")

print("\nüí° Classes com menos exemplos ter√£o maior peso durante o treinamento!")

---
# 7Ô∏è‚É£ Data Augmentation

### üîÑ Por que Data Augmentation?

**Data Augmentation** cria varia√ß√µes artificiais das imagens de treino aplicando transforma√ß√µes:
- Rota√ß√µes, Zoom, Deslocamentos
- Mudan√ßas de brilho, Flips

Isso ajuda o modelo a:
1. ‚úÖ Generalizar melhor
2. ‚úÖ Evitar overfitting
3. ‚úÖ Aumentar artificialmente o tamanho do dataset

### üé® Configura√ß√£o Agressiva

Para imagens de pele, vamos usar transforma√ß√µes agressivas porque les√µes podem aparecer em qualquer orienta√ß√£o.

In [None]:
# Configurar gerador de data augmentation
datagen = ImageDataGenerator(
    rotation_range=45,           # Rota√ß√£o aleat√≥ria at√© ¬±45 graus
    zoom_range=0.2,              # Zoom aleat√≥rio at√© 20%
    width_shift_range=0.15,      # Deslocamento horizontal at√© 15%
    height_shift_range=0.15,     # Deslocamento vertical at√© 15%
    horizontal_flip=True,        # Flip horizontal aleat√≥rio
    vertical_flip=True,          # Flip vertical aleat√≥rio
    brightness_range=[0.8, 1.2], # Varia√ß√£o de brilho (80% a 120%)
    fill_mode='nearest'
)

# Ajustar ao conjunto de treino
datagen.fit(X_train)

print("‚úÖ Data Augmentation configurado!")
print("\nüîÑ Transforma√ß√µes aplicadas:")
print("   ‚Ä¢ Rota√ß√£o: ¬±45¬∞")
print("   ‚Ä¢ Zoom: at√© 20%")
print("   ‚Ä¢ Shifts: at√© 15%")
print("   ‚Ä¢ Flips: horizontal e vertical")
print("   ‚Ä¢ Brilho: 80% a 120%")

### üëÄ Visualizar Exemplos de Augmentation

In [None]:
# Pegar uma imagem de exemplo
sample_img = X_train[0:1]

# Gerar 9 vers√µes augmentadas
fig, axes = plt.subplots(3, 3, figsize=(12, 12))
axes = axes.ravel()

# Desnormalizar para visualiza√ß√£o
def denormalize(img):
    img = img * X_train_std + X_train_mean
    return np.clip(img, 0, 255).astype(np.uint8)

for i, ax in enumerate(axes):
    if i == 0:
        ax.imshow(denormalize(sample_img[0]))
        ax.set_title('Original', fontweight='bold')
    else:
        augmented = next(datagen.flow(sample_img, batch_size=1))
        ax.imshow(denormalize(augmented[0]))
        ax.set_title(f'Augmented {i}', fontweight='bold')
    ax.axis('off')

plt.suptitle('Exemplos de Data Augmentation', fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

print("\nüí° Note como as transforma√ß√µes criam varia√ß√µes realistas!")

---
# 8Ô∏è‚É£ Constru√ß√£o do Modelo CNN

## üß† Arquitetura da Rede Neural Convolucional

```
Input (75, 100, 3)
    ‚Üì
[ Conv2D(32) x2 + MaxPool + Dropout(25%) ]
    ‚Üì
[ Conv2D(64) x2 + MaxPool + Dropout(40%) ]
    ‚Üì
[ Flatten + Dense(128) + Dropout(50%) + Dense(7) ]
    ‚Üì
Output (7 classes)
```

### üìö Explica√ß√£o dos Componentes:

- **Conv2D**: Aprende filtros para detectar padr√µes (bordas, texturas)
- **ReLU**: Fun√ß√£o de ativa√ß√£o n√£o-linear
- **MaxPooling**: Reduz dimensionalidade
- **Dropout**: Desliga neur√¥nios aleatoriamente para evitar overfitting
- **Softmax**: Converte sa√≠da em probabilidades

In [None]:
# Construir modelo
model = Sequential([
    # Bloco Convolucional 1
    Conv2D(32, (3, 3), activation='relu', padding='same', 
           input_shape=(IMG_HEIGHT, IMG_WIDTH, IMG_CHANNELS)),
    Conv2D(32, (3, 3), activation='relu', padding='same'),
    MaxPooling2D((2, 2)),
    Dropout(0.25),
    
    # Bloco Convolucional 2
    Conv2D(64, (3, 3), activation='relu', padding='same'),
    Conv2D(64, (3, 3), activation='relu', padding='same'),
    MaxPooling2D((2, 2)),
    Dropout(0.40),
    
    # Camadas Densas
    Flatten(),
    Dense(128, activation='relu'),
    Dropout(0.5),
    Dense(NUM_CLASSES, activation='softmax')
], name='SkinCancerCNN')

print("\n" + "="*70)
print("üìê ARQUITETURA DO MODELO")
print("="*70)
model.summary()
print("="*70)

---
# 9Ô∏è‚É£ Compila√ß√£o do Modelo

## üéØ Otimizador Adam

**Adam (Adaptive Moment Estimation)** √© um dos melhores otimizadores porque:

1. ‚úÖ **Adapta a taxa de aprendizado** para cada par√¢metro
2. ‚úÖ **Combina AdaGrad + RMSprop**
3. ‚úÖ **Converge rapidamente**
4. ‚úÖ **Robusto a hiperpar√¢metros**

### üìâ Learning Rate Scheduling (ReduceLROnPlateau)

Se a valida√ß√£o parar de melhorar por 3 epochs ‚Üí reduz LR em 50%

In [None]:
# Configurar otimizador
optimizer = Adam(learning_rate=LEARNING_RATE)

# Compilar modelo
model.compile(
    optimizer=optimizer,
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

print("‚úÖ Modelo compilado!")
print(f"\n‚öôÔ∏è Configura√ß√µes:")
print(f"   Otimizador: Adam")
print(f"   Learning Rate inicial: {LEARNING_RATE}")
print(f"   Loss: categorical_crossentropy")

### üîî Configurar Callbacks

In [None]:
# Callback 1: Reduzir learning rate
reduce_lr = ReduceLROnPlateau(
    monitor='val_accuracy',
    factor=0.5,
    patience=3,
    min_lr=0.00001,
    verbose=1
)

# Callback 2: Salvar melhor modelo
checkpoint_path = os.path.join(MODELS_DIR, 'best_cnn_model.h5')
model_checkpoint = ModelCheckpoint(
    checkpoint_path,
    monitor='val_accuracy',
    save_best_only=True,
    mode='max',
    verbose=1
)

# Callback 3: Early stopping
early_stop = EarlyStopping(
    monitor='val_accuracy',
    patience=10,
    restore_best_weights=True,
    verbose=1
)

callbacks = [reduce_lr, model_checkpoint, early_stop]

print("‚úÖ Callbacks configurados:")
print("   1. ReduceLROnPlateau")
print("   2. ModelCheckpoint")
print("   3. EarlyStopping")

---
# üîü Treinamento do Modelo

Agora vamos treinar! Isso pode levar **30 min a 1 hora**.

**M√©tricas:**
- **loss**: erro no treino (‚Üì melhor)
- **accuracy**: acur√°cia no treino (‚Üë melhor)
- **val_loss**: erro na valida√ß√£o
- **val_accuracy**: acur√°cia na valida√ß√£o

**Objetivo:** val_accuracy alto e pr√≥ximo de accuracy

In [None]:
print("\n" + "="*70)
print("üöÄ INICIANDO TREINAMENTO")
print("="*70)
print(f"Epochs: {EPOCHS}")
print(f"Batch size: {BATCH_SIZE}")
print(f"Steps por epoch: {len(X_train) // BATCH_SIZE}")
print("="*70 + "\n")

# Treinar modelo
history = model.fit(
    datagen.flow(X_train, y_train_encoded, batch_size=BATCH_SIZE),
    steps_per_epoch=len(X_train) // BATCH_SIZE,
    epochs=EPOCHS,
    validation_data=(X_val, y_val_encoded),
    callbacks=callbacks,
    class_weight=class_weight_dict,
    verbose=1
)

print("\n" + "="*70)
print("‚úÖ TREINAMENTO CONCLU√çDO!")
print("="*70)

---
# 1Ô∏è‚É£1Ô∏è‚É£ Visualiza√ß√£o do Treinamento

In [None]:
# Plotar hist√≥rico
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Accuracy
axes[0].plot(history.history['accuracy'], label='Treino', linewidth=2)
axes[0].plot(history.history['val_accuracy'], label='Valida√ß√£o', linewidth=2)
axes[0].set_title('Acur√°cia', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Epoch')
axes[0].set_ylabel('Accuracy')
axes[0].legend(loc='lower right')
axes[0].grid(True, alpha=0.3)

# Loss
axes[1].plot(history.history['loss'], label='Treino', linewidth=2)
axes[1].plot(history.history['val_loss'], label='Valida√ß√£o', linewidth=2)
axes[1].set_title('Loss', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Epoch')
axes[1].set_ylabel('Loss')
axes[1].legend(loc='upper right')
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# An√°lise do treinamento
final_train_acc = history.history['accuracy'][-1]
final_val_acc = history.history['val_accuracy'][-1]
best_val_acc = max(history.history['val_accuracy'])

print("üìä RESUMO DO TREINAMENTO")
print("="*50)
print(f"Acur√°cia final no treino:     {final_train_acc*100:.2f}%")
print(f"Acur√°cia final na valida√ß√£o:  {final_val_acc*100:.2f}%")
print(f"Melhor acur√°cia na valida√ß√£o: {best_val_acc*100:.2f}%")
print(f"Diferen√ßa treino-valida√ß√£o:   {(final_train_acc - final_val_acc)*100:.2f}%")
print("="*50)

if (final_train_acc - final_val_acc) < 0.05:
    print("\n‚úÖ Boa generaliza√ß√£o!")
elif (final_train_acc - final_val_acc) < 0.10:
    print("\n‚ö†Ô∏è Leve overfitting.")
else:
    print("\n‚ùå Overfitting significativo!")

---
# 1Ô∏è‚É£2Ô∏è‚É£ Avalia√ß√£o no Conjunto de Teste

In [None]:
# Avaliar no teste
test_loss, test_accuracy = model.evaluate(X_test, y_test_encoded, verbose=0)

print("\n" + "="*70)
print("üéØ RESULTADOS NO CONJUNTO DE TESTE")
print("="*70)
print(f"Test Loss:     {test_loss:.4f}")
print(f"Test Accuracy: {test_accuracy*100:.2f}%")
print("="*70)

print(f"\nüìä Compara√ß√£o:")
print(f"   Valida√ß√£o: {final_val_acc*100:.2f}%")
print(f"   Teste:     {test_accuracy*100:.2f}%")

if abs(final_val_acc - test_accuracy) < 0.03:
    print("\n‚úÖ Resultados consistentes!")
else:
    print("\n‚ö†Ô∏è H√° diferen√ßa entre valida√ß√£o e teste.")

---
# 1Ô∏è‚É£3Ô∏è‚É£ An√°lise Detalhada: Matriz de Confus√£o

In [None]:
# Fazer predi√ß√µes no conjunto de valida√ß√£o
y_pred_probs = model.predict(X_val, verbose=0)
y_pred_classes = np.argmax(y_pred_probs, axis=1)
y_true_classes = y_val

# Calcular matriz de confus√£o
cm = confusion_matrix(y_true_classes, y_pred_classes)

# Plotar
plt.figure(figsize=(12, 10))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=list(class_names.keys()),
            yticklabels=list(class_names.keys()))
plt.title('Matriz de Confus√£o', fontsize=16, fontweight='bold')
plt.ylabel('Classe Verdadeira')
plt.xlabel('Classe Predita')
plt.tight_layout()
plt.show()

print("\nüí° Diagonal principal = acertos")
print("   Fora da diagonal = confus√µes")

---
# 1Ô∏è‚É£4Ô∏è‚É£ M√©tricas Por Classe

In [None]:
# Relat√≥rio de classifica√ß√£o
print("\n" + "="*80)
print("üìä RELAT√ìRIO DE CLASSIFICA√á√ÉO")
print("="*80)
report = classification_report(
    y_true_classes, 
    y_pred_classes, 
    target_names=list(class_names.values()),
    digits=4
)
print(report)
print("="*80)

print("\nüìö Gloss√°rio:")
print("   ‚Ä¢ Precision: Acertos / Total predito como classe X")
print("   ‚Ä¢ Recall: Acertos / Total real da classe X")
print("   ‚Ä¢ F1-Score: M√©dia harm√¥nica de Precision e Recall")

### üìä Taxa de Erro Por Classe

In [None]:
# Calcular taxa de erro por classe
class_correct = np.diag(cm)
class_total = np.sum(cm, axis=1)
class_accuracy = class_correct / class_total
class_error = 1 - class_accuracy

# Plotar
fig, ax = plt.subplots(figsize=(12, 6))
x_pos = np.arange(len(class_names))

bars = ax.bar(x_pos, class_error, edgecolor='black')
ax.set_xlabel('Classe')
ax.set_ylabel('Taxa de Erro')
ax.set_title('Taxa de Erro por Classe', fontsize=16, fontweight='bold')
ax.set_xticks(x_pos)
ax.set_xticklabels(list(class_names.keys()))
ax.set_ylim([0, 1])
ax.grid(axis='y', alpha=0.3)

# Valores nas barras
for bar, error in zip(bars, class_error):
    height = bar.get_height()
    ax.text(bar.get_x() + bar.get_width()/2., height + 0.02,
            f'{error*100:.1f}%', ha='center', fontweight='bold')

plt.tight_layout()
plt.show()

# An√°lise
worst_idx = np.argmax(class_error)
best_idx = np.argmin(class_error)
worst_class = list(class_names.keys())[worst_idx]
best_class = list(class_names.keys())[best_idx]

print(f"\nüìà Classe com MAIOR erro: {worst_class} ({class_error[worst_idx]*100:.2f}%)")
print(f"üìâ Classe com MENOR erro: {best_class} ({class_error[best_idx]*100:.2f}%)")

---
# 1Ô∏è‚É£5Ô∏è‚É£ Salvar Modelo Final

In [None]:
# Salvar modelo final
final_model_path = os.path.join(MODELS_DIR, 'cnn_skin_cancer_final.h5')
model.save(final_model_path)

print("üíæ Modelos salvos:")
print(f"   1. Melhor: {checkpoint_path}")
print(f"   2. Final:  {final_model_path}")
print("\n‚úÖ Carregar depois com:")
print("   model = keras.models.load_model('caminho.h5')")

---
# 1Ô∏è‚É£6Ô∏è‚É£ Conclus√µes e Pr√≥ximos Passos

## üìù Resumo

Implementamos uma **CNN do zero** para classificar les√µes de pele usando apenas imagens.

### ‚úÖ O que fizemos:

1. Carregamos e exploramos HAM10000 (10k+ imagens, 7 classes)
2. Processamos imagens (resize, normaliza√ß√£o)
3. Lidamos com desbalanceamento (class weights)
4. Aplicamos Data Augmentation agressivo
5. Constru√≠mos CNN com regulariza√ß√£o
6. Treinamos com Adam + learning rate scheduling
7. Avaliamos com m√©tricas detalhadas

### üéØ Resultados:

In [None]:
print("\n" + "="*70)
print("üèÜ RESULTADOS FINAIS")
print("="*70)
print(f"Acur√°cia no Treino:      {final_train_acc*100:.2f}%")
print(f"Acur√°cia na Valida√ß√£o:   {final_val_acc*100:.2f}%")
print(f"Acur√°cia no Teste:       {test_accuracy*100:.2f}%")
print(f"\nMelhor Val Accuracy:     {best_val_acc*100:.2f}%")
print("="*70)

### üîç Observa√ß√µes:

1. **Dataset Desbalanceado**: Usamos class weights
2. **Data Augmentation √© Crucial**: Evita overfitting
3. **Regulariza√ß√£o**: Dropout + LR scheduling ajudam
4. **Limita√ß√µes**: Imagens pequenas (100x75) perdem detalhes

### üöÄ Pr√≥ximos Passos:

1. **Vision Transformer (ViT)**: Implementar e comparar
2. **Compara√ß√£o com VLMs**: Testar Gemini, GPT-4V, Claude
3. **Melhorias**:
   - Transfer Learning (ResNet50, EfficientNet)
   - Imagens maiores (224x224)
   - Ensemble de modelos

### üí° Li√ß√µes:

- ‚úÖ CNNs funcionam bem para imagens m√©dicas
- ‚úÖ Data Augmentation e regulariza√ß√£o s√£o essenciais
- ‚úÖ Desbalanceamento requer aten√ß√£o especial
- ‚úÖ An√°lise detalhada revela insights importantes

---

## üéì Fim do Notebook

**Modelo baseline criado!** Pronto para comparar com arquiteturas avan√ßadas.
