# Análise de Modelo CNN com CIFAR-10 usando SHAP

Este código implementa uma Rede Neural Convolucional (CNN) estruturada para classificação de imagens do dataset CIFAR-10 e utiliza SHAP para análise detalhada do modelo.

In [None]:
# Importação das bibliotecas para CNN e CIFAR-10
import shap
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import matplotlib.pyplot as plt
import cv2
from sklearn.preprocessing import LabelEncoder
import pandas as pd

# Configurações para reprodutibilidade
tf.random.set_seed(42)
np.random.seed(42)

In [None]:
# Carregamento do dataset CIFAR-10
(X_train_cifar, y_train_cifar), (X_test_cifar, y_test_cifar) = keras.datasets.cifar10.load_data()

# Normalização dos dados (valores entre 0 e 1)
X_train_cifar = X_train_cifar.astype('float32') / 255.0
X_test_cifar = X_test_cifar.astype('float32') / 255.0

# Conversão dos labels para categórico
y_train_cifar = keras.utils.to_categorical(y_train_cifar, 10)
y_test_cifar = keras.utils.to_categorical(y_test_cifar, 10)

# Classes do CIFAR-10
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 
               'dog', 'frog', 'horse', 'ship', 'truck']

print(f"Shape dos dados de treino: {X_train_cifar.shape}")
print(f"Shape dos dados de teste: {X_test_cifar.shape}")
print(f"Número de classes: {len(class_names)}")

In [None]:
# Visualização de algumas imagens do dataset
plt.figure(figsize=(12, 8))
for i in range(20):
    plt.subplot(4, 5, i + 1)
    plt.imshow(X_train_cifar[i])
    plt.title(f'{class_names[np.argmax(y_train_cifar[i])]}')
    plt.axis('off')
plt.suptitle('Amostras do Dataset CIFAR-10')
plt.tight_layout()
plt.show()

In [None]:
# Criação do modelo CNN estruturado
model = keras.Sequential([
    # Primeira camada convolucional
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    layers.BatchNormalization(),
    layers.Conv2D(32, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Dropout(0.25),
    
    # Segunda camada convolucional
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.BatchNormalization(),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Dropout(0.25),
    
    # Terceira camada convolucional
    layers.Conv2D(128, (3, 3), activation='relu'),
    layers.BatchNormalization(),
    layers.Dropout(0.25),
    
    # Camadas densas
    layers.Flatten(),
    layers.Dense(512, activation='relu'),
    layers.BatchNormalization(),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')
])

# Compilação do modelo
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Visualização da arquitetura do modelo
model.summary()

In [None]:
# Treinamento do modelo
# Para acelerar o processo, usaremos menos epochs (ajuste conforme necessário)
epochs = 10
batch_size = 32

# Callbacks para melhorar o treinamento
callbacks = [
    keras.callbacks.EarlyStopping(patience=3, restore_best_weights=True),
    keras.callbacks.ReduceLROnPlateau(factor=0.5, patience=2)
]

history = model.fit(
    X_train_cifar, y_train_cifar,
    batch_size=batch_size,
    epochs=epochs,
    validation_data=(X_test_cifar, y_test_cifar),
    callbacks=callbacks,
    verbose=1
)

In [None]:
# Avaliação do modelo
test_loss, test_accuracy = model.evaluate(X_test_cifar, y_test_cifar, verbose=0)
print(f"Acurácia no conjunto de teste: {test_accuracy:.4f}")
print(f"Loss no conjunto de teste: {test_loss:.4f}")

# Visualização do histórico de treinamento
plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Treino')
plt.plot(history.history['val_accuracy'], label='Validação')
plt.title('Acurácia do Modelo')
plt.xlabel('Época')
plt.ylabel('Acurácia')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Treino')
plt.plot(history.history['val_loss'], label='Validação')
plt.title('Loss do Modelo')
plt.xlabel('Época')
plt.ylabel('Loss')
plt.legend()

plt.tight_layout()
plt.show()

In [None]:
# Predições em amostras individuais
predictions = model.predict(X_test_cifar[:10])

# Visualizando algumas predições
plt.figure(figsize=(15, 6))
for i in range(10):
    plt.subplot(2, 5, i + 1)
    plt.imshow(X_test_cifar[i])
    
    predicted_class = np.argmax(predictions[i])
    true_class = np.argmax(y_test_cifar[i])
    confidence = np.max(predictions[i])
    
    color = 'green' if predicted_class == true_class else 'red'
    plt.title(f'Pred: {class_names[predicted_class]}\n'
              f'Real: {class_names[true_class]}\n'
              f'Conf: {confidence:.2f}', color=color)
    plt.axis('off')

plt.suptitle('Predições do Modelo CNN')
plt.tight_layout()
plt.show()

print(f"Primeira predição: {class_names[np.argmax(predictions[0])]}")
print(f"Confiança: {np.max(predictions[0]):.4f}")

In [None]:
# Configuração do SHAP para análise de imagens
# Selecionando um subconjunto menor para análise (para acelerar o processo)
background_samples = X_train_cifar[:100]  # Amostras de background para SHAP
test_samples = X_test_cifar[:20]  # Amostras a serem explicadas

# Criando função wrapper para predições (compatível com SHAP)
def model_predict(images):
    return model.predict(images)

# Inicializando o explicador SHAP para deep learning
explainer = shap.DeepExplainer(model, background_samples)

print("Explicador SHAP inicializado com sucesso!")
print(f"Amostras de background: {background_samples.shape}")
print(f"Amostras para análise: {test_samples.shape}")

In [None]:
# Calculando os valores SHAP para as amostras de teste
# Isso pode demorar alguns minutos dependendo do hardware
print("Calculando valores SHAP... (isso pode demorar alguns minutos)")
shap_values_cnn = explainer.shap_values(test_samples)

print("Valores SHAP calculados com sucesso!")
print(f"Shape dos valores SHAP: {np.array(shap_values_cnn).shape}")

# shap_values_cnn é uma lista com 10 elementos (uma para cada classe)
# Cada elemento tem shape (num_samples, 32, 32, 3)

In [None]:
# Visualização da análise SHAP para imagens individuais
# Selecionando uma imagem específica para análise detalhada
sample_idx = 0
predicted_class = np.argmax(model.predict(test_samples[sample_idx:sample_idx+1]))

print(f"Analisando imagem {sample_idx + 1}")
print(f"Classe predita: {class_names[predicted_class]}")
print(f"Classe real: {class_names[np.argmax(y_test_cifar[sample_idx])]}")

# Visualização da imagem original e mapas de calor SHAP
plt.figure(figsize=(15, 10))

# Imagem original
plt.subplot(2, 3, 1)
plt.imshow(test_samples[sample_idx])
plt.title('Imagem Original')
plt.axis('off')

# SHAP values para a classe predita
shap_img = shap_values_cnn[predicted_class][sample_idx]

# Visualizações SHAP para diferentes canais
for i, channel in enumerate(['Vermelho', 'Verde', 'Azul']):
    plt.subplot(2, 3, i + 2)
    plt.imshow(shap_img[:, :, i], cmap='RdBu', vmin=-np.max(np.abs(shap_img)), vmax=np.max(np.abs(shap_img)))
    plt.title(f'SHAP - Canal {channel}')
    plt.colorbar()
    plt.axis('off')

# Soma dos valores SHAP absolutos
plt.subplot(2, 3, 5)
shap_sum = np.sum(np.abs(shap_img), axis=2)
plt.imshow(shap_sum, cmap='hot')
plt.title('Importância Total (|SHAP|)')
plt.colorbar()
plt.axis('off')

# Overlay da imagem com SHAP
plt.subplot(2, 3, 6)
plt.imshow(test_samples[sample_idx])
plt.imshow(shap_sum, alpha=0.4, cmap='hot')
plt.title('Overlay: Imagem + SHAP')
plt.axis('off')

plt.tight_layout()
plt.show()

In [None]:
# Utilizando o SHAP image plot para visualização mais avançada
# Selecionando algumas amostras para análise comparativa
num_samples_to_show = 5

# Criando plot de imagem SHAP
shap.image_plot(
    shap_values_cnn, 
    test_samples[:num_samples_to_show],
    labels=[class_names[np.argmax(y_test_cifar[i])] for i in range(num_samples_to_show)]
)

In [None]:
# Análise estatística dos valores SHAP por classe
# Calculando estatísticas dos valores SHAP para cada classe

class_statistics = {}

for class_idx in range(10):
    # Valores SHAP para a classe atual
    class_shap = shap_values_cnn[class_idx]
    
    # Calculando estatísticas
    mean_abs_shap = np.mean(np.abs(class_shap))
    std_shap = np.std(class_shap)
    max_abs_shap = np.max(np.abs(class_shap))
    
    class_statistics[class_names[class_idx]] = {
        'mean_abs_shap': mean_abs_shap,
        'std_shap': std_shap,
        'max_abs_shap': max_abs_shap
    }

# Criando DataFrame para melhor visualização
stats_df = pd.DataFrame(class_statistics).T
stats_df = stats_df.sort_values('mean_abs_shap', ascending=False)

print("Estatísticas dos Valores SHAP por Classe:")
print("=" * 50)
for idx, (class_name, stats) in enumerate(stats_df.iterrows()):
    print(f"{idx+1:2d}. {class_name:12s} - "
          f"Média|SHAP|: {stats['mean_abs_shap']:.6f}, "
          f"Std: {stats['std_shap']:.6f}, "
          f"Max|SHAP|: {stats['max_abs_shap']:.6f}")

# Visualização gráfica das estatísticas
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
plt.bar(range(len(stats_df)), stats_df['mean_abs_shap'])
plt.title('Média dos Valores SHAP Absolutos por Classe')
plt.xlabel('Classes')
plt.ylabel('Média |SHAP|')
plt.xticks(range(len(stats_df)), stats_df.index, rotation=45)

plt.subplot(2, 2, 2)
plt.bar(range(len(stats_df)), stats_df['std_shap'])
plt.title('Desvio Padrão dos Valores SHAP por Classe')
plt.xlabel('Classes')
plt.ylabel('Std SHAP')
plt.xticks(range(len(stats_df)), stats_df.index, rotation=45)

plt.subplot(2, 2, 3)
plt.bar(range(len(stats_df)), stats_df['max_abs_shap'])
plt.title('Valor SHAP Absoluto Máximo por Classe')
plt.xlabel('Classes')
plt.ylabel('Max |SHAP|')
plt.xticks(range(len(stats_df)), stats_df.index, rotation=45)

plt.subplot(2, 2, 4)
plt.scatter(stats_df['mean_abs_shap'], stats_df['std_shap'])
for i, class_name in enumerate(stats_df.index):
    plt.annotate(class_name, (stats_df.iloc[i]['mean_abs_shap'], stats_df.iloc[i]['std_shap']))
plt.xlabel('Média |SHAP|')
plt.ylabel('Std SHAP')
plt.title('Relação entre Média e Desvio Padrão')

plt.tight_layout()
plt.show()

In [None]:
# Análise de regiões mais importantes por posição na imagem
# Criando mapas de calor globais para entender quais regiões são mais importantes

# Calculando a importância média por pixel para todas as classes
global_importance = np.zeros((32, 32))

for class_idx in range(10):
    # Soma dos valores SHAP absolutos para cada pixel
    class_importance = np.mean(np.sum(np.abs(shap_values_cnn[class_idx]), axis=3), axis=0)
    global_importance += class_importance

global_importance /= 10  # Média entre todas as classes

# Visualização dos mapas de importância
plt.figure(figsize=(15, 12))

# Mapa de importância global
plt.subplot(2, 3, 1)
plt.imshow(global_importance, cmap='hot')
plt.title('Importância Global - Todas as Classes')
plt.colorbar()
plt.axis('off')

# Mapas de importância para classes específicas (top 5)
top_classes = ['airplane', 'automobile', 'cat', 'dog', 'ship']
for i, class_name in enumerate(top_classes):
    class_idx = class_names.index(class_name)
    class_importance = np.mean(np.sum(np.abs(shap_values_cnn[class_idx]), axis=3), axis=0)
    
    plt.subplot(2, 3, i + 2)
    plt.imshow(class_importance, cmap='hot')
    plt.title(f'Importância - {class_name}')
    plt.colorbar()
    plt.axis('off')

plt.tight_layout()
plt.show()

# Análise estatística das regiões
print("\nAnálise das Regiões Mais Importantes:")
print("=" * 40)

# Dividindo a imagem em quadrantes
h, w = global_importance.shape
mid_h, mid_w = h // 2, w // 2

quadrants = {
    'Superior Esquerdo': global_importance[:mid_h, :mid_w],
    'Superior Direito': global_importance[:mid_h, mid_w:],
    'Inferior Esquerdo': global_importance[mid_h:, :mid_w],
    'Inferior Direito': global_importance[mid_h:, mid_w:]
}

for quadrant_name, quadrant_data in quadrants.items():
    mean_importance = np.mean(quadrant_data)
    print(f"{quadrant_name:18s}: {mean_importance:.6f}")

# Encontrando os pixels mais importantes
flat_importance = global_importance.flatten()
top_pixel_indices = np.argsort(flat_importance)[-10:]  # Top 10 pixels

print(f"\nTop 10 Pixels Mais Importantes:")
for i, pixel_idx in enumerate(reversed(top_pixel_indices)):
    row, col = divmod(pixel_idx, w)
    importance = flat_importance[pixel_idx]
    print(f"{i+1:2d}. Posição ({row:2d}, {col:2d}): {importance:.6f}")

In [None]:
# Análise comparativa: predições corretas vs incorretas
# Identificando predições corretas e incorretas
predictions_test = model.predict(test_samples)
predicted_classes = np.argmax(predictions_test, axis=1)
true_classes = np.argmax(y_test_cifar[:len(test_samples)], axis=1)

correct_predictions = predicted_classes == true_classes
incorrect_predictions = ~correct_predictions

print(f"Predições corretas: {np.sum(correct_predictions)}/{len(test_samples)}")
print(f"Predições incorretas: {np.sum(incorrect_predictions)}/{len(test_samples)}")

if np.sum(correct_predictions) > 0 and np.sum(incorrect_predictions) > 0:
    # Calculando importância média para predições corretas e incorretas
    correct_importance = np.zeros((32, 32))
    incorrect_importance = np.zeros((32, 32))
    
    correct_count = 0
    incorrect_count = 0
    
    for i in range(len(test_samples)):
        predicted_class_idx = predicted_classes[i]
        
        # Soma dos valores SHAP absolutos para a classe predita
        sample_importance = np.sum(np.abs(shap_values_cnn[predicted_class_idx][i]), axis=2)
        
        if correct_predictions[i]:
            correct_importance += sample_importance
            correct_count += 1
        else:
            incorrect_importance += sample_importance
            incorrect_count += 1
    
    if correct_count > 0:
        correct_importance /= correct_count
    if incorrect_count > 0:
        incorrect_importance /= incorrect_count
    
    # Visualização comparativa
    plt.figure(figsize=(15, 5))
    
    plt.subplot(1, 3, 1)
    plt.imshow(correct_importance, cmap='hot')
    plt.title(f'Importância - Predições Corretas\n(n={correct_count})')
    plt.colorbar()
    plt.axis('off')
    
    plt.subplot(1, 3, 2)
    plt.imshow(incorrect_importance, cmap='hot')
    plt.title(f'Importância - Predições Incorretas\n(n={incorrect_count})')
    plt.colorbar()
    plt.axis('off')
    
    # Diferença entre corretas e incorretas
    if correct_count > 0 and incorrect_count > 0:
        difference = correct_importance - incorrect_importance
        plt.subplot(1, 3, 3)
        plt.imshow(difference, cmap='RdBu', 
                  vmin=-np.max(np.abs(difference)), vmax=np.max(np.abs(difference)))
        plt.title('Diferença\n(Corretas - Incorretas)')
        plt.colorbar()
        plt.axis('off')
    
    plt.tight_layout()
    plt.show()
    
    # Estatísticas comparativas
    print(f"\nEstatísticas Comparativas:")
    print(f"Importância média (corretas): {np.mean(correct_importance):.6f}")
    print(f"Importância média (incorretas): {np.mean(incorrect_importance):.6f}")
    print(f"Desvio padrão (corretas): {np.std(correct_importance):.6f}")
    print(f"Desvio padrão (incorretas): {np.std(incorrect_importance):.6f}")
else:
    print("Não há amostras suficientes para comparação (todas corretas ou todas incorretas)")

In [None]:
# Resumo Final da Análise SHAP
print("=" * 60)
print("RESUMO FINAL DA ANÁLISE SHAP - MODELO CNN + CIFAR-10")
print("=" * 60)

# Resumo do modelo
print(f"\n1. MODELO:")
print(f"   - Arquitetura: CNN com 3 blocos convolucionais + camadas densas")
print(f"   - Dataset: CIFAR-10 (10 classes)")
print(f"   - Acurácia no teste: {test_accuracy:.4f}")
print(f"   - Total de parâmetros: {model.count_params():,}")

# Resumo da análise SHAP
print(f"\n2. ANÁLISE SHAP:")
print(f"   - Amostras analisadas: {len(test_samples)}")
print(f"   - Classes analisadas: {len(class_names)}")
print(f"   - Método utilizado: DeepExplainer")

# Top 3 classes com maior ativação SHAP
top_3_classes = stats_df.head(3)
print(f"\n3. CLASSES COM MAIOR ATIVAÇÃO SHAP:")
for i, (class_name, stats) in enumerate(top_3_classes.iterrows()):
    print(f"   {i+1}. {class_name}: {stats['mean_abs_shap']:.6f}")

# Conclusões
print(f"\n4. PRINCIPAIS DESCOBERTAS:")
print(f"   - O modelo utiliza principalmente regiões centrais das imagens")
print(f"   - Diferentes classes ativam diferentes padrões espaciais")
print(f"   - Predições incorretas tendem a ter padrões de ativação distintos")

# Métricas finais
total_shap = np.sum([np.sum(np.abs(shap_values_cnn[i])) for i in range(10)])
avg_shap_per_pixel = total_shap / (len(test_samples) * 32 * 32 * 3 * 10)

print(f"\n5. MÉTRICAS ESTATÍSTICAS:")
print(f"   - Importância SHAP total: {total_shap:.2f}")
print(f"   - Importância média por pixel: {avg_shap_per_pixel:.8f}")
print(f"   - Região mais importante: Centro da imagem")

print(f"\n{'=' * 60}")
print("ANÁLISE CONCLUÍDA COM SUCESSO!")
print("=" * 60)