# üß† Explicabilidade com `dalex` ‚Äî Breast Cancer Wisconsin (Diagnostic)

Neste notebook mostramos **como o modelo escolhido (LR_L2 com MoreStable12)** toma decis√µes, usando a biblioteca **[`dalex`](https://dalex.drwhy.ai/)**. A ideia √© complementar m√©tricas globais (AUC, AP, Recall) com **explica√ß√µes globais e locais**, para apoiar auditoria t√©cnica e comunica√ß√£o com stakeholders n√£o t√©cnicos.

**O que √© o `dalex`?**
`dalex` √© um toolkit de **explicabilidade de modelos**. Ele cria um objeto `Explainer` (modelo + dados + fun√ß√£o de previs√£o + r√≥tulos) e oferece an√°lises como:

* **Import√¢ncia de vari√°veis** (*permutation importance*);
* **Perfis de resposta**: **PDP** (Partial Dependence) e **ALE** (Accumulated Local Effects);
* **Explica√ß√µes locais**: *breakdown* e **SHAP-like**;
* Diagn√≥sticos (*model performance*) e auditorias (vi√©s, estabilidade, etc.).

> Nota: nosso foco aqui √© **interpretar** o comportamento do LR_L2 treinado com **MoreStable12**. Os n√∫meros de performance continuam no notebook de treinamento.


## üéØ Objetivos do notebook

1. Construir um `Explainer` do `dalex` para o **pipeline final** (LR_L2).
2. Avaliar **import√¢ncia de vari√°veis** e **perfis globais** (PDP/ALE) das 12 features.
3. Gerar **explica√ß√µes locais** para indiv√≠duos (ex.: casos malignos/lim√≠trofes).
4. Documentar **cautelas** e **boas pr√°ticas** ao interpretar esses gr√°ficos.

## Imports

Esta c√©lula realiza as importa√ß√µes necess√°rias de bibliotecas Python.

**Biblioteca Dalex** -  **`dalex` (`dx`)**: Para criar explicadores de modelos e realizar an√°lises de interpretabilidade (como import√¢ncia de vari√°veis, perfis de depend√™ncia parcial e explica√ß√µes de previs√µes individuais).

In [1]:
# Imports
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path
import joblib
import json
import dalex as dx
from sklearn.model_selection import train_test_split

## üì¶ Prepara√ß√£o: artefatos, dados e reprodutibilidade

Nesta se√ß√£o, carregamos:

* o **pipeline** salvo (`dash_app/models/lr_l2_morestable12.joblib`);
* a lista de **features** na ordem esperada;
* o conjunto de **teste** (ou amostra do conjunto original) para explicabilidade;
* e fixamos a **semente** para reprodutibilidade dos gr√°ficos.

> O `dalex` precisa de uma fun√ß√£o de previs√£o que retorne **probabilidades** da classe positiva (Maligno). Usaremos `pipe.predict_proba(X)[:, 1]`.


## Carregamento de Artefatos e Dados

Esta c√©lula √© respons√°vel por carregar os artefatos necess√°rios para a an√°lise e execu√ß√£o do modelo treinado, garantindo a reprodutibilidade e independ√™ncia de caminhos absolutos.

### Passos Realizados:

1.  **Defini√ß√£o da Raiz do Projeto (`ROOT`)**:
    *   A fun√ß√£o `add_project_root` √© utilizada para encontrar automaticamente o diret√≥rio raiz do projeto, buscando por uma pasta marcadora (por padr√£o, `src`) at√© tr√™s n√≠veis acima do diret√≥rio atual. Isso adiciona o `ROOT` ao `sys.path`, facilitando importa√ß√µes relativas.
2.  **Localiza√ß√£o dos Artefatos**:
    *   O caminho para o diret√≥rio `models` √© definido como `{ROOT}/dash_app/models`.
    *   O c√≥digo verifica se este diret√≥rio existe, lan√ßando um erro caso n√£o seja encontrado.
3.  **Carregamento do Modelo (`pipeline`)**:
    *   O modelo treinado, salvo anteriormente como `lr_l2_morestable12.joblib`, √© carregado usando `joblib.load`. Este arquivo cont√©m todo o pipeline de pr√©-processamento e o classificador.
4.  **Carregamento de Metadados**:
    *   **Ordem das Features (`FEATURE_ORDER`)**: A lista com as 12 features utilizadas pelo modelo √© carregada a partir de `feature_order_more_stable_12.json`.
    *   **Ranges das Vari√°veis (`VARIABLES_RANGE`)**: Os valores m√≠nimos e m√°ximos de cada feature s√£o carregados de `variables_range_more_stable_12.json`. Esses ranges s√£o √∫teis para simula√ß√µes e valida√ß√µes.
5.  **Carregamento dos Dados do Dataset**:
    *   O caminho para o arquivo de dados `wdbc.csv` √© definido como `{ROOT}/data/wdbc.csv`.
    *   Se o arquivo n√£o existir, o c√≥digo tenta ger√°-lo utilizando uma fun√ß√£o espec√≠fica do projeto (`build_wdbc`). Caso isso falhe, ele recorre ao carregamento direto do dataset `Breast Cancer Wisconsin (Diagnostic)` do `sklearn`, adaptando-o ao formato necess√°rio e salvando como `wdbc.csv`.
    *   Uma vez garantida a exist√™ncia do arquivo, ele √© carregado para um DataFrame (`df`).
6.  **Prepara√ß√£o dos Dados**:
    *   O DataFrame √© dividido em `X_full` (features) e `y_full` (r√≥tulos bin√°rios: 1 para Maligno, 0 para Benigno).
    *   S√£o selecionadas apenas as features relevantes para o modelo (`X_subset`) e seus respectivos r√≥tulos (`y_subset`).
    *   Os dados s√£o divididos em conjuntos de treino (`X_train`, `y_train`) e teste (`X_test`, `y_test`) para permitir an√°lises e valida√ß√µes subsequentes.

Este processo centraliza o carregamento de todas as depend√™ncias necess√°rias, assegurando que o ambiente esteja corretamente configurado para as an√°lises seguintes.

In [2]:
# Carregar artefatos exportados (com suporte a ROOT)
import sys
from pathlib import Path

# --- Definir/Obter ROOT do projeto ---
def add_project_root(max_up=3, marker='src'):
    p = Path().resolve()
    for _ in range(max_up + 1):
        if (p / marker).exists():
            sys.path.insert(0, str(p))
            return p
        p = p.parent
    raise RuntimeError(f"N√£o encontrei a pasta '{marker}' nos n√≠veis acima.")

ROOT = add_project_root()

# --- Definir caminho para os modelos em rela√ß√£o ao ROOT ---
models_dir = ROOT / "dash_app" / "models"

# --- Verificar se o diret√≥rio existe ---
if not models_dir.exists():
    raise FileNotFoundError(f"O diret√≥rio de modelos '{models_dir}' n√£o foi encontrado. Verifique a estrutura do projeto e o valor de ROOT.")

# --- Carregar o modelo treinado ---
model_path = models_dir / "lr_l2_morestable12.joblib"
try:
    pipeline = joblib.load(model_path)
except FileNotFoundError:
    print(f"Erro: Arquivo do modelo n√£o encontrado em {model_path}. Verifique o caminho.")
    # Interrompe a execu√ß√£o se o modelo n√£o for encontrado
    raise SystemExit 

# --- Carregar a ordem das features ---
features_path = models_dir / "feature_order_more_stable_12.json"
try:
    with open(features_path, 'r') as f:
        FEATURE_ORDER = json.load(f)
    print(f"Ordem das features carregada: {FEATURE_ORDER}")
except FileNotFoundError:
    print(f"Erro: Arquivo de ordem das features n√£o encontrado em {features_path}.")
    raise SystemExit

# --- Carregar os ranges das vari√°veis ---
ranges_path = models_dir / "variables_range_more_stable_12.json"
try:
    with open(ranges_path, 'r') as f:
        VARIABLES_RANGE = json.load(f)
    print("Ranges das vari√°veis carregados.")
except FileNotFoundError:
    print(f"Erro: Arquivo de ranges das vari√°veis n√£o encontrado em {ranges_path}.")
    raise SystemExit

# --- Carregar dados reais para contexto (opcional, mas √∫til) ---
# Importa a fun√ß√£o diretamente
from src.data.make_wdbc_dataset import build_wdbc

# Define o caminho para o arquivo de dados
DATA_PATH = ROOT / "data" / "wdbc.csv"

# Garante que o diret√≥rio 'data' exista
DATA_PATH.parent.mkdir(parents=True, exist_ok=True)

# Verifica se o arquivo j√° existe
if not DATA_PATH.exists():
    print(f"Arquivo n√£o encontrado em {DATA_PATH}. Gerando via fun√ß√£o build_wdbc...")
    try:
        # Chama a fun√ß√£o diretamente
        build_wdbc(DATA_PATH)
        print(f"Arquivo gerado e salvo em {DATA_PATH}")
    except Exception as e:
        print("Falha ao rodar o m√≥dulo CLI; gerando via sklearn. Erro:", e)
        from sklearn.datasets import load_breast_cancer
        cancer = load_breast_cancer()
        df_tmp = pd.DataFrame(
            cancer["data"],
            columns=[c.replace(" ", "_") for c in cancer["feature_names"]]
        )
        target = pd.Categorical.from_codes(cancer["target"], cancer["target_names"])
        target = target.rename_categories({"malignant": "Maligno", "benign": "Benigno"})
        df_tmp["diagnosis"] = target.astype(str)
        df_tmp.to_csv(DATA_PATH, index=False)
        print("Gerado e salvo em", DATA_PATH)

# Se chegou at√© aqui, o arquivo deve existir. Carrega o DataFrame.
df = pd.read_csv(DATA_PATH)

X_full = df.drop(columns=["diagnosis"])
y_full = (df["diagnosis"] == "Maligno").astype(int).to_numpy()

# Selecionar apenas as features do modelo
X_subset = X_full[FEATURE_ORDER]
y_subset = y_full

# Dividir os dados para ter um conjunto de refer√™ncia
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_subset, y_subset, test_size=0.2, random_state=42, stratify=y_subset)

print(f"Dados de exemplo carregados: {X_train.shape[0]} amostras de treino, {X_test.shape[0]} amostras de teste.")
print(f"Features usadas pelo modelo: {len(FEATURE_ORDER)}")


Ordem das features carregada: ['worst_concavity', 'worst_area', 'worst_texture', 'worst_smoothness', 'mean_concave_points', 'area_error', 'mean_compactness', 'compactness_error', 'symmetry_error', 'worst_symmetry', 'texture_error', 'concave_points_error']
Ranges das vari√°veis carregados.
Dados de exemplo carregados: 455 amostras de treino, 114 amostras de teste.
Features usadas pelo modelo: 12


## Sele√ß√£o de Amostras Representativas para An√°lise Breakdown

Esta c√©lula tem como objetivo identificar ou gerar um conjunto diversificado de amostras do conjunto de dados de treinamento (`X_train`) para serem utilizadas posteriormente nas an√°lises de explicabilidade `breakdown` com o `dalex`. O crit√©rio para a sele√ß√£o √© obter amostras cujas probabilidades preditas de serem malignas (`proba_malignant`) sejam pr√≥ximas a valores-alvo espec√≠ficos: 0.0, 0.2, 0.4, 0.6, 0.8 e 1.0.

### Passo a Passo:

1.  **Previs√£o no Conjunto de Treino**:
    *   O modelo treinado (`pipeline`) √© usado para prever as probabilidades (`proba_train`) e classes (`pred_train`) para todas as amostras do conjunto de treino (`X_train`).
    *   Um novo DataFrame, `train_proba_df`, √© criado contendo as features originais, a probabilidade predita e a classe predita.

2.  **Fun√ß√µes Auxiliares**:
    *   `pick_closest(target, probs, used)`:
        *   Encontra o √≠ndice da amostra em `probs` (probabilidades preditas) cujo valor √© o mais pr√≥ximo do `target`, excluindo √≠ndices j√° utilizados (`used`).
        *   Retorna o √≠ndice e a dist√¢ncia absoluta entre a probabilidade encontrada e o alvo.
    *   `interpolate_to_target(...)`:
        *   Tenta criar uma amostra sint√©tica cuja probabilidade predita seja pr√≥xima do `target`.
        *   Faz isso interpolando entre duas amostras do treino: uma com probabilidade abaixo do alvo (`x_low`) e outra com probabilidade acima (`x_high`).
        *   Utiliza um m√©todo de bisse√ß√£o para encontrar uma combina√ß√£o linear das duas amostras que resulte na probabilidade desejada, dentro de uma toler√¢ncia (`tol`).
        *   Retorna os valores da nova amostra sint√©tica e a probabilidade alcan√ßada.

3.  **Sele√ß√£o das Amostras Alvo**:
    *   Define os r√≥tulos e valores-alvo desejados (`targets`): `pmin` (0.0), `p_0.20` (0.20), ..., `pmax` (1.00).
    *   **Extremos (`pmin` e `pmax`)**:
        *   As amostras reais com as probabilidades preditas m√≠nima e m√°xima s√£o selecionadas diretamente do conjunto de treino.
    *   **Valores Intermedi√°rios (`p_0.20` a `p_0.80`)**:
        *   **Busca Direta**: Primeiro, tenta encontrar uma amostra real no treino cuja probabilidade esteja dentro de uma toler√¢ncia (`ok_eps = 0.03`) do valor alvo.
        *   **Interpola√ß√£o Sint√©tica**: Se n√£o encontrar uma amostra real suficientemente pr√≥xima, tenta criar uma amostra sint√©tica interpolando entre a amostra real com a maior probabilidade abaixo do alvo e a com a menor probabilidade acima do alvo.
        *   **√öltimo Recurso**: Se a interpola√ß√£o falhar ou n√£o for poss√≠vel, seleciona a amostra real com a probabilidade mais pr√≥xima do alvo, mesmo que a dist√¢ncia seja maior que a toler√¢ncia.

4.  **Consolida√ß√£o dos Resultados**:
    *   As amostras selecionadas (reais ou sint√©ticas) s√£o combinadas em um √∫nico DataFrame (`selected_df`).
    *   Informa√ß√µes sobre cada amostra (r√≥tulo, probabilidade alvo, probabilidade alcan√ßada, origem, √≠ndice no treino) s√£o armazenadas em `meta_df`.
    *   Um dicion√°rio (`obs_for_breakdown`) √© criado para facilitar o acesso √†s amostras individuais posteriormente. Por exemplo, `obs_for_breakdown["p_0.60"]` retorna um DataFrame com uma √∫nica linha contendo os valores das features da amostra selecionada para o alvo 0.60.

### Resultado:

Ao final da execu√ß√£o, a c√©lula imprime um resumo das amostras selecionadas, mostrando seu r√≥tulo, a probabilidade alvo, a probabilidade efetivamente alcan√ßada, a origem (real do treino, interpolada sint√©tica ou a mais pr√≥xima real) e o √≠ndice original no conjunto de treino (se aplic√°vel). Isso garante um conjunto diversificado de casos para an√°lise detalhada do modelo.

In [3]:
# Seleciona/gera amostras representativas
from collections import OrderedDict

# 1) Prever no treino inteiro
X_train_ordered = X_train[FEATURE_ORDER].copy()
proba_train = pipeline.predict_proba(X_train_ordered)[:, 1]
pred_train = (proba_train >= 0.5).astype(int)

train_proba_df = X_train_ordered.copy()
train_proba_df["proba_malignant"] = proba_train
train_proba_df["pred_class"] = pred_train

print(f"Treino: {len(train_proba_df)} linhas, {len(FEATURE_ORDER)} features.")
print("Faixa de probabilidades no treino:",
      f"min={proba_train.min():.4f}  max={proba_train.max():.4f}")

# ---------- Auxiliares ----------
def pick_closest(target, probs, used=None):
    """Retorna √≠ndice do elemento de probs mais pr√≥ximo de target, ignorando used."""
    used = used or set()
    mask = np.ones_like(probs, dtype=bool)
    if used:
        mask[list(used)] = False
    if not mask.any():
        return None, None
    cand_idx = np.where(mask)[0]
    i = cand_idx[np.argmin(np.abs(probs[mask] - target))]
    return int(i), float(abs(probs[i] - target))

def interpolate_to_target(x_low, p_low, x_high, p_high, target,
                          tol=1e-3, max_iter=40):
    """
    Interpola no segmento [x_low, x_high] procurando probabilidade ~ target.
    Usa bisse√ß√£o no alfa do segmento; requer p_low < target < p_high (ou vice-versa).
    """
    # Garante ordem: p_low < target < p_high
    if not (p_low < target < p_high or p_high < target < p_low):
        return None, None
    # Coloca de forma que p_a < target < p_b
    if p_low < p_high:
        x_a, p_a, x_b, p_b = x_low, p_low, x_high, p_high
    else:
        x_a, p_a, x_b, p_b = x_high, p_high, x_low, p_low

    a, b = 0.0, 1.0
    x_a = x_a.astype(float); x_b = x_b.astype(float)
    for _ in range(max_iter):
        m = 0.5 * (a + b)
        x_m = (1 - m) * x_a + m * x_b
        p_m = pipeline.predict_proba(pd.DataFrame([x_m], columns=FEATURE_ORDER))[:, 1][0]
        if abs(p_m - target) <= tol:
            return x_m, float(p_m)
        if p_m < target:
            a, x_a, p_a = m, x_m, p_m
        else:
            b, x_b, p_b = m, x_m, p_m
    return x_m, float(p_m)  # retorna melhor aproxima√ß√£o

# 2) Sele√ß√µes alvo
targets = OrderedDict([
    ("pmin", 0.00),
    ("p_0.20", 0.20),
    ("p_0.40", 0.40),
    ("p_0.60", 0.60),
    ("p_0.80", 0.80),
    ("pmax", 1.00),
])

used = set()
rows = []      # lista de DataFrames 1-linha com as features
metas = []     # metadados por linha
ok_eps = 0.03  # toler√¢ncia para considerar "encontrado no treino"

# extremos (sempre do treino)
i_min = int(np.argmin(proba_train))
i_max = int(np.argmax(proba_train))
for label, idx, tgt in [("pmin", i_min, 0.0), ("pmax", i_max, 1.0)]:
    used.add(idx)
    rows.append(train_proba_df.iloc[[idx]][FEATURE_ORDER])
    metas.append(dict(label=label, source="train", target=tgt,
                      pred=float(proba_train[idx]),
                      train_index=int(train_proba_df.index[idx])))

# metas intermedi√°rias
for label, tgt in [("p_0.20", 0.20), ("p_0.40", 0.40),
                   ("p_0.60", 0.60), ("p_0.80", 0.80)]:
    idx, dist = pick_closest(tgt, proba_train, used)
    if idx is not None and dist <= ok_eps:
        used.add(idx)
        rows.append(train_proba_df.iloc[[idx]][FEATURE_ORDER])
        metas.append(dict(label=label, source="train",
                          target=tgt, pred=float(proba_train[idx]),
                          train_index=int(train_proba_df.index[idx])))
        continue

    # Tentar sintetizar por interpola√ß√£o entre um ponto abaixo e um acima
    below_idx = np.where(proba_train < tgt)[0]
    above_idx = np.where(proba_train > tgt)[0]
    if len(below_idx) and len(above_idx):
        i_low  = below_idx[np.argmax(proba_train[below_idx])]   # maior abaixo
        i_high = above_idx[np.argmin(proba_train[above_idx])]   # menor acima
        x_low  = train_proba_df.iloc[i_low][FEATURE_ORDER].to_numpy()
        x_high = train_proba_df.iloc[i_high][FEATURE_ORDER].to_numpy()

        x_syn, p_syn = interpolate_to_target(
            x_low, proba_train[i_low], x_high, proba_train[i_high],
            target=tgt, tol=1e-3, max_iter=40
        )
        if x_syn is not None:
            row = pd.DataFrame([x_syn], columns=FEATURE_ORDER)
            rows.append(row)
            metas.append(dict(label=label, source="synthetic",
                              target=tgt, pred=float(p_syn),
                              train_index=None))
            continue

    # √öltimo fallback: pega o mais pr√≥ximo dispon√≠vel (mesmo que distante)
    if idx is None:
        idx = int(np.argmin(np.abs(proba_train - tgt)))
    used.add(idx)
    rows.append(train_proba_df.iloc[[idx]][FEATURE_ORDER])
    metas.append(dict(label=label, source="train_nearest",
                      target=tgt, pred=float(proba_train[idx]),
                      train_index=int(train_proba_df.index[idx])))

# 3) Consolidar selecionados para uso no breakdown
selected_df = pd.concat(rows, ignore_index=True)
meta_df = pd.DataFrame(metas)
selected_df.insert(0, "selection_label", meta_df["label"])
selected_df["target_p"] = meta_df["target"].values
selected_df["achieved_p"] = meta_df["pred"].values
selected_df["source"] = meta_df["source"].values
selected_df["train_index"] = meta_df["train_index"].values

# Dicion√°rio pronto para usar com dalex: obs_for_breakdown["p_0.60"] -> DataFrame 1 linha com FEATURES
obs_for_breakdown = {
    lbl: selected_df[selected_df["selection_label"] == lbl][FEATURE_ORDER]
    for lbl in selected_df["selection_label"]
}

print("\nSelecionadas para breakdown:")
print(selected_df[["selection_label", "target_p", "achieved_p", "source", "train_index"]])


Treino: 455 linhas, 12 features.
Faixa de probabilidades no treino: min=0.0000  max=1.0000

Selecionadas para breakdown:
  selection_label  target_p    achieved_p source  train_index
0            pmin       0.0  2.993316e-14  train          101
1            pmax       1.0  1.000000e+00  train          265
2          p_0.20       0.2  1.763068e-01  train           89
3          p_0.40       0.4  3.809545e-01  train           40
4          p_0.60       0.6  5.976898e-01  train          215
5          p_0.80       0.8  8.064941e-01  train          542


## üîå Criando o `Explainer` (`dalex.Explainer`)

Aqui instanciamos o `Explainer`, informando:

* `model`: o pipeline scikit-learn j√° treinado;
* `data`: um `DataFrame` com as **12 vari√°veis** (sem a coluna-alvo);
* `y`: vetor `0/1` (0=Benigno, 1=Maligno);
* `predict_function`: fun√ß√£o que devolve **probabilidade de Maligno**;
* `label`: r√≥tulo amig√°vel do modelo (‚ÄúLR_L2 ‚Äî MoreStable12‚Äù).

In [4]:
# Criar Explainer com Dalex (usando dados reais de treino)

# Definir uma fun√ß√£o de predi√ß√£o nomeada
def predict_proba_positive_class(model, X):
    """Fun√ß√£o para obter a probabilidade da classe positiva (1)."""
    return model.predict_proba(X)[:, 1]

try:
    # Reordenar X_train para garantir a ordem correta
    X_train_ordered = X_train[FEATURE_ORDER]

    # Criar o explainer usando o pipeline carregado e os dados reais de treino
    explainer = dx.Explainer(
        model=pipeline,
        data=X_train_ordered, # J√° ordenado
        y=y_train,
        predict_function=predict_proba_positive_class, # Fun√ß√£o nomeada
        label="LR_L2"
    )

    print("Explainer Dalex criado com sucesso usando dados reais de treino.")
except Exception as e:
    print(f"Erro ao criar explainer: {e}")
    raise

Preparation of a new explainer is initiated

  -> data              : 455 rows 12 cols
  -> target variable   : 455 values
  -> model_class       : sklearn.linear_model._logistic.LogisticRegression (default)
  -> label             : LR_L2
  -> predict function  : <function predict_proba_positive_class at 0x7099747ebeb0> will be used
  -> predict function  : Accepts pandas.DataFrame and numpy.ndarray.
  -> predicted values  : min = 2.99e-14, mean = 0.381, max = 1.0
  -> model type        : classification will be used (default)
  -> residual function : difference between y and yhat (default)
  -> residuals         : min = -0.806, mean = -0.00779, max = 0.956
  -> model_info        : package sklearn

A new explainer has been created!
Explainer Dalex criado com sucesso usando dados reais de treino.


## üåé Import√¢ncia de vari√°veis (Permutation Importance)

Aqui calculamos a **import√¢ncia via permuta√ß√£o**: embaralhamos uma feature por vez, medimos o **quanto o desempenho cai** (por ex., *loss* baseada em log-loss/auc), e ordenamos do **maior impacto** para o **menor**.

**Leitura**:

* Maior queda de desempenho ‚áí **maior import√¢ncia**.
* Em geral casa bem com a magnitude dos **coeficientes** no LR_L2, mas **n√£o √© id√™ntico**: permuta√ß√£o captura **efeitos globais** em conjunto com correla√ß√µes restantes.

In [5]:
# An√°lise de Import√¢ncia de Vari√°veis
try:
    print("Calculando import√¢ncia das vari√°veis...")
    
    # Usar depend_method='random' ou 'permute' para pipelines com pr√©-processamento
    variable_importance = explainer.model_parts(
        depend_method='random',  # Mais robusto para pipelines
        N=100,                   # N√∫mero de observa√ß√µes para permuta√ß√£o
        variables=None           # Usa todas as features
    )

    # Verificar se o resultado tem dados v√°lidos
    if variable_importance.result.empty:
        raise ValueError("O c√°lculo de import√¢ncia retornou um resultado vazio.")

    # Plotar usando plotly (com t√≠tulo)
    fig_imp = variable_importance.plot(max_vars=12, show=False)
    fig_imp.update_layout(
        title="Import√¢ncia das Vari√°veis - Modelo de Regress√£o Log√≠stica",
        yaxis_title="Vari√°vel",
        template="plotly_white"
    )
    fig_imp.show()

except Exception as e:
    print(f"Erro ao calcular ou plotar a import√¢ncia das vari√°veis: {e}")
    # Mostrar o tipo de erro para depura√ß√£o
    print(f"Tipo do erro: {type(e).__name__}")

Calculando import√¢ncia das vari√°veis...


### üìä Permutation Importance vs. Coeficientes da Regress√£o Log√≠stica

Os **coeficientes (LR_L2)** e a **Permutation Importance (PI)** respondem a perguntas diferentes ‚Äî por isso as ordens podem divergir mesmo quando apontam para as mesmas vari√°veis "de topo".

**O que cada uma mede**

* **Coeficientes (|Œ≤|)**: efeito **linear** de **1 unidade** (na escala ap√≥s *preprocess* ‚Äî Yeo-Johnson) na **log-odds** de "Maligno", **mantendo as demais vari√°veis fixas**.

  * Bons para **dire√ß√£o do efeito** (sinal +/‚Äì) e para entender a **forma funcional** assumida pelo modelo.
* **Permutation Importance**: **queda de desempenho** (ex.: AUC/AP) quando embaralhamos os valores de uma vari√°vel **depois do pipeline**.

  * Mede o **impacto pr√°tico/global** dessa vari√°vel na **qualidade preditiva** do modelo.

**Por que os rankings podem diferir?**

1. **Colinearidade / compartilhamento de informa√ß√£o**
   Vari√°veis correlacionadas podem ter coeficientes altos, mas a PI "divide" o cr√©dito: ao embaralhar uma, as outras ainda carregam parte do sinal ‚Üí a queda de AUC √© menor.

2. **M√©trica de avalia√ß√£o**
   A PI depende da **m√©trica escolhida** (AUC, AP, etc.) e do **n√≠vel de ru√≠do** do *holdout* usado. Coeficientes n√£o mudam com a m√©trica.

3. **Regulariza√ß√£o**
   A LR_L2 **encolhe** coeficientes (mais ou menos dependendo de `C`). Uma vari√°vel √∫til pode ter |Œ≤| moderado e ainda assim gerar **grande perda de AUC** quando permutada.

4. **Transforma√ß√µes no *preprocess***
   Yeo-Johnson e mudam a **simetria**; |Œ≤| passa a refletir efeito **na vari√°vel transformada**. A PI, por sua vez, mede o impacto **ap√≥s todo o pipeline** (modelo-agn√≥stica).

5. **Efeito conjunto vs. marginal**
   Coeficientes s√£o **condicionais** (mantendo o resto fixo). A PI √© uma medida **global** do que acontece quando quebramos a **associa√ß√£o natural** daquela vari√°vel com as demais.


## üìà Perfis de resposta ‚Äî PDP e ALE

Nesta se√ß√£o geramos **perfis globais** de uma vari√°vel por vez:

* **PDP (Partial Dependence)**: m√©dia das previs√µes enquanto **mant√©m as demais vari√°veis fixas**. F√°cil de ler, por√©m pode distorcer quando h√° **correla√ß√µes fortes** entre features.
* **ALE (Accumulated Local Effects)**: foca em **efeitos locais** por janelas e integra os efeitos parciais. √â **mais est√°vel** quando h√° correla√ß√£o entre preditores.

**Como ler**:

* Eixo x: valores da vari√°vel (na escala original do pipeline de entrada).
* Eixo y: mudan√ßa na **probabilidade prevista** (ou no *link* interno), mantendo o restante como observado.

> **Nota sobre a escolha do PDP**: Optamos por utilizar os perfis PDP nesta an√°lise porque as 12 features selecionadas para o modelo passaram por um processo de poda (*pruning*) baseado na correla√ß√£o. Esse procedimento de sele√ß√£o reduziu significativamente a multicolinearidade entre as vari√°veis, mitigando um dos principais problemas do PDP. Dessa forma, os perfis PDP refletem de maneira mais fiel a rela√ß√£o entre cada vari√°vel e a predi√ß√£o do modelo.

In [6]:
# Cell 6: Perfil de Depend√™ncia Parcial (Partial Dependence Profile)
# Calcular o perfil de depend√™ncia parcial para algumas features importantes
# Vamos escolher as 4 mais importantes do gr√°fico anterior
# --- Top-3 features pela import√¢ncia (permuta√ß√µes) ---
vi = variable_importance.result.copy()
top_features = (
    vi[vi["variable"] != "_baseline_"]
      .groupby("variable")["dropout_loss"].mean()
      .sort_values(ascending=False)
      .head(4)
      .index.tolist()
)
print("Top-4 features:", top_features)

# --- PDP (ou ALE) ---
pdp = explainer.model_profile(
    type="partial",           # ou "accumulated" (ALE), melhor com features correlacionadas
    variables=top_features,
    N=300,                    # amostras para calcular o perfil
    grid_points=30,           # resolu√ß√£o do eixo x (ajuste se quiser curvas mais suaves)
    verbose=False
)

fig_pdp = pdp.plot(variables=top_features, show=False)  # retorna Plotly Figure
fig_pdp.update_layout(title="Perfis de Depend√™ncia Parcial - Regress√£o Log√≠stica")
fig_pdp.show()


Top-4 features: ['area_error', 'worst_texture', 'mean_concave_points', 'worst_concavity']


Este gr√°fico apresenta **perfis de depend√™ncia parcial (PDP)** para quatro vari√°veis do modelo de Regress√£o Log√≠stica. O PDP mostra como a **probabilidade predita** de uma observa√ß√£o ser classificada como maligna muda quando o valor de uma √∫nica vari√°vel √© alterado, mantendo todas as demais vari√°veis fixas na m√©dia.

Vamos interpretar cada um dos perfis:

### 1. `area_error`
  Crescimento **r√°pido** no in√≠cio (0 ‚Üí ~100), depois **satura**. Pequenos aumentos no baixo/medio intervalo j√° elevam bastante o risco; acima de ~200 o ganho √© **marginal** (efeito de **retorno decrescente**). Interpreta√ß√£o: irregularidade/variabilidade de √°rea maior ‚Üí maior probabilidade de malignidade, com **curva monot√¥nica e c√¥ncava**.

### 2. `worst_texture`
  Rela√ß√£o **quase linear e crescente** em toda a faixa (~13‚Äì49). Cada incremento na textura "pior caso" aumenta o risco de forma **constante** (sem plat√¥ vis√≠vel). Sinal claro de que textura no pior cen√°rio √© um **driver est√°vel** da probabilidade.

### 3. `mean_concave_points`
  Crescente com **forte inclina√ß√£o** at√© ~0.10, depois **abranda** (novo plat√¥ acima de ~0.15). Ou seja, pequenas eleva√ß√µes na densidade m√©dia de pontos c√¥ncavos j√° impactam muito; acima de ~0.10 o efeito **continua**, mas com **menor ganho marginal**.

### 4. `worst_concavity`
  Crescente e **mais suave** que as anteriores; n√£o h√° ponto de inflex√£o marcado, mas a inclina√ß√£o **reduz levemente** em valores altos. Indica que concavidade no pior caso aumenta o risco, por√©m com **efeito marginal moderado** e **gradual**.

Em conjunto, os PDPs sugerem:

* **Monotonicidade positiva** para as quatro vari√°veis (mais "erro/irregularidade/concavidade/textura" ‚Üí maior probabilidade de Maligno).
* **Satura√ß√£o** clara em **area_error** e **mean_concave_points** (boas candidatas a efeitos n√£o lineares capturados pelo Yeo‚ÄìJohnson).
* **worst_texture** se destaca por **linearidade** (efeito consistente em toda a faixa).
* **worst_concavity** contribui, mas com **inclina√ß√£o menor**, refor√ßando seu papel como vari√°vel de apoio ao conjunto.


## üîç Explica√ß√µes locais ‚Äî *Breakdown* e SHAP-like

Agora olhamos **um indiv√≠duo espec√≠fico** (linha do conjunto de teste):

* **Breakdown**: decomp√µe a **previs√£o individual** em **contribui√ß√µes por vari√°vel**, mostrando como partimos de uma **probabilidade base** at√© chegar na **probabilidade final**.
* **SHAP (aprox.)**: distribui a contribui√ß√£o de forma **axiom√°tica** (Shapley), considerando **todas as coaliz√µes**; √© mais caro, mas amplamente utilizado.

**Como escolher a observa√ß√£o**:

* Caso **verdadeiro Maligno** corretamente detectado;
* Caso **Benigno**;
* Um caso **lim√≠trofe** (probabilidade perto do limiar), se existir ‚Äî muito did√°tico.


## Gr√°fico Breakdown

Este c√≥digo define uma fun√ß√£o `plot_breakdown_from_bd` que cria um gr√°fico de barras horizontais em estilo **Waterfall** utilizando a biblioteca `plotly.graph_objects`. O objetivo √© visualizar de forma clara e detalhada como um modelo preditivo chega a uma determinada previs√£o para uma observa√ß√£o espec√≠fica, decompondo a contribui√ß√£o de cada vari√°vel.

### Como funciona o gr√°fico:

1.  **Estrutura Waterfall**:
    *   Cada barra horizontal representa a **contribui√ß√£o (`contribution` ou Œî)** de uma vari√°vel (ou do intercepto) para a previs√£o final.
    *   As barras s√£o empilhadas horizontalmente, mostrando como a previs√£o evolui do **intercepto** (valor base) at√© a **predi√ß√£o final**.
2.  **Elementos Chave**:
    *   **Intercepto**: A primeira barra (na base) mostra o valor base da previs√£o do modelo antes de considerar qualquer caracter√≠stica da observa√ß√£o. Uma **linha vertical tracejada cinza** marca exatamente esse valor no eixo X para facilitar a refer√™ncia.
    *   **Vari√°veis**: As barras subsequentes mostram o impacto de cada vari√°vel. Barras para a **direita** indicam contribui√ß√£o positiva (aumentam a probabilidade), enquanto barras para a **esquerda** indicam contribui√ß√£o negativa (diminuem a probabilidade).
    *   **Predi√ß√£o Final**: A √∫ltima barra (no topo) representa a previs√£o final do modelo para aquela observa√ß√£o.
3.  **Personaliza√ß√£o e Controle**:
    *   **R√≥tulos**: Os r√≥tulos no eixo Y j√° v√™m formatados pelo `dalex` (ex: `worst_concavity = 0.4636`), evitando duplica√ß√µes.
    *   **Hover Personalizado**: Ao passar o mouse sobre uma barra, um tooltip mostra informa√ß√µes detalhadas:
        *   Nome da vari√°vel e seu valor.
        *   `contribution (Œî)`: A contribui√ß√£o exata dessa vari√°vel.
        *   `cum. before`: A probabilidade acumulada *antes* de considerar essa vari√°vel.
        *   `cum. after`: A probabilidade acumulada *depois* de considerar essa vari√°vel.
    *   **Ordem Fixa**: O gr√°fico garante que o intercepto esteja sempre na base e a predi√ß√£o final no topo, respeitando a l√≥gica da decomposi√ß√£o.
    *   **Cores**: Cores distintas para contribui√ß√µes positivas (vermelho/crimson) e negativas (verde/seagreen), com a predi√ß√£o final em azul (royalblue).

### Por que um c√≥digo personalizado?

Optamos por desenvolver este gr√°fico personalizado ao inv√©s de utilizar diretamente a visualiza√ß√£o padr√£o dispon√≠vel no pacote `dalex` porque desej√°vamos **maior controle e personaliza√ß√£o**, especialmente em rela√ß√£o √†s informa√ß√µes exibidas no **tooltip (hover)**. Esta vers√£o nos permite mostrar de forma clara e precisa os valores cumulativos antes e depois de cada contribui√ß√£o, o que √© crucial para a interpreta√ß√£o detalhada do modelo.

Este gr√°fico ser√° integrado ao **dashboard do projeto**, proporcionando uma visualiza√ß√£o interativa e informativa para an√°lise de previs√µes individuais do modelo.

In [7]:
# Gr√°fico Breakdown
import plotly.graph_objects as go

def plot_breakdown_from_bd(bd, title=None):
    """
    Waterfall horizontal a partir de bd.result (dalex predict_parts),
    com:
      - contribution (Œî) e cumulative (antes/depois) no hover via customdata
      - intercept no topo e prediction embaixo
      - r√≥tulos prontos (sem duplica√ß√£o)
    """
    res = bd.result.copy()

    # r√≥tulos prontos (do dalex)
    labels = res["variable"].astype(str).tolist()

    # n√∫meros
    contrib     = res["contribution"].astype(float).to_numpy()  # Œî (o que desejamos mostrar)
    cum_after   = res["cumulative"].astype(float).to_numpy()    # acumulado ap√≥s o passo
    cum_before  = cum_after - contrib                           # acumulado antes do passo

    # intercept √© o 1¬∫; prediction √© o √∫ltimo -> manter essa ordem e fix√°-la no eixo
    # Medidas: todos 'relative' e o √∫ltimo 'total'
    measure = ["relative"] * len(res)
    if measure:
        measure[-1] = "total"

    # Linha tracejada na posi√ß√£o do intercept (acumulado ap√≥s o 1¬∫ passo)
    intercept_x = cum_after[0] if len(cum_after) else 0.0

    # --- construir figura ---
    fig = go.Figure()

    fig.add_shape(
        type="line",
        x0=intercept_x, x1=intercept_x, y0=0, y1=1, yref="paper",
        line=dict(color="rgb(90,90,90)", width=1.5, dash="dot"), layer="below"
    )

    # customdata com as 3 coisas que queremos no hover: Œî, cum_before, cum_after
    customdata = np.stack([contrib, cum_before, cum_after], axis=1)

    fig.add_trace(go.Waterfall(
        orientation="h",
        measure=measure,
        y=labels,
        x=contrib,                         # passa o Œî como 'x'; no hover N√ÉO usaremos %{x}
        text=[f"{c:+.3f}" for c in contrib],
        textposition="outside",
        customdata=customdata,
        hovertemplate=(
            "%{y}"
            "<br>contribution (Œî): %{customdata[0]:.3f}"
            "<br>cum. before: %{customdata[1]:.3f}"
            "<br>cum. after: %{customdata[2]:.3f}"
            "<extra></extra>"
        ),
        connector=dict(line=dict(color="rgb(90,90,90)")),
        decreasing=dict(marker=dict(color="seagreen")),
        increasing=dict(marker=dict(color="crimson")),
        totals=dict(marker=dict(color="royalblue")),
    ))

    # Garantir ordem visual: intercept (linha 0) no topo, prediction (√∫ltima) embaixo
    fig.update_yaxes(categoryorder="array", categoryarray=labels)

    fig.update_layout(
        title=title or "Breakdown",
        showlegend=False,
        xaxis_title="contribution",
        hovermode="closest",
        margin=dict(t=70, b=40, l=10, r=10),
        template="plotly_white",
    )
    return fig

### üîé Breakdown (DALEx) ‚Äî como vamos ler as **6 amostras**

Nesta se√ß√£o usamos o **Break Down** do **DALEx** para explicar, **amostra a amostra**, como o *pipeline* **LR L2 + MoreStable12** chega √† probabilidade final. Cada gr√°fico mostra um ‚Äú**caminho de contribui√ß√µes**‚Äù: come√ßamos no **intercepto** do modelo e somamos os efeitos das vari√°veis (barras) at√© chegar √† **previs√£o** daquela observa√ß√£o.

**Como interpretar rapidamente**

* Barras **vermelhas**: aumentam a probabilidade de **Maligno** (contribui√ß√µes positivas).
* Barras **verdes**: reduzem a probabilidade (contribui√ß√µes negativas).
* O eixo horizontal √© a **probabilidade cumulativa** ap√≥s cada passo.
* A ordem das barras reflete a **decomposi√ß√£o local** para a observa√ß√£o (n√£o √© um ranking global).

**Amostras analisadas**
Selecionamos seis casos para cobrir diferentes regi√µes do espa√ßo de probabilidade: **pmin (~0)**, **p_0.20**, **p_0.40**, **p_0.60**, **p_0.80** e **pmax (~1.0)**.


**O que observar nos gr√°ficos**

* Quais vari√°veis **puxam para cima/baixo** a previs√£o e **quanto** (magnitude da barra).
* Coer√™ncia qualitativa com os **coeficientes da LR** (sinal esperado) e com os **gr√°ficos globais** (Permutation Importance, PDPs).
* **Satura√ß√µes**: quando a probabilidade j√° est√° muito alta/baixa, novas contribui√ß√µes tendem a ter **efeito residual**.

A seguir, apresentamos os seis gr√°ficos (um por amostra) com coment√°rios curtos e focados no que realmente move a decis√£o do modelo em cada caso.


In [8]:
# Break Down: prob ‚âà 0.00 (pmin)
label = "pmin"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()


                       variable variable_value  contribution    cumulative
0                     intercept                 3.814162e-01  3.814162e-01
1   compactness_error = 0.01084        0.01084  5.026219e-02  4.316784e-01
2     worst_smoothness = 0.1584         0.1584  2.684975e-02  4.585282e-01
3    mean_compactness = 0.07568        0.07568  1.893783e-02  4.774660e-01
4       worst_symmetry = 0.2932         0.2932  1.882573e-02  4.962917e-01
5         texture_error = 1.508          1.508 -2.237566e-02  4.739161e-01
6      symmetry_error = 0.02659        0.02659 -2.343634e-02  4.504798e-01
7         worst_concavity = 0.0            0.0 -8.948160e-02  3.609981e-01
8            worst_area = 185.2          185.2 -1.028565e-01  2.581416e-01
9         worst_texture = 19.54          19.54 -1.291136e-01  1.290280e-01
10   concave_points_error = 0.0            0.0 -1.170937e-01  1.193431e-02
11    mean_concave_points = 0.0            0.0 -1.193411e-02  1.956204e-07
12           area_error =

### üîç Breakdown ‚Äî amostra **p_min** (prob. prevista ‚âà **0,00**)

Vamos interpretar o gr√°fico de **Breakdown** para a amostra **pmin** (aquela com **probabilidade prevista ‚âà 0**). O gr√°fico mostra um "**caminho de contribui√ß√µes**" (waterfall) que parte do **intercepto** e soma os efeitos de cada vari√°vel at√© chegar √† probabilidade final.

### Como ler

* **Barra vermelha (intercept)**: ponto de partida do modelo (**~0,381**).
* **Barras verdes**: **diminuem** a probabilidade final (empurram para Benigno).
* **Barras vermelhas**: **aumentam** a probabilidade (empurram para Maligno).
* O eixo x mostra a **probabilidade cumulativa** ap√≥s cada passo.

### Passo a passo (principais destaques)

1. **Intercepto ~ 0,381 ‚Üí 0,432**
   Pequenos **empurr√µes para cima** (malignidade) vindos de:

   * `compactness_error = 0.01084` (+0,050)
   * `worst_smoothness = 0.1584` (+0,027)
   * `mean_compactness = 0.07568` (+0,019)
   * `worst_symmetry = 0.2932` (+0,019)
     Esses valores, um pouco mais altos, **puxam levemente** para Maligno.

2. **Virada para baixo (predom√≠nio de sinais de benignidade)**
   Em seguida aparecem efeitos **negativos** (verde) que **reduzem fortemente** a probabilidade:

   * `texture_error = 1.508` (‚àí0,022) e `symmetry_error = 0.02659` (‚àí0,023) j√° come√ßam a puxar para baixo.
   * **Grandes quedas** v√™m de atributos **muito baixos** em medidas cr√≠ticas:

     * `worst_concavity = 0.0` (‚àí0,089)
     * `worst_area = 185.2` (baixo) (‚àí0,103)
     * `worst_texture = 19.54` (baixo) (‚àí0,129)
     * `concave_points_error = 0.0` (‚àí0,117)
     * `mean_concave_points = 0.0` (‚àí0,012)

3. **Fechamento em ~0**

   * `area_error = 9.833` finaliza a descida (contribui√ß√£o residual) e a probabilidade **colapsa para ~0**.

### Interpreta√ß√£o cl√≠nica/modelo

* Esta amostra exibe **valores muito baixos** nas vari√°veis que, quando **altas**, caracterizam **malignidade** (`worst_area`, `worst_texture`, `worst_concavity`, `mean_concave_points`, `concave_points_error`).
* Apesar de **pequenos sinais pr√≥-malignidade** relacionados a **smoothness/compactness/symmetry**, eles **n√£o s√£o suficientes** para contrabalan√ßar a **forte evid√™ncia de benignidade** nas medidas de **√°rea/texture/concavidade**.
* Resultado coerente com os **PDPs** e com os **coeficientes da LR_L2**: aumentos nessas vari√°veis "de pior caso" elevam o risco; aqui, como est√£o **baixas ou zero**, a previs√£o √© **Benigno com prob. ~0**.


In [9]:
# Break Down: prob ‚âà 0.20
label = "p_0.20"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()

                          variable variable_value  contribution  cumulative
0                        intercept                     0.381416    0.381416
1               area_error = 42.76          42.76      0.114753    0.496169
2    mean_concave_points = 0.07064        0.07064      0.227842    0.724011
3           texture_error = 0.7372         0.7372      0.070535    0.794546
4   concave_points_error = 0.01623        0.01623      0.076741    0.871287
5          worst_symmetry = 0.3151         0.3151      0.043841    0.915128
6         worst_concavity = 0.2604         0.2604      0.010307    0.925436
7               worst_area = 803.6          803.6      0.012823    0.938259
8        worst_smoothness = 0.1277         0.1277     -0.001908    0.936351
9         symmetry_error = 0.02427        0.02427     -0.003051    0.933300
10       mean_compactness = 0.1339         0.1339     -0.016237    0.917063
11     compactness_error = 0.04412        0.04412     -0.137621    0.779442
12          

### üîç Breakdown ‚Äî amostra **p_0.20** (prob. final ‚âà **0,176**)

**Resumo em uma frase:** havia um forte ac√∫mulo de evid√™ncias pr√≥-maligno (subiu at√© ~**0,94**), mas **duas vari√°veis puxaram muito para baixo** ‚Äî principalmente **`worst_texture`** (muito baixa) e, em menor grau, **`compactness_error`** ‚Äî levando a probabilidade final para ~**0,20** (benigno).


**Subidas iniciais (pr√≥-Maligno)**

* **Intercepto ‚Üí 0,381** (ponto de partida).
* **`area_error = 42.76` (+0,115)**: eleva o risco ‚Äî erros de √°rea maiores costumam indicar irregularidade.
* **`mean_concave_points = 0.0706` (+0,228)**: forte empurr√£o; mais *concave points* m√©dios associam-se a malignidade.
* **`texture_error = 0.737` (+0,071)** e **`concave_points_error = 0.0162` (+0,077)**: refor√ßam o movimento de alta.
* **`worst_symmetry = 0.315` (+0,044)** e **`worst_concavity = 0.260` (+0,010)**: contribui√ß√µes positivas adicionais.
* **`worst_area = 804` (+0,013)**: "pior √°rea" elevada tamb√©m puxa para cima.

**Freios (pr√≥-Benigno) ‚Äî virada para baixo**

* **`compactness_error = 0.044` (‚àí0,138)** e **`mean_compactness = 0.134` (‚àí0,016)**: erros/n√≠veis de *compactness* atenuam o risco acumulado.
* **`worst_texture = 18.24` (‚àí0,603)**: **ponto de inflex√£o** ‚Äî valor baixo de *worst texture* derruba o score e domina o balan√ßo final.
* Pequenos ajustes negativos: **`worst_smoothness = 0.128` (‚àí0,002)** e **`symmetry_error = 0.024` (‚àí0,003)**.

### Por que termina em ~0,176?

Apesar de v√°rios sinais pr√≥-malignidade (principalmente **`mean_concave_points`** e **`area_error`**), a combina√ß√£o **`compactness_error`** moderado e, sobretudo, **`worst_texture` muito baixo** **supera** os empurr√µes positivos. O resultado final fica **abaixo de 0,2**, classificando como **Benigno** nesse limiar.

In [10]:
# Break Down: prob ‚âà 0.40
label = "p_0.40"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()

                           variable variable_value  contribution  cumulative
0                         intercept                     0.381416    0.381416
1             worst_texture = 30.25          30.25      0.077719    0.459135
2       compactness_error = 0.01102        0.01102      0.061721    0.520856
3        mean_compactness = 0.06031        0.06031      0.041990    0.562845
4            texture_error = 0.8265         0.8265      0.030110    0.592956
5           symmetry_error = 0.0138         0.0138      0.026824    0.619780
6           worst_symmetry = 0.2994         0.2994      0.027321    0.647101
7                worst_area = 787.9          787.9      0.035904    0.683005
8          worst_concavity = 0.2085         0.2085      0.028877    0.711883
9         worst_smoothness = 0.1094         0.1094     -0.022050    0.689832
10  concave_points_error = 0.006881       0.006881     -0.037808    0.652024
11               area_error = 20.53          20.53      0.018274    0.670298

### üîç Breakdown ‚Äî amostra **p_0.40** (prob. final ‚âà **0,381**)

**Panorama:** o caso come√ßa no **intercepto (0,381)** e recebe v√°rios **empurr√µes pr√≥-Maligno** moderados ‚Äî por√©m termina praticamente **onde come√ßou** porque um √∫nico fator puxa fortemente para baixo no final.

**Principais vetores de alta (‚Üë risco):**

* **`worst_texture = 30.25` (+0,078)**: textura "pior caso" em faixa intermedi√°ria‚Äìalta eleva o score.
* **`compactness_error = 0.011` (+0,062)** e **`mean_compactness = 0.060` (+0,042)**: irregularidade/compacta√ß√£o empurram para cima.
* **`texture_error = 0.827` (+0,030)**, **`symmetry_error = 0.0138` (+0,027)**, **`worst_symmetry = 0.299` (+0,027)**: refor√ßos positivos, por√©m pequenos.
* **`worst_area = 788` (+0,036)** e **`worst_concavity = 0.209` (+0,029)**: medidas de "pior caso" acima de valores t√≠picos de benignos somam ao risco.
* **`area_error = 20.53` (+0,018)**: contribui√ß√£o menor, mas no sentido pr√≥-Maligno.

**Freios (‚Üì risco):**

* **`worst_smoothness = 0.109` (‚àí0,022)** e **`concave_points_error = 0.0069` (‚àí0,038)**: atenuam parte do ganho acumulado.
* **Ponto decisivo:** **`mean_concave_points = 0.0203` (‚àí0,289)** ‚Äî valor **baixo** de *mean concave points* produz **forte queda** no score e praticamente "anula" os incrementos anteriores, fechando em **‚âà0,381**.

**Leitura final:**
Apesar de m√∫ltiplos sinais pr√≥-malignidade, o **baixo `mean_concave_points`** domina o balan√ßo local e **ancora a probabilidade em ~0,38**, muito pr√≥xima ao intercepto. No **threshold 0,50 (padr√£o)**, este caso √© **classificado como Benigno**.



In [11]:
# Break Down: prob ‚âà 0.60
label = "p_0.60"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()

                          variable variable_value  contribution  cumulative
0                        intercept                     0.381416    0.381416
1         worst_concavity = 0.4636         0.4636      0.057869    0.439285
2    mean_concave_points = 0.05602        0.05602      0.107912    0.547197
3           worst_symmetry = 0.363          0.363      0.098472    0.645669
4            worst_texture = 26.93          26.93      0.091197    0.736866
5   concave_points_error = 0.01435        0.01435      0.076151    0.813017
6         worst_smoothness = 0.146          0.146      0.024229    0.837246
7               worst_area = 750.1          750.1      0.035658    0.872903
8            texture_error = 1.194          1.194     -0.001292    0.871611
9         symmetry_error = 0.01939        0.01939      0.000340    0.871951
10     compactness_error = 0.03438        0.03438     -0.081902    0.790049
11       mean_compactness = 0.1517         0.1517     -0.186471    0.603578
12          

### üîç Breakdown ‚Äî amostra **p_0.60** (prob. final ‚âà **0,598**)

**Trajet√≥ria geral:** partimos do **intercepto (0,381)** e acumulamos **v√°rios empurr√µes pr√≥-Maligno** at√© ~**0,873**; no fim, **dois freios relevantes** derrubam o score para ~**0,60**, ainda **acima de 0,50**.

**Principais for√ßas que **aumentam** o risco (barras vermelhas):**

* **`worst_concavity = 0.4636`** **(+0,058)** ‚Äî concavidade "pior caso" alta, forte sinal morfol√≥gico de malignidade.
* **`mean_concave_points = 0.056`** **(+0,108)** ‚Äî presen√ßa de pontos c√¥ncavos em m√©dia eleva substancialmente o risco.
* **`worst_symmetry = 0.363`** **(+0,098)** ‚Äî simetria pior-caso elevada, mais um ind√≠cio de padr√£o irregular.
* **`worst_texture = 26.93`** **(+0,091)** ‚Äî textura no "pior caso" em faixa alta empurra o score.
* **`concave_points_error = 0.014`** **(+0,076)** ‚Äî varia√ß√£o em pontos c√¥ncavos tamb√©m colabora para o aumento.
* **`worst_smoothness = 0.146`** **(+0,024)** e **`worst_area = 750.1`** **(+0,036)** ‚Äî refor√ßos adicionais pr√≥-Maligno.

**Ajustes pequenos / neutros:**

* **`texture_error = 1.194`** (~0) e **`symmetry_error = 0.019`** (~0) t√™m efeito marginal neste caso.

**Freios que **reduzem** o risco (barras verdes):**

* **`compactness_error = 0.034`** **(‚àí0,082)** ‚Äî neste regime, maior "erro" de compacidade atua como amortecedor.
* **`mean_compactness = 0.152`** **(‚àí0,186)** ‚Äî **principal queda**: valores altos de compacidade m√©dia, **condicionais** √†s vari√°veis "worst", tendem a puxar para o lado benigno no nosso LR_L2.
* **`area_error = 22.69`** **(‚àí0,006)** ‚Äî ajuste fino, pequeno.

**Leitura final:** mesmo com dois freios relevantes no fim, o conjunto de sinais fortes em **"pior caso"** (**worst_concavity**, **worst_texture**, **worst_symmetry**) e em **concavidade** (**mean_concave_points**) mant√©m a probabilidade em **~0,60**, **acima do limiar 0,50**, logo **classificado como Maligno**.

In [12]:
# Break Down: prob ‚âà 0.80
label = "p_0.80"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()

                          variable variable_value  contribution  cumulative
0                        intercept                     0.381416    0.381416
1            worst_texture = 32.29          32.29      0.111739    0.493156
2      compactness_error = 0.01172        0.01172      0.058129    0.551285
3       mean_compactness = 0.07214        0.07214      0.018088    0.569373
4               worst_area = 826.4          826.4      0.030659    0.600032
5   concave_points_error = 0.01269        0.01269      0.034325    0.634356
6               area_error = 27.41          27.41      0.127278    0.761634
7          worst_symmetry = 0.2722         0.2722      0.016814    0.778448
8          symmetry_error = 0.0187         0.0187      0.002959    0.781407
9            texture_error = 1.385          1.385     -0.038574    0.742833
10        worst_smoothness = 0.106          0.106     -0.039545    0.703288
11        worst_concavity = 0.1611         0.1611      0.021085    0.724373
12   mean_co

### üîç Breakdown ‚Äî amostra **p_0.80** (prob. final ‚âà **0,806**)

**O que empurrou para cima (pr√≥-Maligno):**

* **`area_error = 27.41`** **(+0,127)** ‚Äî maior varia√ß√£o de √°rea est√° entre os **maiores impulsos** de risco.
* **`worst_texture = 32.29`** **(+0,112)** ‚Äî textura no pior caso alta √© um forte ind√≠cio de malignidade.
* **`mean_concave_points = 0.030`** **(+0,082)** ‚Äî presen√ßa m√©dia de pontos c√¥ncavos eleva significativamente a probabilidade.
* **`compactness_error = 0.0117`** **(+0,058)** e **`worst_area = 826.4`** **(+0,031)** ‚Äî refor√ßos adicionais, coerentes com morfologia mais agressiva.
* Incrementos menores, mas no mesmo sentido:
  **`concave_points_error = 0.0127`** **(+0,034)**, **`worst_symmetry = 0.272`** **(+0,017)**,
  **`worst_concavity = 0.161`** **(+0,021)**, **`symmetry_error = 0.0187`** **(+0,003)**.

**O que freou (pr√≥-Benigno):**

* **`worst_smoothness = 0.106`** **(‚àí0,040)** e **`texture_error = 1.385`** **(‚àí0,039)** ‚Äî amortecem um pouco o score, mas **n√£o** mudam o desfecho.

**Leitura final:** partindo do **intercepto (0,381)**, a combina√ß√£o de **textura/√°rea no pior caso elevadas** e **medidas de concavidade** empurra o score para **~0,81** ‚Äî **bem acima de 0,50**, portanto **classificado como Maligno**.

In [13]:
# Break Down: prob ‚âà 1.00 (pmax)
label = "pmax"
obs   = obs_for_breakdown[label]
bd    = explainer.predict_parts(new_observation=obs, type="break_down", keep_distributions=True)

meta  = selected_df[selected_df["selection_label"] == label].iloc[0]
title = (f"Breakdown ‚Äî {label}  (target={meta['target_p']:.2f}, "
         f"achieved={meta['achieved_p']:.3f}, source={meta['source']})")

print(bd.result[["variable","variable_value","contribution","cumulative"]])

fig = plot_breakdown_from_bd(bd, title=title)
fig.show()

                          variable variable_value  contribution  cumulative
0                        intercept                 3.814162e-01    0.381416
1               area_error = 199.7          199.7  4.250201e-01    0.806436
2            worst_texture = 47.16          47.16  1.833300e-01    0.989766
3    mean_concave_points = 0.08646        0.08646  1.022608e-02    0.999992
4              worst_area = 3432.0         3432.0  7.568126e-06    1.000000
5      compactness_error = 0.01478        0.01478 -1.835081e-07    1.000000
6         worst_concavity = 0.3442         0.3442  2.305173e-07    1.000000
7         symmetry_error = 0.01367        0.01367  1.763440e-09    1.000000
8        worst_smoothness = 0.1401         0.1401  3.692027e-10    1.000000
9          worst_symmetry = 0.2868         0.2868  7.554923e-11    1.000000
10       mean_compactness = 0.1143         0.1143 -1.248649e-10    1.000000
11  concave_points_error = 0.00928        0.00928  1.202322e-10    1.000000
12          

### üîç Breakdown ‚Äî amostra **pmax** (prob. final ‚âà **1.000**)

**Impulsos decisivos (pr√≥-Maligno):**

* **`area_error = 199.7`** **(+0.425)** ‚Üí √© o **maior motor** do caso. Varia√ß√£o de √°rea extremamente alta empurra o score de **0.38 ‚Üí 0.81** sozinha.
* **`worst_texture = 47.16`** **(+0.183)** ‚Üí textura no pior caso **muito elevada** leva o score de **0.81 ‚Üí 0.99**.
* **`mean_concave_points = 0.0865`** **(+0.010)** ‚Üí pequeno empurr√£o adicional para ~**1.00**.
* **`worst_area = 3432.0`** **(+7.6e-06)** ‚Üí valor **extremo**, por√©m j√° em zona de satura√ß√£o do modelo; contribui marginalmente porque a probabilidade j√° est√° no teto.

**Ajustes residuais (quase nulos):**

* **`compactness_error = 0.0148`** (‚àí1.8e-07), **`worst_concavity = 0.344`** (+2.3e-07),
  **`symmetry_error = 0.0137`** (+1.8e-09), **`worst_smoothness = 0.140`** (+3.7e-10),
  **`worst_symmetry = 0.287`** (+7.6e-11), **`mean_compactness = 0.114`** (‚àí1.2e-10),
  **`concave_points_error = 0.0093`** (+1.2e-10), **`texture_error = 1.617`** (‚àí4.9e-12).
  Esses termos aparecem, mas o efeito √© **irrelevante** pois o score j√° colou em **1.00**.

**Leitura final:** a combina√ß√£o **muito extrema** de **varia√ß√£o de √°rea** e **textura no pior caso** faz o modelo **saturar** (probabilidade ‚âà **1.0**). Os demais preditores t√™m influ√™ncia residual porque, na escala log√≠stica, **incrementos adicionais ap√≥s ~0.99 quase n√£o movem** a probabilidade.

**Intui√ß√£o cl√≠nica/modelo:** padr√µes morfol√≥gicos **muito irregulares e heterog√™neos** (grande **erro/varia√ß√£o de √°rea** e **textura** no pior cen√°rio) s√£o fortemente associados a malignidade; aqui, esses sinais s√£o t√£o expressivos que dominam completamente a decis√£o.


### ‚úÖ Conclus√µes

Encerramos este notebook de **explicabilidade** mostrando como o *pipeline* **LR L2 + MoreStable12** toma decis√µes para casos individuais usando **DALEx** (Permutation Importance, PDPs/ICE e Break Down):

**O que aprendemos**

* **Coer√™ncia global vs. local**: as vari√°veis destacadas globalmente (Permutation Importance) tamb√©m aparecem, com frequ√™ncia, como motores locais nos *breakdowns*.
* **Dire√ß√µes consistentes**: sinais dos **coeficientes da LR** e efeitos nos **PDPs** alinham-se com as contribui√ß√µes locais ‚Äî p.ex., valores altos de *worst_texture*, *worst_area* e *area_error* empurram a probabilidade para **Maligno**.
* **Satura√ß√£o do risco**: em casos extremos (*pmin/pmax*), contribui√ß√µes finais tendem a ser residuais ‚Äî o risco j√° est√° quase decidido antes das √∫ltimas vari√°veis entrarem.
* **Sensibilidade local**: alguns casos no "meio" da escala (p.ex., ~0.4‚Äì0.6) evidenciam **trade-offs**: pequenas varia√ß√µes em *mean_concave_points*, *worst_concavity* ou *area_error* podem alterar a decis√£o final.

**Boas pr√°ticas e limites**

* **Permutation Importance ‚â† coeficiente**: a import√¢ncia por permuta√ß√£o mede **impacto no desempenho** ao perturbar a vari√°vel; coeficientes medem o **peso linear** no modelo. Diverg√™ncias s√£o esperadas, sobretudo quando h√° correla√ß√£o entre preditores.
* **Amostras sint√©ticas**: quando usadas para cobrir extremos, servem ao entendimento, mas podem exibir padr√µes pouco prov√°veis no mundo real ‚Äî interpret√°-las com parcim√¥nia.
* **Explica√ß√µes s√£o condicionais**: *breakdowns* dependem do ponto do espa√ßo; n√£o substituem uma an√°lise global.

**Como usar no dia a dia**

* **Auditoria de decis√µes**: Break Down para casos cr√≠ticos (falsos negativos/positivos), registrando as principais contribui√ß√µes.
* **Melhoria cont√≠nua**: monitorar se a import√¢ncia relativa muda com dados novos (deriva).
* **Suporte cl√≠nico**: usar gr√°ficos (PDP/ICE) como material de discuss√£o para validar se os efeitos aprendidos fazem sentido cl√≠nico.

> Em resumo, o modelo est√° **explic√°vel e consistente**: as vari√°veis do **MoreStable12** exercem efeitos alinhados ao conhecimento do dom√≠nio e √†s m√©tricas. As visualiza√ß√µes aqui reunidas fornecem uma base s√≥lida para **confian√ßa**, **auditoria** e **comunica√ß√£o** com stakeholders cl√≠nicos e t√©cnicos.