tests/general/test_limeexplainer.py

# pylint: disable=import-error, wrong-import-position, wrong-import-order, duplicate-code
"""LIME explainer test suite"""

from common import *

import pytest

from trustyai.explainers import LimeExplainer
from trustyai.utils import TestModels
from trustyai.model import feature, Model, simple_prediction
from trustyai.metrics import ExplainabilityMetrics
from trustyai.visualizations import plot

from org.kie.trustyai.explainability.local import (
    LocalExplanationException,
)


def mock_features(n_features: int):
    return [mock_feature(i, f"f-num{i}") for i in range(n_features)]


def test_empty_prediction():
    """Check if the explanation returned is not null"""
    lime_explainer = LimeExplainer(seed=0, samples=10, perturbations=1)
    inputs = []
    model = TestModels.getSumSkipModel(0)
    outputs = model.predict([inputs])[0].outputs
    with pytest.raises(LocalExplanationException):
        lime_explainer.explain(inputs=inputs, outputs=outputs, model=model)


def test_non_empty_input():
    """Test for non-empty input"""
    lime_explainer = LimeExplainer(seed=0, samples=10, perturbations=1)
    features = [feature(name=f"f-num{i}", value=i, dtype="number") for i in range(4)]

    model = TestModels.getSumSkipModel(0)
    outputs = model.predict([features])[0].outputs
    saliency_map = lime_explainer.explain(inputs=features, outputs=outputs, model=model)
    assert saliency_map is not None


def test_sparse_balance():  # pylint: disable=too-many-locals
    """Test sparse balance"""
    for n_features in range(1, 4):
        lime_explainer_no_penalty = LimeExplainer(samples=100, penalise_sparse_balance=False)

        features = mock_features(n_features)

        model = TestModels.getSumSkipModel(0)
        outputs = model.predict([features])[0].outputs

        saliency_map_no_penalty = lime_explainer_no_penalty.explain(
            inputs=features, outputs=outputs, model=model
        ).saliency_map()

        assert saliency_map_no_penalty is not None

        decision_name = "sum-but0"
        saliency_no_penalty = saliency_map_no_penalty.get(decision_name)

        lime_explainer = LimeExplainer(samples=100, penalise_sparse_balance=True)

        saliency_map = lime_explainer.explain(inputs=features, outputs=outputs, model=model).saliency_map()
        assert saliency_map is not None

        saliency = saliency_map.get(decision_name)

        for i in range(len(features)):
            score = saliency.getPerFeatureImportance().get(i).getScore()
            score_no_penalty = (
                saliency_no_penalty.getPerFeatureImportance().get(i).getScore()
            )
            assert abs(score) <= abs(score_no_penalty)


def test_normalized_weights():
    """Test normalized weights"""
    lime_explainer = LimeExplainer(normalise_weights=True, perturbations=2, samples=10)
    n_features = 4
    features = mock_features(n_features)
    model = TestModels.getSumSkipModel(0)
    outputs = model.predict([features])[0].outputs

    saliency_map = lime_explainer.explain(inputs=features, outputs=outputs, model=model).saliency_map()
    assert saliency_map is not None

    decision_name = "sum-but0"
    saliency = saliency_map.get(decision_name)
    per_feature_importance = saliency.getPerFeatureImportance()
    for feature_importance in per_feature_importance:
        assert -3.0 < feature_importance.getScore() < 3.0


def lime_plots(block):
    """Test normalized weights"""
    lime_explainer = LimeExplainer(normalise_weights=False, perturbations=2, samples=10)
    n_features = 15
    features = mock_features(n_features)
    model = TestModels.getSumSkipModel(0)
    outputs = model.predict([features])[0].outputs

    explanation = lime_explainer.explain(inputs=features, outputs=outputs, model=model)
    plot(explanation, block=block)
    plot(explanation, block=block, render_bokeh=True)
    plot(explanation, block=block, output_name="sum-but0")
    plot(explanation, block=block, output_name="sum-but0", render_bokeh=True)


@pytest.mark.block_plots
def test_lime_plots_blocking():
    lime_plots(True)


def test_lime_plots():
    lime_plots(False)


def test_lime_v2():
    np.random.seed(0)
    data = pd.DataFrame(np.random.rand(1, 5)).values

    model_weights = np.random.rand(5)
    predict_function = lambda x: np.stack([np.dot(x, model_weights), 2 * np.dot(x, model_weights)], -1)
    model = Model(predict_function)

    explainer = LimeExplainer(samples=100, perturbations=2, seed=23, normalise_weights=False)
    explanation = explainer.explain(inputs=data, outputs=model(data), model=model)

    for score in explanation.as_dataframe()["output-0"]['Saliency']:
        assert score != 0

    for out_name, df in explanation.as_dataframe().items():
        assert "Feature" in df
        assert "output" in out_name
        assert all([x in str(df) for x in "01234"])


def test_impact_score():
    np.random.seed(0)
    data = pd.DataFrame(np.random.rand(1, 5))
    model_weights = np.random.rand(5)
    predict_function = lambda x: np.dot(x.values, model_weights)
    model = Model(predict_function, dataframe_input=True)
    output = model(data)
    pred = simple_prediction(data, output)
    explainer = LimeExplainer(samples=100, perturbations=2, seed=23, normalise_weights=False)
    explanation = explainer.explain(inputs=data, outputs=output, model=model)
    saliency = list(explanation.saliency_map().values())[0]
    top_features_t = saliency.getTopFeatures(2)
    impact = ExplainabilityMetrics.impactScore(model, pred, top_features_t)
    assert impact > 0
    return impact


def test_lime_as_html():
    np.random.seed(0)
    data = np.random.rand(1, 5)

    model_weights = np.random.rand(5)
    predict_function = lambda x: np.stack([np.dot(x, model_weights), 2 * np.dot(x, model_weights)], -1)

    model = Model(predict_function, disable_arrow=True)

    explainer = LimeExplainer()
    explainer.explain(inputs=data, outputs=model(data), model=model)
    assert True

    explanation = explainer.explain(inputs=data, outputs=model(data), model=model)
    for score in explanation.as_dataframe()["output-0"]['Saliency']:
        assert score != 0


def test_lime_numpy():
    np.random.seed(0)
    data = np.random.rand(101, 5)
    model_weights = np.random.rand(5)
    predict_function = lambda x: np.stack([np.dot(x, model_weights), 2 * np.dot(x, model_weights)], -1)
    fnames = ['f{}'.format(x) for x in "abcde"]
    onames = ['o{}'.format(x) for x in "12"]
    model = Model(predict_function,
                  feature_names=fnames,
                  output_names=onames
                  )

    explainer = LimeExplainer()
    explanation = explainer.explain(inputs=data[0], outputs=model(data[0]), model=model)

    for oname in onames:
        assert oname in explanation.as_dataframe().keys()
        for fname in fnames:
            assert fname in explanation.as_dataframe()[oname]['Feature'].values