# 説明可能性

[恵木 (2020)](https://www.jstage.jst.go.jp/article/jssmjournal/34/1/34_20/_pdf/-char/ja)の分類に則ると、4つに分けられる

1. 因子型：「この特徴量の値がこれだからこの予測結果」
2. 事例型：「似たような事例はこうだったから」
3. 知識型：「AIはここの要素が弱いと考えた」
4. 反実型：「もしこの特徴量の値がこれだったらこの予測結果となった」

## 因子型

LIME、SHAPなど

## 事例型

予測対象と類似した訓練事例を出すアプローチ

### k近傍のサンプルを出す方法

### Influence function

- [Koh & Liang (2017)](http://proceedings.mlr.press/v70/koh17a/koh17a.pdf)が提案
- [Hara et al. (2019)](https://proceedings.neurips.cc/paper/2019/file/5f14615696649541a025d3d0f8e0447f-Paper.pdf)はconvexでない損失関数にも使えるよう拡張
- [Guo et al. (2020)](https://arxiv.org/abs/2012.15781)（Salesforce）のFastIFはk近傍に絞って計算することで訓練を高速化

### TracIn

SGDにおいて各インスタンスが誤差をどれだけ増減させるかを見てインスタンスの影響度を測るアプローチ

- [TracIn — A Simple Method to Estimate Training Data Influence – Google Research Blog](https://blog.research.google/2021/02/tracin-simple-method-to-estimate.html?m=1)
- [[2002.08484] Estimating Training Data Influence by Tracing Gradient Descent](https://arxiv.org/abs/2002.08484)

### ProtoDash

事例ベースの説明。 AI Explainability 360パッケージで実行できる

[[1707.01212] Efficient Data Representation by Selecting Prototypes with Importance Weights](https://arxiv.org/abs/1707.01212)


### 反実型

[[2010.10596] Counterfactual Explanations and Algorithmic Recourses for Machine Learning: A Review](https://arxiv.org/abs/2010.10596)

## ライブラリ

### AI Explainability 360

いろいろな論文でまとめられた説明に関する手法をまとめたライブラリ

- Docs: https://aix360.res.ibm.com/
- Github: https://github.com/Trusted-AI/AIX360
- PyPI: https://pypi.org/project/aix360/



#### ProtoDash

`ProtodashExplainer` で実行できる

[Directly Interpretable Unsupervised Explainers — aix360 0.1 documentation](https://aix360.readthedocs.io/en/latest/die.html#protodash-explainer)


```python
# 1. データの用意
# https://scikit-learn.org/stable/datasets/real_world.html#california-housing-dataset
# 1レコード = 地区ブロック
# y: 10万ドル単位の、地区ブロックの住宅価格の中央値
from sklearn.datasets import fetch_california_housing
X, y = fetch_california_housing(as_frame=True, return_X_y=True)
X.assign(y = y)

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y)

# 2. 予測モデルの学習
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor(max_depth=2, random_state=0)
model.fit(X_train, y_train)

from sklearn.metrics import mean_absolute_percentage_error
y_pred = model.predict(X_test)
print(f"MAPE={mean_absolute_percentage_error(y_test, y_pred):.1%}")

# 3. 説明
from aix360.algorithms.protodash import ProtodashExplainer
e = ProtodashExplainer()
e.explain(
    X=X_train, # X (double 2d array) – Dataset you want to explain.
    Y=X_test, # Y (double 2d array) – Dataset to select prototypical explanations from.
    m=3, # m (int) – Number of prototypes
    kernelType="other", # kernelType (str) – Type of kernel (viz. ‘Gaussian’, / ‘other’)
)
```



## 参考

### サーベイ・チュートリアル

- [JSAI2023 チュートリアル「解釈可能な機械学習 〜説明は人のためか〜」 - Speaker Deck](https://speakerdeck.com/yuyay/jsai2023-tiyutoriaru-jie-shi-ke-neng-naji-jie-xue-xi-shuo-ming-haren-notameka)
- [亀谷由隆. (2022). 説明可能 AI 技術のこれまでとこれから. 電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review, 16(2), 83-92.](https://www.jstage.jst.go.jp/article/essfr/16/2/16_83/_pdf/-char/ja)
- [恵木正史. (2020). XAI (eXplainable AI) 技術の研究動向. 日本セキュリティ・マネジメント学会誌, 34(1), 20-27.](https://www.jstage.jst.go.jp/article/jssmjournal/34/1/34_20/_pdf/-char/ja)