# 自動 Machine Learning の説明を確認する

機械学習がますます普及するにつれて、モデルによる予測は私たちの社会の多くの側面に大きな影響を与えます。たとえば、機械学習モデルは、銀行が融資を許可するか、医師が治療の優先順位を決定する方法においてますます重要な要素となっています。モデルを解釈して説明する能力はますます重要になり、機械学習モデルによる予測の根拠を説明し、正当化し、モデル内の不注意な偏りを特定することができます。

自動機械学習を使用してモデルをトレーニングする場合、各機能 (前処理変換によって生成されたエンジニアリング フィーチャーを含む) がラベル予測に影響を与える程度を定量化する機能の重要性の説明を生成するオプションがあります。このラボでは、自動 Machine Learning 実験によって生成された説明について説明します。


## ワークスペースに接続する

まず、Azure ML SDK を使用してワークスペースに接続する必要があります。

> **注**: 前回の演習を完了してから Azure サブスクリプションとの認証済みセッションの有効期限が切れている場合は、再認証を求めるメッセージが表示されます。

In [None]:
import azureml.core
from azureml.core import Workspace

# 保存した構成ファイルからワークスペースを読み込む
ws = Workspace.from_config()
print('Ready to use Azure ML {} to work with {}'.format(azureml.core.VERSION, ws.name))

## 自動 Machine Learning 実験を実行する

このラボの時間を短縮するために、ローカル コンピューティングで 3 回の反復のみで自動 Machine Learning 実験を実行します。

**model_explainability** 構成オプションが **True** に設定されていることに注意してください。

In [None]:
import pandas as pd
from azureml.train.automl import AutoMLConfig
from azureml.core.experiment import Experiment
from azureml.widgets import RunDetails

# データを読み込む
train_data = pd.read_csv('data/diabetes.csv')

# 自動 ML を構成する
automl_config = AutoMLConfig(name='Automated ML Experiment',
                             task='classification',
                             compute_target='local',
                             training_data = train_data,
                             n_cross_validations = 2,
                             label_column_name='Diabetic',
                             iterations=3,
                             primary_metric = 'AUC_weighted',
                             max_concurrent_iterations=3,
                             featurization='off',
                             model_explainability=True # フィーチャーの重要度を生成します!
                             )

# 自動 ML 実験を実行する
print('Submitting Auto ML experiment...')
automl_experiment = Experiment(ws, 'diabetes_automl')
automl_run = automl_experiment.submit(automl_config)
automl_run.wait_for_completion(show_output=True)
RunDetails(automl_run).show()

## フィーチャーの重要度を表示する

上のウィジェットで実験が完了したら、最適な結果を生成した実行をクリックして詳細を表示します。次に、視覚化の下部までスクロールして、フィーチャーの相対的な重要度を確認します。

**ExplanationClient**クラスを使用して、実験によって生成された最適なモデルのフィーチャーの重要度を表示することもできます。

In [None]:
from azureml.contrib.interpret.explanation.explanation_client import ExplanationClient

# 最適なモデルを取得する (出力の 2 番目の項目)
best_run, fitted_model = automl_run.get_output()

# フィーチャーの説明を取得する
client = ExplanationClient.from_run(best_run)
engineered_explanations = client.download_model_explanation()
feature_importances = engineered_explanations.get_feature_importance_dict()

# 全体フィーチャーの重要度
print('Feature\tImportance')
for key, value in feature_importances.items():
    print(key, '\t', value)

## Azure Machine Learning Studio でモデルの説明を表示する

実験の実行が完了したら、ウィジェット内のリンクをクリックして Azure Machine Learning Studio で実行を確認し、**説明**タブを表示します。そして:

1.自動 Machine Learning によって作成された Explainer を選択します。
2.全体的なグローバル フィーチャーの重要度を示す**グローバル重要度**グラフを表示します。
3.**サマリー重要度**グラフを表示すると、*スウォーム*、*バイオリン*、*ボックス*プロットのテスト データの各データ ポイントが表示されます。
4.個々のポイントを選択すると、選択したデータ ポイントの個々の予測の**ローカル フィーチャーの重要度** が表示されます。

## 自動設計フィーチャーの重要度を表示する

自動 Machine Learning には、データの前処理を試みるオプションが含まれており、多くの場合、モデルのトレーニング元となる新しい派生フィーチャーを作成するための*フィーチャー エンジニアリング*を実行します。このオプションを有効にして、自動 Machine Learning 実験を再実行してみましょう。

In [None]:
import pandas as pd
from azureml.train.automl import AutoMLConfig
from azureml.core.experiment import Experiment
from azureml.widgets import RunDetails

# データを読み込む
train_data = pd.read_csv('data/diabetes.csv')

# 自動 ML を構成する
automl_config = AutoMLConfig(name='Automated ML Experiment',
                             task='classification',
                             compute_target='local',
                             training_data = train_data,
                             n_cross_validations = 2,
                             label_column_name='Diabetic',
                             iterations=3,
                             primary_metric = 'AUC_weighted',
                             max_concurrent_iterations=3,
                             featurization='auto', # フィーチャー エンジニアリングを有効にする
                             model_explainability=True # フィーチャーの重要度を生成する
                             )

# 自動 ML 実験を実行する
print('Submitting Auto ML experiment...')
automl_experiment = Experiment(ws, 'diabetes_automl')
automl_run = automl_experiment.submit(automl_config)
automl_run.wait_for_completion(show_output=True)
RunDetails(automl_run).show()

機能化、[Scikit-Learn 変換パイプライン](https://scikit-learn.org/stable/modules/compose.html#combining-estimators)を使用して実現されます (Azure Machine Learning パイプラインと混同しないでください)。これらは、推論する前にデータを変換するステップを含むモデルを生成します。

次のコードを実行して、モデル パイプラインのステップ、エンジニアリングされたフィーチャーの重要度を表示します。

In [None]:
from azureml.contrib.interpret.explanation.explanation_client import ExplanationClient

# 最適なモデルを取得する (出力の 2 番目の項目)
best_run, fitted_model = automl_run.get_output()

print('Model pipeline steps:')
for step in fitted_model.named_steps:
    print('-',step)
    
# フィーチャーの説明を取得する
client = ExplanationClient.from_run(best_run)
engineered_explanations = client.download_model_explanation(raw=False)
feature_importances = engineered_explanations.get_feature_importance_dict()

# 全体フィーチャーの重要度
print('\nFeature\tImportance')
for key, value in feature_importances.items():
    print(key, '\t', value)

> **詳細情報**: 自動 Machine Learning の詳細については、[Azure ML のドキュメント](https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train)を参照してください。