# dp100_17 ハイパーパラメータ調整

## 検索空間を定義する

ハイパーパラメータの調整中に思考されたハイパーパラメータのセットは"検索空間"と呼ばれる。  
選択可能な値の範囲の定義は、ハイパーパラメータの型によって異なる。

### 不連続ハイパーパラメータ

**choice**を使用して、明示的な値のリストから個別のパラメータの検索空間を定義できる。  
これはPythonで以下のように定義できる。

- **リスト(choice([10,20,30]))**
- **範囲(choice(range(1,10)))**
- **任意のコンマ区切りのセット(choice(30,50.100))**

次のいずれかの離散型分布から不連続値を選択することもできる。

- qnormal
- quniform
- qlognormal
- qloguniform

### 連続ハイパーパラメータ

一部のハイパーパラメータは"連続"、つまりスケールに沿って任意の値を使用できる。  
これらの種類の値の検索空間を定義するには、次のいずれかの分布の種類を使用できる。

- 普通
- uniform
- lognormal
- loguniform

### 検索空間を定義する

名前付きハイパーパラメータ毎に適切なパラメータ式を使用して、例えば以下のように辞書を作成する。  

```
from azureml.train.hyperdrive import choice, normal

param_space = {
                 '--batch_size': choice(16, 32, 64),
                 '--learning_rate': normal(10, 3)
              }
```

## サンプリングを構成する

ハイパーパラメータの調整実行で使用される特定の値は、使用する"サンプリング"の種類によって異なる。

### グリッドサンプリング

すべてのハイパーパラメータが不連続の場合にのみ使用できる。  
また、検索空間内のパラメータのすべての組み合わせを試すために使用される。以下の例では各パラメータの値すべての組み合わせを試す。

```
from azureml.train.hyperdrive import GridParameterSampling, choice

param_space = {
                 '--batch_size': choice(16, 32, 64),
                 '--learning_rate': choice(0.01, 0.1, 1.0)
              }

param_sampling = GridParameterSampling(param_space)
```

### ランダムサンプリング

ランダムに選択するため、不連続値と連続値を混在させることができる。

```
from azureml.train.hyperdrive import RandomParameterSampling, choice, normal

param_space = {
                 '--batch_size': choice(16, 32, 64),
                 '--learning_rate': normal(10, 3)
              }

param_sampling = RandomParameterSampling(param_space)
```

### ベイジアンサンプリング

ベイジアン最適化アルゴリズムに基づいてハイパーパラメータ値を選択する。  
これにより、前の選択からパフォーマンスが向上するパラメータの組み合わせを選択しようとする。

```
from azureml.train.hyperdrive import BayesianParameterSampling, choice, uniform

param_space = {
                 '--batch_size': choice(16, 32, 64),
                 '--learning_rate': uniform(0.05, 0.1)
              }

param_sampling = BayesianParameterSampling(param_space)
```

> 注:ベイジアンサンプリングは、**choice**、**uniform**、**quniform**のパラメータ式でのみ使用でき、  
早期終了ポリシーと組み合わせることができない。

## 早期終了を構成する

時間の無駄にするのを防ぐために、以前に完了した実行よりも良い結果が生成される可能性が低い実行を破棄する早期終了ポリシーを設定できる。  
このポリシーは、ターゲットパフォーマンスメトリックがログに記録されるたびに、指定した*evaluation_interval*で評価される。  
また、*delay_evaluation*パラメータを設定して、最小数の反復が完了するまでポリシーが評価されないようにすることもできる。

> 注:早期終了は、DNN多数のエポックに対して反復的にトレーニングされるディープラーニングのシナリオに特に役立つ。  
トレーニングスクリプトでは、各エポックの後にターゲットメトリックを報告でき、パフォーマンスが前の実行を大幅に下回っている場合はその実行を破棄できる。

### バンディットポリシー

バンディットポリシーを使用すると、ターゲットパフォーマンスメトリックがそれまでの最適な実行を指定されたマージンで下回った場合、  
実行を停止することができる。以下の例では、最初の5回のあとのすべての反復にポリシーを適用し、ターゲットメトリックが最良実行より0.2下回ってたら破棄する。  
また、スラック"係数"を用いてバンディットポリシーを適用することもでき、この場合は比率として比較される。


```
from azureml.train.hyperdrive import BanditPolicy

early_termination_policy = BanditPolicy(slack_amount = 0.2,
                                        evaluation_interval=1,
                                        delay_evaluation=5)
```

### 中央値の停止ポリシー

ターゲットパフォーマンスメトリックがすべての実行の移動平均の中央値を下回っている実行を破棄。

```
from azureml.train.hyperdrive import MedianStoppingPolicy

early_termination_policy = MedianStoppingPolicy(evaluation_interval=1,
                                                delay_evaluation=5)
```

### 切り捨て選択ポリシー

切り捨て選択ポリシーでは、*X*に対して指定した*truncation_percentage*値に基づいて、  
各評価間隔でパフォーマンスが低い*X*%の実行を取り消す。

```
from azureml.train.hyperdrive import TruncationSelectionPolicy

early_termination_policy = TruncationSelectionPolicy(truncation_percentage=10,
                                                     evaluation_interval=1,
                                                     delay_evaluation=5)
```

## ハイパーパラメータの調整実験を実行する

AzureMLでは、"ハイパードライブ"実験を実行してハイパーパラメータを調整できる。

### ハイパーパラメータ調整用のトレーニングスクリプトを作成する

ハイパードライブ実験を実行するには、他のトレーニング実験と同様の方法でトレーニングスクリプトを作成する必要がある。  
ただし、**スクリプトは次のことを行う必要がある。**

- 変更するハイパーパラメータごとに引数を含める
- ターゲットパフォーマンスメトリックをログに記録する。これにより、ハイパードライブの実行によって開始された子実行のパフォーマンスが評価され、  
最適なパフォーマンスのモデルが生成されるものを特定できる。

例えば、次のサンプルスクリプトでは、**--regularization**引数を使用して"正規化率"ハイパーパラメータを設定するロジスティック回帰モデルをトレーニングし、  
"正確性"メトリックを**Accuracy**の名前でログに記録している。

```
import argparse
import joblib
from azureml.core import Run
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# Get regularization hyperparameter
parser = argparse.ArgumentParser()
parser.add_argument('--regularization', type=float, dest='reg_rate', default=0.01)
args = parser.parse_args()
reg = args.reg_rate

# Get the experiment run context
run = Run.get_context()

# load the training dataset
data = run.input_datasets['training_data'].to_pandas_dataframe()

# Separate features and labels, and split for training/validatiom
X = data[['feature1','feature2','feature3','feature4']].values
y = data['label'].values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30)

# Train a logistic regression model with the reg hyperparameter
model = LogisticRegression(C=1/reg, solver="liblinear").fit(X_train, y_train)

# calculate and log accuracy
y_hat = model.predict(X_test)
acc = np.average(y_hat == y_test)
run.log('Accuracy', np.float(acc))

# Save the trained model
os.makedirs('outputs', exist_ok=True)
joblib.dump(value=model, filename='outputs/model.pkl')

run.complete()
```

> Scikit-Learn LogisticRegressionクラスでは、**C**は正規化率の"逆数"であることに注意すること(C = 1/reg)

### ハイパードライブ実験の構成と実行

ハイパードライブ実験を準備するには、次のコード例に示すように**HyperDriveConfig**オブジェクトを使用して実験の実行を構成する必要がある。

```
from azureml.core import Experiment
from azureml.train.hyperdrive import HyperDriveConfig, PrimaryMetricGoal

# Assumes ws, script_config and param_sampling are already defined

hyperdrive = HyperDriveConfig(run_config=script_config,
                              hyperparameter_sampling=param_sampling,
                              policy=None,
                              primary_metric_name='Accuracy',
                              primary_metric_goal=PrimaryMetricGoal.MAXIMIZE,
                              max_total_runs=6,
                              max_concurrent_runs=4)

experiment = Experiment(workspace = ws, name = 'hyperdrive_training')
hyperdrive_run = experiment.submit(config=hyperdrive)
```

### ハイパードライブの実行の監視と確認

ハイパードライブ実験は、AzureMLスタジオで監視できる。  
また、ノートbっくの**RunDetails**ウィジェットを使用することもできる。

実験では、思考するハイパーパラメータの組み合わせ毎に子の実行を開始する。以下のコードを使用してログに記録されたメトリックを取得できる。

```
for child_run in run.get_children():
    print(child_run.id, child_run.get_metrics())
```

次のようにパフォーマンスの降順ですべての実行を一覧表示することもできる。

```
for child_run in hyperdrive_run.get_children_sorted_by_primary_metric():
    print(child_run)
```

最適な実行を取得するには、次のコードを使用する。

```
best_run = hyperdrive_run.get_best_run_by_primary_metric()
```

## 演習 ハイパーパラメータを調整する

### ワークスペースへの接続

In [1]:
import azureml.core
from azureml.core import Workspace

# Load the workspace from the saved config file
ws = Workspace.from_config()
print('Ready to use Azure ML {} to work with {}'.format(azureml.core.VERSION, ws.name))

Ready to use Azure ML 1.28.0 to work with 20210613


### データの準備

In [2]:
from azureml.core import Dataset

default_ds = ws.get_default_datastore()

if 'diabetes dataset' not in ws.datasets:
    default_ds.upload_files(files=['./data/diabetes.csv', './data/diabetes2.csv'], # Upload the diabetes csv files in /data
                        target_path='diabetes-data/', # Put it in a folder path in the datastore
                        overwrite=True, # Replace existing files of the same name
                        show_progress=True)

    #Create a tabular dataset from the path on the datastore (this may take a short while)
    tab_data_set = Dataset.Tabular.from_delimited_files(path=(default_ds, 'diabetes-data/*.csv'))

    # Register the tabular dataset
    try:
        tab_data_set = tab_data_set.register(workspace=ws, 
                                name='diabetes dataset',
                                description='diabetes data',
                                tags = {'format':'CSV'},
                                create_new_version=True)
        print('Dataset registered.')
    except Exception as ex:
        print(ex)
else:
    print('Dataset already registered.')

Dataset already registered.


### 訓練スクリプトの準備

モデルの学習に使用する訓練スクリプトのフォルダ、スクリプトの作成。

In [3]:
import os

experiment_folder = 'diabetes_training-hyperdrive'
os.makedirs(experiment_folder, exist_ok=True)

print('Folder ready.')

Folder ready.


モデルを学習するためのPythonスクリプトを作成する。この例ではGradient Boostingアルゴリズムを使って分類問題を学習するが、以下点に注意する。

- 最適化したいハイパーパラメータの引数
    - ここでは学習率と推定器の数
- 最適化したい性能指標を記録するコード
    - AUCと精度の両方を記録するので、どちらか一方でモデルを最適化することができる

In [4]:
%%writefile $experiment_folder/diabetes_training.py
# Import libraries
import argparse, joblib, os
from azureml.core import Run
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import roc_auc_score, roc_curve

# Get the experiment run context
run = Run.get_context()

# Get script arguments
parser = argparse.ArgumentParser()

# Input dataset
parser.add_argument("--input-data", type=str, dest='input_data', help='training dataset')

# Hyperparameters
parser.add_argument('--learning_rate', type=float, dest='learning_rate', default=0.1, help='learning rate')
parser.add_argument('--n_estimators', type=int, dest='n_estimators', default=100, help='number of estimators')

# Add arguments to args collection
args = parser.parse_args()

# Log Hyperparameter values
run.log('learning_rate',  np.float(args.learning_rate))
run.log('n_estimators',  np.int(args.n_estimators))

# load the diabetes dataset
print("Loading Data...")
diabetes = run.input_datasets['training_data'].to_pandas_dataframe() # Get the training data from the estimator input

# Separate features and labels
X, y = diabetes[['Pregnancies','PlasmaGlucose','DiastolicBloodPressure','TricepsThickness','SerumInsulin','BMI','DiabetesPedigree','Age']].values, diabetes['Diabetic'].values

# Split data into training set and test set
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30, random_state=0)

# Train a Gradient Boosting classification model with the specified hyperparameters
print('Training a classification model')
model = GradientBoostingClassifier(learning_rate=args.learning_rate,
                                   n_estimators=args.n_estimators).fit(X_train, y_train)

# calculate accuracy
y_hat = model.predict(X_test)
acc = np.average(y_hat == y_test)
print('Accuracy:', acc)
run.log('Accuracy', np.float(acc))

# calculate AUC
y_scores = model.predict_proba(X_test)
auc = roc_auc_score(y_test,y_scores[:,1])
print('AUC: ' + str(auc))
run.log('AUC', np.float(auc))

# Save the model in the run outputs
os.makedirs('outputs', exist_ok=True)
joblib.dump(value=model, filename='outputs/diabetes_model.pkl')

run.complete()

Writing diabetes_training-hyperdrive/diabetes_training.py


### コンピューティングの作成

ハイパーパラメータのチューニングを効率的に行うためにクラスターを作成し、複数のトレーニング反復を同時に実行することができる。

In [5]:
from azureml.core.compute import ComputeTarget, AmlCompute
from azureml.core.compute_target import ComputeTargetException

cluster_name = "msl-20210613b"

try:
    # Check for existing compute target
    training_cluster = ComputeTarget(workspace=ws, name=cluster_name)
    print('Found existing cluster, use it.')
except ComputeTargetException:
    # If it doesn't already exist, create it
    try:
        compute_config = AmlCompute.provisioning_configuration(vm_size='STANDARD_DS11_V2', max_nodes=2)
        training_cluster = ComputeTarget.create(ws, cluster_name, compute_config)
        training_cluster.wait_for_completion(show_output=True)
    except Exception as ex:
        print(ex)
    

Found existing cluster, use it.


### ハイパーパラメータ調整実験の実行

AzureMLには、ハイパードライブ実験によるハイパーパラメータのチューニング機能があり、  
これらの実験はそれぞれ異なるハイパーパラメータの組み合わせで複数の子実行を起動する。  
最良のモデルを生成する実行を特定し、そのトレーニングされたモデルを登録及びデプロイ用に選択することができる。

> 注:この例では、早期停止のポリシーは指定されていない。  
そのようなポリシーが必要になるのはトレーニングスクリプトが複数のトレーニング反復を行い、  
各反復毎に主要な指標を記録する場合。この方法は、DNNを複数のエポックでトレーニングする場合によく用いられる。

In [6]:
from azureml.core import Experiment, ScriptRunConfig, Environment
from azureml.core.conda_dependencies import CondaDependencies
from azureml.train.hyperdrive import GridParameterSampling, HyperDriveConfig, PrimaryMetricGoal, choice
from azureml.widgets import RunDetails

# Create a Python environment for the experiment
sklearn_env = Environment("sklearn-env")

# Ensure the required packages are installed (we need scikit-learn, Azure ML defaults, and Azure ML dataprep)
packages = CondaDependencies.create(conda_packages=['scikit-learn','pip'],
                                    pip_packages=['azureml-defaults','azureml-dataprep[pandas]'])
sklearn_env.python.conda_dependencies = packages

# Get the training dataset
diabetes_ds = ws.datasets.get("diabetes dataset")

# Create a script config
script_config = ScriptRunConfig(source_directory=experiment_folder,
                                script='diabetes_training.py',
                                # ハイパーパラメータではない引数を追加する　ここではトレーニングデータセット
                                arguments = ['--input-data', diabetes_ds.as_named_input('training_data')],
                                environment=sklearn_env,
                                compute_target = training_cluster)

# Sample a range of parameter values
params = GridParameterSampling(
    {
        # ハイパードライブは6つの組み合わせを試し、これらをスクリプトの引数として追加する
        '--learning_rate': choice(0.01, 0.1, 1.0),
        '--n_estimators' : choice(10, 100)
    }
)

# ハイパードライブ設定
hyperdrive = HyperDriveConfig(run_config=script_config, 
                          hyperparameter_sampling=params, 
                          policy=None, # No early stopping policy
                          primary_metric_name='AUC', # Find the highest AUC metric
                          primary_metric_goal=PrimaryMetricGoal.MAXIMIZE, 
                          max_total_runs=6, # Restict the experiment to 6 iterations
                          max_concurrent_runs=2) # Run up to 2 iterations in parallel

# Run the experiment
experiment = Experiment(workspace=ws, name='mslearn-diabetes-hyperdrive')
run = experiment.submit(config=hyperdrive)

# Show the status in the notebook as the experiment runs
RunDetails(run).show()
run.wait_for_completion()

_HyperDriveWidget(widget_settings={'childWidgetDisplay': 'popup', 'send_telemetry': False, 'log_level': 'INFO'…

{'runId': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b',
 'target': 'msl-20210613b',
 'status': 'Completed',
 'startTimeUtc': '2021-06-15T16:18:41.021735Z',
 'endTimeUtc': '2021-06-15T16:35:46.628243Z',
 'properties': {'primary_metric_config': '{"name": "AUC", "goal": "maximize"}',
  'resume_from': 'null',
  'runTemplate': 'HyperDrive',
  'azureml.runsource': 'hyperdrive',
  'platform': 'AML',
  'ContentSnapshotId': '47b50ae6-b100-4825-911b-849fe53e6544',
  'score': '0.9885804604667666',
  'best_child_run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_4',
  'best_metric_status': 'Succeeded'},
 'inputDatasets': [],
 'outputDatasets': [],
 'logFiles': {'azureml-logs/hyperdrive.txt': 'https://202106138491592323.blob.core.windows.net/azureml/ExperimentRun/dcid.HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b/azureml-logs/hyperdrive.txt?sv=2019-02-02&sr=b&sig=tm2Zbbd7xQTYO8%2FQkOHDED7nJltmqxSe0LnpEftD4lM%3D&st=2021-06-15T16%3A25%3A59Z&se=2021-06-16T00%3A35%3A59Z&sp=r'},
 'submittedBy': 'Tatsuya Kato'}



実験の実行状況はウィジェットで確認できる。また、AzureMLスタジオでメインのハイパードライブ実験と子実行を表示することもできる。

> 注:数値以外のものが可視化できないことを示すメッセージが表示された場合、無視しても問題ない。

![image.png](attachment:34a5af0d-bb1c-4a30-9e77-9f79d67d8038.png)

### 最良のパフォーマンスの実行を決定する

すべての実行が終了したら、指定したパフォーマンス指標(ここではAUC)に基づいて、最も良いものを見つけることができる。

In [7]:
# すべての子実行をプライマリメトリックでソートして表示
for child_run in run.get_children_sorted_by_primary_metric():
    print(child_run)

{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_4', 'hyperparameters': '{"--learning_rate": 0.1, "--n_estimators": 100}', 'best_primary_metric': 0.9885804604667666, 'status': 'Completed'}
{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_5', 'hyperparameters': '{"--learning_rate": 1.0, "--n_estimators": 100}', 'best_primary_metric': 0.9853941909447965, 'status': 'Completed'}
{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_2', 'hyperparameters': '{"--learning_rate": 1.0, "--n_estimators": 10}', 'best_primary_metric': 0.982908128731084, 'status': 'Completed'}
{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_3', 'hyperparameters': '{"--learning_rate": 0.01, "--n_estimators": 100}', 'best_primary_metric': 0.9559393638830617, 'status': 'Completed'}
{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_1', 'hyperparameters': '{"--learning_rate": 0.1, "--n_estimators": 10}', 'best_primary_metric': 0.9516323866285732, 'status': 'Completed'}
{'run_id': 'HD_e1b80c59-52d9-4fa7-a7de-3c9

In [8]:
# 最良の実行とそのメトリックと引数を取得
best_run = run.get_best_run_by_primary_metric()
best_run_metrics = best_run.get_metrics()
script_arguments = best_run.get_details() ['runDefinition']['arguments']
print('Best Run Id: ', best_run.id)
print(' -AUC:', best_run_metrics['AUC'])
print(' -Accuracy:', best_run_metrics['Accuracy'])
print(' -Arguments:',script_arguments)

Best Run Id:  HD_e1b80c59-52d9-4fa7-a7de-3c97b9288f8b_4
 -AUC: 0.9885804604667666
 -Accuracy: 0.9457777777777778
 -Arguments: ['--input-data', 'DatasetConsumptionConfig:training_data', '--learning_rate', '0.1', '--n_estimators', '100']


最良な実行が見つかったため、その実行が学習したモデルを登録することができる。

In [9]:
from azureml.core import Model

# Register model
best_run.register_model(model_path='outputs/diabetes_model.pkl', model_name='diabetes_model',
                        tags={'Training context':'Hyperdrive'},
                        properties={'AUC': best_run_metrics['AUC'], 'Accuracy': best_run_metrics['Accuracy']})

# List registered models
for model in Model.list(ws):
    print(model.name, 'version:', model.version)
    for tag_name in model.tags:
        tag = model.tags[tag_name]
        print ('\t',tag_name, ':', tag)
    for prop_name in model.properties:
        prop = model.properties[prop_name]
        print ('\t',prop_name, ':', prop)
    print('\n')

diabetes_model version: 12
	 Training context : Hyperdrive
	 AUC : 0.9885804604667666
	 Accuracy : 0.9457777777777778


diabetes_model version: 11
	 Training context : Inline Training
	 AUC : 0.8780859744265883
	 Accuracy : 0.8903333333333333


diabetes_model version: 10
	 Training context : Inline Training
	 AUC : 0.8778496442609085
	 Accuracy : 0.8906666666666667


diabetes_model version: 9
	 Training context : Pipeline
	 AUC : 0.8854221505732166
	 Accuracy : 0.9004444444444445


diabetes_model version: 8
	 Training context : Compute cluster
	 AUC : 0.8840918562273435
	 Accuracy : 0.8991111111111111


diabetes_model version: 7
	 Training context : File dataset
	 AUC : 0.8568743524381947
	 Accuracy : 0.7891111111111111


diabetes_model version: 6
	 Training context : Tabular dataset
	 AUC : 0.8568509052814499
	 Accuracy : 0.7891111111111111


diabetes_model version: 5
	 Training context : Tabular dataset
	 AUC : 0.8568509052814499
	 Accuracy : 0.7891111111111111


diabetes_model versi

ハイパードライブの詳細URL　: https://docs.microsoft.com/azure/machine-learning/how-to-tune-hyperparameters

## 知識チェック

1. ハイパーパラメーターの調整を使用して、ハイパーパラメーターのセットに最適な不連続値を見つけることを計画しています。  
指定された不連続値のセットのすべての組み合わせを試そうとしています。 どの種類のサンプリングを使用するべきですか?

    - ランダム サンプリング
    - グリッド サンプリング
    - ベイジアン サンプリング


2. "AUC" という名前のターゲット メトリックに基づいて最適なモデルをトレーニングするために、ハイパーパラメーターの調整を使用しています。  
トレーニング スクリプトでは何を行う必要がありますか?

    - logging パッケージをインポートし、logging.info() ステートメントを使用して AUC をログに記録します。
    - print() ステートメントを組み込んで、AUC の値を標準出力ストリームに書き込みます。
    - Azure ML 実行コンテキストへの参照を取得し、run.log() ステートメントを使用して、実行ログに AUC の値を書き込みます。

↓解答

1. グリッド サンプリング
    - グリッド サンプリングを使用して、不連続のハイパーパラメーター値のすべての組み合わせを試す必要があります。
2. Azure ML 実行コンテキストへの参照を取得し、run.log() ステートメントを使用して、実行ログに AUC の値を書き込みます。
    - スクリプトでは、ハイパードライブ構成で指定したのと同じ名前を使用してプライマリ メトリックを実行に記録する必要があります。