# トレーニング スクリプトをコマンド ジョブとして実行する

Azure Machine Learning 用の Python SDK を使って、スクリプトをコマンド ジョブとして送信できます。 ジョブを使用すると、機械学習モデルのトレーニング時に入力パラメーターと出力を簡単に追跡できます。

## 開始する前に

このノートブックでコードを実行するには、**azureml-ai-ml** パッケージの最新バージョンが必要です。 次のセルを実行して、パッケージがインストールされていることを確認します。

> **注**:
> **azure-ai-ml** パッケージがインストールされていない場合は、`pip install azure-ai-ml` を実行してインストールします。

In [None]:
## ワークスペースに接続する

必要な SDK パッケージがインストールされているため、ワークスペースに接続できます。

ワークスペースに接続するには、識別子パラメーター (サブスクリプション ID、リソース グループ名、ワークスペース名) が必要です。 リソース グループ名とワークスペース名は既に入力されています。 コマンドを完了するには、サブスクリプション ID のみが必要です。

必要なパラメーターを見つけるには、Studio の右上にあるサブスクリプションとワークスペース名をクリックします。 右側にペインが開きます。

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> サブスクリプション ID をコピーし、**YOUR-SUBSCRIPTION-ID** をコピーした値に置き換えます。 </p>

## MLflow を使用したカスタム追跡

スクリプトをジョブとして実行する場合は、トレーニング スクリプトで MLflow を使用してモデルを追跡できます。 MLflow を使用すると、ジョブ出力と共に保存するカスタム パラメーター、メトリック、または成果物を追跡できます。

次のセルを実行して、**src** フォルダーに **train-model-mlflow.py** スクリプトを作成します。 スクリプトは、同じフォルダー内の **diabetes.csv** ファイルを使用して分類モデルをトレーニングします。これは引数として渡されます。 

次のコードを確認して、スクリプトにより `mlflow` がインポートされ、ログされることを確認します。

- **パラメーター**としての正則化率。 
- **メトリック**としての正確性と AUC。
- **成果物**としてプロットされた ROC 曲線。

In [None]:
これで、スクリプトをコマンド ジョブとして送信できます。

次のセルを実行してモデルをトレーニングします。 

In [None]:
スタジオで、**diabetes-train-mlflow** ジョブに移動して、実行したコマンド ジョブの概要を確認します。

- **[概要]** タブの **[パラメーター]** で、ログされたパラメーター を見つけます。
- **[メトリック]** タブで、ログされたメトリックを見つけます。
- ログされた成果物を **[イメージ]** タブ (特に画像用) と **[出力 + ログ]** タブ (すべてのファイル) で見つけます。

## MLflow を使用した自動ログ記録

MLflow では、カスタム ログを使用する代わりに、あらゆるパラメーター、メトリック、成果物を自動的にログすることもできます。 MLflow を使用した自動ログ記録には、コードは 1 行のみです。

次のセルを実行して、**src** フォルダーに **train-model-autolog.py** スクリプトを作成します。 スクリプトは、同じフォルダー内の **diabetes.csv** ファイルを使用して分類モデルをトレーニングします。これは引数として渡されます。 

次のコードを確認して、スクリプトにより `mlflow` がインポートされ、行で自動ログ記録が有効になっていることを確認します。 

`mlflow.autolog()`

In [None]:
これで、スクリプトをコマンド ジョブとして送信できます。

次のセルを実行してモデルをトレーニングします。 

In [None]:
スタジオで、**diabetes-train-autolog** ジョブに移動し、実行したコマンド ジョブの概要を確認します。

- **[概要]** タブの **[パラメーター]** で、ログされたパラメーター を見つけます。
- **[メトリック]** タブで、ログされたメトリックを見つけます。
- ログされた成果物を **[イメージ]** タブ (特に画像用) と **[出力 + ログ]** タブ (モデル ファイルを含むすべてのファイル) で見つけます。

## MLflow を使用して実験を表示および検索する

Azure Machine Learning スタジオは、ジョブの実行を表示し、比較するための使いやすい UI です。 あるいは、MLflow を使って実験ジョブを表示することもできます。 

ワークスペース内のジョブを一覧表示するには、次のコマンドを使用して、ワークスペース内の実験を一覧表示します。


In [None]:
特定の実験を取得するには、その名前で取得できます。

実験名を使用すると、その実験のすべてのジョブを取得できます。

ジョブの実行と出力をより簡単に比較するために、結果を並べ替える検索を構成できます。 たとえば、次のセルは結果を `start_time` で並べ替え、最大 `2` 個の結果のみを表示します。 

In [None]:
実行をフィルター処理するクエリを作成することもできます。 フィルター クエリ文字列は、SQL `WHERE` 句の簡略化されたバージョンで記述されます。 

フィルター処理には、次の 2 つのクラスの比較子を使用できます。

- 数値比較子 (メトリック): =、!=、>、>=、<、<=。
- 文字列比較子 (パラメーター、タグ、属性): = と !=。

詳細については、[MLflow を使用して実験を追跡する方法](https://learn.microsoft.com/azure/machine-learning/how-to-track-experiments-mlflow)に関するページを参照してください。

Now, you can submit the script as a command job.

Run the cell below to train the model. 

In [None]:
from azure.ai.ml import command

# configure job

job = command(
    code="./src",
    command="python train-model-autolog.py --training_data diabetes.csv",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    display_name="diabetes-train-autolog",
    experiment_name="diabetes-training"
    )

# submit job
returned_job = ml_client.create_or_update(job)
aml_url = returned_job.studio_url
print("Monitor your job at", aml_url)

In the Studio, navigate to the **diabetes-train-autolog** job to explore the overview of the command job you ran:

- Find the logged parameters in the **Overview** tab, under **Params**.
- Find the logged metrics in the **Metrics** tab.
- Find the logged artifacts in the **Images** tab (specifically for images), and in the **Outputs + logs** tab (all files, including the model files).

## Use MLflow to view and search for experiments

The Azure Machine Learning Studio is an easy-to-use UI to view and compare job runs. Alternatively, you can use MLflow to view experiment jobs. 

To list the jobs in the workspace, use the following command to list the experiments in the workspace:


In [None]:
import mlflow
experiments = mlflow.list_experiments()
for exp in experiments:
    print(exp.name)

To retrieve a specific experiment, you can get it by its name:

In [None]:
experiment_name = "diabetes-training"
exp = mlflow.get_experiment_by_name(experiment_name)
print(exp)

Using an experiment name, you can retrieve all jobs of that experiment:

In [None]:
mlflow.search_runs(exp.experiment_id)

To more easily compare job runs and outputs, you can configure the search to order the results. For example, the following cell orders the results by `start_time`, and only shows a maximum of `2` results: 

In [None]:
mlflow.search_runs(exp.experiment_id, order_by=["start_time DESC"], max_results=2)

You can even create a query to filter the runs. Filter query strings are written with a simplified version of the SQL `WHERE` clause. 

To filter, you can use two classes of comparators:

- Numeric comparators (metrics): =, !=, >, >=, <, and <=.
- String comparators (params, tags, and attributes): = and !=.

Learn more about [how to track experiments with MLflow](https://learn.microsoft.com/azure/machine-learning/how-to-track-experiments-mlflow).

In [None]:
query = "metrics.AUC > 0.8 and tags.model_type = 'LogisticRegression'"
mlflow.search_runs(exp.experiment_id, filter_string=query)