# オンライン エンドポイントのデプロイ

アプリケーションからモデルを使用するには、モデルをオンライン エンドポイントにデプロイします。 ローカル ファイルから MLflow モデルを作成し、エンドポイントをテストします。

## 開始する前に

このノートブックでコードを実行するには、最新バージョンの **azureml-ai-ml** パッケージが必要です。 次のセルを実行して、パッケージがインストールされていることを確認します。

> **注**:
> **azure-ai-ml** パッケージがインストールされていない場合は、`pip install azure-ai-ml` を実行してインストールします。

In [None]:
## ワークスペースに接続する

必要な SDK パッケージがインストールされているため、ワークスペースに接続できます。

ワークスペースに接続するには、識別子パラメーター (サブスクリプション ID、リソース グループ名、ワークスペース名) が必要です。 リソース グループ名とワークスペース名は既に入力されています。 コマンドを完了するには、サブスクリプション ID のみが必要です。

必要なパラメーターを見つけるには、Studio の右上にあるサブスクリプションとワークスペース名をクリックします。 右側にペインが開きます。

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> サブスクリプション ID をコピーし、**YOUR-SUBSCRIPTION-ID** をコピーした値に置き換えます。 </p>

## エンドポイントを定義して作成する

最終的には、エンドポイントにモデルをデプロイすることが目標です。 そのため、最初にエンドポイントを作成する必要があります。 エンドポイントは、アプリケーションがモデルから予測を受信するために呼び出すことができる HTTPS エンドポイントになります。 アプリケーションは、その URI を使用し、キーまたはトークンを使用して認証して、エンドポイントを使用できます。

次のセルを実行して、エンドポイントを定義します。 エンドポイントの名前は一意である必要があることにご注意ください。 `datetime` 関数を使用して一意の名前を生成します。

In [None]:
次に、次のセルを実行してエンドポイントを作成します。 この処理には数分かかることがあります。 エンドポイントが作成されている間に、「[Azure Machine Learning エンドポイントとは](https://learn.microsoft.com/azure/machine-learning/concept-endpoints)」を確認することができます。

In [None]:
<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> 重要:  エンドポイントが正常に作成されるまで待ってから続行してください。 スタジオに緑色の通知が表示されます。 </p>

## 展開を構成する

複数のモデルをエンドポイントにデプロイできます。 これは、現在のモデルを運用環境に維持しながら、デプロイされたモデルを更新する場合に最も便利です。 エンドポイントにデプロイする必要があるモデルを指定するように、デプロイを構成する必要があります。 次のセルでは、トレーニングされ、ローカル `model` フォルダーに格納されているモデルを参照します (このノートブックと同じフォルダーに保存されます)。 MLflow モデルを使用しているため、環境またはスコアリング スクリプトを指定する必要はありません。

また、モデルをデプロイするために必要なインフラストラクチャも指定します。

## 配置を作成する

最後に、次のセルを実行して、実際にモデルをエンドポイントにデプロイできます。

In [None]:
モデルのデプロイには 10 から 15 分かかる場合があります。 モデルがデプロイされるのを待っている間に、マネージド エンドポイントの詳細について、[こちらのビデオ](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper)をご覧ください。

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> 重要:  デプロイが完了するまで待ってから続行してください。 スタジオに緑色の通知が表示されます。</p>

エンドポイントに 1 つのモデルしかデプロイしていないため、このデプロイでトラフィックの 100% を取得する必要があります。 エンドポイントに複数のモデルをデプロイする場合は、同じアプローチを使用して、デプロイされたモデル間でトラフィックを分散できます。

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> 重要:  ブルー デプロイが構成されるまで待ってから続行してください。 スタジオに緑色の通知が表示されます。 </p> 

## 展開をテスト

エンドポイントを呼び出して、デプロイされたモデルをテストしてみましょう。 サンプル データを含む JSON ファイルが入力として使用されます。 トレーニング済みモデルでは、年齢、BMI、妊娠回数などの医療データに基づいて、患者が糖尿病かどうかを予測します。 `[0]` は、患者が糖尿病ではないことを示します。 `[1]` は、患者が糖尿病であることを意味します。

In [None]:
必要に応じて、`sample-data.json` ファイル内の値を変更して、別の予測を取得することもできます。

## エンドポイントを一覧表示する

スタジオですべてのエンドポイントを表示できますが、SDK を使用してすべてのエンドポイントを一覧表示することもできます。

In [None]:
## エンドポイントの詳細を取得する

特定のエンドポイントに関する詳細情報が必要な場合は、SDK を使用して詳細を調べることもできます。

## エンドポイントとデプロイを削除する

エンドポイントは常に使用可能であるため、コストを節約するために一時停止することはできません。 不要なコストを避けるには、エンドポイントを削除します。

In [None]:
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

The deployment of the model may take 10-15 minutes. While waiting for the model to be deployed, you can learn more about [managed endpoints in this video](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the deployment is completed before continuing! A green notification should appear in the studio.</p>

Since you only have one model deployed to the endpoint, you want this deployment to take 100% of the traffic. If you deploy multiple models to the endpoint, you could use the same approach to distribute traffic across the deployed models.

In [None]:
# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.begin_create_or_update(endpoint).result()

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the blue deployment is configured before continuing! A green notification should appear in the studio. </p> 

## Test the deployment

Let's test the deployed model by invoking the endpoint. A JSON file with sample data is used as input. The trained model predicts whether a patient has diabetes or not, based on medical data like age, BMI, and the number of pregnancies. A `[0]` indicates a patient doesn't have diabetes. A `[1]` means a patient does have diabetes.

In [None]:
# test the blue deployment with some sample data
response = ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="sample-data.json",
)

if response[1]=='1':
    print("Diabetic")
else:
    print ("Not diabetic")

Optionally, you can change the values in the `sample-data.json` file to try and get a different prediction.

## List endpoints

Although you can view all endpoints in the Studio, you can also list all endpoints using the SDK:

In [None]:
endpoints = ml_client.online_endpoints.list()
for endp in endpoints:
    print(endp.name)

## Get endpoint details

If you want more information about a specific endpoint, you can explore the details using the SDK too.

In [None]:
# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

## Delete the endpoint and deployment

As an endpoint is always available, it can't be paused to save costs. To avoid unnecessary costs, delete the endpoint.

In [None]:
ml_client.online_endpoints.begin_delete(name=online_endpoint_name)