# 10.Azure ML SDKの概要

## Azure Machine Learning ワークスペース

ワークスペースは、機械学習ワークロードに関連付けられた実験、データ、コンピューティング先およびその他の資産のコンテキスト。

### Machine Learning資産用のワークスペース

ワークスペースは、関連する一連の機械学習リソースの境界を定義するもの。  
ワークスペースを使用することで、プロジェクト、デプロイ環境(テストと運用など)、チーム、またはその他の編成の原則に基づいて機械学習リソースをグループ化できる。

ワークスペース内には以下の資産がある。

- 開発、トレーニング、デプロイのためのコンピューティング先
- 実験及びモデルトレーニング用のデータ
- 共有コードとドキュメントを含むノートブック
- 実験(履歴、ログに記録されたメトリック、出力含む)
- トレーニング済みのモデル

### Azureリソースとしてのワークスペース

ワークスペースはAzureリソースなので、ワークスペースをsupportするために必要なその他の関連するAzureリソースとともに、  
Azureサブスクリプションのリソースグループ内に定義される。

![image.png](attachment:a9acd393-d1d5-4f58-98a2-e01e0390269a.png)

ワークスペースとともに作成されるAzureリソースは次のものがある。

- ストレージアカウント
    - ワークスペースで使用されるファイルと、実験およびモデルトレーニング用のデータを格納するために使用される
- Application Insights
    - ワークスペース内で予測サービスを監視するために使用される
- Azure Key Vault
    - ワークスペースで使用される認証キーや資格情報などのシークレットを管理するために使用される
- コンテナーレジストリ
    - デプロイされたモデルのコンテナーを管理するために必要に応じて作成される

### ロールベースのアクセス制御

ワークスペースにはロールベースの承認ポリシーを割り当てることができる。  
これにより、特定のAzure Active Directoryプリンシパルが実行できるアクションを制限するアクセス許可を管理できる。

### ワークスペースの作成

以下の方法でワークスペースを作成できる。

- Azureポータルで、サブスクリプション、リソースグループ、ワークスペース名を指定して、新しいMachine Learningリソースを作成。
- Azure ML Python SDKを使用して、ワークスペースを作成するコードを実行する。  
たとえば、次のコードによって`aml-workspace`という名前のワークスペースが作成される。  
※Azure ML SDK for Pythonがインストールされ、有効なサブスクリプションIDが指定されていることを前提としている。

```
from azureml.core import Workspace
    
    ws = Workspace.create(name='aml-workspace', 
                      subscription_id='123456-abc-123...',
                      resource_group='aml-resources',
                      create_resource_group=True,
                      location='eastus'
                     )
```

- Azure ML CLI拡張機能を含むAzure CLIを使用する。  
例えば次のコマンドを使用できる　※aml-resourcesという名前のリソースグループが既に作成されていることを前提としてる

```
az ml workspace create -w 'aml-workspace' -g 'aml-resources'
```

- Azure Resource Managerテンプレートを使用する。

# 演習 - ワークスペースを作成する

1. Azureポータルで、新しいMLリソースを作成する。

    - サブスクリプション
    - リソースグループ
    - ワークスペース名
    - リージョン
    - ストレージアカウント
    - Key vault
    - アプリケーション insights
    - コンテナーレジストリ

![image.png](attachment:c495cc31-10bb-4f0d-872e-a1e2d094a096.png)

※注:Azure MLワークスペースを作成する際には、高度なオプションを使用してプライベートエンドポイントを介したアクセスを制御したり、  
データ暗号化のカスタムキーを指定したりすることができる。

2. ワークスペースとその関連リソースが作成されたら、ポータルでワークスペースを表示する。

## Azure ML Studioを見る

Azure MLスタジオでは、ワークスペースを操作するための専用Webポータルを提供している。  
スタジオを起動することで、Azure MLスタジオへ移動することができ、ワークスペースのリソースを管理することができる。

## コンピューティングインスタンスの作成

Azure MLのメリットの一つは、実験やトレーニングスクリプトを大規模に実行できるクラウドベースのコンピューティングを作成できること。

1. **コンピューティング**を表示する。  
ここでは、データサイエンス活動のためのコンピューティングリソースを管理する。作成できるリソースは4種類

    - **コンピューティングインスタンス**
        - データサイエンティストがデータやモデルを扱うために使用する開発ワークステーション
    - **コンピューティングクラスター**
        - 実行コードをオンデマンドに処理するためのスケーラブルな仮想マシンのクラスター
    - **推論クラスター**
        - 訓練されたモデルを使用する予測サービスの導入対象
    - **アタッチされたコンピューティング**
        - 他のAzureコンピューティングリソースへのリンク  
        Virtual MachineやAzure Databricksクラスターなど、他のAzureコンピューティングへのリンク

2. コンピューティングインスタンスより、新しいコンピューティングインスタンスを追加する。  
このインスタンスは、ノートブックでコードを実行するためのワークステーションとして使用する。

3. コンピューティングが作成されるまで待つ。


## ノートブックのクローンおよび実行

データサイエンスや機械学習の実験の多くは、ノートブックでコードを実行することで行われる。  
あなたのコンピューティングインスタンスには、広範な作業に使用できる全機能のPythonノートブック環境が含まれているが、  
基本的なノートブックの編集には、Azure MLスタジオの組み込みノートブックページを使用できる。

1. Azure MLスタジオで**Notebooks**を開く

2. ターミナルを開き、`git`コマンドでノートブックのクローンを取得する

3. ターミナルを閉じ、ファイルペイン上で更新してからノートブックを選択することで、ノートブックを開くことができる。

test

# Azure Machine Learningでノートブックを始める

Azure Machine Learningは機械学習を作成・管理するためのクラウドサービスで、  
データサイエンスや機械学習の作業の多くは、このようなノートブックで実現できる。

## Azure ML Python SDK

このケースでは、Azure MLコンピューティングインスタンス上のConda環境でノートブックを実行している。  
この環境はデフォルトでコンピューティングインスタンスにPythonパッケージがインストールされており、  
データサイエンティストが通常使用する一般的なPythonパッケージが含まれている。

また、Azure ML Python SDKも含まれており、これはAzure MLワークスペースのリソースを使用するコードを書くことができるPythonパッケージである。

以下のセルを実行して、`azureml-core`パッケージをインポートし、インストールされているSDKのバージョンを確認する。

In [1]:
import azureml.core

print("Ready to use Azure ML", azureml.core.VERSION)

Ready to use Azure ML 1.28.0


## ワークスペースの接続

すべての実験と関連するリソースは、Azure MLのワークスペース内で管理される。  
既存のワークスペースに接続するか、Azure ML SDKを使用して新しいワークスペースを作成することができる。

ほとんどの場合、ワークスペースの接続情報JSONファイルに保存する必要がある。
これにより、AzureのサブスクリプションIDなどの詳細を覚えておく必要がなく、簡単に接続することができる。

JSONファイルは、Azureポータルのワークスペース用ブレード、またはAzure MLスタジオのワークスペース詳細ペインからダウンロードできるが、  
ワークスペース内でコンピューティングインスタンスを使用している場合は、構成ファイルはすでにルートフォルダにダウンロードされている。

以下のコードは、設定ファイルを使用してワークスペースに接続している。  
> 注:ノーツブックセッションでワークスペースに初めて接続した時、Azureにサインインするように促されることがある。  
サインインに成功したら、開いていたブラウザタブを閉じ、このノートブックに戻ることができる。

In [2]:
from azureml.core import Workspace

ws = Workspace.from_config()
print(ws.name, "loaded")

20210613 loaded


## ワークスペースでAzure MLリソースを表示する

ワークスペースの接続ができたので、リソースを扱うことができる。  
例えば、以下のコードを使用して、ワークスペースのコンピューティングリソースを列挙することができる。

In [3]:
print("Compute Resources:")
for compute_name in ws.compute_targets:
    compute = ws.compute_targets[compute_name]
    print("\t", compute.name, ':', compute.type)

Compute Resources:
	 mslearn-20210613a : ComputeInstance


## Azure MLのツールとインターフェイス

Azure MLにはクラウドベースのサービスが用意されており、その使用方法には柔軟性がある。  
Azure ML用に特別に設計されたユーザインターフェイスがある。  
また、プログラムインターフェイスを使用してワークスペースリソースを管理したり、機械学習の操作を実行したりすることができる。


### Azure MLスタジオ

Azure MLワークスペース内の資産をAzureポータル上で管理できるが、  
これはAzureのすべての種類のリソースを管理するための一般的なインターフェイスであるため、データ分析に関連するその他のユーザは、  
より焦点を絞った専用インターフェイスの使用を推奨。

Azure MLスタジオは、Azure MLワークスペースを管理するためのWebベースツールで、  
これを使用してワークスペース内のすべての資産を作成、管理、表示できる。また、次のグラフィカルツールが用意されている。

- デザイナー
    - コードなしの機械学習モデル開発のためのインターフェイス
- 自動機械学習
    - データに対して最適なモデルを見つけるため、アルゴリズムとデータ前処理手法を組み合わせて使用しモデルをトレーニングできる  
    ウィザードインターフェイス

### Azure ML SDK
Azure MLスタジオのようなグラフィカルインターフェイスを使用すると、機械学習資産を簡単に作成および管理できるが、  
多くの場合、リソースの管理にコードベースのアプローチを使用すると便利で、管理するためのスクリプトを記述することで、次のことができる。

- 好みの開発環境から機械学習を実行できる
- リソースの作成と構成を自動化し、反復可能にする
- 複数の環境(開発、テスト、運用など)でレプリケートする必要があるリソースの一貫性を確保する
- 継続的インテグレーション/継続的デプロイ(CI/CD)パイプラインなどの開発者の運用(DevOps)ワークフローに機械学習のリソース構成を組み込むことができる。

Azure MLにより、Azure MLワークスペースでリソースを作成、管理、使用するために使用できる、PythonおよびR用のソフトウェア開発キット(SDK)が提供される。

### Azure ML SDK for Pythonのインストール

`pip`コマンドを用いて、以下のようにインストールできる。

```
pip install azureml-sdk
```
SDKはPython pipユーティリティを使用してインストールされ、メインの**azureml-sdk**パッケージと、特殊な昨日を含む多くの補助的なパッケージで構成される。  
例えば、**azureml-widgets**パッケージでは、jupyter notebook環境で対話型ウィジェットのサポートが提供される。


### ワークスペースへの接続

SDKパッケージをpython環境にインストールできたら、ワークスペースに接続して機械学習の操作を実行するためのコードを記述できる。  
ワークスペースに接続する最も簡単な方法は、以下のようにAzureサブスク、リソースグループ、ワークスペースの詳細を含むワークスペース構成ファイルを使用すること。

> ※以下のjsonファイルは、概要ページからダウンロードしたもの

```:json
{
    "id": "/subscriptions/153404fd-72ab-4092-b50e-de490c5509fc/resourceGroups/20210613/providers/Microsoft.MachineLearningServices/workspaces/20210613",
    "name": "20210613",
    "type": "Microsoft.MachineLearningServices/workspaces",
    "location": "westus2",
    "tags": {},
    "etag": null,
    "properties": {
        "friendlyName": "20210613",
        "description": "",
        "storageAccount": "/subscriptions/153404fd-72ab-4092-b50e-de490c5509fc/resourcegroups/20210613/providers/microsoft.storage/storageaccounts/202106138491592323",
        "containerRegistry": "",
        "keyVault": "/subscriptions/153404fd-72ab-4092-b50e-de490c5509fc/resourcegroups/20210613/providers/microsoft.keyvault/vaults/a202106137570553126",
        "applicationInsights": "/subscriptions/153404fd-72ab-4092-b50e-de490c5509fc/resourcegroups/20210613/providers/microsoft.insights/components/202106137897442529",
        "hbiWorkspace": false,
        "tenantId": "5456e8d8-0223-4619-ba5b-e313627da53d",
        "imageBuildCompute": "",
        "provisioningState": "Succeeded",
        "creationTime": "2021-06-13T08:30:48.5558351+00:00",
        "notebookInfo": {
            "resourceId": "ed8e6e4a20b24598986771c9c7468e34",
            "fqdn": "ml-20210613-westus2-322f90dd-b503-46f1-8d45-68f1641a9197.notebooks.azure.net",
            "isPrivateLinkEnabled": false,
            "notebookPreparationError": null
        },
        "storageHnsEnabled": false,
        "workspaceId": "322f90dd-b503-46f1-8d45-68f1641a9197",
        "linkedModelInventoryArmId": null,
        "privateLinkCount": 0,
        "allowPublicAccessWhenBehindVnet": false,
        "discoveryUrl": "https://westus2.api.azureml.ms/discovery",
        "sdkTelemetryAppInsightsKey": "19f24253-9564-406c-9a1e-a48a21b145aa"
    },
    "identity": {
        "type": "SystemAssigned",
        "principalId": "18459ee1-c609-4ff2-98c6-ad94eb5ac6c1",
        "tenantId": "5456e8d8-0223-4619-ba5b-e313627da53d"
    },
    "sku": {
        "name": "Basic",
        "tier": "Basic"
    },
    "systemData": {
        "createdAt": "2021-06-13T08:30:45.1488264Z",
        "createdBy": "tsutayan@gmail.com",
        "createdByType": "User",
        "lastModifiedAt": "2021-06-13T08:30:45.1488264Z",
        "lastModifiedBy": "tsutayan@gmail.com",
        "lastModifiedByType": "User"
    }
}
```

構成ファイルを