Skip to content
Azure Machine Learning Automated ML で二項分類 ~ 機械学習のフローを理解する(タイタニック号から脱出できるか?)
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
dataset
images
01_preparedata.md
02_createworkspace.md
03_runexperiment.md
04_createimage_deploy.md
05_requestservice.md
README.md

README.md

Automated ML で二項分類 ~ タイタニック号から脱出できるか?

このコンテンツでは、Azure Machine Learning Service の Automated Machin Learning (autoML と言うこともあります) を使って 二項分類 を行う手順を紹介します。

Automated ML を使用するメリットは、Experiment (学習の実行単位) で、アルゴリズムや条件を変えて複数のイテレーションを自動的に実行してくれることです。この結果、もっとも精度が高い学習モデル を簡単に決定できることです。

このコンテンツのテーマは、タイタニック号の乗船リスト から、どのような属性の人が "助かる" かを予測 することです。

学習からサービスの公開まで、すべての操作を Azure ポータルの Machine Learning Service Workspace で行います。 Workspace は機械学習プロジェクトのすべてのステップを管理できるものです。

Workspace

同様の分類モデルを作成する手順として、

を用意しています。


今回は、データセットを 学習 するだけではなく、学習済みモデルを ACI (Azure Container Instances) で サービス化 してクライアントから利用する手順まで紹介します。

このコンテンツの実施には、Azure サブスクリプション(無償評価版 でも可)が必要です。

機械学習は、以下の流れで進めます。

  1. データを用意する
  2. Workspace と Compute を作成する
  3. 学習する
  4. イメージの作成と展開
  5. 展開したサービスを利用する

※このコンテンツの利用上の注意

このコンテンツでは、10~20分の待ち時間が数回 発生します。

集合形式でのハンズオン実施などでは、できるだけ待ち時間を短くしたり、待ち時間のタイミングを休憩時間にしたりするなどの工夫が必要になるかもしれません。

  • Compute (=学習で使う仮想マシン) を、コンテンツの最後まで起動したままにする。
  • Experiment (学習の単位) のイテレーションの回数を少なくして、すべての学習が完了するまでの時間を短縮する。
  • 集合形式では、学習から Docker イメージの作成までの手順までとする。サービス化のステップは必要に応じて各自で持ち帰って行う。

また コンテンツの終了時(中断やコンテンツ途中での終了の場合も含む)には、

  • リソースグループの削除
  • 少なくとも 仮想マシンのシャットダウン (必須)

を実施するようお勧めします。 リソースグループの削除方法や仮想マシンのシャットダウンの方法は、展開したサービスを利用する の最後に書いてあります。

上記を行わないことで何が起こるかを理解している場合は、もちろんそのまま起動しておいても問題ありません。


間違いや更新の提案は、Issue、Pull Request でお知らせください。

You can’t perform that action at this time.