## データのアップロード (オンプレミス to クラウド)
Cifar10 のサンプルデータを Azure Mahcine Learning の Datastore にアップロードし、Dataset として登録します。

### PyTorch の Cifar10 サンプルデータのダウンロード

In [None]:
from torchvision import datasets
dataset = datasets.CIFAR10("../data/cifar10/", train=False, download=True)

### Azure Machine Learning Datastore へのアップロード

Datastore は様々な Azure のストレージサービスに対する接続情報を保持しています。今回は Azure Machine Learning 付属の Blob storage (デフォルトの Datstore) にデータをアップロードします。

登録済みの Datastore は [Azure Machine Learning studio](ml.azure.com)の左メニューの 「データストア」から確認できます。

In [None]:
from azureml.core import Workspace, Datastore, Dataset
ws = Workspace.from_config()

In [None]:
# デフォルトの Datastore にデータをアップロード
datastore = ws.get_default_datastore()
datastore.upload(src_dir='../data/cifar10', target_path='datasets/cifar10', overwrite=True)

### Azure Machine Learning Dataset への登録

Datstore に格納されたデータを Dataset として登録することができます。Dataset は Tabular 形式と File 形式をサポートしています。今回は画像データなので、File 形式になります。

登録済みの Dataset は [Azure Machine Learning studio](ml.azure.com)の左メニューの 「データセット」 から確認できます。

In [None]:
# File 形式の Dataset を作成
dataset = Dataset.File.from_files(path=(datastore, 'datasets/cifar10'))

In [None]:
# Dataset を登録
dataset.register(ws, name="cifar10", description="for hack", create_new_version=True)

**参考情報**
- [Azure Machine Learning のしくみ:アーキテクチャと概念 - データセットとデータストア](https://docs.microsoft.com/ja-jp/azure/machine-learning/concept-azure-machine-learning-architecture#datasets-and-datastores)