<h1 style="color:blue;text-align:center">Azure ML Service</h1>

<p style="text-align:center;"><img style="width:80%" src="https://docs.microsoft.com/en-us/samples/microsoft/mlopspython/mlops-with-azure-ml/media/ml-lifecycle.png" /></p>

<h1 style="color:blue;text-align:center"><i>Edistynyt käyttö</i></h1>

Tässä harjoituksessa käydään läpi asioita, jotka mahdollistavat suorituksen ja kehityksen joustavamman erottamisen. Lisäksi tutustumme mahdollisuuksiin ajaa mallinnustöitä etänä Azure:n laskentaresursseilla oman ympäristön sijaan, mikä on käytännössä välttämätöntä tuotantokäytössä.

<hr>

## Azure ML työtilan asetus

Kuten ennenkin, luetaan työtilan parametrit tiedostosta (jotta näitä ei siis tarvitse kovakoodata joka paikkaan):

In [2]:
import json

# read file
with open('../ws_conf.json', 'r') as myfile:
    data = myfile.read()

# parse file
conf = json.loads(data)

conf

{'ws_name': 'MLtraining',
 'subscription_id': '8762927b-0537-46e8-8e47-aa45d83df5f0',
 'resource_group': 'koulutukset'}

ja sen jälkeen luodaan työtila-objekti:

In [3]:
from azureml.core import Experiment, Workspace, Run

ws = Workspace(subscription_id = conf['subscription_id'],
               resource_group = conf['resource_group'],
               workspace_name = conf['ws_name'])

ja luodaan työtilaan vielä uusi eksperimentti:

In [4]:
experiment = Experiment(workspace = ws, name = "advanced-train-local")

<hr>

## Mallinnuslogiikka

Tässä harjoituksessa ei mallien koulutusta tehdä suoraan notebookissa, vaan kutsutaan Python-skriptiä, johon on määritelty tarvittavat toimenpiteet. Skripti on tyypillisesti nimetty `train.py`:

In [5]:
with open('./train.py', 'r') as f:
    print(f.read())

# Copyright (c) Microsoft. All rights reserved.
# Licensed under the MIT license.

from sklearn.datasets import load_diabetes
from sklearn.linear_model import Ridge
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score
from sklearn.model_selection import train_test_split
from azureml.core.run import Run
import joblib
import os
import numpy as np

# Create ouputs folder if it does not exist yet:
os.makedirs('./outputs', exist_ok=True)

X, y = load_diabetes(return_X_y=True)

run = Run.get_context()

X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                    test_size=0.2,
                                                    random_state=0)
data = {"train": {"X": X_train, "y": y_train},
        "test": {"X": X_test, "y": y_test}}

# list of numbers from 0.0 to 1.0 with a 0.05 interval
alphas = np.arange(0.0, 1.0, 0.05)

for alpha in alphas:
    # Use Ridge algorithm to create a regression model:
    reg = Ridg

Tämä skripti hakee `sklearn.datasets` modulista esimerkkidatan ja opettaa regularisoidun regressiomallin, käyden läpi monia eri regularisointiparametrin arvoja.

<hr>

## Ympäristön konfigurointi

Python ympäristön (jossa on kaikki tarvittavat kirjastot) voi joko asettaa itse, tai sitten jättää asia automatiikan huoleksi. Jälkimmäinen vaihtoehto luo lennossa ympäristön ilman että käyttäjän tarvitsee juurikaan vaivata päätään.

In [6]:
from azureml.core.runconfig import RunConfiguration
from azureml.core.conda_dependencies import CondaDependencies

run_config = RunConfiguration()

run_config.environment.python.user_managed_dependencies = False

# Specify conda dependencies with scikit-learn:
cd = CondaDependencies.create(conda_packages=['scikit-learn'])

# Add depoendnecies to the environment configuration:
run_config.environment.python.conda_dependencies = cd

In [16]:
run_config.environment.python.conda_dependencies._conda_dependencies

ordereddict([('name', 'project_environment'), ('dependencies', ['python=3.6.2', ordereddict([('pip', ['azureml-defaults==1.0.83.*'])]), 'scikit-learn']), ('channels', ['conda-forge'])])

On myös mahdollista käyttää olemassa olevaa ympäristöä, jotka saa listattua `azureml.core.Environment.list(workspace=ws)` komennolla. Oman ympäristön saa rekisteröityä työtilaan `myenv.register(workspace=ws)` komennolla.

<hr>

## Skriptin ajaminen

Seuraavaksi muodostetaan ajo-konfiguraatio, jolle kerrotaan mistä ajettava skripti löytyy ja mitä ympäristökonfiguraatiota käytetään:

In [17]:
from azureml.core import ScriptRunConfig

src = ScriptRunConfig(source_directory='./', script='train.py', 
                      run_config = run_config)

src.script

'train.py'

Sitten vain annetaan ajo-konfiguraatio-objekti eksperimentin `.run()` metodille ja odotellaan ajon valmistumista:

In [18]:
# Start run:
run = experiment.submit(src)

# Monitor run status:
run.wait_for_completion(show_output=True)

RunId: advanced-train-local_1580113977_41f6e200
Web View: https://ml.azure.com/experiments/advanced-train-local/runs/advanced-train-local_1580113977_41f6e200?wsid=/subscriptions/8762927b-0537-46e8-8e47-aa45d83df5f0/resourcegroups/koulutukset/workspaces/MLtraining

Streaming azureml-logs/60_control_log.txt

Streaming log file azureml-logs/60_control_log.txt
Starting the daemon thread to refresh tokens in background for process with pid = 1493
Running: ['/bin/bash', '/private/var/folders/r3/jd6gflm5307fsmf72g3s69xr0000gn/T/azureml_runs/advanced-train-local_1580113977_41f6e200/azureml-environment-setup/conda_env_checker.sh']
Found materialized conda environment in: /Users/lasse/.azureml/envs/azureml_8accac11dc2e5bf1e1751759a19aa270


Running: ['/Users/lasse/.azureml/envs/azureml_8accac11dc2e5bf1e1751759a19aa270/bin/python', 'azureml-setup/run_script.py', '/Users/lasse/.azureml/envs/azureml_8accac11dc2e5bf1e1751759a19aa270/bin/python', 'azureml-setup/context_manager_injector.py', '-i', 'Pr

{'runId': 'advanced-train-local_1580113977_41f6e200',
 'target': 'local',
 'status': 'Completed',
 'startTimeUtc': '2020-01-27T08:32:59.873221Z',
 'endTimeUtc': '2020-01-27T08:34:26.653874Z',
 'properties': {'_azureml.ComputeTargetType': 'local',
  'ContentSnapshotId': 'd52e2e4b-d837-47c9-9fa9-f2ea250008d2'},
 'inputDatasets': [],
 'runDefinition': {'script': 'train.py',
  'arguments': [],
  'sourceDirectoryDataStore': None,
  'framework': 'Python',
  'communicator': 'None',
  'target': 'local',
  'dataReferences': {},
  'data': {},
  'jobName': None,
  'maxRunDurationSeconds': None,
  'nodeCount': 1,
  'environment': {'name': 'Experiment advanced-train-local Environment',
   'version': 'Autosave_2020-01-24T10:11:35Z_2f06e7ee',
   'python': {'interpreterPath': 'python',
    'userManagedDependencies': False,
    'condaDependencies': {'channels': ['conda-forge'],
     'dependencies': ['python=3.6.2',
      {'pip': ['azureml-defaults==1.0.83.*']},
      'scikit-learn'],
     'name': 'azur

In [19]:
run

Experiment,Id,Type,Status,Details Page,Docs Page
advanced-train-local,advanced-train-local_1580113977_41f6e200,azureml.scriptrun,Completed,Link to Azure Machine Learning studio,Link to Documentation


<hr>

## Suorittaminen etänä

In [20]:
from azureml.core.compute import ComputeTarget, AmlCompute

AmlCompute.supported_vmsizes(workspace = ws)[0:3]

[{'name': 'Standard_D1_v2',
  'vCPUs': 1,
  'gpus': 0,
  'memoryGB': 3.5,
  'maxResourceVolumeMB': 51200},
 {'name': 'Standard_D2_v2',
  'vCPUs': 2,
  'gpus': 0,
  'memoryGB': 7.0,
  'maxResourceVolumeMB': 102400},
 {'name': 'Standard_D3_v2',
  'vCPUs': 4,
  'gpus': 0,
  'memoryGB': 14.0,
  'maxResourceVolumeMB': 204800}]

Teemme tässä niin, että määrittelemme etälaskentaresurssin, joka luodaan ajon käynnistyessä ja tuhon ajon päätyttyä. Mikäli etäresurssille on jatkuva tarve, on järkevämpää luoda persistentti resurssi. Lisäksi on huomioitava, että laskentaresurssin käynnistäminen vie jonkin aikaa.

In [21]:
from azureml.core.runconfig import RunConfiguration
from azureml.core.conda_dependencies import CondaDependencies
from azureml.core.runconfig import DEFAULT_CPU_IMAGE

# create a new runconfig object
run_config = RunConfiguration()

# signal that you want to use AmlCompute to execute script.
run_config.target = "amlcompute"

# AmlCompute will be created in the same region as workspace
# Set vm size for AmlCompute
run_config.amlcompute.vm_size = 'STANDARD_D2_V2'

# enable Docker 
run_config.environment.docker.enabled = True

# set Docker base image to the default CPU-based image
run_config.environment.docker.base_image = DEFAULT_CPU_IMAGE

# use conda_dependencies.yml to create a conda environment in the Docker image for execution
run_config.environment.python.user_managed_dependencies = False

# specify CondaDependencies obj
run_config.environment.python.conda_dependencies = CondaDependencies.create(conda_packages=['scikit-learn'])

run_config

{
    "script": "train.py",
    "arguments": [],
    "target": "amlcompute",
    "framework": "Python",
    "communicator": "None",
    "maxRunDurationSeconds": null,
    "nodeCount": 1,
    "environment": {
        "name": null,
        "version": null,
        "environmentVariables": {
            "EXAMPLE_ENV_VAR": "EXAMPLE_VALUE"
        },
        "python": {
            "userManagedDependencies": false,
            "interpreterPath": "python",
            "condaDependenciesFile": null,
            "baseCondaEnvironment": null,
            "condaDependencies": {
                "name": "project_environment",
                "dependencies": [
                    "python=3.6.2",
                    {
                        "pip": [
                            "azureml-defaults==1.0.83.*"
                        ]
                    },
                    "scikit-learn"
                ],
                "channels": [
                    "conda-forge"
                ]
            

In [23]:
from azureml.core.script_run_config import ScriptRunConfig

# Make run config for AmlCompute:
script_run_config = ScriptRunConfig(source_directory='./',
                                    script='train.py',
                                    run_config=run_config)

# Submit task to AmlCompute:
run = experiment.submit(script_run_config)

# Show run details
run

Experiment,Id,Type,Status,Details Page,Docs Page
advanced-train-local,advanced-train-local_1580114328_2733bc23,azureml.scriptrun,Starting,Link to Azure Machine Learning studio,Link to Documentation


Ajon edistymistä on kätevintä seurata AML-portaalissa, mutta `.get_status()` metodilla ajon etenemistä voi kysellä myös täällä:

In [24]:
run.get_status()

'Finalizing'