<h1 style="color:blue;text-align:center">Azure ML Service</h1>

<p style="text-align:center;"><img style="width:80%" src="https://docs.microsoft.com/en-us/samples/microsoft/mlopspython/mlops-with-azure-ml/media/ml-lifecycle.png" /></p>

<h1 style="color:blue;text-align:center"><i>Tuotannollistaminen</i></h1>

Tässä viimeisessä harjoituksessa viedään koneoppimismalli tuotantoon. Käymme läpi seuraavat vaiheet: (1) mallin rekisteröinti työtilaan, (2) ennustelogiikan luominen, (3) Python ympäristön vaatimusten dokumentointi, (4) kontti-imagen luonti ja (5) imagen julkaisu web-servisenä.

<hr>

## Azure ML työtilan asetus
Aluksi ladataan `azure.core` python kirjasto:

In [1]:
from azureml.core import Experiment, Workspace, Run
import azureml.core

# Check core SDK version number

print("This notebook was created using SDK version 1.0.62, you are currently running version", 
      azureml.core.VERSION)

This notebook was created using SDK version 1.0.62, you are currently running version 1.0.83


Seuraavaksi luetaan konfiguraatiotiedosto (JSON), johon on määritelty Azure ML Service työtilan tiedot:

In [2]:
import json

# read file
with open('../ws_conf.json', 'r') as myfile:
    data = myfile.read()

# parse file
conf = json.loads(data)

conf

{'ws_name': 'MLtraining',
 'subscription_id': '8762927b-0537-46e8-8e47-aa45d83df5f0',
 'resource_group': 'koulutukset'}

Käyttäen funktiota `Workspace`, luodaan työtilaobjekti, jota tarvitaan myöhemmin: 

In [3]:
ws = Workspace(subscription_id = conf['subscription_id'],
               resource_group = conf['resource_group'],
               workspace_name = conf['ws_name'])

In [4]:
print('Workspace name: ' + ws.name, 
      'Azure region: ' + ws.location, 
      'Subscription id: ' + ws.subscription_id, 
      'Resource group: ' + ws.resource_group, sep='\n')

Workspace name: MLtraining
Azure region: northeurope
Subscription id: 8762927b-0537-46e8-8e47-aa45d83df5f0
Resource group: koulutukset


<hr>

## Mallin rekisteröinti



Jotta malli voidaan julkaista webservisenä, se täytyy ensin rekisteröidä Azure ML Service työtilaan. Malli pitää käydä hakemassa oikeasta eksperimentistä, eli ensi luodaan objekti joka linkkaa haluttuun eksperimentiin:

In [5]:
experiment = Experiment(workspace = ws, name = "parameter-tuning")

Seuraavaksi haetaan eksperimentissä ajo, joka aikaisemmin tägättiin parhaaksi:

In [35]:
best_run = [r for r in experiment.get_runs(tags='Best Run')][0]
best_run.id

'69031ea3-f863-4a8c-a858-5fda7f3c2e2c'

Ajon aikana tallennetut tiedot saadaan näkyviin seuraavasti: 

In [36]:
# View the files in the run
[f for f in best_run.get_file_names()]

['logs/user_log.txt', 'model.pkl', 'outputs/model.pkl']

Haluttu objekti löytyy polun `'outputs/model.pkl'` takaa ja se saadaan rekisteröityä `.register_model()` metodilla. Tarvitsee vain antaa mallin polku ja määritellä mallille nimi:

In [37]:
# Register the model with the workspace
model = best_run.register_model(model_name='best_model', model_path='outputs/model.pkl')
model

Model(workspace=Workspace.create(name='MLtraining', subscription_id='8762927b-0537-46e8-8e47-aa45d83df5f0', resource_group='koulutukset'), name=best_model, id=best_model:2, version=2, tags={}, properties={})

Seuraavassa `Model.list()` funktiolla listataan työtilaan rekisteröidyt mallit:

In [47]:
# Find all models called "best_model" and display their version numbers
from azureml.core.model import Model

models = Model.list(ws, name='best_model')
for m in models:
    print('Experiment: '+m.experiment_name,'\nmodel name: '+m.name, '\nversion: '+str(m.version))

Experiment: parameter-tuning 
model name: best_model 
version: 2


## Ennustelogiikka

Mallin rekisteröinti ei vielä riitä toimivan ennustepalvelun luontiin, vaan on luotava myös skripti, jossa kerrotaan mitä rekisteröidyllä tehdään ja miten se käytännössä trapahtuu. Tässä skriptissä, joka on hyvä nimetä esim. `score.py`, tulee olla vähintään kaksi funktiota `init()` ja `run()`, joista ensimmäinen kutsutaan ennustepalvelun käynnistyessä ja jälkimmäinen on toiminnassa ennustepalvelua kutsuttaessa. Tässä esimerkissä tarvittava skripti näyttää esim. tältä:

## Ympäristön määrittely

Ennustepalvelun käyttäminen, joka voi sisältää sekä datan prosessointia että mallin soveltamista, vaatii tietyn kokoelman Python kirjastoja. Tätä varten tarvitaan tiedosto, jossa riippuvuudet on listattu, jotta **Docker** osaa asentaa tarvittavat kirjastot. Riippuvuus-tiedoston voi kätevästi luoda `CondaDependencies()` Python-luokan avulla. Tässä tapauksessa tarvitaan `scikit-learn` kirjasto, jolla malli on luotu.

In [53]:
from azureml.core.conda_dependencies import CondaDependencies 

# Create an empty conda environment and add the scikit-learn package
conda_dep = CondaDependencies()
conda_dep.add_conda_package("scikit-learn")

# Display the environment
print(conda_dep.serialize_to_string())

# Write the environment to disk
with open("dependencies.yml","w") as f:
    f.write(conda_dep.serialize_to_string())

# Conda environment specification. The dependencies defined in this file will
# be automatically provisioned for runs with userManagedDependencies=False.

# Details about the Conda environment file format:
# https://conda.io/docs/user-guide/tasks/manage-environments.html#create-env-file-manually

name: project_environment
dependencies:
  # The python interpreter version.
  # Currently Azure ML only supports 3.5.2 and later.
- python=3.6.2

- pip:
    # Required packages for AzureML execution, history, and data preparation.
  - azureml-defaults

- scikit-learn
channels:
- conda-forge



Nyt meillä on kaikki tarvittava kasassa, sekä ennustelogiikka `score.py` -tiedostossa että Python-ympäristön määrittely `dependencies.yml`-tiedostossa. Seuraavaksi voimme luoda julkaisuun tarvittavan ympäristö objektin:

In [55]:
from azureml.core.environment import Environment

deploy_env = Environment(name="myenv")

# Adds dependencies to PythonSection of myenv
deploy_env.python.conda_dependencies = conda_dep

## Ennustepalvelun luonti

Tarvitaan vielä ennustepalvelun konfiguraatio-objektit:

In [64]:
from azureml.core.model import InferenceConfig
from azureml.core.webservice import AciWebservice, Webservice

# Represents configuration settings for a custom environment used for deployment:
inference_config = InferenceConfig(entry_script = "score.py",
                                   environment = deploy_env)

# Determine ACI compute resource:
deployment_config = AciWebservice.deploy_configuration(cpu_cores = 1, memory_gb = 1)

ja sitten voidaan viimein pystyttää palvelu:

In [60]:
# Deploy model as a webservice:
service = Model.deploy(workspace = ws, 
                       name = "aciservice", 
                       models = [model], 
                       inference_config = inference_config, 
                       deployment_config = deployment_config)

service.wait_for_deployment(show_output = True)

print(service.state)

Running............................
Succeeded
ACI service creation operation finished, operation "Succeeded"
Healthy


In [65]:
service

AciWebservice(workspace=Workspace.create(name='MLtraining', subscription_id='8762927b-0537-46e8-8e47-aa45d83df5f0', resource_group='koulutukset'), name=aciservice, image_id=None, compute_type=None, state=ACI, scoring_uri=Healthy, tags=http://a621924d-29c8-474b-a249-0c5388e011fb.northeurope.azurecontainer.io/score, properties={}, created_by={})

## Palvelun testaus

Testausta varten otetaan mallin opetukseen käyttämästämme datasta ensimmäinen rivi. Oleellista on muistaa, mitä muuttujia mallin opetukseen on käytetty, koska ennustelogiikka vaatii kyselyn noudattavan samaa dimensionaalisuutta. 

In [84]:
import pandas as pd

features = ['LotArea', 'HalfBath', 'OpenPorchSF', 'WoodDeckSF', '2ndFlrSF',
       'BsmtFinSF1', 'Fireplaces', 'YearRemodAdd', 'YearBuilt', 'TotRmsAbvGrd',
       'FullBath', '1stFlrSF', 'TotalBsmtSF', 'GarageArea', 'GarageCars',
       'GrLivArea', 'OverallQual','SalePrice']

df = pd.read_csv('../tuning/house_prices.csv',nrows=1).dropna(axis=1).loc[:,features]

In [91]:
import json
# Scrape the first row from the test set.
test_samples = json.dumps({"data": df.drop('SalePrice',axis=1).values.tolist()})

# Score on our service:
pred = service.run(input_data = test_samples)
pred

[217264.125]

Koska tiedämme todellisen hinnan, voimme laskea paljonko ennuste meni metsään:

In [100]:
from numpy import round
print('prediction error:', round(100*float((pred - df['SalePrice'])/df['SalePrice']),2),'%')

prediction error: 4.2 %


## Lopetus
Ennustepalvelun ylläpitäminen maksaa rahaa. Nöäin ollen palvelu on parasta ajaa alas, jos sille ei ole tarvetta.

In [101]:
%%time
service.delete()

CPU times: user 48.4 ms, sys: 20.1 ms, total: 68.5 ms
Wall time: 3 s
