# 2019华为软件精英挑战赛-基于ModelArts-SDK使用操作指导
_**基于Modelarts SDK功能，利用MXNet引擎，端到端实现车牌识别的一站式开发**_

---

---

## 内容

1. [背景介绍](#背景介绍)
1. [环境配置](#环境配置)
1. [数据管理](#数据管理)
1. [训练作业](#训练作业)
1. [模型部署](#模型部署)
1. [部署上线](#部署上线)
1. [在线测试](#在线测试)
1. [资源释放](#资源释放)

---


## 背景介绍

本案例将展示利用 [ModelArts SDK功能](https://support.huaweicloud.com/sdkreference-modelarts/modelarts_04_0001.html)，结合MXNet引擎和车牌数据集，实现车牌识别的端到端一站式开发。主要内容包括：

* 基本的环境配置.
* 数据集的管理，包括获取数据集.
* 创建训练作业.
* 根据训练输出文件，构建模型
* 实现模型的上线部署.
* 输入测试图片进行在线预测.
* 释放本notebook生成的资源，包括作业、模型和服务，以及存储资源.


## 环境配置

本项目无需手动设置，所需的存储桶目录等都可自动生成，配置内容包括：

* 导入所需的Python库

In [None]:
import urllib3
urllib3.disable_warnings()
from modelarts.session import Session
from modelarts.estimator import Estimator
from modelarts.predictor import Predictor
from modelarts.model import Model
from modelarts.config.model_config import ServiceConfig,TransformerConfig 
import os
import json

* 建立session，并创建承载本项目的默认[OBS](https://storage.huaweicloud.com/obs/?region=cn-north-1#/obs/buckets) bucket.

In [None]:
session = Session()
bucket_name = session.default_bucket('obs-car-reg-ai') # 选手可指定其他的桶名，但obs-car-reg桶为公共桶，不可再作为桶名

---
## 数据管理

* 获取比赛提供的数据集，并下载到容器本地：

In [None]:
import os
home_path = os.environ['HOME']+'/work/licence-plate' # 输入下载到容器中的地址，如home_path=os.environ['HOME']+'/work'
data_path = home_path + '/data'
!mkdir -p $data_path

dataset_url='https://codecraft-2019.obs.cn-north-1.myhuaweicloud.com/data/train-data.zip'

!wget $dataset_url -O $data_path/train-data.zip -P $data_path 
import zipfile
dataset_file = data_path + '/train-data.zip'
zip = zipfile.ZipFile(dataset_file)
zip.extractall(data_path)
zip.close()
!rm -rf $dataset_file

In [None]:
!ls $data_path/

* 将本地数据集上传至OBS

In [None]:
base_bucket_path = '/' + bucket_name
session.upload_data(base_bucket_path, data_path)          ##数据集较大，上传到OBS较耗时，请耐心等待

---
## 训练作业

环境配置和数据管理完成后，可以开始训练作业。
* 首先, 将训练代码从容器中上传至OBS指定目录下

In [None]:
train_file = 'train_demo.py'
src_local_path = home_path + '/src'
session.upload_data(base_bucket_path, src_local_path)
print('The train files locate in %s/train/ ' % base_bucket_path)

* 其次，展示基于MXNet实现车牌识别的训练脚本train_demo.py.

In [None]:
! cat $src_local_path/$train_file

* 展示当前ModelArts支持的train_instance_types和framework_list

In [None]:
print(json.dumps(Estimator.get_train_instance_types(session),indent = 1))

In [None]:
print(json.dumps(Estimator.get_framework_list(session),indent = 1))

* 初始化训练作业

In [None]:
estimator = Estimator(modelarts_session=session,
                      framework_type='MXNet',                                   # AI引擎名称
                      framework_version='MXNet-1.2.1-python2.7',                # AI引擎版本
                      code_dir= base_bucket_path + '/src/',                     # 训练代码目录
                      boot_file=base_bucket_path + '/src/'+ train_file,         # 训练启动文件
                      hyperparameters=[{"label":"lr","value":"0.05"},           # 训练运行参数，若为空，则改为[]即可
                                       {"label":"num","value":"10"}
                                       ],
                      output_path=base_bucket_path + '/output/',                 # 训练输出位置
                      log_url=base_bucket_path + "/log/",                       # 训练作业日志路径          
                      train_instance_type='modelarts.vm.cpu.2u',                # 训练资源池规格
                      train_instance_count=1,                                   # 计算节点个数
                      job_description='This is a licence plate training job')   # 训练作业描述              

* 最后，开始训练作业，当参数wait=True时，等待训练完成并实时输出训练状态。若训练失败，可到ModelArts的训练作业模块或OBS中查看该训练作业的日志

In [None]:
session.create_directory(bucket_name, '/output')     #创建训练模型输出位置
session.create_directory(bucket_name, '/log')     #创建训练模型日志路径
job_id = estimator.fit(inputs=base_bucket_path + '/data/',wait = True)  # inputs为训练数据存储位置

---
##  模型部署

训练作业完成后，会自动生成训练对应的文件。 除此之外，创建模型还需要[模型配置文件config.json](https://support.huaweicloud.com/usermanual-modelarts/modelarts_02_0061.html),和推理文件customize_service.py. 当文件都生成后，即可开始模型创建。选手可线下或使用Notebook编写上述文件，编写完成后，请将文件上传或移动到$src_local_path目录下
* 首先，生成模型创建的源路径，并将config.json和customize_service.py从notebook容器中导入到OBS路径中。

In [None]:
model_location  =  base_bucket_path + '/output/model'
session.create_directory(bucket_name, '/output/model')     #创建训练模型位置
config_json = src_local_path + '/config.json'
custom_service = src_local_path + '/customize_service.py'
filelist = [config_json, custom_service]

session.upload_data(model_location , filelist)
print('The model file is uploaded to the OBS path: %smodel/' % model_location) 

* 其次，展示模型配置文件config.json  

In [None]:
!cat $config_json | python -m json.tool

* 展示模型customize_service.py

In [None]:
!cat $custom_service

* 最后，根据源路径中的模型文件创建模型，并实时输出模型状态

In [None]:
model = estimator.create_model( model_name      = "licence_plate",  # 模型名称
                                model_version   = "1.0.0",          # 模型版本
                                source_location =  base_bucket_path + '/output',   # OBS中的模型位置，选择模型文件夹的父目录，系统会自动定位到”model”目录
                                model_type      = "MXNet",
                                model_algorithm = "image_classification") 

---
##  部署上线

模型部署完成后，即可根据模型ID将模型部署上线.
* 资源规格(specification)：当前版本可选modelarts.vm.cpu.2u/modelarts.vm.gpu.p4(需申请)/modelarts.vm.ai1.a310(需申请),[申请链接](https://console.huaweicloud.com/ticket/?region=southchina&locale=zh-cn#/ticketindex/createIndex)

In [None]:
configs = []
config1 = ServiceConfig(model_id=model.get_model_id(), weight="100", instance_count=1, specification="modelarts.vm.cpu.2u", 
                        envs={"input_data_name":"images","input_data_shape":"0,1,28,28","output_data_shape":"0,10"}) #若无env，传{}即可
configs.append(config1)
predictor = model.deploy_predictor(service_name="licencePlate", description ="licencePlate Service", configs=configs)

---
## 在线测试

* 查看测试图片名称

In [None]:
data_file_path = data_path + '/train-data'
!ls $data_file_path

* 选择测试图片并展示

In [None]:
import imageio
import matplotlib.pyplot as plt
test_image = data_file_path + '/2b10978d80c7b92d.jpg'
image = imageio.imread(test_image)
plt.imshow(image)
plt.show()

* 输入文件本地路径和类型，开始预测

In [None]:
predict_result = predictor.predict(data=test_image,data_type = 'images')
print("pretictor result is %s " % json.dumps(predict_result,indent = 1))

## 资源释放

至此，车牌识别一站式开发结束，在MoelArts上生成的训练作业、模型和服务资源，可以选择删除

In [None]:
estimator.delete(job_id = job_id, model_id = model.model_id, service_id = model.service_id)

* 可以选择删除存储本项目的OBS桶

In [None]:
session.delete_bucket(bucket_name)    