## 简介

在构建用于运行Endpoint的docker镜像，并将其推送到ECR之后，即可启动Endpoint节点，下面notebook为启动Multi Model Endpoint节点的代码。

Multi Model Endpoint支持一个 Endpoint 调用多个模型。

在启动Endpoint前，需要设置的包括3个参数：

- endpoint_name : Endpoint的名字
- model_url : 模型的s3路径
- container : Docker镜像在ECR的地址
- role : Endpoint运行时的Role

需要注意：
1. endpoint_name 不可以与已有的Endpoint名字重复
2. endpoint_name 不可以使用下划线`_`命名，但可以使用`-`
3. model_url必须以`/`为结尾
4. 模型必须以 模型名.tar.gz 的格式存储在 model_url 对应的 s3 中
5. role需要拥有 SageMaker Full Access 以及 S3 Full Access 权限

In [None]:
#endpoint名字
endpoint_name = 'your-endpoint-name'
#模型列表，注意最后结尾带上 /
model_url = 'https://s3-cn-northwest-1.amazonaws.com/sagemaker-cn-northwest-1-468855463735/output1/testx00001-2020-10-14-07-59-46-191/output/'
container = '468855463735.dkr.ecr.cn-northwest-1.amazonaws.com.cn/end1014'
role = 'arn:aws-cn:iam::468855463735:role/SageMaker_Executor_for_Endpoints'

导入所需的 Python 库，并创建sagemaker.client及sagemaker-runtime对象

In [None]:
# !pip install -qU awscli boto3 sagemaker
import boto3
from sagemaker import get_execution_role
import os
import tarfile

sm_client = boto3.client(service_name='sagemaker')
runtime_sm_client = boto3.client(service_name='sagemaker-runtime')

配置Endpoint的Docker配置，并设置模式`'Mode' : 'MultiModel'`，来表明Endpoint为Multi Model模式。

In [None]:
container = {
    'Image': container,
    'ModelDataUrl': model_url,
    'Mode': 'MultiModel'
}

model_name = endpoint_name

create_model_response = sm_client.create_model(
    ModelName = model_name,
    ExecutionRoleArn = role,
    Containers = [container])

配置Endpoint实例，包括机型及 Auto Scaling等等

In [None]:
endpoint_config_name = model_name
print('Endpoint config name: ' + endpoint_config_name)

create_endpoint_config_response = sm_client.create_endpoint_config(
    EndpointConfigName = endpoint_config_name,
    ProductionVariants=[{
        'InstanceType': 'ml.m5.large',
        'InitialInstanceCount': 2,
        'InitialVariantWeight': 1,
        'ModelName': model_name,
        'VariantName': 'AllTraffic'}])

构建endpoint

In [None]:
print('Endpoint name: ' + endpoint_name)

create_endpoint_response = sm_client.create_endpoint(
    EndpointName=endpoint_name,
    EndpointConfigName=endpoint_config_name)
print('Endpoint Arn: ' + create_endpoint_response['EndpointArn'])

resp = sm_client.describe_endpoint(EndpointName=endpoint_name)
status = resp['EndpointStatus']
print("Endpoint Status: " + status)

print('Waiting for {} endpoint to be in service...'.format(endpoint_name))
waiter = sm_client.get_waiter('endpoint_in_service')
waiter.wait(EndpointName=endpoint_name)