### SageMaker  Endpoint 部署ChatYuan
  
[ChatYuan](https://huggingface.co/ClueAI/ChatYuan-large-v1): 元语功能型对话大模型 , 这个模型可以用于问答、结合上下文做对话、做各种生成任务，包括创意性写作，也能回答一些像法律、新冠等领域问题。它基于PromptCLUE-large结合数亿条功能对话多轮对话数据进一步训练得到。

PromptCLUE-large在1000亿token中文语料上预训练，累计学习1.5万亿中文token，并且在数百种任务上进行Prompt任务式训练。针对理解类任务，如分类、情感分析、抽取等，可以自定义标签体系；针对多种生成任务，可以进行采样自由生成。

#### 准备
1. 升级boto3, sagemaker python sdk  
2. 准备inference.py, requirements.txt

In [3]:
!pip install --upgrade boto3
!pip install --upgrade sagemaker

Looking in indexes: https://pypi.org/simple, https://pip.repos.neuron.amazonaws.com
Looking in indexes: https://pypi.org/simple, https://pip.repos.neuron.amazonaws.com


In [2]:
import boto3
import sagemaker

account_id = boto3.client('sts').get_caller_identity().get('Account')
region_name = boto3.session.Session().region_name

sagemaker_session = sagemaker.Session()
bucket = sagemaker_session.default_bucket()
role = sagemaker.get_execution_role()

print(role)
print(bucket)

arn:aws:iam::596030579944:role/sagemaker-soln-bs-us-east-1-nb-role
sagemaker-us-east-1-596030579944


In [4]:
!touch dummy
!tar czvf model.tar.gz dummy
assets_dir = 's3://{0}/{1}/assets/'.format(bucket, 'chatyuan')
model_data = 's3://{0}/{1}/assets/model.tar.gz'.format(bucket, 'chatyuan')
!aws s3 cp model.tar.gz $assets_dir
!rm -f dummy model.tar.gz

dummy
upload: ./model.tar.gz to s3://sagemaker-us-east-1-596030579944/chatyuan/assets/model.tar.gz


### 设置模型推理参数
1. model_name: Huggingface diffusers models (not support single check point format)
2. model_args: diffuser StableDiffusionPipeline init arguments

In [5]:
model_name = None
entry_point = 'inference.py'
framework_version = '1.12'
py_version = 'py38'
bucket='m.flowq.io'
model_environment = {
    'SAGEMAKER_MODEL_SERVER_TIMEOUT':'600', 
    'SAGEMAKER_MODEL_SERVER_WORKERS': '1', 
}

In [6]:
from sagemaker.pytorch.model import PyTorchModel

model = PyTorchModel(
    name = model_name,
    model_data = model_data,
    entry_point = 'inference.py',
    source_dir = './code',
    role = role,
    framework_version = framework_version, 
    py_version = py_version,
    env = model_environment
)

### 部署 SageMaker Endpoint
部署推理服务

In [7]:
endpoint_name = None
instance_type = 'ml.g4dn.xlarge'
instance_count = 1

from sagemaker.serializers import JSONSerializer
from sagemaker.deserializers import JSONDeserializer
predictor = model.deploy(
    endpoint_name = endpoint_name,
    instance_type = instance_type, 
    initial_instance_count = instance_count,
    serializer = JSONSerializer(),
    deserializer = JSONDeserializer()
)

------------!

### ChatYuan 测试


In [8]:
inputs= {
    "ask": "费德勒网球水平怎么样? "

}

response = predictor.predict(inputs)
print(response["answer"])


费德勒在网球界的地位如何? 费德勒,这个曾经被认为"世界第一"的网球选手,在网球史上的地位是毋庸置疑的。 费天王在网球界的成就,可以说是无人能及的。他不仅在网球场上,在其他领域也取得了很多成就。 在网球领域,费德勒已经连续7年夺得温网冠军,在去年的法网,费天王更是夺得了男单冠军。 从费德勒的职业生涯来看,他已经取得了很多辉煌的成就。在网球赛场上,他一共获得了4个大满贯冠军,2个大赛冠军,2次大满冠,2届大满赛冠军,1次大冠军,1个大冠军。在其他方面,他也取得了非常多的成就。比如在网球运动中,他曾经获得过4个世界冠军,3个大联盟冠军,4个大师赛冠军,3次大联盟亚军,1届大联盟季军,1项大满球赛冠军,4次大赛冠军。 对于费德勒来说,他能够取得如此辉煌的成就,主要还是得益于他的努力。 他曾经在网球上获得过3个世界第一,1座大满


### 删除SageMaker  Endpoint
删除推理服务

In [9]:
predictor.delete_endpoint()