In [16]:
import json

with open('../config.json') as f:
    config = json.load(f)

config

{'MODEL_NAME': 'chatglm-6b',
 'S3_MODEL': 's3://hugging-face/llm/chatglm-6b.tar.gz',
 'ENDPOINT_NAME': 'HF-FALCON-7B-INSTRUCT-20230710-141220',
 'REGION_NAME': 'cn-northwest-1',
 'INSTANCE_TYPE': 'ml.g4dn.2xlarge'}

In [17]:
import boto3  
from sagemaker.huggingface.model import HuggingFaceModel
import sagemaker
from time import gmtime, strftime

s3_model = config['S3_MODEL']

try:
    role = sagemaker.get_execution_role()
except ValueError:
    iam = boto3.client('iam')
    role = iam.get_role(RoleName='sagemaker_execution_role')['Role']['Arn']

huggingface_model = HuggingFaceModel(
    model_data=s3_model,
    role=role,
    transformers_version='4.26',
    pytorch_version='1.13',
    py_version='py39',
)

predictor = huggingface_model.deploy(
    initial_instance_count=1,
    # instance_type='ml.m5.xlarge',
    instance_type='ml.g4dn.2xlarge',
    endpoint_name=config['MODEL_NAME'].upper() + strftime("-%Y%m%d-%H%M%S", gmtime()),
)

--------------------!

In [1]:
from sagemaker.huggingface.model import HuggingFacePredictor

predictor = HuggingFacePredictor(
  endpoint_name='CHATGLM-6B-20230711-080222'
)

In [17]:
# send request
response = predictor.predict({"input": "七月份去京都，有什么推荐的景点或者活动吗？"})
print(response)

京都的七月份是一个气温适宜、风景优美的季节，以下是一些推荐的景点和活动：

1. 京都塔：京都塔是京都最著名的建筑之一，是一座高塔，可以俯瞰整个京都市。在七月份，京都塔的攀登活动通常会举行，这是一个非常受欢迎的活动。

2. 金阁寺：金阁寺是一座古老的佛教寺庙，建于17世纪，以其美丽的花园和壮观的建筑而闻名。在七月份，金阁寺的樱花季节即将到来，这是一个观赏樱花的好时机。

3. 清水寺：清水寺是京都最古老的佛教寺庙之一，建于778年。在七月份，清水寺的樱花季节即将到来，这是一个观赏樱花的好时机。

4. 祇園：祇園是京都最古老的園子之一，建于7世纪。在七月份，祇園的祇園花月活动通常会举行，这是一个观赏樱花和花月的好时机。

5. 奈良公园：奈良公园是京都另一个受欢迎的公园，位于奈良山上。在七月份，奈良公园的鹿会进入季节，这是一个观赏鹿的好时机。

6. 京都市场：京都有许多市场，其中一些非常有趣。例如，草津市场是一个古老的市场，建于7世纪，是一个购物和品尝当地美食的好地方。

7. 京都温泉：京都有许多温泉酒店和温泉诊所，在七月份，这是一个享受温泉的好时机。

希望这些推荐能帮助你计划一次愉快的京都之旅！
