# Huggingface Bloom 1b7 Deployment to SageMaker Endpoint

* HuggingFace Model [bigscience/bloom-1b7](https://huggingface.co/bigscience/bloom-1b7)

> BigScience, BigScience Language Open-science Open-access Multilingual (BLOOM) Language Model. International, May 2021-May 2022

* [HuggingFace Inference Containers](https://github.com/aws/deep-learning-containers/blob/master/available_images.md#huggingface-inference-containers)
| Framework | Job Type | CPU/GPU | Python Version Options | Example URL |
|:---|:---|:---|:---|:---|
| TensorFlow 2.11.0 with HuggingFace transformers | inference | GPU | 3.9 (py39) | 763104351884.dkr.ecr.us-east-1.amazonaws.com/huggingface-tensorflow-inference:2.11.0-transformers4.26.0-gpu-py39-cu112-ubuntu20.04 |
| PyTorch 1.13.1 with HuggingFace transformers | inference | GPU | 3.9 (py39) | 763104351884.dkr.ecr.us-east-1.amazonaws.com/huggingface-pytorch-inference:1.13.1-transformers4.26.0-gpu-py39-cu117-ubuntu20.04 |


In [2]:
#!pip install "sagemaker>=2.48.0" --upgrade --quiet
!pip install sagemaker  --upgrade --quiet

[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
pytest-astropy 0.8.0 requires pytest-cov>=2.0, which is not installed.
pytest-astropy 0.8.0 requires pytest-filter-subpackage>=0.1, which is not installed.
awscli 1.27.104 requires rsa<4.8,>=3.1.2, but you have rsa 4.9 which is incompatible.[0m[31m
[0m

In [3]:
import sagemaker
import boto3

try:
    role = sagemaker.get_execution_role()
except ValueError:
    iam = boto3.client('iam')
    role = iam.get_role(RoleName='sagemaker_execution_role')['Role']['Arn']

print(f"sagemaker role arn: {role}")

sagemaker role arn: arn:aws:iam::755863699032:role/service-role/AmazonSageMaker-ExecutionRole-20230320T140558


In [6]:
from sagemaker.huggingface import HuggingFaceModel

# Hub Model configuration. https://huggingface.co/models
hub = {
#   'HF_MODEL_ID':'bigscience/bloom-1b7', # model_id from hf.co/models
  'HF_MODEL_ID':'bigscience/bloomz-1b7',      # model_id from hf.co/models
  'HF_TASK':'text-generation'                      # NLP task you want to use for predictions
}

# Hugging Face Model Class
# Take the versions from the availble HuggingFace DLC
huggingface_model = HuggingFaceModel(
   env=hub,
   role=role,                   # iam role with permissions to create an Endpoint
   transformers_version="4.26", # transformers version used
   pytorch_version="1.13",      # pytorch version used
   py_version="py39",           # python version of the DLC
)

In [7]:
# deploy model to SageMaker Inference
predictor = huggingface_model.deploy(
   initial_instance_count=1,
   # instance_type="ml.m5.xlarge"
   instance_type="ml.g4dn.2xlarge"
)

----------------!

# keywords

In [153]:
prompt = """Keywords in English from the sentence. Keyword must be in English:
Sentence:在新南威尔士州选举投票接近尾声之际，独立议员格林威治曾经谈到了如果他在未来州议会中握有举足轻重一票的潜在可能性。如果我们出现了一个少数政府中立议员，最重要的作用是为下届政府提供稳定性。这意味着我们必须考虑许多因素，那就是谁拥有最多的席位，是否有想做出改变的愿望。重要的是谁对我们州的未来有更好的想法？后来的事实证明，各方也许并不需要他的帮助。新南威尔士州工党需要赢得至少九个席位才能取得胜利，但忻州工党赢得了组建政府所需的最少四十七个席位。选票仍在计算当中，以确定工党是作为多数政府还是少数政府上台执政。分析人士预测，工党可能会在众议院九十三个席位中赢得多达五十个席位。澳大利亚总理阿尔巴尼斯缩短了在悉尼观看足球赛的时间。在周六晚上的胜利聚会上，介绍了忻州工党领袖冥思，他即将出任新州的四十七任州长。新南威尔士，中国人民齐心协力选择了更美好的未来。今晚，新南威尔士州开始了一个新时代，有了一位了不起的领导人。自第二次世界大战以来，新南威尔士州工党仅有两次从反对党变成执政党，一次是一九七六年在内维尔弗兰的领导下一次是一九九五年在鲍勃卡尔的领导下明思说工党打算充分利用他们重新执政的机会。没有们新南威尔士州人民投票决定建立一个将人民至于所有决策核心的政府我们不会让他们失望即将上任的州长将这次竞选活动描述为是未来选举的典范。我认为不可否认的是这场竞选活动也许是独一无二的是尊重和文明的典范任何一方都没有采取的捷手段两个政党都没有用非法手段打击对方我认为这可以成为在这个国家实现民主的一个榜样。随着工党在新南威尔士州的成功工党现在已经完成了人们所称的对澳大利亚大陆各州和联邦政坛的一网打尽。塔斯马尼亚是唯一一个由自由党领导的周由洛克利夫领导澳大利亚前总理霍华德在悉尼希尔顿酒店出席了联盟党的活动。他拒绝对工党的新统治地位对联盟党意味着什么发表看法。他告诉记者说，做出相关推测应该是别人的事。我现在谈论这个为时过早。我只想说，我不是来代表自由党发表声明的，那是州长的事儿，但我非常钦佩佩洛提他在极其困难的情况下接任，并以英勇的方式进行了竞选。联盟党的议员和厅长们告诉记者，在生活成本危机中想要连续第四次执政肯定是一场艰苦的战斗。但即将离任的州长佩洛提告诉自由党的忠实支持者说，联盟党让新南威尔士州成了一个更加自信和成功的周。他说他尊重选举结果。他说新南威尔士州伟大的人民今晚决定在忻州选举一个工党政府。我们尊重这个决定。竞选过程可能会很丑陋，但我相信这次的选举是一场高层次的竞赛，是一场真正的思想交锋，这是政治所处的最佳状态。佩罗提也证实，他将辞去自由党领袖，一直为前财政厅长马特吉安敞开大门。人们普遍预计他将争取获得忻州联盟党的领导地位。基恩拒绝证实他是否考虑参选，称现在下结论还为时过早。
Keywords in English: 
"""

In [154]:
# prompt = """概括句子. 新南威尔士州选举投票接近尾声之际，独立议员格林威治曾经谈到了如果他在未来州议会中握有举足轻重一票的潜在可能性。如果我们出现了一个少数政府中立议员，最重要的作用是为下届政府提供稳定性。这意味着我们必须考虑许多因素，那就是谁拥有最多的席位，是否有想做出改变的愿望。重要的是谁对我们州的未来有更好的想法？后来的事实证明，各方也许并不需要他的帮助。新南威尔士州工党需要赢得至少九个席位才能取得胜利，但忻州工党赢得了组建政府所需的最少四十七个席位。选票仍在计算当中，以确定工党是作为多数政府还是少数政府上台执政。分析人士预测，工党可能会在众议院九十三个席位中赢得多达五十个席位。澳大利亚总理阿尔巴尼斯缩短了在悉尼观看足球赛的时间。在周六晚上的胜利聚会上，介绍了忻州工党领袖冥思，他即将出任新州的四十七任州长。新南威尔士，中国人民齐心协力选择了更美好的未来。今晚，新南威尔士州开始了一个新时代，有了一位了不起的领导人。自第二次世界大战以来，新南威尔士州工党仅有两次从反对党变成执政党，一次是一九七六年在内维尔弗兰的领导下一次是一九九五年在鲍勃卡尔的领导下明思说工党打算充分利用他们重新执政的机会。没有们新南威尔士州人民投票决定建立一个将人民至于所有决策核心的政府我们不会让他们失望即将上任的州长将这次竞选活动描述为是未来选举的典范。我认为不可否认的是这场竞选活动也许是独一无二的是尊重和文明的典范任何一方都没有采取的捷手段两个政党都没有用非法手段打击对方我认为这可以成为在这个国家实现民主的一个榜样。随着工党在新南威尔士州的成功工党现在已经完成了人们所称的对澳大利亚大陆各州和联邦政坛的一网打尽。塔斯马尼亚是唯一一个由自由党领导的周由洛克利夫领导澳大利亚前总理霍华德在悉尼希尔顿酒店出席了联盟党的活动。他拒绝对工党的新统治地位对联盟党意味着什么发表看法。他告诉记者说，做出相关推测应该是别人的事。我现在谈论这个为时过早。我只想说，我不是来代表自由党发表声明的，那是州长的事儿，但我非常钦佩佩洛提他在极其困难的情况下接任，并以英勇的方式进行了竞选。联盟党的议员和厅长们告诉记者，在生活成本危机中想要连续第四次执政肯定是一场艰苦的战斗。但即将离任的州长佩洛提告诉自由党的忠实支持者说，联盟党让新南威尔士州成了一个更加自信和成功的周。他说他尊重选举结果。他说新南威尔士州伟大的人民今晚决定在忻州选举一个工党政府。我们尊重这个决定。竞选过程可能会很丑陋，但我相信这次的选举是一场高层次的竞赛，是一场真正的思想交锋，这是政治所处的最佳状态。佩罗提也证实，他将辞去自由党领袖，一直为前财政厅长马特吉安敞开大门。人们普遍预计他将争取获得忻州联盟党的领导地位。基恩拒绝证实他是否考虑参选，称现在下结论还为时过早。
# """


In [156]:
request = {
    "inputs": prompt,
    "parameters": {
        "return_full_text": False,
        "repetition_penalty": 50.0,
#        "do_sample": False, 
        "min_new_tokens": 10,
        "max_new_tokens": 50,
#        "min_length": 50,
#        "max_length": 15
#        " top_k": 50, 
#        "top_p": 0.9
    }
}
response = predictor.predict(request)
print(response[0]['generated_text'])

New South Wales, Australia - The Australian people have chosen a new government


# Summarization

In [148]:
prompt = """Summarize the sentence. Summary must be in English:
Sentence:在新南威尔士州选举投票接近尾声之际，独立议员格林威治曾经谈到了如果他在未来州议会中握有举足轻重一票的潜在可能性。如果我们出现了一个少数政府中立议员，最重要的作用是为下届政府提供稳定性。这意味着我们必须考虑许多因素，那就是谁拥有最多的席位，是否有想做出改变的愿望。重要的是谁对我们州的未来有更好的想法？后来的事实证明，各方也许并不需要他的帮助。新南威尔士州工党需要赢得至少九个席位才能取得胜利，但忻州工党赢得了组建政府所需的最少四十七个席位。选票仍在计算当中，以确定工党是作为多数政府还是少数政府上台执政。分析人士预测，工党可能会在众议院九十三个席位中赢得多达五十个席位。澳大利亚总理阿尔巴尼斯缩短了在悉尼观看足球赛的时间。在周六晚上的胜利聚会上，介绍了忻州工党领袖冥思，他即将出任新州的四十七任州长。新南威尔士，中国人民齐心协力选择了更美好的未来。今晚，新南威尔士州开始了一个新时代，有了一位了不起的领导人。自第二次世界大战以来，新南威尔士州工党仅有两次从反对党变成执政党，一次是一九七六年在内维尔弗兰的领导下一次是一九九五年在鲍勃卡尔的领导下明思说工党打算充分利用他们重新执政的机会。没有们新南威尔士州人民投票决定建立一个将人民至于所有决策核心的政府我们不会让他们失望即将上任的州长将这次竞选活动描述为是未来选举的典范。我认为不可否认的是这场竞选活动也许是独一无二的是尊重和文明的典范任何一方都没有采取的捷手段两个政党都没有用非法手段打击对方我认为这可以成为在这个国家实现民主的一个榜样。随着工党在新南威尔士州的成功工党现在已经完成了人们所称的对澳大利亚大陆各州和联邦政坛的一网打尽。塔斯马尼亚是唯一一个由自由党领导的周由洛克利夫领导澳大利亚前总理霍华德在悉尼希尔顿酒店出席了联盟党的活动。他拒绝对工党的新统治地位对联盟党意味着什么发表看法。他告诉记者说，做出相关推测应该是别人的事。我现在谈论这个为时过早。我只想说，我不是来代表自由党发表声明的，那是州长的事儿，但我非常钦佩佩洛提他在极其困难的情况下接任，并以英勇的方式进行了竞选。联盟党的议员和厅长们告诉记者，在生活成本危机中想要连续第四次执政肯定是一场艰苦的战斗。但即将离任的州长佩洛提告诉自由党的忠实支持者说，联盟党让新南威尔士州成了一个更加自信和成功的周。他说他尊重选举结果。他说新南威尔士州伟大的人民今晚决定在忻州选举一个工党政府。我们尊重这个决定。竞选过程可能会很丑陋，但我相信这次的选举是一场高层次的竞赛，是一场真正的思想交锋，这是政治所处的最佳状态。佩罗提也证实，他将辞去自由党领袖，一直为前财政厅长马特吉安敞开大门。人们普遍预计他将争取获得忻州联盟党的领导地位。基恩拒绝证实他是否考虑参选，称现在下结论还为时过早。
Summary in English: 
"""

request = {
    "inputs": prompt,
    "parameters": {
        "return_full_text": False,
        "repetition_penalty": 50.0,
#        "do_sample": False, 
#        "min_new_tokens": 10,
        "max_new_tokens": 100,
#        "min_length": 50,
#        "max_length": 15
#        " top_k": 50, 
#        "top_p": 0.9
    }
}
response = predictor.predict(request)
print(response[0]['generated_text'])

根据最新民调显示：


# Code Generation

In [93]:
prompt = """C: printf("Hello, World!");
Python: print("hello world")
Java: System.out.println("Hello world")
R:
"""

request = {
    "inputs": prompt,
    "parameters": {
        "return_full_text": False,
        "repetition_penalty": 10.0,
        "do_sample": False, 
        "min_new_tokens": 20,
        "max_new_tokens": 50,
        "min_length": 20,
    }
}

response = predictor.predict(request)
print(response[0]['generated_text'])

System out = new java::lang :: PrintStream() ; 
print ( "Hello " +  "World!\n" )


# Translation

In [94]:
prompt = "To say 'The federal government is advocating for a pay rise that stops low-paid workers going backwards, but business groups have expressed concerns about higher wage bills.' in Spanish, you would say:"

request = {
    "inputs": prompt,
    "parameters": {
        "return_full_text": False,
        "repetition_penalty": 10.0,
        "do_sample": False, 
        "min_new_tokens": 20,
        "max_new_tokens": 50,
        "min_length": 20,
    }
}

response = predictor.predict(request)
print(response[0]['generated_text'])

 El gobierno está abogando por un aumento salarial que detenga la pérdida de puestos laborales para los trabajadores más bajos y las empresas han expresado sus preocupaciones sobre el alza en impuestos al trabajo


# Text generation 

In [95]:
predictor.predict({
    'inputs': "In Japan, earthquake is",
    "parameters": {
        "return_full_text": False,
        "repetition_penalty": 10.0,
        "do_sample": False, 
        "min_new_tokens": 20,
        "max_new_tokens": 50,
        "min_length": 20,
    }
})

[{'generated_text': ' a natural disaster that occurs when the Earth moves in an unusually strong way. The Japanese government has designated it as one of their top five national disasters'}]

# Clean up

In [157]:
# delete endpoint
predictor.delete_model()
predictor.delete_endpoint()