# フォルダ移動

In [9]:
%cd ~/sagemaker_studio_luke_endpoint/pipeline

/root/sagemaker_studio_luke_endpoint/pipeline


# ライブラリ

In [11]:
!pip install transformers sentencepiece

[0m

In [12]:
import os
import boto3
import json
import sagemaker
from sagemaker import get_execution_role
from sagemaker.pytorch.model import PyTorchModel
import json
import requests
from transformers import MLukeTokenizer, LukeModel

# upload data

In [13]:
SAVED_MODEL_DIR = 'sentence-luke'
os.makedirs(SAVED_MODEL_DIR, exist_ok=True)

MODEL_NAME = "sonoisa/sentence-luke-japanese-base-lite"
tokenizer = MLukeTokenizer.from_pretrained(MODEL_NAME)
model = LukeModel.from_pretrained(MODEL_NAME)

tokenizer.save_pretrained(SAVED_MODEL_DIR)
model.save_pretrained(SAVED_MODEL_DIR)

In [14]:
!cd sentence-luke && tar czvf ../model.tar.gz *

added_tokens.json
config.json
entity_vocab.json
pytorch_model.bin
sentencepiece.bpe.model
special_tokens_map.json
tokenizer_config.json


In [15]:
sagemaker_session = sagemaker.Session() 
s3_model_location = sagemaker_session.upload_data(path='model.tar.gz', key_prefix='model')

In [16]:
# 削除
!rm model.tar.gz 

In [17]:
# 削除
!rm -r sentence-luke

## エンドポイント作成

In [18]:
role = get_execution_role()
endpoint_name = 'luke-endpoint'

sagemaker_model = PyTorchModel(
    model_data=s3_model_location, #s3上の、model.tar.gzが置かれた場所
    role=role,
    framework_version='2.0.0',  # 使用するPyTorchのバージョン
    py_version='py310', #python3.10を指定
    entry_point='inference.py',  # 推論を行うためのPythonスクリプト
    source_dir='./code'  # inference.pyとrequirements.txtが存在するディレクトリ
)

In [19]:
predictor = sagemaker_model.deploy(
    instance_type='ml.g4dn.xlarge', 
    initial_instance_count=1,
    endpoint_name = endpoint_name,
)

------------!

# エンドポイント動作確認

In [20]:
# AWSのセッションを作成し、SageMakerクライアントを取得
session = boto3.Session()
sagemaker_runtime = session.client('sagemaker-runtime')

# 推論したいデータをJSON形式に変換
data = {"text": "異世界転生"}
json_data = json.dumps(data)

# SageMakerエンドポイントにリクエストを送信
response = sagemaker_runtime.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType='application/json',
    Accept='text/plain', #今回、なぜかjson形式のレスポンスを受け取れなかったため、文字列を受け取るようにしています。
    Body=json_data
)

# レスポンスを取得
response_body = response['Body']
result=response_body.read().decode()

print(result)

{'mean similarity with previous novels': 0.45441929}


# エンドポイント削除

In [21]:
predictor.delete_endpoint()