In [1]:
!pip install sagemaker --upgrade

Collecting sagemaker
  Downloading sagemaker-2.111.0.tar.gz (577 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m577.4/577.4 KB[0m [31m5.7 MB/s[0m eta [36m0:00:00[0m00:01[0m
[?25h  Preparing metadata (setup.py) ... [?25ldone
Collecting protobuf<4.0,>=3.1
  Downloading protobuf-3.20.3-cp38-cp38-manylinux_2_5_x86_64.manylinux1_x86_64.whl (1.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m10.7 MB/s[0m eta [36m0:00:00[0m:00:01[0m
Collecting schema
  Downloading schema-0.7.5-py2.py3-none-any.whl (17 kB)
Collecting contextlib2>=0.5.5
  Downloading contextlib2-21.6.0-py2.py3-none-any.whl (13 kB)
Building wheels for collected packages: sagemaker
  Building wheel for sagemaker (setup.py) ... [?25ldone
[?25h  Created wheel for sagemaker: filename=sagemaker-2.111.0-py2.py3-none-any.whl size=793048 sha256=c8fae89b15497faf54718d62118bf43ad0f21578923c3467802ac978910fa242
  Stored in directory: /root/.cache/pip/wheels/45/89/ba

In [2]:
import sagemaker
sess = sagemaker.Session()
role = sagemaker.get_execution_role()

In [5]:
from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker.serverless import ServerlessInferenceConfig

# Hub model configuration <https://huggingface.co/models>
hub = {
  'HF_MODEL_ID':'distilbert-base-uncased-distilled-squad', # model_id from hf.co/models
  'HF_TASK':'question-answering'                           # NLP task you want to use for predictions
}

# create Hugging Face Model Class
huggingface_model = HuggingFaceModel(
   env=hub,                                                # configuration for loading model from Hub
   role=role,                                              # IAM role with permissions to create an endpoint
   transformers_version="4.6",                             # Transformers version used
   pytorch_version="1.7",                                  # PyTorch version used
   py_version='py36',                                      # Python version used
)

# deploy model to SageMaker Inference
predictor = huggingface_model.deploy(
    serverless_inference_config=ServerlessInferenceConfig(
        memory_size_in_mb=3072,
        max_concurrency=10,
    ),
)

---------!

In [6]:
data = {
"inputs": {
	"question": "What is used for inference?",
	"context": "My Name is Philipp and I live in Nuremberg. This model is used with sagemaker for inference."
	}
}

# request
predictor.predict(data)

{'score': 0.9987210035324097, 'start': 68, 'end': 77, 'answer': 'sagemaker'}

In [None]:
data = {
    "inputs": [
        {
            "question": "How much was the total?",
            "context": "Sokos Helsinki p. 010 766 5100 Hok-Elanto Liiketoiminta Oy, 1837957-3 33 K33 M000280/2960 21:04 29-11-2021 M&S PERUNA 3-PA 14.95 22270177 N.ALUSH.LAHKEETON YHTEENSA 14.95 KORTTITAPAHTUMA Kortti: VISA ELECTRON **** **** **** 9701 LN Sovellus: A0000000032010 Tap.nro/Varmennus: 06196/514778 Yritys/Ala: 018379573482/5311 Viite: 211129336196 Debit/Veloitus 14,95 EUR Visa Contactless ALV VEROTON VERO VEROLLINEN 24.00% 12.06 2.89 14.95 YHTEENSA 12.06 2.89 14.95 Käyttämättomillä ja myyntikuntoisilla tuotteilla vaihto- ja palautus- oikeus 6.1.2022 saakka"
        },
        {
            "question": "What is the name of the vendor?",
            "context": "Sokos Helsinki p. 010 766 5100 Hok-Elanto Liiketoiminta Oy, 1837957-3 33 K33 M000280/2960 21:04 29-11-2021 M&S PERUNA 3-PA 14.95 22270177 N.ALUSH.LAHKEETON YHTEENSA 14.95 KORTTITAPAHTUMA Kortti: VISA ELECTRON **** **** **** 9701 LN Sovellus: A0000000032010 Tap.nro/Varmennus: 06196/514778 Yritys/Ala: 018379573482/5311 Viite: 211129336196 Debit/Veloitus 14,95 EUR Visa Contactless ALV VEROTON VERO VEROLLINEN 24.00% 12.06 2.89 14.95 YHTEENSA 12.06 2.89 14.95 Käyttämättomillä ja myyntikuntoisilla tuotteilla vaihto- ja palautus- oikeus 6.1.2022 saakka"
        },
        {
            "question": "What is the address of the vendor?",
            "context": "Sokos Helsinki p. 010 766 5100 Hok-Elanto Liiketoiminta Oy, 1837957-3 33 K33 M000280/2960 21:04 29-11-2021 M&S PERUNA 3-PA 14.95 22270177 N.ALUSH.LAHKEETON YHTEENSA 14.95 KORTTITAPAHTUMA Kortti: VISA ELECTRON **** **** **** 9701 LN Sovellus: A0000000032010 Tap.nro/Varmennus: 06196/514778 Yritys/Ala: 018379573482/5311 Viite: 211129336196 Debit/Veloitus 14,95 EUR Visa Contactless ALV VEROTON VERO VEROLLINEN 24.00% 12.06 2.89 14.95 YHTEENSA 12.06 2.89 14.95 Käyttämättomillä ja myyntikuntoisilla tuotteilla vaihto- ja palautus- oikeus 6.1.2022 saakka"
        },
    ]
}

predictor.predict(data)