Add support for testing nightly images in sagemaker endpoint tests (#788

)
deepjavalibrary · Jun 1, 2023 · e2be156 · e2be156
1 parent 026e557
commit e2be156
Show file tree

Hide file tree

Showing 3 changed files with 58 additions and 30 deletions.
diff --git a/.github/workflows/sagemaker-integration.yml b/.github/workflows/sagemaker-integration.yml
@@ -3,6 +3,10 @@ name: SageMaker PythonSDK Integration Tests
 on:
   workflow_dispatch:
     inputs:
+      mode:
+        description: "release/nightly containers to test. Default is nightly"
+        required: false
+        default: nightly
       sagemaker-repository:
         description: 'Link to Github repository for SageMaker Python SDK. Can be a personal fork.'
         required: false
@@ -73,32 +77,32 @@ jobs:
       - name: MME Test
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py deepspeed-mme djl_mme
+          python3 llm/sagemaker-endpoint-tests.py deepspeed-mme djl_mme ${{ github.event.inputs.mode }}
       - name: Test gpt2xl
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py gpt2-xl djl
+          python3 llm/sagemaker-endpoint-tests.py gpt2-xl djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test stable diffusion
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py stable-diffusion-2-1-base djl
+          python3 llm/sagemaker-endpoint-tests.py stable-diffusion-2-1-base djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test opt-1.3b
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py opt-1-3-b djl
+          python3 llm/sagemaker-endpoint-tests.py opt-1-3-b djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test flan-t5-xxl
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py flan-t5-xxl djl
+          python3 llm/sagemaker-endpoint-tests.py flan-t5-xxl djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
         
@@ -128,28 +132,28 @@ jobs:
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py gpt-j-6b djl
+          python3 llm/sagemaker-endpoint-tests.py gpt-j-6b djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test gpt-neo-2.7b no code DeepSpeed
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py gpt-neo-2-7-b no_code
+          python3 llm/sagemaker-endpoint-tests.py gpt-neo-2-7-b no_code ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test bloom-7b1 no code FasterTransformer
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py bloom-7b1 no_code
+          python3 llm/sagemaker-endpoint-tests.py bloom-7b1 no_code ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
       - name: Test DeepSpeed pythia-12b
         if: success() || failure()
         working-directory: tests/integration
         run: |
-          python3 llm/sagemaker-endpoint-tests.py pythia-12b djl
+          python3 llm/sagemaker-endpoint-tests.py pythia-12b djl ${{ github.event.inputs.mode }}
           echo "sleep 30 seconds to allow endpoint deletion"
           sleep 30
 

diff --git a/engines/python/setup/djl_python/transformers-neuronx.py b/engines/python/setup/djl_python/transformers-neuronx.py
@@ -189,8 +189,8 @@ def infer(self, inputs):
                     "transformers-neuronx")
                 model_kwargs["engine"] = "transformers-neuronx"
                 outputs.add_stream_content(
-                    stream_generator(self.model, self.tokenizer,
-                                     input_text, **model_kwargs))
+                    stream_generator(self.model, self.tokenizer, input_text,
+                                     **model_kwargs))
                 return outputs
 
             encoded_inputs = self.tokenizer.batch_encode_plus(

diff --git a/tests/integration/llm/sagemaker-endpoint-tests.py b/tests/integration/llm/sagemaker-endpoint-tests.py
@@ -19,11 +19,16 @@
 parser.add_argument("test_case",
                     help="The test case to execute",
                     choices=["djl", "no_code", "djl_mme"])
+parser.add_argument(
+    "image_type",
+    help="Whether to use release or nightly images for testing",
+    choices=["nightly", "release"])
 
 ROLE = "arn:aws:iam::185921645874:role/AmazonSageMaker-ExeuctionRole-IntegrationTests"
 DEFAULT_INSTANCE_TYPE = "ml.g5.12xlarge"
 DEFAULT_PAYLOAD = {"inputs": "Deep Learning is"}
 DEFAULT_BUCKET = "sm-integration-tests-rubikon"
+RELEASE_VERSION = "0.22.1"
 
 SINGLE_MODEL_ENDPOINT_CONFIGS = {
     "stable-diffusion-2-1-base": {
@@ -91,19 +96,13 @@
             "HF_MODEL_ID": "EleutherAI/gpt-neo-2.7B",
             "TENSOR_PARALLEL_DEGREE": "1",
         },
-        "image_uri":
-        sagemaker.image_uris.retrieve(framework="djl-deepspeed",
-                                      version="0.22.1",
-                                      region="us-east-1")
+        "framework": "deepspeed"
     },
     "bloom-7b1": {
         "env": {
             "HF_MODEL_ID": "bigscience/bloom-7b1"
         },
-        "image_uri":
-        sagemaker.image_uris.retrieve(framework="djl-fastertransformer",
-                                      version="0.22.1",
-                                      region="us-east-1")
+        "framework": "fastertransformer"
     }
 }
 
@@ -124,13 +123,22 @@
         }],
         "instance_type":
         "ml.g5.8xlarge",
-        "image_uri":
-        "125045733377.dkr.ecr.us-east-1.amazonaws.com/djl-serving:0.22.1-deepspeed",
+        "framework":
+        "deepspeed",
     }
 }
 
 ENGINE_TO_METRIC_CONFIG_ENGINE = {"Python": "Accelerate"}
 
+NIGHTLY_IMAGES = {
+    "python":
+    "125045733377.dkr.ecr.us-east-1.amazonaws.com/djl-serving:deepspeed-nightly",
+    "deepspeed":
+    "125045733377.dkr.ecr.us-east-1.amazonaws.com/djl-serving:deepspeed-nightly",
+    "fastertransformer":
+    "125045733377.dkr.ecr.us-east-1.amazonaws.com/djl-serving:fastertransformer-nightly"
+}
+
 
 def get_sagemaker_session(default_bucket=DEFAULT_BUCKET,
                           default_bucket_prefix=None):
@@ -218,7 +226,7 @@ def _run_benchmarks(predictor, config, metric_name):
     _upload_metrics(benchmark_data)
 
 
-def mme_test(name):
+def mme_test(name, image_type):
     config = MME_CONFIGS.get(name)
     session = get_sagemaker_session(
         default_bucket_prefix=get_name_for_resource("mme-tests"))
@@ -230,19 +238,25 @@ def mme_test(name):
         for model_config in models:
             model = DJLModel(model_config.get("model_id"),
                              ROLE,
-                             image_uri=config.get("image_uri"),
                              name=get_name_for_resource(
                                  model_config.get("model_id") + '-mme'),
                              sagemaker_session=session,
                              **model_config.get("model_kwargs"))
             model.create()
             created_models.append(model)
 
+        if image_type == "nightly":
+            mme_image_uri = NIGHTLY_IMAGES[config.get("framework")]
+        else:
+            mme_image_uri = sagemaker.image_uris.retrieve(
+                framework="djl-" + config.get("framework"),
+                version=RELEASE_VERSION,
+                region="us-east-1")
         mme = MultiDataModel(get_name_for_resource(name),
                              "s3://" + session.default_bucket() + '/' +
                              session.default_bucket_prefix,
                              config.get("prefix"),
-                             image_uri=config.get("image_uri"),
+                             image_uri=mme_image_uri,
                              role=ROLE,
                              sagemaker_session=session,
                              predictor_cls=sagemaker.predictor.Predictor)
@@ -269,19 +283,26 @@ def mme_test(name):
             predictor.delete_endpoint()
 
 
-def no_code_endpoint_test(name):
+def no_code_endpoint_test(name, image_type):
     config = HUGGING_FACE_NO_CODE_CONFIGS.get(name)
     data = config.get("payload", DEFAULT_PAYLOAD)
     session = get_sagemaker_session(
         default_bucket_prefix=get_name_for_resource("no-code-tests"))
     model = None
     predictor = None
+    if image_type == "nightly":
+        image_uri = NIGHTLY_IMAGES[config.get("framework")]
+    else:
+        image_uri = sagemaker.image_uris.retrieve(framework="djl-" +
+                                                  config.get("framework"),
+                                                  version=RELEASE_VERSION,
+                                                  region="us-east-1")
     try:
         model = HuggingFaceModel(
             role=ROLE,
             env=config.get("env"),
             sagemaker_session=session,
-            image_uri=config.get("image_uri"),
+            image_uri=image_uri,
             name=get_name_for_resource(name),
         )
 
@@ -303,7 +324,7 @@ def no_code_endpoint_test(name):
             model.delete_model()
 
 
-def single_model_endpoint_test(name):
+def single_model_endpoint_test(name, image_type):
     config = SINGLE_MODEL_ENDPOINT_CONFIGS.get(name)
     data = config.get("payload", DEFAULT_PAYLOAD)
     session = get_sagemaker_session(
@@ -319,6 +340,8 @@ def single_model_endpoint_test(name):
             name=get_name_for_resource(name),
             **config.get("model_kwargs"),
         )
+        if image_type == "nightly":
+            model.image_uri = NIGHTLY_IMAGES[model.engine.value[0].lower()]
 
         if config.get("partition", False):
             model.partition(instance_type=DEFAULT_INSTANCE_TYPE,
@@ -351,12 +374,13 @@ def single_model_endpoint_test(name):
     args = parser.parse_args()
     model_name = args.model_name
     test_case = args.test_case
+    image_type = args.image_type
     if test_case == "djl":
-        single_model_endpoint_test(model_name)
+        single_model_endpoint_test(model_name, image_type)
     elif test_case == "no_code":
-        no_code_endpoint_test(model_name)
+        no_code_endpoint_test(model_name, image_type)
     elif test_case == "djl_mme":
-        mme_test(model_name)
+        mme_test(model_name, image_type)
     else:
         raise ValueError(
             f"{test_case} is not a valid test case. Valid choices: [djl, no_code, djl_mme])"