In [None]:
# Copyright 2022 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

<table align="left">
  <td>
    <a href="https://github.com/GoogleCloudPlatform/vertex-ai-samples/blob/main/notebooks/community/prediction/custom_prediction_routines/SDK_Custom_Predict_SDK_Integration.ipynb">
      <img src="https://cloud.google.com/ml-engine/images/github-logo-32px.png" alt="GitHub logo">
      在 GitHub 上查看
    </a>
  </td>
  <td>
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/vertex-ai-samples/main/notebooks/community/prediction/custom_prediction_routines/SDK_Custom_Predict_SDK_Integration.ipynb">
      <img src="https://lh3.googleusercontent.com/UiNooY4LUgW_oTvpsNhPpQzsstV5W8F7rYgxgGBD85cWJoLmrOzhVs_ksK_vgx40SHs7jCqkTkCk=e14-rj-sc0xffffff-h130-w32" alt="Vertex AI logo">
      在 Vertex AI Workbench 中打开
    </a>
  </td>
</table>

## 概述

本教程演示了如何使用Vertex AI SDK构建一个自定义容器，该容器使用自定义预测例行程序模型服务器来为Vertex AI预测提供一个scikit-learn模型。



### 数据集

本教程使用R.A. Fisher的鸢尾花数据集，这是一个小数据集，非常受欢迎用于尝试机器学习技术。每个实例有四个数值特征，这些特征是一朵花的不同测量值，并且有一个目标标签，标记它是三种类型的鸢尾花之一：山鸢尾（Iris setosa）、变色鸢尾（Iris versicolour）或维吉尼亚鸢尾（Iris virginica）。

本教程使用[scikit-learn库中包含的鸢尾花数据集的副本](https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html)。

### 目标

目标是：
- 训练一个模型，该模型将花的测量作为输入来预测它是什么类型的鸢尾花。
- 保存模型以及其序列化的预处理器
- 使用Vertex AI SDK中的自定义预测例行程序功能构建一个自定义的sklearn服务容器
- 在本地测试构建的容器
- 上传并部署自定义容器到Vertex Prediction

本教程更专注于使用Vertex AI部署这个模型，而不是模型本身的设计。

### 成本

本教程使用Google Cloud的计费组件：

* Vertex AI

了解[Vertex AI定价](https://cloud.google.com/vertex-ai/pricing)，并使用[Pricing Calculator](https://cloud.google.com/products/calculator/)根据您的预期使用量生成成本估算。

### 设置本地开发环境

**如果您正在使用 Vertex AI Workbench 笔记本**，您的环境已经满足运行此笔记本的所有要求。您可以跳过这一步。

否则，请确保您的环境满足本笔记本的要求。
您需要以下内容：

* Docker
* Git
* Google Cloud SDK（gcloud）
* Python 3
* virtualenv
* 在使用Python 3的虚拟环境中运行的Jupyter笔记本

Google Cloud的[设置Python开发环境指南](https://cloud.google.com/python/setup)和[Jupyter安装指南](https://jupyter.org/install)提供了满足这些要求的详细说明。以下步骤提供了一套简洁的说明：

1. [安装并初始化Cloud SDK。](https://cloud.google.com/sdk/docs/)

1. [安装Python 3。](https://cloud.google.com/python/setup#installing_python)

1. [安装virtualenv](https://cloud.google.com/python/setup#installing_and_using_virtualenv)并创建一个使用Python 3的虚拟环境。激活虚拟环境。

1. 要安装Jupyter，请在终端窗口中的命令行中运行`pip install jupyter`。

1. 要启动Jupyter，请在终端窗口中的命令行中运行`jupyter notebook`。

1. 在Jupyter Notebook Dashboard中打开此笔记本。

### 安装额外的包

安装在您的笔记本环境中尚未安装的额外的包依赖，例如NumPy、Scikit-learn、FastAPI、Uvicorn和joblib。

In [None]:
%%writefile requirements.txt
fastapi
uvicorn==0.17.6
joblib~=1.0
numpy~=1.20
scikit-learn~=0.24
google-cloud-storage>=1.26.0,<2.0.0dev
google-cloud-aiplatform[prediction]>=1.16.0

你部署的模型将预先安装了一组不同的依赖项，而不是笔记本环境中默认安装的依赖项。你不应该假设因为在笔记本里能工作就一定能在模型中工作。相反，你应该通过在requirements.txt中列出依赖项，并使用`pip install`在笔记本中安装完全相同的依赖项。请注意，当然，有可能你在requirements.txt中漏掉了笔记本中已经存在的依赖项。如果是这种情况，事情将在笔记本中运行，但在模型中就会出现问题。为了防范这种情况，你应该在部署到云端之前在本地测试模型。

In [None]:
# Install the same dependencies used in the serving container in the notebook
# environment.
%pip install -U --user -r requirements.txt

重新启动内核

在安装额外的软件包之后，您需要重新启动笔记本内核，以便它可以找到这些软件包。

In [None]:
# Automatically restart kernel after installs
import os

if not os.getenv("IS_TESTING"):
    # Automatically restart kernel after installs
    import IPython

    app = IPython.Application.instance()
    app.kernel.do_shutdown(True)

在你开始之前

### 在这个示例中设置日志记录

In [None]:
import logging

logging.basicConfig(level=logging.INFO)

### 设置您的Google Cloud项目

**无论您使用的是哪种笔记本环境，以下步骤都是必须的。**

1. [选择或创建 Google Cloud 项目](https://console.cloud.google.com/cloud-resource-manager)。当您首次创建帐户时，您将获得$300的免费信用额度，可用于计算/存储成本。

1. [确保为您的项目启用计费](https://cloud.google.com/billing/docs/how-to/modify-project)。

1. [启用 Vertex AI API 和 Compute Engine API](https://console.cloud.google.com/flows/enableapi?apiid=aiplatform.googleapis.com,compute_component)。

1. 如果您在本地运行此笔记本，您需要安装[Cloud SDK](https://cloud.google.com/sdk)。

1. 在下面的单元格中输入您的项目ID。然后运行单元格，以确保Cloud SDK在本笔记本中的所有命令中使用正确的项目。

**注意**：Jupyter 运行以`!`或`%`为前缀的行作为shell命令，并将Python变量插入这些命令中的`$`或`{}`。

设置您的项目ID

**如果您不知道您的项目ID**，您可以使用 `gcloud` 获取您的项目ID。

In [None]:
import os

PROJECT_ID = ""

# Get your Google Cloud project ID from gcloud
if not os.getenv("IS_TESTING"):
    shell_output = !gcloud config list --format 'value(core.project)' 2>/dev/null
    PROJECT_ID = shell_output[0]
    print("Project ID: ", PROJECT_ID)

否则，请在这里设置您的项目ID。

In [None]:
if PROJECT_ID == "" or PROJECT_ID is None:
    PROJECT_ID = "[your-project-id]"  # @param {type:"string"}

In [None]:
! gcloud config set project $PROJECT_ID

区域

您也可以更改`REGION`变量，该变量用于本笔记本的其余操作。以下是Vertex AI支持的区域。我们建议您选择最接近您的区域。

- 美洲：`us-central1`
- 欧洲：`europe-west4`
- 亚太地区：`asia-east1`

您不可以使用多区域存储桶进行Vertex AI的训练。并非所有区域都支持所有Vertex AI服务。

了解更多关于[Vertex AI区域](https://cloud.google.com/vertex-ai/docs/general/locations)。

In [None]:
REGION = "[your-region]"  # @param {type: "string"}

if REGION == "[your-region]":
    REGION = "us-central1"

### 配置项目和资源名称

如果您正在参加直播教程会话，您可能会使用共享的测试账户或项目。为了避免用户在创建的资源之间发生名称冲突，您可以为每个实例会话创建一个时间戳，并将其附加到您在这个教程中创建的资源名称上。

In [None]:
from datetime import datetime

TIMESTAMP = datetime.now().strftime("%Y%m%d%H%M%S")

配置 GCP 资源名称。

In [None]:
MODEL_ARTIFACT_DIR = "sklearn-cpr-model-sdk"  # @param {type:"string"}
REPOSITORY = "custom-container-prediction-sdk"  # @param {type:"string"}
IMAGE = "sklearn-cpr-server-sdk"  # @param {type:"string"}
MODEL_DISPLAY_NAME = "sklearn-cpr-model-sdk"  # @param {type:"string"}

`MODEL_ARTIFACT_DIR` - 在云存储桶中模型工件的文件夹路径，例如："my-models/fraud-detection/trial-4"

`REPOSITORY` - 要创建或使用的工件库的名称。

`IMAGE` - 将要推送的容器图像的名称。

`MODEL_DISPLAY_NAME` - Vertex AI模型资源的显示名称。

### 创建一个云存储桶

**无论您使用的是笔记本环境，以下步骤都是必需的。**

如果要更新您的模型 artfacts 而不必重新构建容器，您必须将您的模型 artfacts 和任何自定义代码上传到云存储中。

请在下方设置您的云存储桶的名称。它必须在所有云存储桶中是唯一的。

In [None]:
BUCKET_NAME = "[your-bucket-name]"  # @param {type:"string"}
BUCKET_URI = f"gs://{BUCKET_NAME}"

In [None]:
if BUCKET_NAME == "" or BUCKET_NAME is None or BUCKET_NAME == "[your-bucket-name]":
    BUCKET_NAME = PROJECT_ID + "-aip-" + TIMESTAMP
    BUCKET_URI = f"gs://{BUCKET_NAME}"

只有在您的存储桶不存在时：运行以下单元格以创建您的云存储桶。

In [None]:
! gsutil mb -l $REGION -p $PROJECT_ID $BUCKET_URI

最后，通过检查云存储桶的内容来验证访问权限。

In [None]:
! gsutil ls -al $BUCKET_URI

## 写你的预处理器

将目录设置为放置您所有自定义代码的位置。

In [None]:
USER_SRC_DIR = "src_dir_sdk"  # @param {type:"string"}

确定放置您训练模型的目录。

In [None]:
LOCAL_MODEL_ARTIFACTS_DIR = "model_artifacts"  # @param {type:"string"}

将每个数值特征列的均值设置为 0，标准差设置为 1 可以改进您的模型。

创建 `preprocess.py`，其中包含一个用于进行此缩放的类。

In [None]:
%mkdir $USER_SRC_DIR
%mkdir $LOCAL_MODEL_ARTIFACTS_DIR

In [None]:
%%writefile $USER_SRC_DIR/preprocess.py
import numpy as np

class MySimpleScaler(object):
    def __init__(self):
        self._means = None
        self._stds = None

    def preprocess(self, data):
        if self._means is None:  # during training only
            self._means = np.mean(data, axis=0)

        if self._stds is None:  # during training only
            self._stds = np.std(data, axis=0)
            if not self._stds.all():
                raise ValueError("At least one column has standard deviation of 0.")

        return (data - self._means) / self._stds

## 使用预处理器训练和存储模型
接下来，使用`preprocess.MySimpleScaler`预处理鸢尾花数据，然后使用scikit-learn训练模型。

最后，将训练好的模型导出为一个joblib（`.joblib`）文件，并将`MySimpleScaler`实例导出为一个pickle（`.pkl`）文件：

In [None]:
%cd $USER_SRC_DIR/

import pickle

import joblib
from preprocess import MySimpleScaler
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier

iris = load_iris()
scaler = MySimpleScaler()

X = scaler.preprocess(iris.data)
y = iris.target

model = RandomForestClassifier()
model.fit(X, y)

joblib.dump(model, f"../{LOCAL_MODEL_ARTIFACTS_DIR}/model.joblib")
with open(f"../{LOCAL_MODEL_ARTIFACTS_DIR}/preprocessor.pkl", "wb") as f:
    pickle.dump(scaler, f)

将模型工件和自定义代码上传到云存储

在部署模型以提供服务之前，Vertex AI 需要访问 Cloud Storage 中以下文件：

* `model.joblib` (模型工件)
* `preprocessor.pkl` (模型工件)

运行以下命令上传您的文件：

In [None]:
%cd ..
!gsutil cp {LOCAL_MODEL_ARTIFACTS_DIR}/* {BUCKET_URI}/{MODEL_ARTIFACT_DIR}/
!gsutil ls {BUCKET_URI}/{MODEL_ARTIFACT_DIR}/

使用CPR模型服务器构建一个定制的服务容器

现在模型和处理器已经被训练和保存，是时候构建自定义的Serving容器了。通常构建一个Serving容器需要编写模型服务器代码。然而，使用自定义预测例程功能，Vertex AI Prediction提供了一个可以直接使用的模型服务器。

自定义Serving容器包含以下3个代码片段：
1. [模型服务器](https://github.com/googleapis/python-aiplatform/blob/main/google/cloud/aiplatform/prediction/model_server.py)
    * 托管模型的HTTP服务器。
    * 负责设置路由/端口等。
2. [请求处理器](https://github.com/googleapis/python-aiplatform/blob/main/google/cloud/aiplatform/prediction/handler.py)
    * 负责处理请求的Web服务器方面，例如对请求主体进行反序列化、对响应进行序列化、设置响应标头等。
    * 在本例中，您将使用SDK中提供的默认处理器`google.cloud.aiplatform.prediction.handler.PredictionHandler`。
3. [预测器](https://github.com/googleapis/python-aiplatform/blob/main/google/cloud/aiplatform/prediction/predictor.py)
    * 负责处理预测请求的ML逻辑。

这三个部分中的每一个都可以根据自定义容器的要求进行定制。在本例中，您只需要实现`预测器`。

[`预测器`](https://github.com/googleapis/python-aiplatform/blob/main/google/cloud/aiplatform/prediction/predictor.py)必须实现以下接口：

```python
from abc import ABC, abstractmethod
from typing import Any

class Predictor(ABC):
    """Custom Prediction Routines的Predictor类接口。
    预测器负责处理预测请求的ML逻辑。
    具体而言，预测器必须定义：
    (1) 如何将用于预测的所有模型工件加载到内存中。
    (2) 在预测时应执行的逻辑。
    在使用默认PredictionHandler时，将如下调用预测器：
      predictor.postprocess(predictor.predict(predictor.preprocess(prediction_input)))
    """

    def __init__(self):
        return

    @abstractmethod
    def load(self, artifacts_uri: str) -> None:
        """加载模型工件。
        参数：
            artifacts_uri (str)：
                必需的。环境变量AIP_STORAGE_URI的值。
        """
        pass

    def preprocess(self, prediction_input: Any) -> Any:
        """在进行预测之前对预测输入进行预处理。
        参数：
            prediction_input (Any)：
                必需的。需要预处理的预测输入。
        返回：
            预处理后的预测输入。
        """
        return prediction_input

    @abstractmethod
    def predict(self, instances: Any) -> Any:
        """执行预测。
        参数：
            instances (Any)：
                必需的。用于执行预测的实例。
        返回：
            预测结果。
        """
        pass

    def postprocess(self, prediction_results: Any) -> Any:
        """对预测结果进行后处理。
        参数：
            prediction_results (Any)：
                必需的。预测结果。
        返回：
            经过后处理的预测结果。
        """
        return prediction_results
```

首先，实现一个自定义的`Predictor`，加载预处理器和模型。预处理器和模型将在`predict`时使用。

自定义预测例程支持一种方式，在本地运行容器以测试您的图像。在本地测试图像时，可以传递GCS路径或本地路径。
- 如果传递GCS路径，则需要设置凭据。
- 如果要通过传递本地路径进行测试，则需要在您的`Predictor`中支持远程和本地加载模型。

Vertex AI SDK提供了一个名为`download_model_artifacts`的函数，可以帮助您从GCS路径或本地路径下载模型工件。请参见下面`load`函数中的示例。

In [None]:
%%writefile $USER_SRC_DIR/predictor.py

import joblib
import numpy as np
import pickle

from google.cloud.aiplatform.prediction.predictor import Predictor
from google.cloud.aiplatform.utils import prediction_utils

from sklearn.datasets import load_iris


class CprPredictor(Predictor):
    
    def __init__(self):
        return
    
    def load(self, artifacts_uri: str):
        """Loads the preprocessor and model artifacts."""
        prediction_utils.download_model_artifacts(artifacts_uri)

        with open("preprocessor.pkl", "rb") as f:
            preprocessor = pickle.load(f)

        self._class_names = load_iris().target_names
        self._model = joblib.load("model.joblib")
        self._preprocessor = preprocessor

    def predict(self, instances):
        """Performs prediction."""
        instances = instances["instances"]
        inputs = np.asarray(instances)
        preprocessed_inputs = self._preprocessor.preprocess(inputs)
        outputs = self._model.predict(preprocessed_inputs)

        return {"predictions": [self._class_names[class_num] for class_num in outputs]}

构建自定义容器时，您还需要编写一个启动模型服务器的镜像入口点。但是，使用自定义预测例程功能时，您不再需要编写入口点。Vertex AI SDK将使用您提供的自定义预测器填充入口点。

将要安装在镜像中的源目录的依赖关系写入。

In [None]:
!cp requirements.txt $USER_SRC_DIR/requirements.txt

构建并推送容器到Artifact Registry。

### 构建您的自定义容器

要构建自定义镜像，需要一个 Dockerfile，在其中您需要实现镜像的外观。然而，使用 Custom Prediction Routine 功能，Vertex AI SDK 也会为您生成 Dockerfile 并构建镜像。

默认情况下，使用 `python:3.7` 作为基础镜像。

In [None]:
import os

from google.cloud.aiplatform.prediction import LocalModel
from src_dir_sdk.predictor import \
    CprPredictor  # Update this path as the variable $USER_SRC_DIR to import the custom predictor.

local_model = LocalModel.build_cpr_model(
    USER_SRC_DIR,
    f"{REGION}-docker.pkg.dev/{PROJECT_ID}/{REPOSITORY}/{IMAGE}",
    predictor=CprPredictor,
    requirements_path=os.path.join(USER_SRC_DIR, "requirements.txt"),
)

您可以查看构建图像的服务容器规格。

In [None]:
local_model.get_serving_container_spec()

### 存储测试实例

要了解如何在JSON中格式化输入实例，请[阅读文档。](https://cloud.google.com/vertex-ai/docs/predictions/online-predictions-custom-models#request-body-details)

In [None]:
INPUT_FILE = "instances.json"

In [None]:
%%writefile $INPUT_FILE
{
    "instances": [
        [6.7, 3.1, 4.7, 1.5],
        [4.6, 3.1, 1.5, 0.2]
    ]
}

### 在本地运行并测试容器

自定义预测例程提供两种方式来下载模型文件以便测试图像的本地版本。
1. 本地路径。
2. GCS路径。

要使用本地路径，您的`Predictor`需要支持加载模型的两种方式，以便可以在本地进行测试并部署到Vertex AI预测服务。SDK提供了一个方法`download_model_artifacts`来支持这两种方式，您可以在您的`Predictor`中的`load`函数中调用[prediction_utils.py](https://github.com/googleapis/python-aiplatform/blob/main/google/cloud/aiplatform/utils/prediction_utils.py)中的此方法。

如果您想使用GCS路径在本地测试图像，则需要按照说明设置凭据。

#### 设置凭证

设置凭证仅在本地运行带有 GCS 路径的自定义服务容器时才需要。设置凭证是为了执行`Predictor`的`load`函数，该函数会从谷歌云存储中下载模型工件。

要访问项目中的谷歌云存储，您需要通过以下方式之一设置凭证：

1. 用户账户

2. 服务账户

您可以在[这里](https://cloud.google.com/docs/authentication#principals)了解更多关于以上每种类型的信息。

选项1：使用谷歌用户凭据

首先，授权谷歌身份验证库使用谷歌用户凭据访问云平台。这一步涉及一个交互式提示，需要用户输入。如果您正在使用非交互式的 shell，您应该打开一个终端来运行此命令。请参阅[此处](https://jupyterlab.readthedocs.io/en/stable/user/terminal.html)了解如何在 Vertex Workbench 笔记本环境中打开终端。

请注意，如果您在没有窗口管理器/浏览器的机器上运行下面的命令，它将提示您运行命令 `gcloud auth application-default login --remote-bootstrap="..."`。只有能启动网页浏览器的机器，例如笔记本电脑或工作站，才允许运行此命令。完成使用浏览器的身份验证步骤后，您需要将验证代码复制粘贴回原始终端以继续登录流程。如果您在具有 web 浏览器支持的机器上运行此命令，则无需使用单独的机器。

此命令将把凭据文件打印为 `凭据保存到文件：[凭据文件]`。

In [None]:
!gcloud auth application-default login

指定凭据文件，该文件为json文件，作为路径。

In [None]:
CREDENTIALS_FILE = "[CREDENTIALS_FILE]"  # @param {type:"string"}

接下来，使用Google用户凭据授权gcloud访问Cloud平台。用户凭据需要在项目中具有`setIamPolicy`权限。有关更多详细信息，请参见[这里](https://cloud.google.com/resource-manager/docs/access-control-proj)。

与上一步类似，这也需要用户输入。请按照上一步的说明进行操作。

In [None]:
!gcloud auth login

授予用户账户角色。使用您在gcloud auth步骤中使用的电子邮件地址，例如`myemail@gmail.com`。由于您将使用此用户账户从Google Cloud Storage下载模型工件，您授予用户账户**Storage Object Viewer**角色。有关更多详细信息，请参阅[Cloud Storage的IAM角色](https://cloud.google.com/storage/docs/access-control/iam-roles)。

In [None]:
USER_ACCOUNT = "[USER_ACCOUNT]"  # @param {type:"string"}

!gcloud projects add-iam-policy-binding $PROJECT_ID \
    --member=user:$USER_ACCOUNT --role=roles/storage.objectViewer

使用项目 ID 初始化 Vertex AI SDK，这是使用用户凭据所必需的。

In [None]:
from google.cloud import aiplatform

aiplatform.init(project=PROJECT_ID, location=REGION)

选项2. 使用谷歌服务账号凭据

如果您已经完成上述选项1，请跳过此步骤。如果IAM API尚未启用，请先启用。

In [None]:
!gcloud services enable iam.googleapis.com

服务帐号

在本地运行容器时，您可以使用服务帐号来下载模型工件。如果您不想使用项目的计算引擎服务帐号，请将`SERVICE_ACCOUNT`设置为另一个服务帐号ID。

In [None]:
SERVICE_ACCOUNT = "[your-service-account]"  # @param {type:"string"}

In [None]:
if (
    SERVICE_ACCOUNT == ""
    or SERVICE_ACCOUNT is None
    or SERVICE_ACCOUNT == "[your-service-account]"
):
    # Get your service account from gcloud
    if not IS_COLAB:
        shell_output = !gcloud auth list 2>/dev/null
        SERVICE_ACCOUNT = shell_output[2].replace("*", "").strip()

    else:  # IS_COLAB:
        shell_output = ! gcloud projects describe  $PROJECT_ID
        project_number = shell_output[-1].split(":")[1].strip().replace("'", "")
        SERVICE_ACCOUNT = f"{project_number}-compute@developer.gserviceaccount.com"

    print("Service Account:", SERVICE_ACCOUNT)

创建服务账户。

In [None]:
!gcloud iam service-accounts create $SERVICE_ACCOUNT

授权gcloud使用Google用户凭据访问Cloud Platform。用户凭据需要在项目中具有`setIamPolicy`权限。有关更多详细信息，请参见[这里](https://cloud.google.com/resource-manager/docs/access-control-proj)。

这一步涉及一个交互式提示，需要用户输入。如果您正在使用非交互式shell，您应该打开一个终端来运行此命令。请参见[这里](https://jupyterlab.readthedocs.io/en/stable/user/terminal.html)如何在Vertex Workbench笔记本环境中打开一个终端。

请注意，如果您在没有窗口管理器/浏览器的机器上运行下面的命令，它会提示您运行命令`gcloud auth application-default login --remote-bootstrap="..."`。只有可以启动Web浏览器的机器，例如笔记本电脑或工作站，才允许运行此命令。完成使用浏览器的身份验证步骤后，您需要将验证代码复制粘贴回原始终端以继续登录流程。如果您在具有Web浏览器支持的机器上运行此命令，则无需使用单独的机器。

In [None]:
!gcloud auth login

授予服务帐户角色。由于您将使用此服务帐户从Google Cloud Storage下载模型文件，因此请授予该服务帐户**存储对象查看者**角色。有关更多详细信息，请参阅[Cloud Storage的IAM角色](https://cloud.google.com/storage/docs/access-control/iam-roles)。

In [None]:
!gcloud projects add-iam-policy-binding $PROJECT_ID \
    --member=serviceAccount:{SERVICE_ACCOUNT}@{PROJECT_ID}.iam.gserviceaccount.com \
    --role=roles/storage.objectViewer

指定服务账户密钥文件名。

In [None]:
CREDENTIALS_FILE = "./credentials.json"

生成服务账号密钥文件。在本地运行自定义服务容器时会用到。

In [None]:
!gcloud iam service-accounts keys create $CREDENTIALS_FILE \
    --iam-account="{SERVICE_ACCOUNT}@{PROJECT_ID}.iam.gserviceaccount.com"

#### 在本地运行并发送请求给容器

使用自定义预测例程功能，可以轻松地在本地测试容器。

在这个例子中，容器会执行一个预测请求和一个健康检查。

选项1. 传递本地路径

这个选项要求`Predictor`中的`load`函数支持从GCS路径和本地路径加载模型工件。

In [None]:
with local_model.deploy_to_local_endpoint(
    artifact_uri=f"{LOCAL_MODEL_ARTIFACTS_DIR}",
) as local_endpoint:
    predict_response = local_endpoint.predict(
        request_file=INPUT_FILE,
        headers={"Content-Type": "application/json"},
    )

    health_check_response = local_endpoint.run_health_check()

打印出预测响应及其内容。

In [None]:
print(predict_response, predict_response.content)

打印出健康检查响应和其内容。

In [None]:
print(health_check_response, health_check_response.content)

也要打印出所有容器日志。您将看到容器启动、处理请求和关闭的日志。

In [None]:
local_endpoint.print_container_logs(show_all=True)

选项2. 传递GCS路径

如果您想要传递GCS路径，您需要在之前的步骤中设置好凭证，并在运行容器时传递路径给这些凭证。服务账户应该拥有“Storage Object Viewer”权限。

In [None]:
with local_model.deploy_to_local_endpoint(
    artifact_uri=f"{BUCKET_URI}/{MODEL_ARTIFACT_DIR}",
    credential_path=CREDENTIALS_FILE,
) as local_endpoint:
    predict_response = local_endpoint.predict(
        request_file=INPUT_FILE,
        headers={"Content-Type": "application/json"},
    )

    health_check_response = local_endpoint.run_health_check()

打印出预测响应及其内容。

In [None]:
print(predict_response, predict_response.content)

打印出健康检查的响应以及内容。

In [None]:
print(health_check_response, health_check_response.content)

还打印出所有的容器日志。您将看到容器启动、请求处理和容器拆除的日志。

In [None]:
local_endpoint.print_container_logs(show_all=True)

### 将容器推送到工件注册表

配置Docker以访问工件注册表。然后将您的容器映像推送到您的工件注册表存储库。

打印出项目中所有已启用的服务。

In [None]:
!gcloud services list

如果您的项目中未启用 `artifactregistry.googleapis.com`，请在继续之前启用该API。

In [None]:
!gcloud services enable artifactregistry.googleapis.com

In [None]:
!gcloud artifacts repositories create {REPOSITORY} \
    --repository-format=docker \
    --location=$REGION

In [None]:
!gcloud auth configure-docker {REGION}-docker.pkg.dev --quiet

使用SDK推送图像。

In [None]:
local_model.push_image()

部署到Vertex AI

###上传自定义容器模型

In [None]:
from google.cloud import aiplatform

In [None]:
aiplatform.init(project=PROJECT_ID, location=REGION)

使用LocalModel实例来上传模型。它将自动为您填充容器规格。

In [None]:
model = aiplatform.Model.upload(
    local_model=local_model,
    display_name=MODEL_DISPLAY_NAME,
    artifact_uri=f"{BUCKET_URI}/{MODEL_ARTIFACT_DIR}",
)

### 在 Vertex AI 上部署模型
完成这一步后，模型已部署并准备好进行在线预测。

In [None]:
endpoint = model.deploy(machine_type="n1-standard-4")

发送预测

使用Python SDK

In [None]:
endpoint.predict(instances=[[6.7, 3.1, 4.7, 1.5], [4.6, 3.1, 1.5, 0.2]])

### 使用 REST

In [None]:
ENDPOINT_ID = endpoint.name

In [None]:
! curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
-d @instances.json \
https://{REGION}-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/{REGION}/endpoints/{ENDPOINT_ID}:predict

### 使用gcloud命令行界面

In [None]:
!gcloud ai endpoints predict $ENDPOINT_ID \
  --region=$REGION \
  --json-request=instances.json

清理

要清理此项目中使用的所有 Google Cloud 资源，您可以删除用于教程的[Google Cloud 项目](https://cloud.google.com/resource-manager/docs/creating-managing-projects#shutting_down_projects)。

否则，您可以删除此教程中创建的各个资源。

In [None]:
# Undeploy model and delete endpoint
endpoint.delete(force=True)

# Delete the model resource
model.delete()

# Delete the container image from Artifact Registry
!gcloud artifacts docker images delete \
    --quiet \
    --delete-tags \
    {REGION}-docker.pkg.dev/{PROJECT_ID}/{REPOSITORY}/{IMAGE}

delete_bucket = False

if delete_bucket or os.getenv("IS_TESTING"):
    ! gsutil rm -r $BUCKET_URI