In [None]:
import pandas as pd

pd.set_option("display.max_columns", None)

# [Functions](https://pycaret.gitbook.io/docs/get-started/functions)

## [Deploy（配備・展開）](https://pycaret.gitbook.io/docs/get-started/functions/deploy)

MLOps and deployment related functions in PyCaret

MLOpsとPyCaretの開発関連関数

### predict_model

This function generates the label using a trained model.  When `data` is None, it predicts label and score on the holdout set.

この関数は、学習されたモデルを用いてラベルを生成します。 `data` が None の場合、ホールドアウトされたセットのラベルとスコアを予測します。

#### Hold-out predictions（ホールドアウト予測）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
xgboost = create_model('xgboost')

# predict on hold-out
predict_model(xgboost)

![predict_model_hold-out](./images/predict_model_hold-out.png)

#### Unseen data predictions（未知なるデータ予測）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
xgboost = create_model('xgboost')

# predict on new data
new_data = diabetes.copy()
new_data.drop('Class variable', axis=1, inplace=True)
predict_model(xgboost, data=new_data)

![predict_model_unseen_data](./images/predict_model_unseen_data.png)

#### Probability by class（クラス別の確率）

> NOTE: This is only applicable for the [Classification](https://pycaret.gitbook.io/docs/get-started/modules) use-cases.
>
> 注：これは、[分類](https://pycaret.gitbook.io/docs/get-started/modules のユースケースにのみ適用されます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
xgboost = create_model('xgboost')

# predict on new data
new_data = diabetes.copy()
new_data.drop('Class variable', axis=1, inplace=True)
predict_model(xgboost, raw_score=True, data=new_data)

![predict_model_probability_by_class](./images/predict_model_probability_by_class.png)

#### Setting probability threshold（確率の閾値の設定）

> NOTE: This is only applicable for the [Classification](https://pycaret.gitbook.io/docs/get-started/modules) use-cases (binary only).
>
> 注：これは、[分類](https://pycaret.gitbook.io/docs/get-started/modules) のユースケースにのみ適用されます（バイナリのみ）。

The threshold for converting predicted probability to the class labels. Unless this parameter is set, it will default to the value set during model creation. If that wasn’t set, the default will be 0.5 for all classifiers. Only applicable for binary classification.

予測される確率をクラスラベルに変換するための閾値。このパラメータが設定されない限り、デフォルトはモデル作成時に設定された値になります。設定されていない場合、すべての分類器のデフォルトは0.5となります。2値分類にのみ適用されます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
xgboost = create_model('xgboost')

# probability threshold 0.3
predict_model(xgboost, probability_threshold=0.3)

![predict_model_probability_threshold](./images/predict_model_probability_threshold.png)

##### Comparison between different thresholds on the hold-out data（ホールドアウトデータにおける閾値の違いによる比較）

![predict_model_probability_threshold](./images/predict_model_probability_threshold2.png)

#### Monitor data drift（データドリフトの監視）

An interactive drift report can be generated by using `drift_report` parameter.

`drift_report` パラメータを使用すると、インタラクティブなドリフトレポートを作成することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
xgboost = create_model('xgboost')

# predict on new data
predict_model(xgboost, drift_report=True)

![predict_model_monitor_data_drift](./images/predict_model_monitor_data_drift.png)

![predict_model_monitor_data_drift](./images/predict_model_monitor_data_drift2.png)

![predict_model_monitor_data_drift](./images/predict_model_monitor_data_drift3.png)

![predict_model_monitor_data_drift](./images/predict_model_monitor_data_drift4.png)

### finalize_model

This function trains a given model on the entire dataset including the hold-out set.

この関数は、ホールドアウトセットを含むデータセット全体に対して、与えられたモデルを学習させます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
rf = create_model('rf')

# finalize a model
finalize_model(rf)

![finalize_model](./images/finalize_model.png)

This function doesn't change any parameter of the model. It only refits on the entire dataset including the hold-out set.

この関数はモデルのどのパラメータも変更しません。ホールドアウトセットを含む全データセットに対してのみリフィットを行います。

### deploy_model

This function deploys the entire ML pipeline on the cloud.

この関数は、MLパイプライン全体をクラウド上に展開するものです。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
lr = create_model('lr')

# finalize a model
final_lr = finalize_model(lr)

# deploy a model
deploy_model(
    final_lr,
    model_name='lr_aws',
    platform='aws',
    authentication={ 'bucket': 'pycaret-test' }
)

![deploy_model](./images/deploy_model.png)

#### AWS

Before deploying a model to an AWS S3 (‘aws’), environment variables must be configured using the command-line interface. To configure AWS environment variables, type **aws configure** in your python command line. The following information is required which can be generated using the Identity and Access Management (IAM) portal of your amazon console account:

AWS S3 ('aws') にモデルをデプロイする前に、コマンドラインインターフェースを使用して環境変数を設定する必要があります。AWS環境変数を設定するには、pythonのコマンドラインに **aws configure** と入力します。以下の情報は、amazonコンソールアカウントのIdentity and Access Management (IAM) ポータルを使用して生成することが必要です。

- AWS Access Key ID
  - AWSアクセスキーID
- AWS Secret Key Access
  - AWSシークレットキーアクセス
- Default Region Name (can be seen under Global settings on your AWS console)
  - デフォルトのリージョン名（AWSコンソールのグローバル設定から確認可能）
- Default output format (must be left blank)
  - デフォルトの出力形式（空白のままにしておく必要があります。）

#### GCP

To deploy a model on Google Cloud Platform ('gcp'), the project must be created using the command-line or GCP console. Once the project is created, you must create a service account and download the service account key as a JSON file to set environment variables in your local environment.

Google Cloud Platform ('gcp')にモデルをデプロイするには、コマンドラインまたはGCPコンソールを使用してプロジェクトを作成する必要があります。プロジェクトを作成したら、サービスアカウントを作成し、サービスアカウントキーをJSONファイルとしてダウンロードし、ローカル環境に環境変数を設定する必要があります。

Learn more about it: <https://cloud.google.com/docs/authentication/production>

#### Azure

To deploy a model on Microsoft Azure ('azure'), environment variables for the connection string must be set in your local environment. Go to settings of storage account on Azure portal to access the connection string required.

Microsoft Azure (以下、Azure) 上にモデルを配置するには、接続文字列の環境変数をローカル環境に設定する必要があります。Azureポータルからストレージアカウントの設定にアクセスし、必要な接続文字列にアクセスします。

- AZURE_STORAGE_CONNECTION_STRING (required as environment variable)
  - AZURE_STORAGE_CONNECTION_STRING (環境変数として必要)

Learn more about it: <https://docs.microsoft.com/en-us/azure/storage/blobs/storage-quickstart-blobs-python?toc=%2Fpython%2Fazure%2FTOC.json>

### save_model

This function saves the transformation pipeline and a trained model object into the current working directory as a pickle file for later use.

この関数は、変換パイプラインと学習済みモデルオブジェクトを、あとで使用するためにpickleファイルとして現在の作業ディレクトリに保存します。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
dt = create_model('dt')

# save pipeline
save_model(dt, 'dt_pipeline')

![save_model](./images/save_model.png)

### load_model

This function loads a previously saved pipeline.

この関数は、以前に保存されたパイプラインを読み込みます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# create a model
dt = create_model('dt')

# save pipeline
save_model(dt, 'dt_pipeline')

# load pipeline
load_model('dt_pipeline')

![load_model](./images/load_model.png)

### save_config

This function saves all the global variables to a pickle file, allowing to later resume without rerunning the setup function.

この関数は、すべてのグローバル変数をpickleファイルに保存し、setup 関数を再実行することなく、あとで再開することを可能にします。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# save config
save_config('my_config')

### load_config

This function loads global variables from a pickle file into the Python environment.

この関数は、pickleファイルからPython環境にグローバル変数を読み込みます。

### convert_model

This function transpiles the trained machine learning model's decision function in different programming languages such as Python, C, Java, Go, C#, etc. It is very useful if you want to deploy models into environments where you can't install your normal Python stack to support model inference.

Python、C、Java、Go、C#などの異なるプログラミング言語で学習された機械学習モデルの決定関数をトランスパイルする関数です。モデルの推論をサポートするために通常のPythonスタックをインストールできない環境にモデルを展開したい場合に非常に便利です。

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# train a model
lr = create_model('lr')

# convert a model
convert_model(lr, 'java')

![convert_model](./images/convert_model.png)

#### Video:

<https://www.youtube.com/watch?v=xwQgfNC7808>

### create_api

This function takes an input model and creates a POST API for inference. It only creates the API and doesn't run it automatically. To run the API, you must run the Python file using `!python`.

この関数は、入力モデルを受け取り、推論用のPOST APIを作成します。APIを作成するだけで、自動的に実行されることはありません。APIを実行するには、`!python`を使用してPythonファイルを実行する必要があります。

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# train a model
lr = create_model('lr')

# create api
create_api(lr, 'lr_api')

# run api
!python lr_api.py

![create_api](./images/create_api.png)

Once you initialize API with the `!python` command. You can see the server on localhost:8000/docs.

一旦、`!python`コマンドでAPIを初期化します。localhost:8000/docsにあるサーバーを確認することができます。

![create_api](./images/create_api2.png)

#### Video:

<https://www.youtube.com/watch?v=88M9c5Hc-k0>

### create_docker

This function creates a `Dockerfile` and `requirements.txt` for productionalizing API end-point.

この関数は、APIエンドポイントをプロダクションするための `Dockerfile` と `requirements.txt` を作成します。

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# train a model
lr = create_model('lr')

# create api
create_api(lr, 'lr_api')

# create docker
create_docker('lr_api')

![create_docker](./images/create_docker.png)

You can see two files are created for you.

2つのファイルが作成されているのがわかると思います。

![create_docker](./images/create_docker2.png)

![create_docker](./images/create_docker3.png)

#### Video:

<https://www.youtube.com/watch?v=xMgwEJ57uxs>

### create_app

This function creates a basic `gradio` app for inference. It will later be expanded for other app types such `Streamlit`.

この関数は推論用の基本的な `gradio` アプリを作成します。この関数は後に `Streamlit` のようなほかのタイプのアプリのために拡張される予定です。

![create_app](./images/create_app.png)

#### Video:

<https://www.youtube.com/watch?v=4JyYhbW6eCA>