In [1]:
import pandas as pd

pd.set_option("display.max_columns", None)

# [Functions](https://pycaret.gitbook.io/docs/get-started/functions)

## [Analyze（分析）](https://pycaret.gitbook.io/docs/get-started/functions/analyze)

Analysis and model explainability functions in PyCaret

PyCaretの解析・モデル説明可能関数

### plot_model（プロットモデル）

This function analyzes the performance of a trained model on the hold-out set. It may require re-training the model in certain cases.

この関数は、ホールドアウト集合における学習済みモデルのパフォーマンスを分析します。場合によっては、モデルの再トレーニングが必要になるかもしれません。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
lr = create_model('lr')

# plot model
plot_model(lr, plot='auc')

![plot_model](./images/plot_model.png)

#### Change the scale（スケールを変更する）

The resolution scale of the figure can be changed with `scale` parameter.

図の解像度スケールは `scale` パラメータで変更することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
lr = create_model('lr')

# plot model
plot_model(lr, plot='auc', scale=3)

![plot_model_scale](./images/plot_model_scale.png)

#### Save the plot（プロットを保存する）

You can save the plot as a `png` file using the `save` parameter.

プロットは `save` パラメータを使用して `png` ファイルとして保存することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
lr = create_model('lr')

# plot model
plot_model(lr, plot='auc', save=True)

![plot_model_save](./images/plot_model_save.png)

#### Customize the plot（プロットのカスタマイズ）

PyCaret uses [Yellowbrick](https://www.scikit-yb.org/en/latest/) for most of the plotting work. Any argument that is acceptable for Yellowbrick visualizers can be passed as `plot_kwargs` parameter.

PyCaret はプロット作業のほとんどに [Yellowbrick](https://www.scikit-yb.org/en/latest/) を使用しています。Yellowbrick のビジュアライザに受け入れられる任意の引数は `plot_kwargs` パラメータとして渡すことができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
lr = create_model('lr')

# plot model
plot_model(lr, plot='confusion_matrix', plot_kwargs={'percent': True})

![plot_model_customize](./images/plot_model_customize.png)

|||
|:-:|:-:|
|Before Customization|After Customization|
|![before customization](./images/plot_model_before_customization.png)|![after customization](./images/plot_model_after_customization.png)|

#### Use train data（学習データの活用）

If you want to assess the model plot on the train data, you can pass `use_train_data=True` in the `plot_model` function.

もし、モデルのプロットを学習データで評価したい場合は、 `plot_model` 関数に `use_train_data=True` を渡すことができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
lr = create_model('lr')

# plot model
plot_model(lr, plot='auc', use_train_data=True)

![plot_model_use_train_data](./images/plot_model_use_train_data.png)

|||
|:-:|:-:|
|Train Data|Hold-out Data|
|![plot_model_train_data](./images/plot_model_train_data.png)|![plot_model_hold-out_data](./images/plot_model_hold-out_data.png)|

#### Examples by module（モジュール別の例）

##### Classification（分類）

|Plot Name|Plot|
|:-|:-|
|Area Under the Curve（曲線下の面積）|‘auc’|
|Confusion Matrix（混乱マトリクス）|‘confusion_matrix’|
|Discrimination Threshold（判別しきい値）|‘threshold’|
|Precision Recall Curve（精度リコール曲線）|‘pr’|
|Class Prediction Error（クラス予測誤差）|‘error’|
|Classification Report（分類レポート）|‘class_report’|
|Recursive Feature Selection（再帰的特徴量選択）|‘rfe’|
|Learning Curve（学習曲線）|‘learning’|
|Validation Curve（検証曲線）|‘vc’|
|Feature Importance（特徴量重要度）(Top 10)|‘feature’|
|Feature Importance（特徴量重要度）(all)|'feature_all'|
|Manifold Learning（多様な学習）|‘manifold’|
|Calibration Curve（校正曲線）|‘calibration’|
|Dimension Learning（次元学習）|‘dimension’|
|Decision Boundary（決定境界）|‘boundary’|
|Lift Curve（リフト曲線）|'lift'|
|Gain Curve（利得曲線）|'gain'|
|KS Statistic Plot（KS統計量プロット）|'ks'|
|Model Hyperparameter（モデル ハイパーパラメータ）|‘parameter’|

&nbsp;

|||
|:-:|:-:|
|auc|confusion_matrix|
|![plot_model_auc](./images/plot_model_auc.png)|![plot_model_confusion_matrix](./images/plot_model_confusion_matrix.png)|
|threshold|pr|
|![plot_model_threshold](./images/plot_model_threshold.png)|![plot_model_pr](./images/plot_model_pr.png)|
|error|class_report|
|![plot_model_error](./images/plot_model_error.png)|![plot_model_class_report](./images/plot_model_class_report.png)|
|rfe|learning|
|![plot_model_rfe](./images/plot_model_rfe.png)|![plot_model_learning](./images/plot_model_learning.png)|
|vc|feature|
|![plot_model_vc](./images/plot_model_vc.png)|![plot_model_feature](./images/plot_model_feature.png)|
|manifold|calibration|
|![plot_model_manifold](./images/plot_model_manifold.png)|![plot_model_calibration](./images/plot_model_calibration.png)|
|dimension|boundary|
|![plot_model_dimension](./images/plot_model_dimension.png)|![plot_model_boundary](./images/plot_model_boundary.png)|
|lift|gain|
|![plot_model_lift](./images/plot_model_lift.png)|![plot_model_gain](./images/plot_model_gain.png)|
|ks|parameter|
|![plot_model_ks](./images/plot_model_ks.png)|![plot_model_parameter](./images/plot_model_parameter.png)|

##### Regression（回帰）

|Name|Plot|
|:-|:-|
|Residuals Plot（残差プロット）|‘residuals’|
|Prediction Error Plot（予測誤差プロット）|‘error’|
|Cooks Distance Plot（クックス距離プロット）|‘cooks’|
|Recursive Feature Selection（再帰的特徴量選択）|‘rfe’|
|Feature Importance（特徴量重要度）(top 10)|‘feature’|
|Learning Curve（学習曲線）|‘learning’|
|Validation Curve（検証曲線）|‘vc’|
|Manifold Learning（多様な学習）|‘manifold’|
|Feature Importance（特徴量重要度）(all)|'feature_all'|
|Model Hyperparameter（モデル ハイパーパラメータ）|‘parameter’|

&nbsp;

|||
|:-:|:-:|
|residuals|error|
|![plot_model_reg_residuals](./images/plot_model_reg_residuals.png)|![plot_model_reg_error](./images/plot_model_reg_error.png)|
|cooks|rfe|
|![plot_model_reg_cooks](./images/plot_model_reg_cooks.png)|![plot_model_reg_rfe](./images/plot_model_reg_rfe.png)|
|feature|learning|
|![plot_model_reg_feature](./images/plot_model_reg_feature.png)|![plot_model_reg_learning](./images/plot_model_reg_learning.png)|
|vc|manifold|
|![plot_model_reg_vc](./images/plot_model_reg_vc.png)|![plot_model_reg_manifold](./images/plot_model_reg_manifold.png)|

##### Clustering（クラスタリング）

|Name|Plot|
|:-|:-|
|Cluster PCA Plot (2d)|‘cluster’|
|Cluster TSnE (3d)|‘tsne’|
|Elbow Plot（エルボープロット）|‘elbow’|
|Silhouette Plot（シルエットプロット）|‘silhouette’|
|Distance Plot（距離プロット）|‘distance’|
|Distribution Plot（分布図）|‘distribution’|

&nbsp;

|||
|:-:|:-:|
|cluster|tsne|
|![plot_model_clu_cluster](./images/plot_model_clu_cluster.png)|![plot_model_clu_tsne](./images/plot_model_clu_tsne.png)|
|elbow|silhouette|
|![plot_model_clu_elbow](./images/plot_model_clu_elbow.png)|![plot_model_clu_silhouette](./images/plot_model_clu_silhouette.png)|
|distance|distribution|
|![plot_model_clu_distance](./images/plot_model_clu_distance.png)|![plot_model_clu_distribution](./images/plot_model_clu_distribution.png)|

##### Anomaly Detection（異常検出）

|Name|Plot|
|:-|:-|
|t-SNE (3d) Dimension Plot（t-SNE (3d) 次元プロット）|‘tsne’|
|UMAP Dimensionality Plot（UMAP次元数プロット）|‘umap’|

&nbsp;

|||
|:-:|:-:|
|tsne|umap|
|![plot_model_ad_tsne](./images/plot_model_ad_tsne.png)|![plot_model_ad_umap](./images/plot_model_ad_umap.png)|

##### Natural Language Processing（自然言語処理）

|Name|Plot|
|:-|:-|
|Word Token Frequency（単語トークン頻度）|‘frequency’|
|Word Distribution Plot（単語分布図）|‘distribution’|
|Bigram Frequency Plot（バイグラム頻度プロット）|‘bigram’|
|Trigram Frequency Plot（トライグラム頻度プロット）|‘trigram’|
|Sentiment Polarity Plot（センチメント極座標プロット）|‘sentiment’|
|Part of Speech Frequency（品詞の頻度）|‘pos’|
|t-SNE (3d) Dimension Plot（t-SNE (3d) 次元プロット）|‘tsne’|
|Topic Model (pyLDAvis)（トピックモデル(pyLDAvis)）|‘topic_model’|
|Topic Infer Distribution（トピックの推定分布）|‘topic_distribution’|
|Word cloud（ワードクラウド）|‘wordcloud’|
|UMAP Dimensionality Plot（UMAP次元プロット）|‘umap’|

&nbsp;

|||
|:-:|:-:|
|frequency|distribution|
|![plot_model_nlp_frequency](./images/plot_model_nlp_frequency.png)|![plot_model_nlp_distribution](./images/plot_model_nlp_distribution.png)|
|bigram|trigram|
|![plot_model_nlp_bigram](./images/plot_model_nlp_bigram.png)|![plot_model_nlp_trigram](./images/plot_model_nlp_trigram.png)|
|sentiment|pos|
|![plot_model_nlp_sentiment](./images/plot_model_nlp_sentiment.png)|![plot_model_nlp_pos](./images/plot_model_nlp_pos.png)|
|tsne|umap|
|![plot_model_nlp_tsne](./images/plot_model_nlp_tsne.png)|![plot_model_nlp_umap](./images/plot_model_nlp_umap.png)|
|wordcloud|topic_distribution|
|![plot_model_nlp_wordcloud](./images/plot_model_nlp_wordcloud.png)|![plot_model_nlp_topic_distribution](./images/plot_model_nlp_topic_distribution.png)|
|topic_model||
|![plot_model_nlp_topic_model](./images/plot_model_nlp_topic_model.png)||

##### Association Rule Mining（アソシエーションルールマイニング）

|||
|:-:|:-:|
|2d|3d|
|![plot_model_arm_2d](./images/plot_model_arm_2d.png)|![plot_model_arm_3d](./images/plot_model_arm_3d.png)|

### evaluate_model（評価モデル）

The `evaluate_model` displays a user interface for analyzing the performance of a trained model. It calls the [plot_model](#plot_modelプロットモデル) function internally.

`evaluate_model` は学習済みモデルのパフォーマンスを分析するためのユーザーインターフェースを表示します。内部で [plot_model] 関数を呼び出している。

#### Example

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# create model
lr = create_model('lr')

# launch evaluate widget
evaluate_model(lr)

![evaluate_model](./images/evaluate_model.png)

> NOTE: This function only works in Jupyter Notebook or an equivalent environment.
>
> 注意：この関数は、Jupyter Notebookまたは同等の環境でのみ動作します。

### interpret_model（解釈モデル）

This function analyzes the predictions generated from a trained model. Most plots in this function are implemented based on the SHAP (Shapley Additive exPlanations). For more info on this, please see <https://shap.readthedocs.io/en/latest/>

この関数は，学習済みモデルから生成された予測値を解析します。この関数のほとんどのプロットは、SHAP (Shapley Additive exPlanations)に基づいて実装されています。これに関する詳細な情報は <https://shap.readthedocs.io/en/latest/>

#### Example

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost)

![interpret_model](./images/interpret_model.png)

#### Save the plot（プロットの保存）

You can save the plot as a `png` file using the `save` parameter.

プロットは `save` パラメータを使用して `png` ファイルとして保存することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, save=True)

> NOTE: When save=True no plot is displayed in the Notebook.
>
> 注：save=Trueの場合、ノートブックにプロットは表示されません。

#### Change plot type（プロットタイプの変更）

There are a few different plot types available that can be changed by the `plot` parameter.

プロットの種類はいくつかあり、 `plot` パラメータで変更することができます。

##### Correlation（相関）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='correlation')

![interpret_model](./images/interpret_model_correlation.png)

By default, PyCaret uses the first feature in the dataset but that can be changed using `feature` parameter.

デフォルトでは、PyCaret はデータセットの最初の特徴量を使用しますが、 `feature` パラメータを使用して変更することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='correlation', feature='Age (years)')

![interpret_model](./images/interpret_model_correlation_feature.png)

##### Partial Dependence Plot（部分依存プロット）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='pdp')

![interpret_model](./images/interpret_model_partial_dependence.png)

By default, PyCaret uses the first available feature in the dataset but this can be changed using the `feature` parameter.

デフォルトでは、PyCaret はデータセット内の利用可能な最初の特徴量を使用しますが、これは `feature` パラメータを使用して変更することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='pdp', feature='Age (years)')

![interpret_model](./images/interpret_model_partial_dependence_feature.png)


##### Morris Sensitivity Analysis（モリス感応度分析）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='msa')

![interpret_model](./images/interpret_model_msa.png)


##### Permutation Feature Importance（並べ替え 特徴量 重要度）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='pfi')

![interpret_model](./images/interpret_model_pfi.png)

##### Reason Plot（理由 プロット）

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='reason')

![interpret_model](./images/interpret_model_reason.png)

When you generate `reason` plot without passing the specific index of test data, you will get the interactive plot displayed with the ability to select the x and y-axis. This will only be possible if you are using Jupyter Notebook or an equivalent environment. If you want to see this plot for a specific observation, you will have to pass the index in the `observation` parameter.

テストデータの特定のインデックスを渡さずに `reason` プロットを生成すると、x軸とy軸を選択できるインタラクティブなプロットが表示されます。これはJupyter Notebookまたは同等の環境を使用している場合のみ可能です。もし、特定の観測データに対してこのプロットを見たい場合は、`observation`パラメータにそのインデックスを渡す必要があります。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, plot='reason', observation=1)

![interpret_model](./images/interpret_model_reason_observation.png)

Here the `observation = 1` means index 1 from the test set.

ここで、`observation = 1`は、テストセットからのインデックス1を意味します。

#### Use train data（学習データを利用する）

By default, all the plots are generated on the test dataset. If you want to generate plots using a train data set (not recommended) you can use `use_train_data` parameter.

デフォルトでは、すべてのプロットはテストデータセットで生成されます。もし、トレーニングデータセットを用いてプロットを生成したい場合（推奨しません）、`use_train_data`パラメータを使用することができます。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# creating a model
xgboost = create_model('xgboost')

# interpret model
interpret_model(xgboost, use_train_data=True)

![interpret_model](./images/interpret_model_use_train_data.png)

### dashboard（ダッシュボード）

The `dashboard` function generates the interactive dashboard for a trained model. The dashboard is implemented using ExplainerDashboard ([explainerdashboard.readthedocs.io](https://explainerdashboard.readthedocs.io/en/latest/))

`dashboard` 関数は、学習済みモデルのインタラクティブなダッシュボードを生成します。ダッシュボードは ExplainerDashboard を使って実装されています。([explainerdashboard.readthedocs.io](https://explainerdashboard.readthedocs.io/en/latest/))

#### Dashboard Example

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# train model
lr = create_model('lr')

# launch dashboard
dashboard(lr)

![dashboard](./images/dashboard1.png)

![dashboard](./images/dashboard2.png)

![dashboard](./images/dashboard3.png)

#### Video:

<https://www.youtube.com/watch?v=FZ5-GtdYez0>

### deep_check（ディープチェック）

This function runs a full suite check over a trained model using the [deepchecks](https://github.com/deepchecks/deepchecks) library.

この関数は、[deepchecks](https://github.com/deepchecks/deepchecks) ライブラリを使って、学習済みモデルに対する完全なスイートチェックを実行します。

#### Deep Check Example

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# train model
lr = create_model('lr')

# deep check model
deep_check(lr)

![deep_check](./images/deep_check.png)

![deep_check](./images/deep_check2.png)

![deep_check](./images/deep_check3.png)

> This function is in experimental mode. deepchecks require scikit-learn>1.0 version, whereas pycaret requires scikit-learn==0.23.2. Hence after installing deepchecks you must uninstall scikit-learn and reinstall scikit-learn==0.23.2 otherwise you will get an error with pycaret. The future version of pycaret will be scikit-learn>1.0 compatible.

deepchecks は scikit-learn>1.0 バージョンを必要とし、一方 pycaret は scikit-learn==0.23.2 を必要とします。したがって、deepchecksをインストールした後、scikit-learnをアンインストールし、scikit-learn=0.23.2を再インストールしなければ、pycaretでエラーが発生します。将来のpycaretのバージョンはscikit-learn>1.0と互換性がある予定です。

### eda

This function generates automated Exploratory Data Analysis (EDA) using the AutoViz library. You must install Autoviz separately `pip install autoviz` to use this function.

この関数は、AutoVizライブラリを用いて探索的データ解析（EDA）を自動生成するものです。この関数を使用するには、別途 `pip install autoviz` でAutovizをインストールする必要があります。

#### EDA Example

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# launch eda
eda(display_format='bokeh')

![eda](./images/eda.png)

You can also run this function with `display_format = 'svg'`.

また、この関数は `display_format = 'svg'` と指定して実行することもできます。

In [None]:
# load dataset
from pycaret.datasets import get_data
juice = get_data('juice')

# init setup
from pycaret.classification import *
exp_name = setup(data=juice,  target='Purchase')

# launch eda
eda(display_format='svg')

![ead2](./images/eda2.png)

#### Video:

<https://www.youtube.com/watch?v=Pm5VOuYqU4Q>

### check_fairness（公平性の確認）

There are many approaches to conceptualizing fairness. The `check_fairness` function follows the approach known as group fairness, which asks: which groups of individuals are at risk for experiencing harm. `check_fairness` provides fairness-related metrics between different groups (also called sub-population).

公平性を概念化するアプローチには多くのものがあります。`check_fairness`関数は、グループ・フェアネスとして知られるアプローチに従っています。これは、「どのグループの個体が損害を経験するリスクがあるか」を問うものです。`check_fairness` は異なるグループ（サブ集団とも呼ばれる）間の公平性に関連するメトリクスを提供します。

#### Check Fairness Example

In [None]:
# load dataset
from pycaret.datasets import get_data
income = get_data('income')

# init setup
from pycaret.classification import *
exp_name = setup(data=income,  target='income >50K')

# train model
lr = create_model('lr')

# check model fairness
lr_fairness = check_fairness(lr, sensitive_features=['sex', 'race'])

![check_fairness](./images/check_fairness1.png)

![check_fairness](./images/check_fairness2.png)

#### Video:

<https://www.youtube.com/watch?v=mjhDKuLRpM0>

### get_leaderboard（リーダーボードの取得）

This function returns the leaderboard of all models trained in the current setup.

この関数は、現在の設定で学習させた全モデルのリーダーボードを返します。

In [None]:
# load dataset
from pycaret.datasets import get_data
diabetes = get_data('diabetes')

# init setup
from pycaret.classification import *
clf1 = setup(data=diabetes, target='Class variable')

# compare models
top3 = compare_models(n_select=3)

# tune top 3 models
tuned_top3 = [tune_model(i) for i in top3]

# ensemble top 3 tuned models
ensembled_top3 = [ensemble_model(i) for i in tuned_top3]

# blender
blender = blend_models(tuned_top3)

# stacker
stacker = stack_models(tuned_top3)

# check leaderboard
get_leaderboard()

![get_leaderboard](./images/get_leaderboard.png)

You can also access the trained Pipeline with this.

また、これを使って訓練されたパイプラインにアクセスすることができます。

In [None]:
# check leaderboard
lb = get_leaderboard()

# select top model
lb.iloc[0]['Model']

![get_leaderboard](./images/get_leaderboard2.png)

### assign_model（代入モデル）

This function assigns labels to the training dataset using the trained model. It is available for [Clustering](https://pycaret.gitbook.io/docs/get-started/modules), [Anomaly Detection](https://pycaret.gitbook.io/docs/get-started/modules), and [NLP](https://pycaret.gitbook.io/docs/get-started/modules) modules.

学習済みモデルを用いて、学習データセットにラベルを付与する関数です。[クラスタリング](https://pycaret.gitbook.io/docs/get-started/modules)、[異常検知](https://pycaret.gitbook.io/docs/get-started/modules)および[自然言語処理](https://pycaret.gitbook.io/docs/get-started/modules)の各モジュールで利用可能です。

#### Clustering

In [None]:
# load dataset
from pycaret.datasets import get_data
jewellery = get_data('jewellery')

# init setup
from pycaret.clustering import *
clu1 = setup(data=jewellery)

# train a model
kmeans = create_model('kmeans')

# assign model
assign_model(kmeans)

![assign_model](./images/assign_model_clustering.png)

#### Anomaly Detection

In [None]:
# load dataset
from pycaret.datasets import get_data
anomaly = get_data('anomaly')

# init setup
from pycaret.anomaly import *
ano1 = setup(data=anomaly)

# train a model
iforest = create_model('iforest')

# assign model
assign_model(iforest)

![assign_model_anomaly_detection](./images/assign_model_anomaly_detection.png)

#### Natural Language Processing

In [None]:
# load dataset
from pycaret.datasets import get_data
kiva = get_data('kiva')

# init setup
from pycaret.nlp import *
nlp1 = setup(data=kiva, target='en')

# train a model
lda = create_model('lda')

# assign model
assign_model(lda)

![assign_model](./images/assign_model_nlp.png)