# 使用 MLflow 跟踪笔记本中的模型训练

可在笔记本中使用 MLflow 来跟踪训练的任何模型。 由于你将使用 Azure 机器学习计算实例运行此笔记本，因此无需设置 MLflow：它已安装并集成。 

准备一些数据并训练模型来预测糖尿病。 使用自动日志记录和自定义日志记录来探索如何在笔记本中使用 MLflow。

## 准备工作

需要最新版本的“azureml-ai-ml”包才能运行此笔记本中的代码。 运行下面的单元以验证是否已安装它。

> **注意**：
> 如果未安装“azure-ai-ml”包，请运行 `pip install azure-ai-ml` 以进行安装。

In [None]:
## 连接到工作区

安装必需的 SDK 包后，就可以连接到工作区了。

若要连接到工作区，我们需要标识符参数 - 订阅 ID、资源组名称和工作区名称。 已为你填写资源组名称和工作区名称。 只需订阅 ID 即可完成命令。

若要查找必要的参数，请单击工作区右上角的订阅和工作区名称。 右侧将打开一个窗格。

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> 复制订阅 ID，并将“YOUR-SUBSCRIPTION-ID”替换为复制的值。 </p>

## 配置 MLflow

在 Azure 机器学习工作室中的计算实例上运行此笔记本时，无需配置 MLflow。 

不过，最好验证是否确实安装了必要的库：

In [None]:
## 准备数据

训练糖尿病分类模型。 训练数据以 diabetes.csv 的形式存储在 data 文件夹中 。 

首先，读取数据：

In [None]:
接下来，将数据拆分为特征和标签（糖尿病）：

现在有四个数据帧：

- `X_train`：包含特征的训练数据集。
- `X_test`：包含特征的测试数据集。
- `y_train`：训练数据集的标签。
- `y_test`：测试数据集的标签。

使用这些数据帧来训练和评估要训练的模型。

## 创建 MLflow 试验

现在，你已准备好训练机器学习模型，首先创建一个 MLflow 试验。 通过创建试验，可将所有运行分组到一个试验中，从而更容易在工作室中查找运行。

In [None]:
## 训练和跟踪模型

若要跟踪训练的模型，可使用 MLflow 并启用自动日志记录。 以下单元将使用逻辑回归来训练分类模型。 你会注意到，不需要计算任何评估指标，因为它们由 MLflow 自动创建和记录。

In [None]:
也可通过 MLflow 使用自定义日志记录。 可将自定义日志记录添加到自动日志记录，也可仅使用自定义日志记录。

使用 scikit-learn 再训练两个模型。 由于之前运行了 `mlflow.sklearn.autolog()` 命令，因此 MLflow 现在将自动记录使用 scikit-learn 训练的任何模型。 若要禁用自动日志记录，请运行以下单元：

现在，可仅使用自定义日志记录来训练和跟踪模型。 

运行以下单元时，只会记录一个参数和一个指标。

In [None]:
要跟踪模型的原因可能是为了比较使用不同超参数值训练的模型的结果。 

例如，你刚刚训练了一个正则化率为 0.1 的逻辑回归模型。 现在，训练另一个模型，但这次正则化率为 0.01。 由于你也在跟踪准确度，因此可比较和确定哪种比率会产生性能更好的模型。

跟踪模型结果的另一个原因是你正在测试另一个估算器。 到目前为止，已训练的所有模型都使用逻辑回归估算器。 

运行以下单元，使用决策树分类器估算器训练模型，并查看准确度是否比其他运行更高。

In [None]:
最后，尝试记录项目。 项目可以是任何文件。 例如，可绘制 ROC 曲线并将绘图存储为图像。 可将图像记录为项目。 

运行以下单元以记录参数、指标和项目。

In [None]:
在 Azure 机器学习工作室的“作业”页上查看模型的结果。 

- 可在“概述”选项卡中的“参数”下找到参数 。
- 可在“概述”选项卡的“指标”下和“指标”选项卡中找到指标  。
- 可在“输出 + 日志”选项卡中找到项目。

![“作业”页上的“输出和日志”选项卡的屏幕截图。](./images/output-logs.png)

You now have four dataframes:

- `X_train`: The training dataset containing the features.
- `X_test`: The test dataset containing the features.
- `y_train`: The label for the training dataset.
- `y_test`: The label for the test dataset.

You'll use these to train and evaluate the models you'll train.

## Create an MLflow experiment

Now that you're ready to train machine learning models, you'll first create an MLflow experiment. By creating the experiment, you can group all runs within one experiment and make it easier to find the runs in the studio.

In [None]:
import mlflow
experiment_name = "mlflow-experiment-diabetes"
mlflow.set_experiment(experiment_name)

## Train and track models

To track a model you train, you can use MLflow and enable autologging. The following cell will train a classification model using logistic regression. You'll notice that you don't need to calculate any evaluation metrics because they're automatically created and logged by MLflow.

In [None]:
from sklearn.linear_model import LogisticRegression

with mlflow.start_run():
    mlflow.sklearn.autolog()

    model = LogisticRegression(C=1/0.1, solver="liblinear").fit(X_train, y_train)


You can also use custom logging with MLflow. You can add custom logging to autologging, or you can use only custom logging.

Let's train two more models with scikit-learn. Since you ran the `mlflow.sklearn.autolog()` command before, MLflow will now automatically log any model trained with scikit-learn. To disable the autologging, run the following cell:

In [None]:
mlflow.sklearn.autolog(disable=True)

Now, you can train and track models using only custom logging. 

When you run the following cell, you'll only log one parameter and one metric.

In [None]:
from sklearn.linear_model import LogisticRegression
import numpy as np

with mlflow.start_run():
    model = LogisticRegression(C=1/0.1, solver="liblinear").fit(X_train, y_train)

    y_hat = model.predict(X_test)
    acc = np.average(y_hat == y_test)

    mlflow.log_param("regularization_rate", 0.1)
    mlflow.log_metric("Accuracy", acc)

The reason why you'd want to track models, could be to compare the results of models you train with different hyperparameter values. 

For example, you just trained a logistic regression model with a regularization rate of 0.1. Now, train another model, but this time with a regularization rate of 0.01. Since you're also tracking the accuracy, you can compare and decide which rate results in a better performing model.

In [None]:
from sklearn.linear_model import LogisticRegression
import numpy as np

with mlflow.start_run():
    model = LogisticRegression(C=1/0.01, solver="liblinear").fit(X_train, y_train)

    y_hat = model.predict(X_test)
    acc = np.average(y_hat == y_test)

    mlflow.log_param("regularization_rate", 0.01)
    mlflow.log_metric("Accuracy", acc)

Another reason to track your model's results is when you're testing another estimator. All models you've trained so far used the logistic regression estimator. 

Run the following cell to train a model with the decision tree classifier estimator and review whether the accuracy is higher compared to the other runs.

In [None]:
from sklearn.tree import DecisionTreeClassifier
import numpy as np

with mlflow.start_run():
    model = DecisionTreeClassifier().fit(X_train, y_train)

    y_hat = model.predict(X_test)
    acc = np.average(y_hat == y_test)

    mlflow.log_param("estimator", "DecisionTreeClassifier")
    mlflow.log_metric("Accuracy", acc)

Finally, let's try to log an artifact. An artifact can be any file. For example, you can plot the ROC curve and store the plot as an image. The image can be logged as an artifact. 

Run the following cell to log a parameter, metric, and an artifact.

In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import roc_curve
import matplotlib.pyplot as plt
import numpy as np

with mlflow.start_run():
    model = DecisionTreeClassifier().fit(X_train, y_train)

    y_hat = model.predict(X_test)
    acc = np.average(y_hat == y_test)

    # plot ROC curve
    y_scores = model.predict_proba(X_test)

    fpr, tpr, thresholds = roc_curve(y_test, y_scores[:,1])
    fig = plt.figure(figsize=(6, 4))
    # Plot the diagonal 50% line
    plt.plot([0, 1], [0, 1], 'k--')
    # Plot the FPR and TPR achieved by our model
    plt.plot(fpr, tpr)
    plt.xlabel('False Positive Rate')
    plt.ylabel('True Positive Rate')
    plt.title('ROC Curve')
    plt.savefig("ROC-Curve.png")

    mlflow.log_param("estimator", "DecisionTreeClassifier")
    mlflow.log_metric("Accuracy", acc)
    mlflow.log_artifact("ROC-Curve.png")

Review the model's results on the Jobs page of the Azure Machine Learning studio. 

- You'll find the parameters under **Params** in the **Overview** tab.
- You'll find the metrics under **Metrics** in the **Overview** tab, and in the **Metrics** tab.
- You'll find the artifacts in the **Outputs + logs** tab.

![Screenshot of outputs and logs tab on the Jobs page.](./images/output-logs.png)