# 简介

创建一个管道，将多个转换器和一个最终的估算器连接起来，形成一个组合估算器。
区别：
    make_pipeline 是一个便捷函数，用于创建 Pipeline 对象。
    Pipeline 是一个类，用于创建 Pipeline 对象。

```
参数：
    *steps：可变数量的转换器和估算器对象，按顺序连接在一起，最后一个对象为估算器。

返回值：
    Pipeline 对象，表示创建的管道。

```


In [1]:
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
import numpy as np

# 创建一个示例数据集
X_train = np.array([[1, 2], [3, 4], [5, 6]])
y_train = np.array([3, 7, 11])

# 创建一个 Pipeline 对象
pipeline = make_pipeline(
    StandardScaler(),  # 第一个步骤是数据标准化
    LinearRegression()  # 最后一个步骤是线性回归模型
)

# 使用管道进行数据拟合和预测
pipeline.fit(X_train, y_train)
predictions = pipeline.predict(X_train)
print(predictions)


[ 3.  7. 11.]


In [2]:
from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# 加载示例数据集
iris = load_iris()
X = iris.data
y = iris.target

# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建一个 Pipeline 对象
pipeline = make_pipeline(
    StandardScaler(),  # 第一个步骤是数据标准化
    LogisticRegression()  # 最后一个步骤是逻辑回归模型
)

# 使用管道进行数据拟合和预测
pipeline.fit(X_train, y_train)
predictions = pipeline.predict(X_test)
print(predictions)


[1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]
