In [1]:
# 导入必要的库
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import KFold, cross_val_score

# 加载数据集。这里使用的是鸢尾花数据集（包含150个样本的特征数据和对应的类别标签）
data = load_iris()
X = data.data  # 特征数据
y = data.target  # 类别标签

# 创建逻辑回归模型。这里设置对数回归的最大迭代次数为200
model = LogisticRegression(max_iter=200)

# 设置K折交叉验证的参数。指定数据集划分成5折来验证，shuffle参数为True表示在划分前会对数据进行打乱，random_state参数设置为42用来控制打乱时的随机性
kf = KFold(n_splits=5, shuffle=True, random_state=42)

# 使用K折验证方法来评估逻辑回归模型的效果。这里使用了交叉验证函数，传入模型、特征数据、类别标签和K折交叉验证对象kf
scores = cross_val_score(model, X, y, cv=kf)

# 输出每个验证轮得分的结果，以及最终的所有验证得分的平均值和标准差
print("交叉验证的得分:", scores)
print("得分的均值:", scores.mean())
print("得分的标准差:", scores.std())

交叉验证的得分: [1.         1.         0.93333333 0.96666667 0.96666667]
得分的均值: 0.9733333333333334
得分的标准差: 0.024944382578492935
