In [None]:
import pandas as pd
import numpy as np  # 导入numpy库
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import train_test_split

# 假设的特征数据集
feature_names = [
    '一天去两家医院的天数', '月统筹金额_MAX', '药品费自费金额_SUM', '贵重药品发生金额_SUM',
    '就诊次数_SUM', '住院天数_SUM', '医院编码_NN', '个人账户金额_SUM', '起付线标准金额_MAX',
    '医疗救助个人按比例负担金额_SUM', '是否挂号', '出院诊断病种名称_NN', '药品在总金额中的占比', '个人支付的药品占比'
]

# 生成模拟数据
data = pd.DataFrame(np.random.rand(1000, 14), columns=feature_names)
# 添加一个随机的目标变量
data['Target'] = np.random.randint(0, 2, size=1000)

# 分离特征和目标变量
X = data[feature_names]
y = data['Target']

# 分割数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建GBDT模型
gbdt = GradientBoostingClassifier(n_estimators=100, random_state=42)

# 训练模型
gbdt.fit(X_train, y_train)

# 获取特征重要性
feature_importances = gbdt.feature_importances_

# 创建特征重要性表格
feature_importance_df = pd.DataFrame({
    '特征名称': feature_names,
    '贡献度': feature_importances
})

# 打印特征重要性表格
print(feature_importance_df.sort_values(by='贡献度', ascending=False))

# 如果需要生成3份不同的表格，可以对模型进行不同的参数调整或使用不同的随机种子
# 例如，可以尝试不同的n_estimators参数，或者在不同的数据分割上训练模型