Skip to content

类似泰坦尼克号的一个 薪资预测 demo

Notifications You must be signed in to change notification settings

Azure-Sky-L/ML-Test

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

数据预处理:

step1:查看数据,分析数据

step2: 检查数据

step3: 把数据样本里的 ? 填充为该特征的众数

step4:数据转换,把字符串转换为 int

训练、测试:

step5:运用 sklearn 训练单个 model

step6:测试单个模型的准确度

step7:挑出比较好的模型进行融合

step8: 测试准确度

step9: 可视化每个特征对最终结果的影响程度

ste10: 只使用影响程度最大的几个特征,再次训练,测试

尝试提升准确度的过程:

step1: 挑出准确度较高的几个模型,进行融合

调参:

step2:微调单个模型的参数 (dt,knn,log = 9,7,1)

step3:调节融合模型的权重比例 (dt:knn:log = 23:3:0, 准确率: 0.8602051471039862)

一开始:log、knn、dt的准确度分别是:0.785,0.779,0.842,通过微调参数分别得到:0.8006,0.802,0.8573 的准确度

从单个模型的预测准确度来看,dt 的效果明显好于 log 和 knn,所以在模型融合时给 dt 分配较高的权重

step4:可视化出每个特征对最终结果的影响程度,挑出决定作用最大的几个特征

step5:微调单个模型的参数 (dt,knn,log = 9,13,1)

此时微调后的:log、knn、dt 的准确度分别是:0.803,0.8378,0.8497,log 有略微提升、knn 提升显著、dt 有一定下降

step6:调节融合模型的权重比例 (dt:knn:log = 7: 5:1,准确率:0.858731036177139)

About

类似泰坦尼克号的一个 薪资预测 demo

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages