Skip to content

datacruiser/CreditCard

Repository files navigation

CreditCard

一套基于R并采用woe包的快速构建信用评分卡的代码。

大致的建模流程如下:

![评分卡建模流程](# CreditCard 一套基于R并采用woe包的快速构建信用评分卡的代码。

本人转行将近一周年了,最早是从转行后的第一个公司的同事那边拿到这套初版的代码,经过团队里面的不同同事的优化和迭代,不断提高评分卡构建的效率,虽然还是有一些瑕疵,比如前面提到的woe包不支持对缺失值进行单独分箱,也无法对类别型变量进行处理,但是易用,而且功能强大,比较适合我们这些不会自己造轮子的同学。

大致的建模流程如下:

评分卡建模流程

项目文件说明

  • service文件夹:存放主要数据处理和建模的文件
    • dataCleaning.R:完成以下主要功能
      • 原始数据导入
      • 异常值删除
      • 缺失值处理
      • 非数值类型变量处理
      • 变量IV计算
      • 根据IV及随机森林算法得到的变量重要性系数筛选变量,在特征较多的时候可以调整CRF_BASE阈值
    • featureEngineering.R:完成以下主要功能
      • WOE分箱及编码
      • 用逐步回归筛选WOE编码后的变量
      • 计算WOE单调性并保持图片及数据
      • 保存各个变量的好坏标签的分布图
    • modeling.R
      • 确定最终的入模变量
      • 建模并计算评分
      • 计算评估模型评价指标:KSPSI
      • 导入评分卡模板并输出评分卡
    • modelingtest.R
      • 通过变量IV、个变量间VIF、入模变量P值显著性等测试入模变量时测试用
  • rawdata:保存原始数据
  • util
    • udf.R
      • 自定义的几个函数,主要是绘制WOE图并保持相关图片到特定位置
    • packageManage.R
      • 管理各种包,特别是需要提前通过devtoolsiinstall_github("tomasgreif/riv")函数安装 WOE
  • output
    • 本文件夹主要保持代码运行过程当中产生的数据文件
  • score_card_template.xlsx
    • 评分卡模板文件
  • score_card_group_14_KS_0.491+1215_205311.xlsx
    • 输出的评分卡

项目分支

  • master
    • 用全量数据构建评分卡
  • train_score
    • 用 train 数据集构建评分卡

About

一套基于 R 并采用“tomasgreif/riv”包的 快速构建scorecard 的代码

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages