Skip to content

AnTi-anti/Credit-Intelligence-Assessment

Repository files navigation

比赛链接

https://www.datafountain.cn/competitions/337

赛题信息

随着社会信用体系建设的深入推进, 社会信用标准建设飞速发展,相关的标准相继发布,包括信用服务标准、信用数据釆集和服务标准、信用修复标准、城市信用标准、行业信用标准等在内的多层次标准体系亟待出台,社会信用标准体系有望快速推进。社会各行业信用服务机构深度参与广告、政务、涉金融、共享单车、旅游、重大投资项目、教育、环保以及社会信用体系建设,社会信用体系建设是个系统工程,通讯运营商作为社会企业中不可缺少的部分同样需要打造企业信用评分体系,助推整个社会的信用体系升级。同时国家也鼓励推进第三方信用服务机构与政府数据交换,以增强政府公共信用信息中心的核心竞争力。

传统的信用评分主要以客户消费能力等少数的维度来衡量,难以全面、客观、及时的反映客户的信用。中国移动作为通信运营商拥有海量、广泛、高质量、高时效的数据,如何基于丰富的大数据对客户进行智能评分是中国移动和新大陆科技集团目前攻关的难题。运营商信用智能评分体系的建立不仅能完善社会信用体系,同时中国移动内部也提供了丰富的应用价值,包括全球通客户服务品质的提升、客户欠费额度的信用控制、根据信用等级享受各类业务优惠等,希望通过本次建模比赛,征集优秀的模型体系,准确评估用户信用分值。

数据说明

本次提供数据主要包含用户几个方面信息:身份特征、消费能力、人脉关系、位置轨迹、应用行为偏好。字段说明如下:

  • 用户编码 数值 唯一性
  • 用户实名制是否通过核实 1为是0为否
  • 用户年龄 数值
  • 是否大学生客户 1为是0为否
  • 是否黑名单客户 1为是0为否
  • 是否4G不健康客户 1为是0为否
  • 用户网龄(月) 数值
  • 用户最近一次缴费距今时长(月) 数值
  • 缴费用户最近一次缴费金额(元) 数值
  • 用户近6个月平均消费话费(元) 数值
  • 用户账单当月总费用(元) 数值
  • 用户当月账户余额(元) 数值
  • 缴费用户当前是否欠费缴费 1为是0为否 用户话费敏感度 用户话费敏感度一级表示敏感等级最大。根据极值计算法、叶指标权重后得出的结果,根据规则,生成敏感度用户的敏感级别:先将敏感度用户按中间分值按降序进行排序,前5%的用户对应的敏感级别为一级:接下来的15%的用户对应的敏感级别为二级;接下来的15%的用户对应的敏感级别为三级;接下来的25%的用户对应的敏感级别为四级;最后40%的用户对应的敏感度级别为五级。
  • 当月通话交往圈人数 数值
  • 是否经常逛商场的人 1为是0为否
  • 近三个月月均商场出现次数 数值
  • 当月是否逛过福州仓山万达 1为是0为否
  • 当月是否到过福州山姆会员店 1为是0为否
  • 当月是否看电影 1为是0为否
  • 当月是否景点游览 1为是0为否
  • 当月是否体育场馆消费 1为是0为否
  • 当月网购类应用使用次数 数值
  • 当月物流快递类应用使用次数 数值
  • 当月金融理财类应用使用总次数 数值
  • 当月视频播放类应用使用次数 数值
  • 当月飞机类应用使用次数 数值
  • 当月火车类应用使用次数 数值
  • 当月旅游资讯类应用使用次数 数值

评价方式

竞赛评价指标采用MAE系数。

平均绝对差值是用来衡量模型预测结果对标准结果的接近程度的一种衡量方法。计算方法如下:

$$M A E=\frac{1}{n} \sum_{i=1}^{n}\left|p r e d_{i}-y_{i}\right|$$

其中$ p r e d_{i}$为预测样本, $y_{i}$为真实样本。MAE的值越小,说明预测数据与真实数据越接近。

最终结果为:

$$ Score =\frac{1}{1+M A E}$$

$$M S E=\frac{1}{n} \sum_{i=1}^{n}\left(\operatorname{pred}{i}-y{i}\right)^{2}$$

MSE对预测偏差越大的样本惩罚越大,因为加上平方之后数据会越来越大。

最终的结果越接近1分数越高

About

消费者人群画像-信用智能评估Top1

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published