评分卡2022-01-14
原理
WOE
假设违约客户为正样本(bad),其标签为1,正常客户为负样本(good),其标签为0。则WOE(Weight of Evidence)的定义为:
以Age特征为例:
Age | bad | good | WOE |
---|
0-10 | 50 | 200 | |
10-18 | 20 | 200 | |
18-35 | 5 | 200 | |
35-50 | 15 | 200 | |
50以上 | 10 | 200 | |
汇总 | 100 | 1000 | |
IV
IV相当于WOE的加权平均,公式如下:
其中,为分组个数 以Age为例,IV为:
Logistics
假设违约客户为正样本,其标签为1,概率为,正常客户为负样本,其标签为0,概率为。
令正样本概率为:
定义正负样本概率的比值为:
因此,正样本(违约)的概率越大,越大。
对个人信用评分卡,我们希望违约的概率越大,其分数越低。那么,可使用下式计算Score:
其中,和为常数 一般情况下,我们将连续值进行离散化,然后转为WOE作为特征值,使用Logistics进行建模。得到其系数后,便可进行分数的计算。
A和B估计
对评分卡的计算公式:
对于参数A和B,可基于以下两个假设进行计算:
- 某个特定的违约概率下的预期分值
- 指定的违约概率翻倍的分数(PDO)
假设,当对数几率为时,设定的特定分数为600,PDO=200,那么对数几率为时的分数是620。带入公式得:
解得,A=522,B=29
建模过程
特征分箱
对特征进行分箱处理
特征选择
选择的特征
Logistics模型建立
将特征值根据分箱结果转为对应的WOE,然后将WOE作为训练数据进行建模
预测数据-Score计算
其中,和为常数,和为模型参数,为特征对应的
评分卡
评分卡:

计算示例:

参考文档
- 信用卡评分模型(A卡) - 知乎 (zhihu.com)
- AI智能风控(二)——风控评分卡全流程建模看这篇就够了 - 知乎 (zhihu.com)
- 《SAS开发经典案例解析》(杨驰然)