评分卡
2022-01-14

 

原理

WOE

假设违约客户为正样本(bad),其标签为1,正常客户为负样本(good),其标签为0。则WOE(Weight of Evidence)的定义为:

(1)WOEi=ln(Py1Py0)=ln(Bi/BtotalGi/Gtotal)iiBibadGigoodBtotalbadGtotalgood

以Age特征为例:

AgebadgoodWOE
0-1050200=ln50/100200/1000=0.92
10-1820200=ln20/100200/1000=0.0
18-355200=ln5/100200/1000=1.39
35-5015200=ln15/100200/1000=1.39
50以上10200=ln10/100200/1000=0.69
汇总1001000 

 

IV

IV相当于WOE的加权平均,公式如下:

(2)IVi=(BiBtotalGiGtotal)ln(Bi/BtotalGi/Gtotal)IV=k=0nIVin

以Age为例,IV为:(0.50.2)0.92+(0.20.2)0+(0.050.2)(1.39)+(0.150.2)(1.39)+(0.10.2)(0.69)=0.623

Logistics

假设违约客户为正样本,其标签为1,概率为p,正常客户为负样本,其标签为0,概率为1p

令正样本概率为:

(3)p=11+e(θTX+b)

定义正负样本概率的比值为odds

(4)odds=p1p

因此,正样本(违约)的概率越大,odds越大。

对个人信用评分卡,我们希望违约的概率越大,其分数越低。那么,可使用下式计算Score:

(5)Score=ABln(odds)=AB(θTX+b)AB

一般情况下,我们将连续值进行离散化,然后转为WOE作为特征值,使用Logistics进行建模。得到其系数后,便可进行分数的计算。

 

A和B估计

对评分卡的计算公式:

(6)Score=ABln(odds)

对于参数A和B,可基于以下两个假设进行计算:

  1. 某个特定的违约概率下的预期分值
  2. 指定的违约概率翻倍的分数(PDO)

假设,当对数几率为160时,设定的特定分数为600,PDO=200,那么对数几率为130时的分数是620。带入公式得:

(7)600=ABlog(160)620=ABlog(130)

解得,A=522,B=29

建模过程

  1. 特征分箱

    对特征进行分箱处理

  2. 特征选择

    选择IV0.1的特征

  3. Logistics模型建立

    将特征值根据分箱结果转为对应的WOE,然后将WOE作为训练数据进行建模

  4. 预测数据-Score计算

    (8)Score=AB(θTX+b)ABθbXWOE

评分卡

评分卡:

score_card

 

计算示例:

计算示例

 

参考文档

  1. 信用卡评分模型(A卡) - 知乎 (zhihu.com)
  2. AI智能风控(二)——风控评分卡全流程建模看这篇就够了 - 知乎 (zhihu.com)
  3. 《SAS开发经典案例解析》(杨驰然)