LR的预测概率值转分数

LR的预测概率值转分数(评分卡)

背景:在互联网金融中,一般用LR模型来预测一个借贷用户的好坏,但是LR模型得到的结果是逾期的概率值,如何仅仅给出预测概率值,人一般很难判断这个概率值代表的用户质量好坏,但是如果能够给出分数就比较理解了。而我们一般要把逾期概率转为分数来供公司进行决策,那么如何将逾期概率转化为用户质量的得分,例如0-100呢?

评分卡的分数转化

逻辑回归(Logistic Regression)是一种因变量与事件发生的概率之间的一种映射关系。其中的p/(1-p),称为odds,即事件成功的概率除以事件失败的概率

odds=p1podds=\frac{p}{1-p}

对几率取对数得到对数几率(log odds,亦称logit):

logp1p=ωTx+blog\frac{p}{1-p}=\omega^Tx+b

y=11+e(wTx+b)y=\frac{1}{1+e^{-(w^{\rm{T}}x+b)}}

lny1y=wTx+b\ln \frac{y}{1-y}=w^{\rm{T}}x+b

Score=A+B×ln(odds)Score=A+B\times\ln(odds)

设定当每增加1倍时,增加的分数PDO(point of double odds),即比率翻番的倍数

Score+PDO=A+B×ln(2odds)Score+PDO=A+B\times\ln(2odds)

求解A和B

要算出系数A、B的话,需要从业务角度先预设两个前提条件:

  1. 在某个特定的比率θ0\theta_0设定特定的预期分值S0S_0
  2. 指定比率翻番时分数的变动值(PDO)

解释:

  1. 比如根据业务经验,消费金融信贷的客户违约率4.8%算正常(θ0=Odds=5%\theta_0=Odds=5\%)。预设评分卡的分值为0-100分,那取预期分值S0S_0为50分,并指定当Odds按双倍上下浮动时(比如2.5%或10%),分值则对应上下变动10分(比如60分或40分)。
  2. 这里θ0=5%\theta_0=5\%是根据业务经验来的,没有数学依据;
  3. 0-100分是根据做评分卡的需要来的,没有数学依据。要是想做成600-1000分的评分卡也可以,修改对应的S0S_0和PDO就行;
  4. S0=50S_0=50分是根据0-100分来的,也可以取45分或73分,不重要。重要的是随着Odds翻番变动时,分数也随之变动的联动变化体系(你翻番我就变PDO=10分)

B=PDO/ln(2)B = PDO/ln(2)

A=S0PDOln(θ0)/ln(2)A = S_0-PDO*ln(\theta_0)/ln(2)

评分卡的好处

评分卡不使用概率转换分数,而是用线性部分转换成分数,这样做的好处是,每一个特征xx的分数和就是总分,而如果用概率转分,则单个特征增加s分,总分并不增加s分。

Score=A+B×ln(odds)=A+B×(ω0+ω1x1++ωnxx)=(A+Bω0)+Bω1x1++Bωnxx\begin{align} Score&=A+B\times\ln(odds) \\ &=A+B\times(\omega_0+\omega_1x_1+\cdots+\omega_nx_x)\\ &=(A+B\omega_0)+B\omega_1x_1+\cdots+B\omega_nx_x \end{align}

(A+Bω0)(A+B\omega_0)是基础分数,Bω1x1,,BωnxxB\omega_1x_1,\cdots,B\omega_nx_x是每个变量对应分配的分数,求和得到总分数。

分箱

如果之前步骤中每个变量都有进行分箱操作,就把每个变量对应的分数,分别乘以变量中每个分箱的WOE,得到每个分箱的评分结果。

WOE(Weight of Evidence)即证据权重,可以将logistic回归模型转化为标准评分卡格式,WOE是对原始自变量的一种编码形式,要对一个变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱)。WOE=ln(坏样本占比/好样本占比)

WOEi=ln(BadX=Xi/BadtatolGoodX=Xi/Goodtatol)WOE_i=\ln(\frac{Bad_{X=X_i}/Bad_{tatol}}{Good_{X=X_i}/Good_{tatol}})

评分卡

以上步骤都完成后,假如新产生一个新样本,我们只需将此用户每个变量对应到各分箱中得到其对应的WOE值,再根据上面的公式计算出这个样本在每个变量下的分数。最后将所有变量对应的分数相加,即为最终评分结果。

参考资料

  1. https://blog.csdn.net/sscc_learning/article/details/78591210
  2. https://www.ngui.cc/el/3600135.html?action=onClick

LR的预测概率值转分数
https://wangyinan.cn/LR的预测概率值转分数
作者
yinan
发布于
2023年8月5日
许可协议