龙空技术网

单变量稳定性指标CSI

Penny1218 130

前言:

现在各位老铁们对“阈值指标”大约比较重视,咱们都需要学习一些“阈值指标”的相关资讯。那么小编也在网络上汇集了一些对于“阈值指标””的相关文章,希望姐妹们能喜欢,咱们一起来了解一下吧!

关于模型的监控,大家用的比较多的是模型稳定性指标

PSI=(现行样本占比-开发样本占比)*ln(现行样本占比/开发样本占比)

但是当模型稳定性变差的时候,就需要看一下具体是哪个变量不再稳定,单变量稳定性指标CSI就隆重登场了。

02

举个栗子

我们以逻辑回归模型,举例说明一下:

性别变量:当为男性时,得分是8分;女性,得分为15分

最终算出来的得分为-0.6,该变量的CSI为负数,也就是说现行样本相对开发样本,向低分字段移动,也就是男性占比增加。

若CSI为正数,则现行样本相较开发样本,向高分字段移动。

而对比多个变量的CSI,主要看变量的绝对值,绝对值高,则该变量的稳定性差,并非正数的稳定性优于负数。

03

无奖互动环节

本文留下三个小问题,欢迎大家在后台踊跃回复:

CSI的绝对值小于多少,代表该变量稳定,有阈值吗?除了逻辑回归,其他机器学习的模型该如何计算CSI?PSI过大的时候,应该如何调整模型?

标签: #阈值指标