首页 > 专栏

【专栏】怎样理解银行信贷风控模型可解释性的需求

顾亦明 · 零壹财经 2019-04-18 19:46:33 阅读:10154

关键词:技术挪威行为监管银行监管风险

在三月中旬的一次银行行业交流会议上,交通银行战略发展部的何飞博士提出了一个很有价值的问题:银行在推进数字化转型应用数据驱动业务经营中,信贷业务数据风控模型的可解释性是否是一个必需的要求?是否只有传统逻辑回归模型才能满足风控模型的可解释性要求? 大凡在传统银行里面从事数据...

在三月中旬的一次银行行业交流会议上,交通银行战略发展部的何飞博士提出了一个很有价值的问题:银行在推进数字化转型应用数据驱动业务经营中,信贷业务数据风控模型的可解释性是否是一个必需的要求?是否只有传统逻辑回归模型才能满足风控模型的可解释性要求?

大凡在传统银行里面从事数据模型开发和管理的人,以及从事数字化信贷业务展开的人都知道,不管是自己开发或者委托第三方合作开发信贷业务数据风控模型,一直都强调最终所上线的模型是可以完全解释的,是透明的而不是一个黑匣子。

如果只是从所开发模型上线本身的需求来看,我们很好理解以前为什么一直有这个可解释性需求。因为以前模型首先是运用历史数据离线开发,然后在银行的信贷业务系统中部署上线生产。既然需要专门的模型部署这一步,就需要将模型离线开发得出的结果,以程序的形式将从头到底每一步计算和逻辑公式很清晰地表示出来。这就是模型需要有可解释性的最原始的动机。

今天算法技术有了很大的提高,数据资源有了海量的扩张,信贷业务平台已经很先进了,模型实施的环境已经很方便了,有些模型也可以不需要离线开发而实现在线自我学习了。在这种情况下,我们对待银行信贷业务的数据风控模型,是否依旧必须坚持需要可解释性?

基于对于银行信贷业务环境和从业者综合能力的理解,笔者认为,第一,银行信贷业务在宏观层面依旧需要数据风控模型的可解释性;第二,数据模型可解释性的确切定义是可以进一步讨论并放宽;第三,相对宽松的可解释性定义并非只有逻辑回归模型可以满足;第四,当前对于数据模型的实际综合管理能力依旧需要可解释性趋于从严定义。

银行信贷业务需要数据风控模型的可解释性

我们讲银行信贷业务在宏观层面是依旧需要数据风控模型的可解释性,就是指在全社会的大范畴下,对于大多数的银行,面对企业、小微和个人客户中的主流客群所提供的信贷产品,至少是应该都满足可解释性的需求。不排除可以接受有部分银行对于部分客群所提供的信贷业务,其所用的数据风控模型不具备良好的可解释性,但是肯定不提倡。

为什么要强调数据风控模型的可解释性?笔者认为是要从两个方面去理解,一个是银行监管的层面,一个是银行内部管理层面。

从监管的层面,首先要防范部分银行信贷业务的失控可能给整个社会所带来的系统性风险,尤其是对主流银行及主流信贷产品。监管需要对于银行从事的信贷业务的相当细节,包括防范欺诈风险和信用风险的具体措施都能够有穿透式的了解和掌握。因此从宏观层面在一个整体的范畴内,监管对于银行在信贷业务中使用的数据风控模型是有着模型可解释的需求。

其次,很多银行在信贷业务中使用的数据风控模型,同时也是银行关于最小风险资本金的数据模型和关于新审计方法的数据模型。现在强调行为监管,对于资本金、流动性和全面风险管理的监督管理要求,本身都包括对于所使用的数据模型的可解释性需求。

第三,监管也承担着监督银行开展信贷服务中所涉及的消费者权益保护、社会公正维护、竞争中性原则和金融回归本源服务实体经济等的责任,必要时候需要检查和确认银行开展信贷业务的风控过程中,不存在由数据模型所导致的不合理的社会歧视、恶性竞争、脱实向虚等状况。

从银行的管理层面,首先是希望对于信贷业务的整体发展是可预测的,以保障稳健经营、适度发展,防止盲目扩张。这个预测不是在风控层面对于每个客户的预测,而是对于业务未来发展的整体预测。这种预测是没有实时数据,因此数据模型的可解释性将为这种业务发展预测提供有效基础,并且在需要的时候帮助业务部门通过预测练习进行相关业务参数的调整。

第二,在信贷业务开展过程中,银行管理层需要充分防范数据风险和系统安全风险。数据模型本身可以看作是业务逻辑,但其实现过程是依赖于技术系统平台。当一个数据风控模型是可穿透式解释的,则一旦遇到模型结果和业务预测发生偏差的时候,相关人员是很容易鉴定究竟是业务流程的问题、进件或数据的问题还是技术系统执行发生了偏差,从而为后续的处置带来方便。

第三,在信贷业务开展过程中,银行管理层还需要充分明确各个部门的责任分工。在目前传统银行尚在逐步推进数字化转型的过程中,完善相关的统计标准和考核标准,完善人工参与时尽职免责的边界,完善流程优化等事项,都需要对于在信贷业务流程中部署的数据风控模型有比较好的解释性。

数据模型可解释性定义的讨论及其现实的适用性

目前大家所熟悉的数据模型的可解释性,大多是来自于逻辑回归模型的结果用计算和逻辑公式线性化(包括分段线性化)表示的形式。然而笔者认为,第一,在传统银行业界应用信贷风控模型中,数据模型的可解释性从没有被严格地定义过,更多是从业人员之间的一种含糊的约定俗成;第二,如果从满足上述监管和银行内部管理需求出发,数据模型的可解释性还是可以比当前业界约定俗成的用计算和逻辑公式线性化表示的形式更为宽广一点。

从技术的层面来理解,可解释性是对于数据模型的一种信任方式,是为了有助于揭示模型的输入与输出之间的因果关系,从模型的计算过程中获取更多有用的信息,确保模型的可使用范围,以及全面了解数据分布的特征。

业界从业人员目前对于数据模型的可解释性诉求,笔者更多地是将其视作为对于数据模型的可读性和可理解性的诉求,就是为了让所有相关的人能够非常清楚地阅读并且完全理解整个的模型运算过程与结果输出之间的关系,包括每个输入数据字段在模型运算过程中所起的作用,以及模型运算每个子步骤的上下关系。

可读的可理解的模型必然是可解释的模型,但是反之则不完全是。完整线性化表示的模型是可读和可理解的,但是部分非线性化表示的模型依旧是可读和可理解的。因此,笔者将数据模型的可解释性区分为狭窄定义的和比较宽松定义的。

狭窄定义的数据模型可解释性,就是我们目前常见的用计算和逻辑公式线性化表示的形式。如果不完全是线性化的表示但是能够满足对于一般从业人员可读和可理解,则视为相对宽松的可解释性。进一步,如果整个模型的运算过程与结果输出是可以通过一整套解释逻辑实现离线模拟,并且对于固定的输入所获得的结果是不变的,则可以视为是更为宽松的可解释性。

如果从一个更为宽松的定义出发,那么目前业界正在应用中的绝大多数建模方法,都是具备可解释性,包括传统的逻辑回归方法和决策树方法,所有的线性模型以及具有监督的机器学习方法等等。此时余下的数据模型可解释性所受到限制的问题,往往不在于模型的建模算法本身,而在于以此算法开发的数据模型能否具备同时提供离线完整模拟的条件。

对于银行信贷业务的数据风控模型来说,模型的可解释性究竟应该达到怎样的程度,监管部门和银行内部的管理部门,可根据具体情况来酌情决定。所谓具体情况,不仅仅是对于数据模型计算运营和输出结果的具体监督管理需求,还有相关管理部门现有的监督管理能力可以达到的水准。

笔者认为,如果仅从预测业务发展趋势,防范系统性风险传染,识别风险苗头和处置风险暴露的角度出发,监管部门和银行内部管理部门是可以通过相应的模拟手段,包括沙盒试验和压力测试的方法,达到监督管理的效果和目的。因此,一个相对宽松的数据模型可解释性要求应该是可以胜任。

此时模型开发者只要能够同时提供技术、程序和说明,让上线的风控模型在任何需要的情况下,管理部门可以平行进行离线模拟并得到完全相同的输出结果,则管理部门即可接受该模型是属于可解释的。

然后我们回到现实世界,我们发现,平均地讲,今天各级管理部门相应的知识能力和工作能力,包括监管部门和银行内部管理部门,离开按部就班地按照技术指导完成一个数据模型的动态模拟,并从模拟过程和结果中理解信贷风控模型的具体作用,完成学习过程,准确进行仿真预测,以及对于各项输入数据的限制和作用,都还是有着较大的距离。

也就是说,虽然从理论上讲我们可以放宽对于数据模型可解释性的定义,同时依旧能够满足各级管理部门面对银行信贷业务及其风控流程的监督管理需求,然而在实际中,还无法完美实现。所以说,在目前和未来的一段时间内,类似于逻辑回归模型的开发上线所使用的、用计算和逻辑公式线性化表示的形式,也就是我们所说的狭窄定义的可解释性,还将是各级管理部门的直接需求。

总之,实事求是地掌握好银行信贷业务中数据风控模型的可解释性需求,鼓励创新但不追求一刀切,也是当前银行数字化转型过程中的一个必要的课题。

作者简介:老古成都(顾亦明),大数据风控、自动化审批与数字化应用领域资深人士。曾在GE消费金融中国数据中心和决策科学实验室、GE消费金融(挪威)风险管理部、澳新银行中国运营服务中心风险模型与数据部、上海农商银行网络金融、征信机构益博睿(Experian)和科锐富(CRIF)、数据服务巨头安客诚(Acxiom)等国内外机构担任负责人或高管。

零壹智库推出“金融毛细血管系列策划”,通过系列文章、系列视频、系列报告、系列研讨会和专著,系统呈现“金融毛细血管”的新状态、新功能、新价值、新定位。
 

相关文章


用户评论

游客

自律公约

所有评论


资讯排行

  • 48h
  • 7天


专题推荐

more

第四届中国零售金融发展峰会(共15篇)

《陆家嘴》交流会第6期(共14篇)

2022第一届中国数字科技投融资峰会(共43篇)

2019年数字信用与风控年会(共15篇)



耗时 201ms