进军超级场景:隐私计算金融风控应用报告(2022)

  42页 阅读:55988 温泉,刘霁雯
从对数据源的改变来看,隐私计算技术的应用将大大拓展金融风控能够用到的数据源的广度和深度。

摘要
 
√ 隐私计算在金融风控场景的最初探索开始于金融科技巨头蚂蚁集团微众银行。但是,真正大量进入实际应用场景则是在2019年9月的“净网行动”之后。
 
√ 目前,隐私计算技术在金融风控场景的应用探索覆盖了信贷领域的贷前、贷中、贷后的各个环节,在面向个人的消费金融贷款和对公贷款当中都有尝试。而且,目前的应用不仅局限于信贷领域,在反洗钱、保险和资管场景中亦有应用前景。
 
√ 隐私计算厂商在金融风控领域的服务方式有四种:提供一站式服务、提供全流程解决方案、提供数据运营解决方案、提供纯技术服务。这四种服务方式的不同,源于厂商背景和资源的不同。从服务方式的差异,能够更清晰地看到隐私计算厂商在商业模式上的差异,这在很大程度上也决定着隐私计算厂商的方向和终局。
 
√ 隐私计算厂商在金融风控领域的竞争力是个综合指标,主要体现在技术、数据、对业务的理解三个方面。
 
√ 隐私计算技术未来将在数据来源、数据分析、数据应用三个层面重构金融风控。
 
作者:温泉 刘霁雯
出品:零壹智库
 
 
一、隐私计算在金融风控领域的应用历程
 
(一)前瞻性技术布局
 
在中国,金融领域对隐私计算的应用,最早是从以蚂蚁集团和微众银行为代表的一批金融科技领域的先行者开始的。
 
最早是2016年,从蚂蚁集团开始。根据公开资料[ 《蚂蚁金服共享智能实践》,来源于知乎号“蚂蚁共享智能”,https://zhuanlan.zhihu.com/p/146954520。原文首发于期刊《中国计算机学会通讯》(CCCF)2020年第5期。],为了更好地应对形势的变化,解决数据共享的需求与隐私泄露和数据滥用之间的矛盾,蚂蚁集团2016年提出了希望通过技术手段,在多方参与且各数据提供方与平台方互不信任的场景下,能够聚合多方信息进行数据分析和机器学习,并确保各参与方的隐私不被泄漏,数据不被滥用,蚂蚁集团当时称之为“共享智能”。
 
欧洲议会于2016年4月通过《欧盟一般数据保护条例》,是世界范围内加强数据安全和个人隐私保护立法的开端。蚂蚁的共享智能研究在同一年启动,可视作是对数据合法合规利用的前瞻性技术布局。
 
蚂蚁集团最初在可信执行环境(TEE)和多方安全计算(MPC)两个方向进行探索。在实践中,蚂蚁集团逐渐发现,不同技术都有各自的优势,同时在业务发展的不同阶段用户对隐私保护的需求是不同的。把不同的技术融合到一起,发挥各自技术的优势,往往会达到一个更为理想的效果。因此,在实际的应用中,基于用户的需求,蚂蚁集团逐渐尝试灵活应用多种技术提升实际应用效果。
 
与此同时,2018年微众银行人工智能团队也开始关注到隐私计算技术。[ 《对金融领域而言,联邦学习的实际价值是如何体现的?》,来源于InfoQ访谈,载于FATE开源社区微信公众号,网址https://mp.weixin.qq.com/s/Vg71N3RC3u93X7gRr6iCWQ。]018年,在业务实践和行业观察中,微众银行人工智能团队发现训练AI所需要的大数据实际上很难获得,数据的控制权分散在不同机构、不同部门,“数据孤岛”问题严重,加之政策法规对数据隐私和数据安全的要求让数据共享和合作更加困难。
 
针对实际的业务痛点,他们发现联邦学习是一种行之有效的解决方案,并开始进行研究和探索。从2018年到2019年初,微众银行发表了多篇联邦学习相关论文,对于联邦学习的概念、分类、基本原理等基础理论进行系统性研究。同时,2018年起,微众银行人工智能团队基于联邦学习理论研究进行相关开源软件研发。经过探索,微众银行搭建起了理论研究、工具软件、技术标准、行业应用的多层级联邦学习生态框架,并且开始有腾讯、华为京东、平安等生态合作伙伴加入。
 
2019年初,微众银行正式开源全球首个工业级联邦学习框架FATE(Federated Learning Enabler),并开始尝试将联邦学习应用于金融业务中。FATE的开源,使得联邦学习的应用门槛大幅降低。2020年初,针对金融应用中联合风控、匿踪查询等业务需求,微众银行进一步给出了场景式隐私保护解决方案WeDPR,并基于WeDPR在2021年5月发布多方大数据隐私计算平台WeDPR-PPC。WeDPR方案组合了多种隐私保护策略,融合安全多方计算、同态加密、零知识证明、选择性披露等算法,满足多变业务流程。
 
(二)危机引发质变
 
2019年9月,中国金融科技领域迎来一场前所未有的整顿风暴。
 
这场监管风暴源自2019年1月公安部组织部署全国公安机关开展的“净网2019”专项行动。这次专项行动的目标是,依法严厉打击侵犯公民个人信息、黑客攻击破坏等网络违法犯罪活动。
 
“净网行动”始自2011年,是由公安部发起的网络犯罪专项打击行动。2011年首次“净网行动”的主要打击目标为网上涉枪涉爆违法犯罪活动。此后,随着互联网的发展,净网行动的内容根据实际情况不断变化。
 
“净网2019”专项行动开始后,很快聚焦于对“套路贷”及其生态的打击。根据公安部2019年11月14日在北京召开的通报全国公安机关开展“净网2019”专项行动工作情况及典型案例的新闻发布会上披露的信息:
 
2019年5月25日,黑龙江省七台河市接到居民报案,之后七台河市公安局成立专案组,从本地被“套路贷”受害者和催收团伙入手,延伸打击触角、持续经营攻坚,侦获一条集实施“套路贷”犯罪团伙、催收团伙以及帮助“套路贷”犯罪的技术服务商、数据支撑服务商、支付服务商的完整犯罪链条。
 
8月10日开始,上述专案组对“7·30”网络“套路贷”专案开展集中收网行动,打掉犯罪团伙9个,抓获犯罪嫌疑人80名,查封冻结涉案资产7亿元,提取各类涉案数据205T,涉及被催收人员7万余人。
 
在此过程中,公安部网络安全保卫局从这些案件线索出发,组织全国展开集群战役。9月1日以后直至11月间,各地网安会同刑侦部门收网打掉团伙147个,抓获嫌疑人1531名,采取刑事强制措施798名,铲除了一批帮助犯罪的技术服务商、数据支撑服务商、支付服务商,实现了对“套路贷”犯罪规模打击、生态打击。
 
在这场打击当中,金融科技领域受到波及。据财新报道,2019年6月,公安部门锁定“套路贷”、“714高炮”依赖导流获客和暴力催收这两大帮凶,利用爬虫等工具,为这些“套路贷”平台爬取通讯录等个人敏感信息,并引发命案。这些非法个人信息的主要提供者,不少来自大数据风控公司。
 
9月6日,位于杭州的大数据风控平台杭州魔蝎数据科技有限公司被警方控制,高管被带走,相关服务瘫痪。此后,不少第三方风控行业头部公司相继被调查或被波及,使得整个行业主要爬虫服务出于避险考虑基本暂停。对市场来说,这是监管层释放的强烈信号,即用爬虫爬取个人隐私数据(因为大数据风控当中不少数据涉及个人隐私)要付出巨大的代价。
 
这场整治,使得隐私计算成为一种可考虑的替代方案,市场洞然而开。
 
整治之前,爬虫是大数据风控行业的灵魂——大多数大数据风控公司本身并没有那么多数据,因为数据是从业务当中来的,但是有大量数据源的机构实际上并不多,多数大数据风控公司的数据是靠爬虫爬取。本来,用爬虫来爬取公开数据并不违法,但是与个人信息强相关的数据对网络贷款的风险控制才是更直接有效的,在利益的驱使下,爬虫爬取信息的范围逐渐扩大,很多公司都利用爬虫技术去抓个人隐私数据或者政府机关、银行机构的数据。这些数据,是有网络贷款业务的机构用来做风险控制的主要依据。
 
整治之后,大部分爬虫服务停止,市场不得不考虑替代方案。在这个过程中,数据的供需双方开始重新看待数据的合规使用问题:一方面,一些有数据源的机构只愿意与持牌金融机构合作;一方面,持牌金融机构,也要看合作方是否获得了合法的数据源授权。
 
也正是在这场整治之后,发展隐私计算业务的公司迎来了市场机会——这在零壹智库的调研中是有实例证明的。
 
二、隐私计算在金融风控领域的应用现状
 
2021年是隐私计算技术规模化落地元年。经过一整年的努力,隐私计算技术在金融风控场景中已经多有落地。
从金融机构方面来看,国有大行、股份制银行、头部的城商行、保险公司、证券公司目前都有隐私计算技术在风控场景的布局和尝试。
 
从隐私计算技术厂商的业务进展来看,据零壹智库调研了解,2021年头部的10多家隐私计算厂商当中,落地案例较多的已经达到了几十家(包含POC在内)。多数厂商预计,2022年落地场景将进一步爆发。
 
(一)隐私计算厂商在金融风控领域的服务方式
 
目前,就零壹智库所接触到的案例,隐私计算厂商在金融风控领域的服务方式有四种:提供一站式服务、提供全流程解决方案、提供数据运营解决方案、提供纯技术服务。
 
这四种服务方式的不同,源于厂商背景和资源的不同。
 
在零壹智库的《开启新纪元:隐私计算在金融领域应用发展报告》[ 《开启新纪元:隐私计算在金融领域应用发展报告》,http://www.01caijing.com/article/286018.htm]当中,曾经探讨过隐私计算厂商在商业模式上的差异。
 
通过了解隐私计算厂商在金融风控领域的服务方式,能够更清晰地看到各自在商业模式上的差异。
 
这些差异或许在很大程度上决定着隐私计算厂商的方向和终局。
 
1、提供一站式服务
 
第一类服务方式是提供较为全面的金融风控一站式服务。所谓一站式服务,指的是覆盖金融风控场景全流程的服务,包括解决方案的制定、数据源的引入、数据治理、风控策略制定、风控模型的建立与调优等服务。其中,包括需要投入大量人力的数据清洗和驻场建模等服务,此类服务商自身都可以提供。
 
提供此类服务需要隐私计算公司在金融风控方面有充分积累,也需要相当的人力投入。此类服务的提供,以有金融科技背景的公司居多,同盾科技天冕科技洞见科技等是其中的典型代表。
 
以天冕科技为例。
 
天冕科技成立于2019年4月,是WeLab汇立集团旗下的一站式金融科技服务商,在金融科技方面有较为深厚的积累。
 
天冕科技的母公司WeLab汇立集团创立于2013年,Welab汇立集团有超5000万用户、超700家企业客户。天冕科技创立之后致力于为企事业单位提供全价值链的科技产品与解决方案,助力合作方快速数字化转型。截至2021年3月,天冕科技签约合作机构数量已超700家,包括各类持牌金融机构、国企事业单位、传统企业、互联网企业等。
其中,天冕科技为邮储银行提供全定制化信贷技术解决方案,贯穿了产品设计、后台技术、风控管理、智能营销等全过程,打造了中国邮储银行首个互联网信贷产品“邮e贷”,并且一直合作至今。
 
在金融风控领域,天冕科技通过天冕联邦学习平台和一系列技术服务,为金融机构提供一站式服务。这些服务包括:
 
第一,提供隐私计算技术平台。目前,天冕联邦学习平台WeFe已经正式开源。
 
第二,帮助场景方引入数据源。
 
第三,根据场景方需求,提供数据治理、建模等服务。
 
这里,值得注意的是,数据清洗和建模服务的提供需要投入大量人力,是较重的服务模式。这两项服务,天冕科技都可以提供。
 
天冕科技通过天冕数据中台提供数据治理的服务。数据治理模块覆盖全方位的数据治理能力,包含数据标准管理、元数据管理、数据质量管理、数据资产管理等。
 
天冕数据中台是针对业界痛点而设计的一款产品。一般来说,大多数的系统都是在某些业务需求的基础上建立,每条业务线都有一套数据体系或系统,同样的数据要素可能在不同的系统标准不一致、业务口径不统一。要打通几套或所有系统并整合数据到一个平台,需要每个部门的配合,难度较大,而且也可能因为需要修改系统导致对现有业务造成影响。从业内数据集成及统一标准的时间来看,一般需要几个月的时间沟通数据整合需求。天冕技术团队开发出针对不同数据源格式采用的统一插件、一键部署采集数据、无侵入式数据融合,可以实现界面可视化数据标准管理。
 
根据客户的需求,天冕科技也可以驻场提供建模服务。天冕科技有建制完整的风控团队。其中包括,前端设计工程师、前端开发、后端开发工程师、底层算法工程师、整体架构师、产品工程师、调研人员、市场人员、风控检测、营销人员等等。
 
与此同时,天冕科技在金融风控服务方面具备独特的优势:
 
第一,具备独特的数据资源。一方面,天冕科技母公司Welab汇立集团有自身业务的数据积淀,数据体量大,且是一手数据。另一方面,由于自身业务需要,Welab汇立集团与金融风控所需的数据源都有业务合作,对选择数据供应商经验丰富。
 
第二,具备经历过实际业务场景打磨的丰富风控经验。风控经验在金融隐私计算的应用中非常关键。数据在金融风控领域的应用非常复杂,哪些数据和算法对提升实际业务价值最大,这些数据和算法应当如何运用,只有通过大量的实际业务运行才能掌握。比如,手机电量对判断反欺诈很有价值,如果有用户手机电量一直是100%,其欺诈性可能更大,因为电量一直100%说明一直在充电,这个手机可能是欺诈团伙使用的手机。类似这样的数据维度,只有深入金融风控业务才能挖掘出来。
 
2、提供全流程解决方案
 
第二类服务方式是提供全流程解决方案,但是服务方式比第一类更轻。
 
此类服务方式的服务内容包括:其一,提供隐私计算技术平台;其二,帮助场景引入数据源;其三,利用场景经验协助数据源开发数据产品;其四,为金融机构提供风控策略、数据建模的咨询服务。
 
与第一类的区别是:此类服务商不提供重人力投入的服务。比如数据清洗、驻场建模等服务,往往需要投入大量人力。此类服务商更倾向于引入其他合作伙伴为金融机构提供相关服务。比如富数科技
 
但是,也有一些此类服务商,虽然不提供重人力投入的数据清洗、驻场建模服务,但是可以提供数据基础设施和治理产品工具,方便用户上手、将使用门槛降低。比如数牍科技。
 
以富数科技为例。
 
富数科技成立于2016年4月,2019 年就上线了独立自主研发的安全计算平台 Avatar,是国内最早进入隐私计算领域的创业公司之一。
 
富数科技在隐私计算技术和金融风控业务方面均有积累。
 
在隐私计算技术方面,富数科技起步早,投入资金大,技术路线相对全面。富数科技是国内少数能够实现完全自主研发、国内首批通过银行卡检测中心和首批通过信通院多方安全计算&联邦学习性能专项等评测的企业之一。在隐私计算应用场景落地上,截至2021年末已累计服务银行、运营商、国家电网、国际数据港等60多家合作伙伴。
在金融风控业务方面,进入隐私计算领域之前,富数科技的主要业务是金融建模,在金融数据和算法方面经验丰富。富数的智能决策分析和商务部门等业务线,也都聚集了众多金融领域背景的人士,团队成员来自Capital One, GE Money、渣打银行、中国银联等等。
 
富数科技提供的服务即是提供全流程解决方案,其主要提供的服务包括:
 
第一,提供私有化部署的标准化隐私计算产品Avatar;
 
第二,通过Avatar为用户引进运营商、银联等高价值数据,并提供联邦学习的能力。例如,在与某大行深度合作期间,与运营商和银联通过联邦从学习测试了十多个不同业务场景,取得了对数据价值的深度理解;
 
第三,基于场景的理解,做标准的应用级SAAS。比如,富数科技2021年联合多个数据源以及保险公司,通过联邦学习能力,开发了面向车险场景的数据产品,预测车主是否为网约车\拼车\顺风车司机,并结合出险情况实现车险定价。
 
3、提供数据运营服务
 
第三类服务方式是提供数据运营服务。此类服务方式的基本内容与第二类有些相似,但不同之处在于,服务的提供以业务目标为导向,隐私计算服务商与金融机构商定业务目标之后,根据目标来决定引入哪些数据源、采用什么样的策略和模型。其商业回报来源于为金融风控场景创造的业务价值,比如提高了多少资产规模、降低了多少坏账率等等。
 
蓝象智联是提供第三类服务的典型代表。从数据运营的角度,蓝象智联更像是帮助客户达成业务目标的合作伙伴,而不是单纯的乙方。
 
蓝象智联创办于2019年底,正式注册于2020年3月,团队大约一半成员来自阿里巴巴和蚂蚁集团。
 
蓝象智联创始人兼董事长童玲历任蚂蚁金服首席架构师、芝麻信用CTO、蚂蚁区块链及隐私计算平台创始人。其团队曾经在芝麻信用、花呗、借呗、余额宝、网商贷等产品的数据运营方面取得了成功经验。芝麻信用的团队也是中国最早在金融业务中探索数据运营的团队之一。
 
数据运营的核心,在于构建数据要素创造业务价值的最快速路径。在金融场景中精准营销、应用增长、反欺诈、信用评估、合规审查等一些列场景中,数据运营能够有效让数据去驱动以上价值的落地,提升用户活跃、放大信贷规模、管理不良风险等等,数据运营能从各方面提升金融机构的数字化运营能力。数据运营核心离不开几大要素:数据、算法、流量、风控、合规。
 
蓝象智联提供的服务与其他隐私计算厂商的不同之处在于:
 
首先,蓝象智联设有专门的数据运营团队,为使用蓝象智联隐私计算平台的金融机构提供数据运营服务。
第二,服务的主要内容是运营工具、解决方案及方案落地相关服务的提供,其中包括一系列的投放策略、运营策略、规则等。服务的核心在于,需要丰富的经验,特别是成功经验的积累。
 
第三,通过设计数据产品、解决方案,蓝象智联可以测算出数据在场景中贡献的价值。
 
比如,蓝象智联一项独特的能力在于,清晰地知道不同数据在不同场景下的定价,这里的“定价”既包含价值、也包含价格。例如,一条运营商数据的调用,在一个场景中定价为一次0.35元,但是在另外一个场景中可能是0.25元,需要根据数据在不同场景中产生的价值(即给业务带来的价值)来确定价格。要做这样精准的定价,需要数据运营团队有真实数据运营经验,能够准确把握数据在场景中的实际价值。
 
第四,数据运营服务的收入可和业务效果挂钩。比如,蓝象智联与今日头条中国电信、某头部城商行合作,2021年“双十二”期间,该银行发出第一批数字信用卡,蓝象智联帮助银行在今日头条、抖音等渠道上实现了发卡的数据运营。数据运营通过运营商数据和今日头条数据的联邦学习建模,可以更精准地确定营销目标人群,帮助该银行的信用卡中心大大降低营销成本。蓝象智联通过数据运营,可以将信用卡核卡成本降低将近一半。蓝象智联也将从对应的业务效果中获得相应收入。
 
这是目前蓝象智联的数据运营思路在信用卡营销场景取得成功的一个案例。在金融风控场景,也可以达到类似的效果。
 
4、提供纯技术服务
 
在金融风控场景中,亦有厂商提供纯技术服务。他们选择与其他为金融机构提供服务的服务商合作,自身则只提供隐私核心技术服务。冲量在线是其中的典型代表。
 
冲量在线成立于2020年8月,其创始团队主要成员出自百度智能云团队,因为看到了数据要素和国产化信创的巨大市场机会,以及隐私计算工程化落地的加速,结合自身在可信计算硬件、区块链BaaS、机器学习平台等相关方向的技术实力,加入创业大潮。
 
冲量在线在金融风控场景中的应用落地,主要是寻找为金融行业提供IT或者风控解决方案的一些合作伙伴(比如金融IT服务商宇信科技科蓝软件,再如金融云解决方案服务商紫光云等),与这些公司合作,将隐私计算作为插件融入到金融客户的数据建模、数据治理、数据中台的业务流当中,真正地将隐私计算推入生产级环境,使得银行的数据中台可以应用隐私计算技术。
 
除了金融行业场景类的合作伙伴,冲量在线也与服务于金融风控场景的众多数据源供应商建立和深度合作关系,覆盖到企业数据、个人行为数据、消费数据等。从而帮助客户打通从数据到应用的完整闭环。
 
在这个业务闭环中,冲量在线自身则专注于提供以隐私计算为核心的技术服务,主要有两个原因:
 
第一,冲量在线团队在隐私计算核心技术上有更加深厚的积淀,打造了结合TEE和多种技术路线的隐私计算软硬件产品,涵盖可信计算、联邦学习、可信查询等隐私计算关键场景,同时支持纯软件部署和软硬件一体机等多种交付模式。而在金融风控的具体业务应用和数据源方面,则更倾向于与其他有经验的公司合作,将自身精力释放出来加强核心产品优势的持续提升。
 
第二, TEE技术在应用场景中有比较明显的优势:其一,TEE技术的通用性很强,它对业务的干扰是最小的,不需要像多方安全计算和联邦学习那样,需要基于已有框架来开发新的算法。TEE只是一个运行环境,是在基础设施层面的改造,来保证算法的安全性,银行更容易接受,更容易实现推广。其二,TEE技术在性能方面的表现优于多方安全计算和联邦学习,它在真实场景中的运行速度更快,能够达到联邦学习的数倍,甚至高达10多倍。其三,TEE技术也可通过硬件方式为隐私算法进行加速,冲量在线与Intel的联合创新项目通过SGX TEE技术加速联邦学习,提升了2~3倍的总体计算效率。
 
目前,在行业内,英特尔的TEE技术应用更为广泛,但是冲量在线目前在TEE的国产化方面正在快速推进。目前,冲量在线已经能够做到将TEE技术兼容适配到几乎所有(90%以上)的国产化芯片中。并且,在特定场景下虽然性能功能优势不能保证超过英特尔,但是能够达到与英特尔差不多的水平,在应用场景中通过软硬件的优化能够大大缩小差距。相比传统硬件,冲量在线基于国产硬件的产品能够降低客户的成本20%~30%。
 
(二)隐私计算在金融风控场景的应用案例
 
1、信贷风控
 
    目前,隐私计算在信贷风控场景中的应用探索,已经贯穿了信贷风控的贷前、贷中、贷后全流程。

(1)贷前
 
场景一:反欺诈
 
案例一:富数科技基于跨域图计算的反欺诈实践
 

图:富数科技基于跨域图计算的反欺诈方案示意图
 
    业务场景  图计算是一种利用关系网络来识别和判断关联关系的算法,银行在利用图计算进行反欺诈、反洗钱预测有很好的效果。但是由于银行只能通过有限的账户间转账、常用联系人等信息进行判断,会有很多的信息缺失。当通讯、社交等外部数据能够融合,将会大大提升上述场景的精准度。
 
    解决方案  富数在交通银行与运营商的央行沙盒项目中,通过隐私计算的能力,实现跨机构间数据安全融合,构建联合关系图谱,打破图计算的数据边界,识别更复杂、更全面的关系链条以及欺诈风险。
 
    产品效果  通过这个操作,银行获得了三个欺诈预测上的价值提升:第一,可以佐证银行识别的欺诈者关联关系;第二,可以协助银行找到在行内关联关系小,但在通讯关系紧密的关联关系;第三,可以补齐在银行没有任何关系的欺诈客户关联关系。
 
    这个沙箱测试是一个非常经典的跨域图计算融合案例。该案例将会在反欺诈、反洗钱、高净值客户判断等领域获得应用。
 
案例二:富数科技实时多头数据产品
 

图:富数科技实时多头数据产品方案架构图
 
业务场景 用户的多头信息是贷款产品的贷前风险表现,传统上由征信公司或第三方数据源积累各机构的查询数据进行统计汇总。征信公司在信息收集时效性、覆盖率方面目前还存在空间;第三方数据公司的数据积累在目前法律约束下,具有非常大的法律风险。
 
通过隐私计算技术,在去中心化联盟里,银行可以部署隐私计算节点,实现联盟风险名单、申请、拒绝、在途及逾期信息实时共享,实现对人行信息的补充。
 
解决方案 通过匿踪查询+多方安全计算+分布式节点,实现金融数据共享联盟。
 
产品效果 提升进件风险识别及人群细分能力,在这个去中心化联盟里,银行可以部署隐私计算节点,各参与方相互不知对方的数据,协调方、查询方也仅能获得统计后的查询结果,不知各方组成结构,提供数据方都保持自己数据的独立性、安全性,同时又能流动数据价值。
 
场景二:贷前审批和信用卡审核
 
案例:富数科技运营商信用评估产品
 

图:富数科技运营商信用评估产品模型效果图
 
业务场景 贷前审批或信用卡审核,通过运营商数据有效识别高危用户,降低银行个人信贷或信用卡业务违约风险。
 
运营商拥有用户在银行方贷款前的个人信息、终端信息、通话行为、消费行为及浏览行为等类型信息,由于受政策法律法规的约束,双方现有传统方式无法实现联合建模,通过隐私计算方式可以让构建信息流和资金流打通,安全使用更多的底层数据标签进行联邦学习,让模型更有效果。
 
解决方案 采用联邦学习技术,从少数标准标签提升至上千个底层标签,让模型效果显著提升,个贷风险识别作用明显,同时方便模型的迭代与优化,大幅提升工作效率。
 
模型效果 模型区分度高,且模型指标稳定训练集auc为0.7485,ks达到0.3776,测试集auc为0.7036,ks达0.3592,有效识别高危用户,降低银行的个人违约风险。
 
场景三:授信及提额模型
 
案例一:天冕科技与金融机构联合风控案例
 

图:天冕科技联合风控案例图
 
业务场景  目前,银行等金融机构只应用自身内部的业务数据进行风控建模,业务拓展有局限。
 
解决方案  在风控场景上,天冕科技采用线上联邦学习系统,筛选了多家数据征信公司相关性较高的特征,联合数据提供方,在各方数据不出私域的情况下,进行联合风控建模,建立一个泛化能力更强的模型。
 
产品效果  取得了很好的效果。KS提高5%,坏账明显下降。
 
案例二:富数科技高价值识别数据产品
 

图:富数科技高价值识别数据产品案例图
 
业务场景  银行方对目前用户授信模型及提额模型局限于自有数据,亟需借助第三方数据进行优化现有的各个模型,优化存量贷款用户的资产质量,如通过用户的浏览行为来识别用户当前贷款需求,从而提升用户的提现率,也提升银行方的资金利用率。
 
解决方案   通过联邦学习技术,将银联、运营商等数据进行联合建模,优化额度模型及训练贷款响应模型,同时剔除数据源贡献度高的指标,从而大幅提升模型效果。
 
产品效果 提现率提升10%以上,存量用户月增量放款超亿元,且该批存量用户贷后信用表现不变。
 
案例三 蓝象智联与中国工商银行、银联的普惠金融探索
    

图:蓝象智联与中国工商银行、银联合作探索普惠金融服务案例图
 
业务场景  小微商户市场发展前景广阔,客户数量多、总体规模大,在繁荣经济、稳定就业、促进创新、方便群众生活等方面发挥着独特的重要作用,以个体工商户为典型的经营主体,金融需求多样、交易活跃,是未来优质客户的重要来源,为更好地提升小微服务覆盖面,进行更精准的营销,中国工商银行与银联合作,拓宽商户场景服务面,蓝象智联隐私计算平台GAIA提供技术支持。
 
解决方案   在入口端,优化商户违约预测模型,风险识别效果提升20%;深入分析商户收单特征,打造了“刷单套现”精准识别模型,有效防范欺诈风险。
 
在闸口端,基于知识图谱技术,补充借款人同名跨行及关联交易的资金流向分析,打造了全新的资金流向违规领域探测模型,可以提升贷后监测覆盖面及精准度。
 
同时,中国工商银行基于模型风险评估,结合业务经验,制定了综合化授信、差异化定价等精细化应用策略,实现了全线上智能运维管理。
 
产品效果  此方案较传统开发的效率提升巨大,实施成本大大降低。通过自适应和高性能的联邦学习方案,实现计算效率提升2倍以上。同时,通过三方合作,大幅提升场景准入客户规模,且户均授信预计提高30%,大大提高了中国工商银行普惠金融服务在中小微企业的整体覆盖面。
 
案例四: 同盾科技应用知识联邦探索辅助小微企业对公房抵经营贷业务
 

图:同盾科技知识联邦框架体系图
 
业务场景  2021年,金融机构A对公房抵经营贷业务激增,已有的房抵贷准入流程依赖于线下人工审核,不足以支持现在的业务量。同时业务量增加带来的风险也是显而易见的,金融机构A迫切需要引入外部数据源,为对公经营贷业务全流程做好智能风险评估。
 
解决方案  同盾科技依托知识联邦技术,采用联邦方式对信息/流程进行安全串联,基于知识联邦进行联邦建模,帮助金融机构A实现对公经营贷业务完整的线上自动审批流程,帮助金融机构更深入地做好中小微企业的欺诈及信用风险量化评估,提供更及时更精准的分析与决策。
 
该项目主要分为三期:
 
一期,搭建联邦平台,开发冷启动模型。因为金融机构A对公房抵经营贷业务存量数据不足,需基于外部数据源开发的专家模型,并围绕该模型搭建业务的线上审核流程。一期完成后,贷前准入以线下为主,线上为辅的方式运营。同时金融机构A在业务增量发展中累计表现数据。
 
二期,基于搭建完成的联邦平台,可以在保证数据安全的方式下实现其他数据源的引入,增加模型的鲁棒性,进一步增加线上辅助流程在全审核流程中的权重。
 
三期,基于业务增长表现数据累积,使用标准联邦学习方式训练风控模型,实现完整的线上自动审批流程。
 
产品效果  一和二期阶段,上线的专家模型大大提升金融机构小微信贷风控效果,并通过自动化线上审核系统极大程度的缓解了金融机构业务量压力,近50%的小额业务直接线上审核。
 
基于一期二期的累积数据,三期在联邦平台上训练联邦评分模型。构建的模型KS=0.33,AUC=0.87,模型PSI=0.006,模型表现效果良好。
 
(2)贷中
 
场景:贷中监控
 
案例:数牍科技贷中监控案例

图:数牍科技贷中监控案例
 
业务场景  疫情期间,为提升金融普惠水平,降低企业融资成本,数牍科技联合某地方公共事务中心和某国有银行推出面向企业精准扶贫的小微企业信贷方案,在多方数据不出库的基础上,通过实现对双方数据安全融合,助力某国有银行贷中管理能力提升,为分析企业信用风险和企业贷款良性运转提供支撑。 
 
解决方案  数牍科技提供的隐私计算平台和建模服务,联合银行的企业征信数据(多头借款、抵押、违约等),地方公共数据中心的公共数据(税务、工商、司法、房产等),在不收集、不存储原始数据的前提下,进行模型训练(联邦学习)和业务规则制定(隐私统计及分析),打造企业征信评级,实现了对目前贷中监测模型的补充和完善。
 
产品效果  最终模型效果相较于银行单边贷中监测模型提升了数个百分点,辅助该行普惠金融贷中管理能力提升,并对分析企业信用风险和企业贷款良性运转提供支撑。同时,通过隐私计算技术引入政府数据,助力政务数据安全对外分享。
 
(3)贷后
 
从行业整体情况来看,将更多的数据联合起来进行分析,用在贷前、贷中更多,因此目前隐私计算技术的应用也主要在贷前和贷中,贷后用到较少。
 
但是在调研中,我们也惊喜地发现了将隐私计算技术应用在贷后的案例,并且极具应用前景。这个案例来自富数科技,是“基于多方隐私计算方法的零售不良资产动态估值平台”的探索。
 
场景:不良资产估值
 
案例:富数科技零售不良资产动态估值案例
 

图:基于多方安全计算和联邦学习的AMC联合定价方案
 
业务场景  对资产包进行现金流预测和估值是不良资产管理的核心,传统的估值模式主要是基于相似业务历史回款数据的专家经验评估法,精度和效率都比较低,与此同时,随着《网络安全法》、《个人信息保护法》、《数据安全法》等的实施,传统的估值方式无法继续。
 
在AMC资产评估时,一般金融机构不给出太多资产信息,往往会由金融机构为资产做出的评估分类给到AMC机构。有些金融机构会考虑让AMC进驻,对提供的信息进行现场评估。基于这种模式,对于金融机构来说,会担心给出信息有泄露风险;对于AMC方来说,没有太多信息,资产购买完全需要默认金融机构的评级,为后期资产回收带来风险。
 
解决方案  富数在金融机构与AMC之间搭建了隐私计算的数据贯通通道。金融机构可以将出售资产以及相关的金融信息对接在隐私计算节点上,向AMC公司提供评级服务。
 
AMC机构同时通过隐私计算对接更多外部数据源,如催收公司信息(查验对接资产中的客户是否有在催的信息、回款的效率等)、多头信贷信息(判断是否同时有多个贷款)、运营商信息(客户的地理变动、通话记录等)等,与银行数据进行联邦学习,判断回款机率,从而精确判断资产质量,以及盈利率。
 
产品效果  联邦建模保护数据安全和模型安全,较单方数据建模预测能力提升20%~50%。
 
这一方案可以应用于资产管理公司、资产创设机构,如银行、消费金融公司等,以及委外处置机构,基于多方隐私计算构建个贷不良资产数据的互联互通,防范由于信息不对称造成的虚假交易等风险,并持续迭代个贷不良资产的剩余价值模型和清收模型,为金融机构化解不良压力、降低社会居民金融杠杆提供基础工具。
 
2、反洗钱
 
案例:数牍科技基于隐私计算的反洗钱案例
     

图:数牍科技助力银行反洗钱案例
 
业务场景  在银行反洗钱场景中,常用做法是基于内部交易数据、关联账号等建立规则,用来判断哪些动作可归属成洗钱行为,据此搭建模型,应用于实时监控预警和事中控制。然而,由于数据覆盖范围较小且新的洗钱形式不断涌现,传统反洗钱模型召回率和精准率不足,可能会直接影响到判断效果,从而降低信息报送的效率和质量。
 
解决方案  数牍科技应用联邦学习等隐私计算技术,帮助银行引入通信运营商数据,为银行反洗钱业务中补充了50+特征维度,帮助双方进行隐私计算联合建模,通过隐私保护集合求交技术对双方用户ID进行匹配,帮助双方在不交互原始数据的前提下进行安全合规的数据协作,为反洗钱场景模型补充了更多有效数据,提升银行反洗钱识别能力。
 
产品效果  实现“数据孤岛互联”“数据隐私保护”和“反洗钱业务发展”三者间完美平衡。   
 
3、保险风控
 
   在信贷风控和反洗钱之外,隐私计算技术目前在保险风控场景也有落地。零壹智库在调研中发现的保险风控场景的成功落地案例来自光之树科技和煋辰数智。
 
场景:保险反欺诈 
 
案例一:光之树科技保险反欺诈数字联盟方案
 

图:光之树科技保险风控方案架构图
 
业务场景  目前国内保险市场上,骗保和欺诈案件频发,给保险公司带来了较大赔付风险。由于保险公司间缺少数据安全协作的机制和技术支撑,使得保险公司在面临此类风险时,没有风险发现和预防的手段,往往只能在事发后同被保险人协商降低赔付额,而此种形式在消费者保护法框架下是难以获得法律支持。
 
解决方案  光之树科技提供的保险反欺诈数字联盟方案可帮助多家保险公司及相关监管方组成数字联盟,可实现保单数据 无需物理集中的前提下可以支持多头风险的查询。同时,各参与方还可利用联邦学习等技术,更加充分、安全 地共享联盟数据资源,实现更广泛的反欺诈模型的联合建模,从而在核保和核赔过程中建立反欺诈预警机制。
 
产品效果  在场景应用中,可以识别出多头骗保的情况。
 
案例二:煋辰数智车险反欺诈案例
        

图:煋辰数智车险反欺诈案例图
 
业务场景  近年来,车险是保险欺诈的高发区,面对不断攀升的车险欺诈案件,保险公司在防控理赔欺诈过程中面临着诸多痛点,例如在车险理赔过程中,保险公司缺乏大量相关信息资料,团伙识别难度高,信息采集质量低,对外部数据需求迫切。同时,保险公司、监管机构、执法部门之间也缺少信息协同共享机制,数据无法安全、有效地流通使用。针对上述痛点,如果能建立一套安全、智能、合规、多方数据融合的保险反欺诈预警监测体系,从事前、事中、事后多方位进行风险智能管控,将大大提升对车险欺诈案件的预测和识别能力。
 
解决方案  煋辰数智打造基于隐私计算的车险反欺诈解决方案,在保险公司、监管机构、执法部门等多方数据不出私域的前提下,各参与方实现联合建模,安全、有效地使用多方数据资源,从而在出险、核保和理赔过程中建立反欺诈预警机制,并运用特征提取、文本挖掘、机器学习、社交网络分析、关系图谱技术,快速发现风险点和可疑团伙、人员,实现“人机结合”形式的智能化分析、研判和决策。
 
产品效果  在场景的落地实践中,通过人车、人人等分类模型,实现对车险欺诈场景的有效锁定,识别精准度提升50%以上,并形成了全方位的预警监测体系,运用数据智能,提前发现风险隐患。
 
4、资管风控
 
案例:洞见科技基于隐私计算的债券估值体系建设项目

    
图:基于隐私计算的债券指数编制
 
业务场景  隐私计算技术在债券估值体系建设中,创新应用于安全融合企业信用数据、第三方数据、报价数据等,在数据不出域的情况下进行计算,最后输出信用风险预警情况、发债企业违约率、信用溢价等结果,服务债券估值体系。本案例通过隐私计算技术,实现了征信机构评级业务数据和非评级业务数据的安全融合与使用,更好地满足监管要求,并创造了隐私计算技术与资产管理、信用风险管理深度结合的新应用场景。
 
解决方案  案例采用隐私计算、机器学习和大数据多种技术,运用中诚信国际行业信用评价数据以及多元第三方数据,进行数据融合和模型计算,产出收益率曲线和债券估值。
 
在案例数据应用过程中,隐私计算技术深度应用于中诚信国际行业信用评价数据以及多元第三方数据使用全流程,不仅要对中诚信部分数据进行数字化转型,还要基于隐私保护安全、合规应用第三方数据,如工商、司法、交易、政务等数据。
 
产品效果  隐私计算技术在案例中发挥关键作用,一方面根据监管对评级业务和非评级业务的防火墙要求,安全将中诚信内部的评级底稿等信息融合进债券估值计算中,保证在原始数据不出域的情况下进行全局计算;另一方面,在利用多元第三方数据进行估值时,能达到数据不出其系统的情况下实现模型建立与调用。
 
案例产出的债券估值和曲线将广泛应用于风险管理、限额管理、各大机构资产计量、会计师事务所审计标准、净值计算、参考定价等各方面,涵盖客户包括公募基金、银行、保险、证券公司、资产管理公司等。此外,估值着重为投资者提供信用方面的决策参考。在低资质债券和担保债估值方法上实现创新,并实现了相同行业产业债、同区域城投债的点差联动,增加了信用债估值的颗粒度。
 
三、隐私计算厂商在金融风控领域的竞争力分析
 
隐私计算厂商在金融风控领域的竞争力是个综合指标。从零壹智库目前调研获取的信息来看,竞争力主要体现在技术、数据、业务三个方面。
 
(一)技术
 
隐私计算技术在金融风控场景中的竞争力,首先要看技术能力。因为只有技术过关,产品才能被应用在实际商业场景中,否则无法投入实际使用,其他竞争优势无从谈起。
 
在技术方面,主要有如下几个考量因素:安全性、性能、效果、支持大数据量的能力、工程能力。
 
在技术与产品的考量因素方面,对安全性的考量应当放在首位。因为,隐私计算的终极价值就是能够保护隐私数据的安全,使得数据“可用不可见”,如果安全性无法保障,就失去了这一技术的根本立足点。
 
安全性之外,性能是第二个应当被考量的因素。因为,在真实业务场景中,性能的差异会决定一个隐私计算产品能否符合实际业务需要,能否进入真实应用场景。例如,训练一个模型需要一个小时和需要一天,这带来的实际业务影响是完全不同的。
 
在实际应用中,安全性和性能是需要平衡的一对因素。性能,是与安全性成反比的。对产品安全性的要求越苛刻,中间需要用到的安全算法和步骤就会越复杂,需要处理的数据就会更多。因此,当对产品安全性的要求不断提升的时候,它的性能是会不断下降的。
 
如果产品的安全性和性能都过关,下一个决定产品竞争力的维度就是应用效果。应用效果取决于隐私计算项目能够连接到多少数据源、数据建模能力如何。而这一点,在技术能力之外又取决于数据和业务两方面的竞争力,我们将在下文中详细阐释。
 
支持大数据量,这一衡量维度是在零壹智库的调研当中,由数牍科技提出的。其理由是,衡量隐私计算技术的维度不是一成不变的,随着技术的进步、落地应用越来越多,会面临更多的挑战。安全性、性能和效果是衡量隐私计算厂商为客户提供单点服务的能力。随着隐私计算技术应用越来越多,越来越需要多家企业进行合作,这就越来越考验隐私计算平台稳定地支持大数据量的能力。
 
最后,是工程能力。隐私计算软件平台,如果有技术创新,但是如果没有在实际场景中使用过,稳定性是有待验证的。掌握一项技术和让技术真正好用,这其中还要跨越巨大的鸿沟,这是对工程能力的考验。
 
(二)数据
 
1、接入数据源的多少
 
连接数据源的多少,从根本上来说,取决于隐私计算软件平台的连接能力。隐私计算软件平台的运行相当于一个中介平台,连接数据源和数据使用方。因此,数据源和数据使用方有互相撬动的作用——平台连接的数据源越多,愿意加入平台的数据使用方就越多,因为数据使用方是为了使用更多的数据才会选择使用隐私计算平台;反过来,平台连接的数据使用方越多,愿意加入平台的数据源就越多,因为有着更多数据使用方的平台能够为数据源带来更多的业务。
 
在实际当中,这种连接能力与几个因素相关:
 
第一,是隐私计算厂商的背景。
 
首先,自身有独特数据或者与数据源有合作基础的厂商会占有优势。互联网巨头和此前做过大数据风控和营销相关业务的厂商会相对占有优势。互联网巨头有因自身业务运行而积累的独特数据,做过大数据风控和营销相关业务的厂商此前与相关数据源都有过对接。以天冕科技为例,其母公司WeLab汇立集团为近5000万用户提供纯线上金融服务,因此其在日常业务中就接入了风控场景需要的数据源,而没有金融业务的公司则没有必要接入这些数据源,因此对数据源的了解有限。
 
其次,与金融场景有合作基础的公司会占有一定优势。比如一些做过大数据风控或营销业务的公司,此前就为金融机构提供过风控或者营销服务,有现成的场景资源。
 
再次,就同样具备金融风控背景的公司来看,优势也各不相同。自身有信贷业务的公司,与数据源有长期的合作关系,对数据源生态和在真实场景中的表现更为清晰,因为自身有真实业务来进行检验。相对而言,自身没有风控业务的公司在这方面相对来说与前者相比竞争力稍弱。但竞争优势也并不仅看这一个维度。
 
第二,是隐私计算厂商的技术实力。厂商技术实力强,与生态伙伴连接的能力会相对更强。技术实力,特别是单点技术能力,是初创公司优势所在。
 
2、自身数据量
 
在金融风控场景中,数据量的优势,主要存在于一些自身做过信贷业务的公司当中。这样的公司,一般来说有自身业务积淀的数据,业务体量的大小决定数据量的多少。
 
3、是否一手数据
 
在金融风控场景中提供隐私计算服务的公司,能够接入的数据是否一手数据也非常重要。
一手数据有几个优势:
 
其一,数据量级有所保证。如果自身没有数据,需要接入外部数据,能够接入的数据量不一定很大,数据量级则会影响风控建模效果。
 
其二,一手数据实时更新,并且标签丰富,这两者都有助于提升风控建模效果。
 
(三)对业务的理解
 
隐私计算技术要在金融风控场景中很好地运用起来,需要让场景方切实体会到技术的运用对提升业务的影响。
因此,在隐私计算技术应用初期,隐私计算厂商需要协助技术和数据很好地与金融风控场景的真实需求对接起来,需要为数据源方和数据使用方提供数据处理、建模方面的建议及服务。
 
要具备这样的服务能力,需要的是在金融风控场景中的业务理解。这方面实力的比拼,既要看公司提供的平台与管理,也要看人才自身的实力。
 
以风控建模为例, 要掌握风控建模技术本身并不难,技术能力过硬的应届毕业生就可以很快掌握。但是,要在真实业务场景中辅助客户制定建模目标、选取入模变量、建立模型却需要业务经验的积累。这背后是团队人才与资金实力的比拼。
 
四、隐私计算将如何改变金融风控
 
通过调研,零壹智库发现,隐私计算未来将在很大程度上重构金融风控。下面,我们从三个维度来阐释这种重构:数据来源、数据分析、数据应用。
 
(一)数据来源
 
从对数据源的改变来看,隐私计算技术的应用将大大拓展金融风控能够用到的数据源的广度和深度。
 
1、拓展数据源的广度
 
对可应用的数据源广度的拓展,可以说是隐私计算技术对金融风控最大的贡献,因为风控效果的取得,最关键的因素之一就是所能获取的数据的价值。
 
在隐私计算技术进入实际应用之前,零壹智库在调研中接触到的最早探索联合建模的团队是天冕科技,其母公司Welab汇立集团从2014年前后就开始探索“联合建模”。所谓联合建模,就是将不同来源的数据放在一起进行建模,从而提升模型效果。但是,在隐私计算技术应用之前,联合建模的应用范围比较有限,这有两方面的原因:一方面,因为涉及到互相使用对方数据,为了保证数据不泄露,联合建模的双方需要互相信任,所以联合建模主要是在一些已经建立信任关系的公司之间开展;另一方面,那时的联合建模需要在线下进行,需要一方拿着数据到另一方,涉及交通成本,合作双方会衡量成本与收益,如果感觉成本过高就会放弃合作,因为联合建模的效果并不确定。这也限制了联合建模的开展。
 
未来,隐私计算技术的应用,可以解决这两方面的问题。这会使得数据协作的范围大大拓宽:一方面,隐私计算技术可以保护数据协作双方的数据安全,使得信任的建立难度大大降低;另一方面,免去了线下工作的高成本,大大降低联合建模的成本。这两方面的变化,将使得愿意对外贡献数据价值的数据源和愿意应用数据解决问题的数据使用方都大大增加。
 
从数据源的广度上来看,以往用于金融风控的数据主要是三部分:来自金融体系的数据、来自政府部门的公共数据、2019年之前商业机构运用“爬虫”技术爬取的数据。未来,从零壹智库目前调研获得的信息来看,有两方面的数据源的广度会发生变化,一是来源于政府的公共数据,一是来源于商业主体的数据。
 
先看来源于政府部门的公共数据。
 
过去,政府数据的开放程度有限。由于在数据开放的意愿和能力方面都存在问题,与个人和企业风控相关的数据,开放程度较低。
 
但是,应用隐私计算技术之后,可以应用的政府数据的范围将大大拓展。比如,由信用管理集团“中诚信”孵化、网信事业国家队“中国电科”投资的专注于隐私计算的技术服务商洞见科技,过去两年在政务领域落地了不少案例,包括与智慧齐鲁打造的国内首个省级政务数据隐私计算平台及与中诚信联合打造的武汉“汉融通”平台,都是通过隐私计算技术帮助政务数据共享开放给企业。他们能够感受到目前有越来越多的地方政府和相关部门愿意开放数据,而且开放的数据正在快速增加。实际上,政务领域是隐私计算技术落地的一大关键领域,政府数据共享平台和开放平台的建设正在推进当中。
 
再看来源于商业主体的数据。
 
2015年之前,中国征信系统如果按照机构类型划分可以分为三大体系:金融征信体系、社会征信体系、商业征信体系。
 
其中,商业征信体系对应于现在金融风控当中可以用到的来源于商业主体的数据。
 
2015年之前,商业征信体系影响力比较弱,关键原因之一就是民营征信机构没有独立、稳定的数据来源,其数据主要是从前两个体系挖取,商业征信企业所做的工作主要是将数据进行整合、分析。
 
2015年之后,大数据风控行业蓬勃发展。虽然许多大数据风控企业没有拿到征信牌照,但是其所提供的服务客观上起到了征信机构的作用。2015年至2019年期间,大数据风控的核心是爬虫技术,爬虫爬取了不少公开数据用于金融风控。这便是报告开篇提到的——本来,用爬虫来爬取公开数据并不违法,但是与个人信息强相关的数据对网络贷款的风险控制才是更直接有效的,在利益的驱使下,爬虫爬取信息的范围逐渐扩大,很多公司都利用爬虫技术去抓个人隐私数据或者政府机关、银行机构的数据。这些数据,是有网络贷款业务的机构用来做风险控制的主要依据。
 
目前,由于隐私计算技术的应用,许多合规的数据源可以对外提供服务了,这其中包括运营商、银联、互联网巨头等等。这会使得来源于商业主体的数据源大大拓展。
 
目前已经看到了实际的案例。比如,在前文提到的案例中,基于蓝象智联的隐私计算技术,某头部城商行、运营商、字节跳动三方的技术平台实现互联互通,三方数据联合,帮助该银行在今日头条上做了数字银行的发卡营销。在这个案例当中,城商行可以应用到字节跳动和运营商的数据价值。这是一个在营销场景中的应用,在金融风控场景也有类似的探索。
 
2、拓展数据源的深度
 
对数据源深度的拓展,主要体现在可以使得数据分析的维度变得灵活自由。
 
以往,合规数据源对外输出数据时,并不输出原始数据,而是输出一些数据标签,而且这些标签是固定的,不会随意改变。这就使得数据分析的局限性较大,数据使用方不能根据业务需要获得自己想要的结果。比如通话时长,数据源不会对外披露某个用户通话时长是多少分钟,而是给出一个区间,“0—30分钟”“30分钟—60分钟”。如果数据使用方想要获得更精细的数据维度,往往是做不到的。比如如果想知道通话时间在“0—30分钟”之间时,是“1—10分钟”、“10分钟—20分钟”、“20分钟—30分钟”,这是没法办到的。(注:这里只是举个例子,并非实际业务场景数据)
 
但是,应用隐私计算技术之后,数据使用方可以任意设定自己想要获取的标签,从而使得对数据的分析更加贴近业务实际,取得更佳的分析结果。
 
(二)数据分析
 
    从对数据分析的改变来看,隐私计算技术的应用可以使得风控建模的自动化程度进一步提高,同时可以使得建模的准确性提升。 
 
1、风控建模准确性提升
 
    从金融风控实际业务效果来看,风控建模准确性的提升,一方面来源于数据源广度和深度的拓展,另一方面也源于风控建模方式的改变。
 
    过去,如果一家金融机构要与多个数据源联合建模,需要金融机构拿着样本数据在线下先与各个数据源分别联合建模,得到多个模型之后,再将这些模型联合起来。
 
    应用隐私计算技术之后,金融机构可以在线上与多个数据源同时联合建立一个模型。这样带来的改变在于,此前方式得到的模型可以达到“局部最优”,应用隐私计算技术将多方数据联合建模可以达到“全局最优”,提升模型效果。
 
2、风控建模的自动化程度提高
 
    风控建模的自动化程度提高,主要是体现在两个方面,一是降低人工审核的工作量,二是降低风控建模的门槛。
 
1)降低人工审核工作量
 
此前,金融机构要做信用评估,基本方法是先做一个信用评分,给评分设定区间。客户的评分落在区间之内,可以通过审核;落在区间之外,则需要人工审核。
 
应用隐私计算技术带来的改变是,由于数据源的广度和深度拓展、数据分析更加准确,可以使得信用评分的准确性大大提升,从而降低人工审核的工作量。
 
2)降低风控建模门槛
 
以前,利用计算机技术做大数据风控建模的门槛较高,需要懂计算机语言或者数学知识的人才。
 
现在,隐私计算技术在风控建模方面实现了“可视化”。因此,在实际业务操作中,对计算机知识的要求弱化,只需要能看懂模型效果、了解业务以及统计学等相关知识就可以进行风控建模。
 
(三)数据应用
 
    隐私计算对数据源和数据分析的改变,最终成果将体现在金融业务当中。目前,我们可以看到它可以使得面向个人消费者和小微企业的普惠金融业务得到全面的提升,扩大授信面和准确性。
1、授信面扩大、准确性提升
 
1)普惠金融业务提升
 
隐私计算技术的应用,将使得普惠金融进入全新的发展阶段。
 
此前,普惠金融业务的发展遭遇瓶颈。面向个人的消费贷款,各家银行和金融科技公司应用各自体系内的数据拓展业务,已经比较饱和。要进一步拓展业务需要联合外部数据,但是外部数据的应用又受限于隐私保护方面的监管。面向小微企业的贷款,一方面受限于可用的数据,一方面需要做线下的尽职调查,成本较高,业务拓展范围有限。
隐私计算技术的应用,则为普惠金融业务的发展打开了全新的局面。面向个人的消费金融和面向小微企业的小微金融都将迎来新的发展机会。因为各个机构都可以综合利用自身数据和外部数据进行风控和营销,业务范围将大大拓展。
 
2019年的外滩大会上,蚂蚁集团数字金融CTO王晓航在主题演讲中表示,金融场景化是金融服务的趋势,以互联互通、数据化联营为特征的模式将会成为主流。金融和智能的结合将更加紧密,场景的产业数字化会加速。共享智能为代表的互联互通技术将打开生态之间协同的下一波合作红利。联合风控使得金融服务在机构与机构之间、机构与消费场景之间的合作,正在发生一个非常大的转变,从渠道的关系变成一个更加数据化、互相联通为特征的联合经营、联合风控、联合运营及服务。
 
当时,蚂蚁集团资深总监余泉也在演讲中表示,在数字经济转型的大背景下,从金融服务的角度来说,过去以产品为中心、机构割裂的服务方式,未来会慢慢地升级,升级成以客户为中心、产业金融服务融合的一种服务方式,这才是未来发展的方向。
 
当下的发展正在验证这样的判断。
 
2)让不可能的业务变得可能
 
在普惠金融业务之外,隐私计算技术的应用,将使得在更多的业务场景中,过去不可能的业务变得可以实现。
比如,零壹智库在调研中发现的为科创企业授信的案例,令人备受鼓舞。
 
为解决对科创企业重智少资的授信难题,国内各银行处于起步探索阶段等问题,隐私计算初创公司金智塔科技研发了面向科创企业的在线智能授信解决方案。
 
这套方案融合政府部门开放数据、银行行内数据、第三方商业数据,通过联邦学习与多方安全计算解决数据孤岛和用户隐私保护难题。
 
在融合多方数据的基础上,金智塔科技自主研发了以企业生命周期模型、企业成长力模型、知识产权估价模型为核心的授信模型,实现数据驱动的科创企业智能授信。
 

图:金智塔科技数据驱动的科创企业智能授信模型
 
2、改变数据商业模式
 
隐私计算技术的应用,可能改变数据的商业模式。在调研中,零壹智库已经接触到此类案例。
 
一家企业征信机构,此前的商业模式是出售企业征信报告。每份报告信息较为全面,但是价格也贵,高达200多元。但是,在实际商业应用中,对企业征信报告有需求的客户未必需要那么全面的信息,一份200元的报告,可能客户需要的只是其中的几条信息。但企业征信机构通常并不愿意将征信报告当中的信息拆开来卖。这是因为他们的客户比较固定,数量有限,如果降低单价,将降低整体收入。
 
应用隐私计算技术之后,这家企业征信机构的商业模式被完全重构。他们愿意将信息分拆提供给用户,这样每个用户的单次查询成本大大下降。对于这家企业征信机构来说,这样的商业模式也可以提高收入。
 
改变的关键在于,隐私计算技术的应用,可以使得更多的数据可以联合起来进行分析,使得数据的用户量大大增加。虽然数据被单次调用的费用大大下降,但是这家机构的数据调用量会大大提高,总体而言,收入也会上升。
 
需要指出的是,未来隐私计算技术对金融风控的改变可能不仅仅局限于本报告提到的这些。一方面,隐私计算技术的发展才刚刚开始,更多的可能性将在发展过程中逐步呈现;另一方面,也由于我们自身的视野与调研时间的限制,未必能够呈现所有的可能性。未来,我们也将对此问题持续关注。
 
致 谢
 
感谢以下机构为本报告提供的调研支持:天冕科技、富数科技、蓝象智联、洞见科技、数牍科技、金智塔科技、冲量在线、同盾科技、人保金服、光之树科技、煋辰数智(按照接受调研时间先后排名)。
 

 
 
 
 
 
 
 
 
 
 

剩余 50% 未读,点击登录,阅读全文

加关注 消息
文章:123 粉丝:17 总阅读数:1640.1k
点击阅读更多内容

零壹智库研究报告

2013年至今,零壹智库累计发布超过40部新金融专业书籍、200份专题报告500份数据报告,并为数十家机构和政府部门提供了专业的新金融咨询服务;举办了超过30场行业峰会、20000多业内人士到现场交流,超过40场高端闭门会、1500余位业内高管 和专家参与探讨。零壹智库会员体系将在原有机构会员服务的基础上,推出个人VIP会员服务,旨在为新金融行业决策者、从业者和投资者提供专业化的知识、业务交流水平和资源开拓的能力。

报告需求或合作请联系: 132-6199-0570 marketing@01caijing.com 报告购买与咨询请微信扫码:



相关推荐

2024Q2手机银行数字竞争力排行榜TOP 100(总第11期)
免 费

2024Q2手机银行数字竞争力排行榜TOP 100(总第11期)

2024Q1手机银行数字竞争力排行榜TOP 100 (总第10期)
免 费

2024Q1手机银行数字竞争力排行榜TOP 100 (总第10期)

互联网的疆场上,到处跳动着字节的战火
免 费

互联网的疆场上,到处跳动着字节的战火

拼多多怎么还不放贷?
免 费

拼多多怎么还不放贷?


耗时 1951ms