首页 > 互联网+

大佬们谈金融大数据:我们的数据怎么来的?合不合规?

互联网+ 孙爽 · 零壹财经 2016-07-12 阅读:6134

关键词:金融科技大会大数据

听听芝麻信用、Talkingdata、邓白氏……怎么说

 

7月10日,在首届金融科技大会上,冰鉴科技、百融金服、Talkingdata、芝麻信用维信金科高管分享了他们对金融大数据的观点。以下是观点集锦和发言实录。

 

观点集锦:

 

大数据技术是有可能改变风控的本质的,尤其在中国最权威的人民银行征信中心的数据不能充分覆盖中国大部分所谓屌丝客群的时候,大数据我认为几乎是一个唯一的解决方案。

 

欧洲比美国严很多,美国更加靠近商业、亲商业,而欧洲更加亲个人隐私的,我相信中国至少要走到美国那个法律体系——百融金服CEO 张韶峰

 

对于这些流行词我没什么好说的,不管什么Tech本质都是金融,没了。——Talkingdata CEO 崔晓波

 

芝麻信用的90%数据源跟阿里巴巴没有任何关系。——芝麻信用总经理 胡滔

 

发言实录:

 

 

顾凌云(冰鉴科技CEO):下面由我为大家主持下午的第三场论坛,金融大数据:突破与局限。首先请允许我非常荣幸的把5位嘉宾请到台上来,今天的5位有来自于美国、杭州、上海、北京的各个地方:Bradstreet CEO BobCarrigan;维信金科创始人廖世宏先生;TalkingDataCEO崔晓波先生;芝麻信用总经理胡滔女士;百融金服CEO张韶峰先生;

 

这场论坛的题目是"金融大数据:突破与局限"。第一个问题,我们之前一直都称呼互联网金融,现在我们把它正确的翻译叫做"科技金融",在英文当中它简称叫Fintech,第一个问题想问一下诸位嘉宾,在金融科技这个环节中你认为是金融占主要地位还是科技占主要地位。

 

Bob Carrigan:谢谢吴院长,也感谢清华五道口金融学院给我这个机会来参与此次讨论,特别是这个主题是金融大数据。金融科技发展的基础是数据在量和类型上的飞速增长,包括新的设备、新的技术和新的行为带来的数据增长,这些都是我们很有兴趣的领域。邓白氏主要是做数据分析,这次会议给了我们一个很好的机会,找到在金融科技方面的新的领域和新的联盟。

 

邓白氏公司有175年的历史了,也是最早在纽交所上市的企业之一,我们有全球最大的商业数据库,包含2.5亿个企业的信息,另外,我们在不断的发展我们的数据分析能力,通过云,通过API,通过我们的软件以及手机来给我们的伙伴提供服务。

 

邓白氏公司帮助客户从数据中找到真相和意义,我们不仅收集数据,还会去分析数据。我们关注信贷和信用,这是我们传统的,也是对我们最重要的用户场景。我们的客户也会在其他领域使用我们的分析,比如风险管理、供应链的估值,还有全球合规,客户还将我们的数据用于销售和营销领域,更好的实现与他们的客户的互动,在他们的客户关系管理中提高价值。

 

邓白氏公司非常愿意分享我们在大数据和风险管理方面的最佳实践。我们愿意通过我们的特长帮助中国公司更好的获得资本。同时,邓白氏不仅希望促进中国企业在国内的发展和增长,也希望能够帮助中国企业在海外增长和发展。首先,我们所在的世界越来越以数据为驱动了,我注意到中国毫无疑问是有在国际市场进行发展和扩展的雄心的,这对中国和世界来说都是好消息。而中国企业在世界舞台上扩展的关键在于其企业数据可以被获取,包括跨境的数据互动和获取。如果关于中国企业的数据是可靠的、持续的、一致的和透明的,这对于推动这些中国企业在海外发展,如进行海外并购以及在海外寻求合作伙伴和客户来说是很有帮助的。所以,要想利用这样一个全球化的机会,将自己的数据变得透明是非常重要的。而邓白氏可以提供这样的服务。

 

邓白氏公司关注于企业的数据,而不是个人的数据,即使有任何有关个人的数据也是这些个人在企业背景和环境下的数据或信息。

 

另外一个主题是监管,我们应该考虑监管企业征信机构的影响,监管过度的话会影响到企业的决策和业务发展,影响他们去筹集运营资金或者是借款等等。但与此同时,企业征信机构不应该去收集或出版任何有关一个个体的个人和敏感的信息。这方面我们也是从来不做的。

 

最后一点,全球的积极合作对于反欺诈至关重要,我们也会强调反欺诈,高达70%的公司都会受到一定程度欺诈的影响,特别对于金融行业而言。但是,我们并不是要限制使用数据或者建立一个保护墙,把我们与数据隔离,而是要更好的进行合作和创新。建立一个合作的环境是反欺诈最好的办法,充分利用大数据来进行确认、验证和风险评估可以帮助公司、个人和政府避免欺诈、浪费和滥用。

 

顾凌云:谢谢BobCarrigan的回答,他昨天才从美国飞过来,希望你现在不会有时差。廖总,科技金融这个问题你是怎么看待的?

 

廖世宏:谢谢顾总,Fintech这个词去年到现在突然特别火爆,掩盖了互联网金融、金融互联网,我今年4月份去了华盛顿参加了一个很大的会议,我印象当中FICO的CEO出来讲的题目也是到底Fintech会不会颠覆传统的金融,两个礼拜前穆迪也出了一个报告,题目也是一样,到底Fintech会不会颠覆传统金融。今天上午我坐在下面听到很多嘉宾也讲到了这个话题,包括吴院长也讲到了这个,。到今天为止大家的结论应该是一致的,金融的本质我不觉得Fintech金融科技能够颠覆掉

 

回过头来讲维信金科,我们过去十年做消费信贷,做C端个人的无抵押消费信贷,这里面我看到的金融的本质仍然是不变的,仍然是我们要看个人的资金用途,还款来源,还款意愿,你去建模型,用大数据做这一切,这个本质是没有改变的。

 

F,他们已经习惯在手机端上买东西,淘宝也好,京东也好,他们习惯在手机端用微信跟大家交朋友,他们的生活习惯,行为已经转移到这个虚拟世界了。intech金融科技为什么现在突然间那么火爆呢?我自己的感受是跟互联网、移动互联网异常发达有关系的。我看到两个趋势,第一个趋势是我们看到过去几年的人群,特别我们讲的1985年后的人群大量的行为,他的习惯向这个虚拟世界在迁移

 

。所以,如果在这样的情况下,我们看到一些非常有趣的变化,可能做金融,在座有很多银行的朋友,我们以前经常讲做社区银行非常成功,分行要开到小区,但是互联网的世界或者虚拟的世界,突然间大家明白了原来我们从社区银行跑到虚拟的世界了,这对传统金融造成了非常大的挑战,大家都想做社区银行,但社区银行已经从线下搬到了线上。这个大前提为维信金科这类科技类的公司提供了大量的机会。现在发现了很多新的模式的产生。今天上午我听到SoFiCEO介绍了它的模式,我自己的感觉它也是明白了原来在互联网的世界,大学生人群能建一个虚拟的社区,提供更好的金融服务,把传统的金融带进虚拟的社区空间。第二,移动互联网技术的发达造成大量的大数据的产生,而且更容易获得。我十年前做维信金科的时候我们要获取一个个人维度的信息是非常艰难的,我们只能依赖客户提供的申请书上的资料,通过打电话询问。现在手机端有大量的数据源我认为未来的金融科技跟银行是一种合作的关系,它可能更灵活,它可能对互联网虚拟世界虚拟的社区比银行掌控的更理想。

 

这是我的感受。对于金融科技我自己的感觉,从个人消费信贷领域来讲,简单可以分三块,无非就是获客、风险控制和资金,Fintech更应该停留在做获客和做风险,而不应该做资金那一端,或者不应该寻求牌照,更应该寻求用科技的手段跟传统的持牌金融机构合作,共同进入这个虚拟的世界里做金融。

 

顾凌云:谢谢廖总,关于金融科技在中文里很容易看哪个是定语,哪个是主语,互联网金融是互联网是主语还是金融是主语?中国语言很幽默,金融和科技中到底哪个占主,哪个占次,我想听听崔晓波的意见。

 

(现场笑)崔晓波:对于这些流行词我没什么好说的,不管什么Tech本质都是金融,没了。

 

顾凌云:听一下胡总的意见。

 

胡滔:我自己是学IT的,上半段的职业生涯在银行做了将近20年,现在加入蚂蚁金服负责芝麻信用,也是我自己对未来的判断,过去20年传统的银行,包括我之前所在的招商银行是非常重视IT的,也是第一家推出网银的,现在手机的APP也做的非常好。但是今天我们讨论的Fintech已经超越了过去的IT的概念,更多的是像刚才前面几位嘉宾所说的,它是一个基于大数据的可获得性,以及海量的高速的运算低成本的基础下,基于数据能对金融的各行各业的运用。包括上一场论坛的保险,他们提到可能早期的时候主要还是基于销售渠道,以及客户服务的便捷性,但今天Fintech应该是能够跟金融有一个更深层次的结合,利用大数据跟人工智能来形成我们对于保险行业的风险定价的重新界定,对于银行信贷的信用风险的一个高效的评估,也包括未来在财富管理的投资领域,对于消费者的投资习惯的分析以及风险偏好的分析,及整个财富管理的市场用大数据的方式评估来进行的对整个金融行业做金融方式的重塑。其实它的本质仍然是没有改变的。

 

顾凌云:张韶峰发表一下你的意见。

 

张韶峰:不管是Fintech还是互联网金融,如果其本质是金融,毫无疑问,金融更加重要。

 

我的出身背景是偏技术互联网这一端的,我看到非常多的互联网金融的从业者、创业者似乎互联网的背景居多一点,我一直以来的观点就是如果你的公司要长久的活下来,我觉得你一定要弄懂金融的本质,风险的控制。但是如果你活下来之后想活的更快,跑得更快,活得更好,插上科技互联网大数据的翅膀跑得更好。互联网也好,大数据也好,其实是个催化剂,它是个乘数,但是它并不改变本质。其实我觉得推动政府开放数据这个事情,至少可以说咱们从业者早就死光了,等政府开放这个数据这事实不靠谱的,利用市场化民间的大数据公司的技术能够让金融插上快速飞翔的翅膀。不过有一点,大数据技术是有可能改变风控的本质的,尤其在中国最权威的人民银行征信中心的数据不能充分覆盖中国大部分所谓屌丝客群的时候,大数据我认为几乎是一个唯一的解决方案。

 

美国有公司CapitalOne二十多年的历史,他们怎么能后来居上?它是充分的利用技术,利用数据,做得比人家精细,成本比人家要便宜,处理速度比人家快,客户体验比人家好,虽然那个时候没有大数据技术,也没有这个词,实际上它的本质是一样的,它跟别人一样懂金融的本质,但是它对技术的掌握,对数据的掌握比别人好就可以胜出别人,这是我非常简单的看法。

 

顾凌云:,因为在我看来互联网解决的只是信息如何从不对称变为对称的过程,冰鉴做对个人征信和小微企业的征信过程中对通话记录,包括一些采购的行为做出判断。我们有的时候会看到真正互联网信息解决更多的是反欺诈,而这恰恰是对于信息不对称问题的解决,而不是核心金融数据对于还贷能力的判断。如果我知道淘宝的账号中有5个以上的寄送邮件的地址,并且这几个地址男女之间的比例比较均衡,我有很大的概率判断你这个人申请过程中,欺诈概率是比较低的,因为这是一个正常的邮寄过程。如果晚上三点钟申请贷款,这个人可能欺诈的概率很低,但是还款能力不高,这个判断也很简单,因为那些羊毛党跟普通阶层一样也是朝九晚五上班,他才不会半夜加班给你搞欺诈的活动,而正常的申请人如果半夜还在申请借款,很有可能他在其他地方根本借不到钱,也说明了他的还贷能力是不高的,所以通过这种技术手段最终还是落到金融的本质上。这个问题两年前大家争论很多,到底落点在互联网还是落点在金融上,但是今天嘉宾的回答可以看出大家意见基本上完全趋于统一,认为最终的着重点在金融上,这确实是个比较有意思的话题

 

我下面一个问题针对在座每一位嘉宾专门量身定座设计的问题。我第一个问题还是问BobCarrigan,作为领先的小微企业的借贷公司,能不能给我们谈谈你作为公司的领袖,如何能带公司走向正确的方向,你们公司未来的愿景是什么?

 

BobCarrigan:,我们聘请了很多人才,比如数据科学家,这些人对于数据本身很有热情。我们公司的首席数据科学家今天也来到了现场,数据科学家的愿景是希望通过数据解决一些新的问题,这实际上也是我们最核心的一个能力。我们的核心还是信任,尤其是涉及到数据方面的问题,我们要和我们的客户建立起互信的关系,要和相关的、为我们提供数据的公司建立起互信。当然,我们在过去很多年都是在做这件事情。这里有两个核心,第一个是我们聘请的这些人才

 

我们不断地在积累企业的信息,了解它们的同时增强我们处理大数据的能力,然后对这些企业进行分级,来了解他们所有的信息,包括企业族谱的信息、企业发展的状况等等,这些信息对我们来说都是非常重要的。所以,有了数据,你就能更好的接触一些新的客户,包括供应商。因为所有的东西都是经过长期积累得来的,我们就像是在马背上非常有自信的骑马人一样,能很好的掌控局势,现在我们有很多的数据,我们每天数据库的更新项会有超过500万个。未来,如果你要想和一些新的客户做生意的话,无论他是一个供应商或是一个合资企业,我们都能很快的给出相应的信息。另外是我们的DUNSRight TM 流程。

 

当然,我们之所以在这个行业处于领先的位置,是因为我们有世界上规模最大的商业信息数据库,并且我们也充分利用我们的技术、利用数据来解决问题,比如做风险管理和反欺诈等等。

 

顾凌云:BobCarrigan讲到很好,他们公司对数据科学家也有很大的需求,而我们公司的数据科学家经常开玩笑,说DataScientist第一个是D开头,第二是S开头,加在一起简称屌丝,都是在数据科学的过程中,在屌丝的过程中不断寻找自己下一步完美的过程。我想问一下张韶峰,对于百融金服来讲,你们在反欺诈和个人征信方面做的非常成功,你们百融罗盘包括基于电商数据的很多征信评估产品在市场中处于翘楚的地位,你能不能简单谈一下你是如何深入这两方面的数据在这两个领域做的如此之好,或者你对其他不同扩展的数据源怎么看待或者准备怎么使用的呢?

 

张韶峰:谢谢顾凌云。实际上了解我们公司历史发展背景就知道我们最早不是一个做金融征信的企业,所以,对我们来讲,其实数据处理这个事情是比较熟悉的,而且处理数据的维度也是比较广泛的,但是由于我们在电子商务领域做得比较出名,电商90%的个性化推荐引擎是我们在提供。所以,所以,大家就认为我们公司可能用电商数据用得比较多。廖总这边我们就在合作。我们一直以来做数据的企业,从2009年开始给电子商务行业做大数据的服务,那时候就一个产品,个性化推荐引擎,跟亚马逊上猜你喜欢很像,到2011年开始给互联网媒体社区提供,到2012年给线下零售商提供,航空公司,各种金融机构提供服务。最早的时候我们用电商数据来做金融的征信、反欺诈做的比较多。我们最早做这个事儿是非常偶然的,就是像招行、光大、中信给我们钱,过去测一测,我们就根据我们的常识给他,我们过去的用户比他平均的逾期率低了2/3。后面我们开始加更多的维度,从纯电商到航空公司的数据,随着数据越来越多,我们就开始能够区分一些坏人,刚开始我们用好人,区分出一些坏人,生活地址,填的联系人,跟自己平常有没有联系,或者你的手机设备上是不是老换不同身份证号填来填去,经常更改自己的身份证号、联系方式,最早都是一些常识。到了后来数据维度越建越多,已经有几十万的变量,就开始采用机器学习的方法。因为我们是搞互联网出身的,大数据的方法,集成学习,深度学习都开始用,这个对中国目前的情况确实比较适用,刚才讲人民银行的用户互联网信息比较有限,中国的P2P也好,消费金融也好扩展速度远远超过人民银行征信中心的扩展速度,两者是不匹配的,大量的用户是无法用人民银行的数据来评估的,采用这种方法可以解决一些实际的问题,

 

我们知道美国征信局数据来源非常广泛,可能从两三家企业收集数据对于我们来讲,早期的时候纯粹用电商扩展到用媒体、社交、运营商的数据是比较自然而然的,因为我们公司的基因最早是给所有行业提供大数据平台的供应商。比如华为的大数据平台也是我们建的,海尔,长安汽车,长虹电视,几乎所有行业,还有政府广电总局的数据仓库也是我们建的。你能想到的所有行业数据我们都有触及。只不过从金融来讲,征信是个相对比较独立的领域,所以我们才独立出来成立单独的公司,我们数据源从一开始就是比较广泛的,我们一开始要用各个领域不同的数据来交叉验证一个人身份的真实性,以及行为的真实性。比如他号称月工资有十万,但是我们发现他平常团购的场所在城乡结合部,如果老是这样子的话我们会怀疑你月收入是否真有十万。用很多不同维度的数据做交叉验证,当维度很多的时候你能骗我一次、两次,但是你骗我十次是非常困难的事情,因为你的成本会提升。,所有的攻与防都是成本和收益的对决,要骗我是可以的,但是你要算算成本,我每扩展一个行业数据源你要骗我就要攻那个数据源,你可以故意买东西,故意坐飞机,但是你合算吗?最后我们就用各个不同领域的数据交叉验证,我不在乎某个领域的数据是错的,我也会弄错,但我在乎的是当我验证一百次的时候我有几次出错,我验证一百次有80次正确的那基本上我就是可用的。

 

这些原理跟我们自己搞大数据的时候没有涉及到金融的时候已经是这样想的,我自己做这个事情做了16年时间,我觉得我对这个事情是有感觉,什么叫大数据,我从十几年前开始做数据挖掘,2009年开始做电商数据和大数据,我对这个有自己的感觉和体会,我会套用非金融的理念用到金融里验证我的想法对不对,很多时候都是正确的,效果也是可以的。

 

顾凌云:谢谢。韶峰的回答是对"魔高一尺,道高一丈"最完美的诠释,这个世界上永远都不可能没有贼,你永远都不可能觉得这个世界上没有钱,最好的办法是把自家的篱笆修得高一点,别人家的篱笆矮了,贼自然就去翻篱笆矮的那家人,就不到自己家里来了。下面的问题我想问一下胡总,芝麻信用分应该是到目前为止在整个中国信用生态环境中大家最耳熟能详的一个产品了,大家更多的可能是认为芝麻信用分是产生于阿里巴巴或者淘宝、天猫自己内部生产环境中的电商的数据以及支付宝产生的闭环数据,你能不能给大家介绍一下芝麻信用分是通过这种闭环数据来产生获得的?还是更多地引入了外部数据对于个人进行一个更加均衡的评估?

 

胡滔:您这个问题特别好,也是大家非常关心的。也借这个机会把这一年多我们做的事情跟大家做一个沟通。芝麻在去年1月28号推出我们第一个信用的评分,我想在这里先把芝麻的使命说一下。我们的使命非常简单,中国2000多年儒家的文化是非常重视诚信和讲信用的,但是为什么我们目前跟美国这样的发达国家相比,大家总觉得我们的信用体系不是很完善,大家不怎么讲信用?当时芝麻成立的时候,我们给自己定的使命是希望让世界因为信用而变得简单。在这样的一个使命之下,我们大概做了一年多了,现在还在公测期间,我感觉大家很有一部分人会认为因为淘宝所以信用,会认为因为我在淘宝上购物很多,用支付宝很多,所以,我的芝麻分才高。

 

基于信用评价,其实是我刚才说的,征信它的本质也还是征信,不管你用什么方式来做。做征信一个非常关键的因素是对于每一个人信用的评价必须是科学、客观和公正的,如此,大家才会认可你这个分。所以,在过去的一年多研究中我们做了非常多的事情。这里,我想用三个数字来跟大家讲一下今天芝麻的评分是怎么组成的。

 

数据源这块大家很关心芝麻的数据源,我们目前数据源有接近60家的数据合作伙伴,有90%是跟蚂蚁和阿里巴巴没有任何关系的合作伙伴。从信用评价的角度来讲,我们要很客观的评价一个人的信用无非是两类数据,一类叫正面数据,就是你的身份特质,你的正常履约的情况。还有一类是负面信息,也就是你违约的信息。大家可能以为阿里、淘宝包括蚂蚁金服数据量很大,但是我想告诉大家的,克强总理前段时间在贵阳的大数据会上说了一句话我非常认同,他说我们真正有效的大数据有80%都集中在政府和国有运营的机构里,运营企业。所以,我们去年在跟公安,包括跟国家的学历学籍,还有各地政府的社保、公积金和税务的数据做了非常多的合作,引入了正面的数据。负面数据这块我们跟最高法专线实时连接T+1日的这些老赖的数据就更新到我们芝麻的数据库这边。还有各地法院做的一些判案的裁决,涉及到经济纠纷的,都在芝麻的数据源的合作里。正是基于这么多的外部的数据之后,我们芝麻的评分才能尽量的对相关人做出一个客观公正的,基于它经济违约率的一个预判。所以,这是第一个,90%的数据源,来源于外部。

 

包括今天早上井总提到我们在自行车的租赁,大家到各地旅游,杭州的自行车有接近三万个点,但是外地人去了很不方便用,为什么?因为它需要去杭州的一个街道办事处办一个卡,存上200块钱押金才能开锁打开。但是今天用芝麻信用,我们和自行车公司合作,每个信用好的人可以直接开锁使用自行车。现在所有外部场景里,我们200多个各行各业的场景,90%和蚂蚁和阿里没关系。第二,我们今天的评分,实际上它的应用范围不是像大家所理解的可能就是一个阿里巴巴或者蚂蚁金服的自我闭环的使用,目前我们外部场景使用的合作伙伴已经超过200家,而且这200家里有非常多不同的行业,比如租车,比如住酒店,比如银行信用卡审批,包括一些互联网金融的公司,为什么我们会在租车跟酒店的行业也会使用我们的芝麻产品呢?是因为在中国老百姓消费金融的渗透率还非常之低,中国人平均每个人拥有的信用卡是0.3张,美国超过3张,这些没有信用卡没有信用记录的人在租车的时候可能需要付现金做押金或者住酒店需要刷借记卡付押金,所以芝麻在生活领域的应用不是泛生活,而是在生活领域里跟钱相关的,涉及到对个人信用不了解所带来的押金的服务。

 

第三个是百分之百,当芝麻提供征信的服务给到我们的合作伙伴时,也包括集团内的合作伙伴,我们是百分之百一视同仁,同样都是一个产品的输出,对于集团内的业务单元或者集团外的单元会有不同的服务。

 

所以,回到刚才顾总问的问题,今天芝麻信用的评分我们作为一家征信公司,我如果只是在系统内运转的话,其实我的评分它绝对只是一个金融机构自己做决策的分。之前我在招行的时候,十年前我们的房贷就有评分卡了,那个和今天芝麻信用的评分有两个本质上的不同和一个本质上的相同,

 

 

相同之处就是你的评分必须要在违约率的判断方面非常准确,也就是随着你的评分越高它的违约率就越低,如果平分越低的话违约率越高,芝麻是350-950的评分。

 

它有两个非常大的不同,当每一个金融机构自己内部使用这个评分的时候,不需要对外做任何的解释我为什么给他打多少分,但是芝麻的评分,因为我们是一个普适的分,所以,我们大家分哪几个维度,可解释性要求比较高。还有每一家贷款机构和银行都可以根据自己不同的贷款策略,目标客户群的变化,评分可以非常频繁的变化,但是我们作为一个通用的评分必须具有一个非常好的稳定性,也就是在相当的一段时间里这个分数在各行各业的违约率的表现要趋于稳定。所以,这是作为一个普适性的评分我们追求三个方面,准确性、可解释性和它的稳定性。

 

顾凌云:谢谢胡总。我在美国生活了16年,我刚刚去的时候我的FICO分只有500多分,经过我持之以恒的努力再加上不断的提升自己的信用,现在我的FICO大概820分左右,回到国内以后,每个月我总有一件事是看我的芝麻信用分这个月涨到多少了,现在已经693,眼看就要突破700分了。我会继续努力的。

 

下一个问题问一下晓波,大家做征信的时候往往都会说到你核心的金融数据是纵深的评判一个人,这就是为什么我刚到美国时,我的FICO分数不高的原因,因为当时我在美国没有任何金融消费的记录,随后因为我信用卡开得越来越多,有房贷有车贷,并且都准时还完了,所以我的信用变得越来越高,TalkingData相当于你纵深的情况下又提供了横向更广的维度对个人进行评估,你能不能在这个方向上更多的给大家讲讲你的经验和优势?

 

崔晓波:我先简单解释一下,因为目前我们还是一家创业公司,最早我们是从为中国绝大部分APP的移动开发者提供数据工具起步的,到今天为止大概有超过十万款APP在使用我们的工具,每天有超过三亿部设备报送各种各样的数据,其中包括手机、平板、智能电视,也包括一部分可穿戴。数据的类型可以分成几类:有跟设备相关的,有跟你所使用应用的行为相关的,也有我们所称的情景数据,大家最容易理解的是跟位置相关的数据,所有这些,还有其他的传感器,包括陀螺仪、加速仪、气压、温度、光线等等,这是目前TalkingData数据的来源,刚才胡总也介绍他们90%是靠外部数据,其实现在TalkingData也发展到我们70%的数据也是从外面过来的,我们的数据交换平台后面连接了超过90个数据源,包括公安、运营商,包括一些大的电商合作伙伴,还有一些APP合作伙伴每天给我们做大量的数据交换。

 

第二,数据在金融行业的应用从TalkingData角度看,征信只是其中的场景之一,相对于金融行业,包括针对银行,包括保险公司、基金公司等等,他们都有不同的应用场景。我们最早从2012年开始,主要是给银行服务,目前13家主要的股份制银行12家是我们的客户,早晨提到帮助传统的金融机构做互联网化,因为那时候他们自己也开始产生大量的数据应用,招行、兴业、平安等等,这些都是采用我们产品的第一批客户。所以从我们角度来看,首先我们看到这些客户面临最直接的问题是数据管理不起来,历史上有很多交易数据、资产数据以及跟客户资料相关的数据,但是由于移动互联网的快速发展,产生大量的行为数据,这些数据往往是非结构化的,包括你的微信的数据,包括手机APP里的行为信息,包括网站的信息等等。我们跟金融企业先谈的不是做数据模型,首先这些数据要经过有效的管理。所以,我们一般会有数据咨询团队去到金融企业里,根据它的业务情况梳理它的核心的业务流程和它的KPI,定AR模型,结合我们自己的方法论,我们的AR模型用在运营方面,我们TPO模型用在获客和营销指导方面,先建立基本的指标体系。金融企业数据进来要经过非常有效的加工。比如招商银行要做个活动,可能我们面向的人群是25-30在北京地区净资产在100万以上、经常出国旅游的年轻女性,这样的场景就需要既有自己的第一方数据,又需要TalkingData这样的企业给它提供第三方的数据源,才可能把这样的人群找出来,这是第一步。

 

第二步,不同的金融企业里,保险企业里我们主要是在UBI方向,不管车险还是人身保险上我们已经开始建立模型,包括他的驾驶习惯的模型。证券公司是处于一个获客的早期,所以,他们更多的是在用我们的数据和模型去优化在移动端获客,如何获取更多有效的客户,防止羊毛党,让红包发的更有效等等。这是我们看到的。

 

因为你申请一张卡,银行都想推实时开卡业务,取决于你有没有给他实时授信的能力,他通过收集一些信息过来,比如他申请业务要提供的一些信息,包括家庭住址等等,我们有能力帮他校验这个人填的是不是真实,最后回到风控领域,我们跟风控部门的合作是比较早的,在四年前就跟包括招行在内的风控,以及反欺诈的部门在合作,他们用了很多TalkingData提供的基于场景的数据,特别是位置数据。他填在北京工作上班,他基本上在河南和广西活动,这样就会被打到人工审核队列,目前我们测下来比较有效的维度应该有35个。大概是这样一个情况。

 

顾凌云:谢谢崔总。下面我想问问廖总,维信在座的基本上都听过这个大名鼎鼎的牌子,大概在中国根植了十年左右了,我想问问廖总,从没有大数据或者没有数据到现在一路数据变得越来越多,维信是怎么走过这十年的路,包括你怎么精准的定位到一些风险比较低、比较好的消费场景,并且完整的从获客到风控到客户流程完全走完,保持每个月几十万的进件数并且保持相对比较低的坏账率,维信是怎么做到的?

 

廖世宏:谢谢顾总。如果十年前认识张总我就不会那么艰辛了,十年前想做这件事情,一开始我们就想做数据金融,但是第一件要做的事情,如果我们看美国的CapitalOne,你必须做评分卡,但是没有任何数据,维信的头六年走得非常非常慢,我们用了6年时间做第一张评分卡。所有的数据源,十年前我们基本上是依赖客户提供给我们的申请书上的资料,通过人工排查,确认这个数据他提供的对还是不对,入库,观察期,贷款三年。头六年是非常艰辛。

 

我今天想讲过去几年的变化,突然之间大量的大数据源非常的丰富。所以,我们维信金科快速发展是在过去的三年,到目前为止我们已经根据不同的大数据源头打造了二十几张评分卡。过去两年我们做了非常有意思的事情,讲智能信贷或者我们讲机器人信贷。这样的情况下,其实数据源的丰富很多时候让你这个机器人可以插入很多的场景,经常讲消费金融要场景,场景有很多,有线上的场景,也有线下的场景。跟大家举个例子,当你拿了大数据,能够用机器人运作,完全摆脱人手运作的时候,而且你做到了秒杀,实际上很多的想象就可以变成现实。我发现原来大数据这么丰富的时候,其实可以构建我们消费金融的AlphaGo,完全用智能机器人去做。维信从去年年初推出第一款全自动化的产品,到今天有8款式全天24小时在互联网上运作的消费信贷的产品。大家可以想像我们做了8个机器人出来,这8个机器人每天24小时在运作。

 

我们一个拳头的互联网产品叫卡卡贷,我们刚刚跟银联商务签了一个合作,你们在线下刷卡的时候,银联商务的小单上会放上我们的二维码,你扫扫我们就可以帮你做你刷卡的信用卡的代还,而且是全自动化的,当一个产品完全自动化地在互联网上运作的时候会产生很多想象的空间。

 

今天因为时间有限,我想跟大家分享两点经验。以前我们通过线下走到线上,目前90%的客户是全自动化无人工干预获取的,每个月50多万的客户。那风险可控吗?我想跟大家分享两点心得。我们做了两年,互联网上做消费金融,用大数据做风控要解决两个维度的风险,一个是信用风险,一个是欺诈风险,信用风险上我们得到的感受是非常不理想,信用风险如果用评估模型来做,实际上是一个统计学的原理,在美国FICO分400分的时候,你得到的结果就是基本上可以计算出来的,因为美国的模型好体现在标准误差小,中国做了十年,我们打造的模型、我们算出来基本上要做到1400分,1500分才能到预想值。所以,当互联网如果能每天获得海量客户,你发现信用风险更可预测,因为大更平稳。

 

第二点我想跟大家分享的心得,实际上我们现在还是面对一个很大的挑战就是刚才几位嘉宾提到的欺诈风险,当你把人完全撇除,你要用一套新的方法在互联网虚拟世界里解决这个欺诈风险目前还是一个挑战,这也是我们维信金科目前积极的探讨,跟各个大数据源头或者有技术背景的公司合作,希望未来解决这个问题。我觉得机器人信贷在中国是完全可行,因为我们有丰富的数据源头,因为由于非常发达的移动互联网的人群。谢谢。

 

顾凌云:谢谢廖总。还有很多问题,但时间所限我再问最后一个问题,每位一分钟简短的分享一下。我最后一个问题是关于跟创新和监管之间的问题,尤其在大数据信贷中尤为重要,我在美国带领ZestFinance和Cabbage这两个模型团队时,我经常的朋友是来自美国CFPB中国翻译是美国消费者保护协会,他们整天到我模型团队来就是看一件事情,看我这些变量到底有没有违规,有没有踩红线,在美国的变量中,性别、年龄,尤其是种族那都是绝对不可以使用的,如果使用那就一定踩了红线了。在今天互联网金融的监管开始越来越成型,变的越来越上轨道的同时,诸位在使用数据的时候是怎么样在监管和创新二者之间寻求一个平衡的,因为时间比较短,我还是先问一下BobCarrigan。有一天他看到我的变量中家庭中到底买了什么样的杂志,他就说你这个变量不能用,我就感到很困惑为什么这个变量不能用?我仔细一看突然就明白了,因为很多家庭采购这些杂志的时候,有的人采购了Costco,有的是采购了沃尔玛的,有的是Burlingtondepartmentstore采购其他的。他说你仔细看,所有来Burlingtondepartmentstore采购杂志的几乎全部都是黑人,因为他们最喜欢买当中的皮草和金项链,所以,这个不能用,因为这个变量直接等同于你对种族进行了判断。后来我们改了你爱吃什么,这个问题他们不管了,但是还是有很好的判断准则,喜欢吃面、稀饭基本都是东亚的。喜欢吃芙蓉炒蛋的都是黑人,大家感兴趣可以看一下芙蓉炒蛋是怎么做的,反正东亚人是不太愿意吃的。

 

BobCarrigan创新和监管是好的对手,二者之间有什么样的平衡?

 

BobCarrigan:对我们来说,如果你要在全球做生意的话,监管或者合规是我们邓白氏的商业模式之一,只有合规才能很好的建立信任。因为我们在全球都有业务,我们在数据业务方面可能会遇到成千上万甚至几十万的监管,我们都要应对。所以,我们的一个核心竞争优势就是要充分合规,我们把它作为我们的竞争优势,如果我们通过努力合规给我们全球的客户一种信任感,当他们与我们合作的时候,他们要选择一家在数据隐私和保护方面有非常高标准的公司。所以,合规、遵守监管对我们公司,对我们品牌而言是一个非常重要的事情,我们标准很高,而且这也是我们的优势。所以,我们做生意的时候是充分合规的,而且我们也愿意努力合规,达到高标准。

 

崔晓波:数据采集部分各国的规则是差不多的,因为我们的国外客户也比较多,不管你还是你的合作伙伴采集各种类型信息的时候,必须给终端用户提示,并且要得到他的许可。所以,我们在做金融业务的过程中实际上也是通过这个业务流程的设计拿到最终用户的许可,以取得一些相对敏感的信息,这是第一部分。

 

第二,处理加工以及落地保存的时候,要做脱敏处理,一些信息绝对不能落地保存的,就像你说的家庭住址、身份证等等。

 

第三是应用。数据公司都比较保守,我们现在应用主要还是在群体类型数据的应用上走的比较快,一群人的行为画像或者行为模式我们现在是大规模使用的,包括针对这类业务我们是比较谨慎和小心的。就这三个方面。

 

廖世宏:简单讲,从我们角度更多是应用的角度来看。所以,第一我们坚持合法合规,任何的数据源要么客户授权或者第三方有资质把这个授权给我,我们要求合法合规。第二点,顾总也提到中国对很多数据的应用还没有一个非常严格的法律的要求,比如男性、女性。目前来讲,既然法律没有限制,我们还是在用的,女性风险明显比男性低很多,这些重要参数我们确实在使用中。

 

第三,我们会跟我们的合作伙伴,因为我们数据的使用方,我们尽可能考虑到隐私的保护,我们尽可能不拿原始数据。举个简单例子,我们跟中国电信有合作,我们有一个封装好的黑盒子在中国电信,经常抓回一些数据,最后出结果客户接受我们信贷的时候,中国电信才会把这二三十个重要的参数,还要做一个过滤,它不告诉你这个人每个月话费是多少,但是会告诉你一个区间,每个企业走得更长远必须是合规合法的应用数据。这是我们的做法。

 

张韶峰:我们公司从2009年开始做大数据,从那个时候我们就开始研究全球隐私保护,包括美国体系,欧洲体系的不一样,我们从那个时候已经有这个问题。所以,我们在给电子商务企业提供推荐引擎服务的时候,尽可能:第一是让电商企业告知他的消费者某些服务不是我提供的,是另外第三方公司提供的,他们是跟我们联合运营分成的。所以,这个第三方公司必须拥有你的数据,你可以不同意,不同意我们就不提供这种服务。

 

第二,我们跟那些电商公司签的合约,这个数据我们是可以脱敏加工之后二次使用的,等于在数据采集端,我们创业开始,七年前就开始做一些工作,迄今为止都还在做。

 

第三,数据的使用端,我们尽可能要求我们的使用端告知他们的贷款申请者可能在跟第三方公司合作,尽可能把百融金服的名字点出来,让他知道了百融金服参与了决策评估。这件事情上我们没断过努力做这个工作。

 

实际上今年3月份人民银行北京银管部的领导也到我们公司考察过,从实际上来看,有一些机构他自己的法律意识是比较淡漠的,我们当时跟电商谈在你的用户使用条款里加进去,直接说清楚第三方,他说这个没关系的,懒得加,弄得我们也没办法,我们尽可能的跟监管的要求,跟法律体系靠拢,但是有的时候别人不配合你,在中国的法律体系下,不管是个人也好,还是企业,对事情的看法认知还没到那个程度,他觉得我把生意做成就行了。这个时候我们也非常难办的,尽到我们最大努力把事情做好。但是我相信凌云讲的,中国肯定有一天走到那个程度,跟西方不管美国还是欧洲差不多,,我相信中国至少要走到美国那个法律体系,去靠近我那个体系。它要求你商家用这个数据,如果消费者不反对就可以用,欧洲是你必须得明确告诉商家,商家可以用才可以用,两边法律体系是反过来,中国现在还没有特别清晰的法律体系,我们给自己加了个枷锁,这个枷锁很大程度上抬高了我们公司运营成本,但是我们依然在做这个事情。欧洲比美国严很多,美国更加靠近商业、亲商业,而欧洲更加亲个人隐私的我们在市面上的相关公司里还是做得相对比较好的一家公司,我们会奖励我们的销售你跟客户谈下来,如果他愿意加这个条款我多给你一万块钱,这对我们来讲是个很大的成本,通过这种方法尽可能让我们公司更加合规。

 

胡滔:其实从刚才凌云提到国内法律还不是特别完善,早上吴院长也提了非常多的建议,在目前这样一个过渡的阶段,芝麻信用我们一直是按三个词来坚持我们的原则。

 

 

第一个是合法,所有跟我们合作的数据源它自己的数据必须是合法的,如果有一些机构它的数据对于信用评价虽然非常有价值,但是它来源不合法,批量采购买卖这种我们是坚决不会用的,

 

第二个词就是正当,也就是我们在所有采集的时候需要用户授权,输出的时候一定要脱敏。再一个我们在所有的流程当中确保整个过程的正当。

 

第三就是相关,因为大家一谈到大数据,有两种观点都是非常片面的,一种认为垃圾进垃圾出,所有的东西都是没有价值的。还有一种认为大数据即金矿,每一个数据都是有用的。我们的观点是说其实大数据最终是为商业问题服务的,作为芝麻信用来讲,是解决信用风险的评价,我们承诺只采集跟信用评价相关的数据。客户的地理位置我们是绝对不会采集的,因为我们认为它跟你的信用是没有关系的。

 

所以,合法、正当和相关,我们认为在目前法律框架不够完善的过程中是非常值得我们自己去坚守的,而且这些东西也并没有影响我们的评分效果,因为在过去一年当中,我们也呼吁目前在大数据和Fintech领域一起努力的同仁们按照严格的守则做,我们仍然可以做的非常好。我们为我们的外部机构——光在信用贷款这块我们就提供了超过一千万人的信用的贷款,而且贷款的总额达到280亿,但是运行下来,他们的纯网上信贷的违约率不到1%,

 

顾凌云:谢谢胡总和各位的分享。我们这节讨论必须要结束了,此感谢台上所有的嘉宾,谢谢各位的分享!

 

第一届中国金融科技大会相关文章:

百度副总裁张旭阳:以技术的力量,助力财富管理业务的发展

霍学文:现在不规范区块链技术 将成为非法金融活动来源

陈生强:京东金融不想把自己做成一个金融机构

廖理:我国P2P网贷行业的四大监管建议

腾讯副总裁赖智明:金融云是红包之后互联网金融的下一个风口



零壹智库推出“金融毛细血管系列策划”,通过系列文章、系列视频、系列报告、系列研讨会和专著,系统呈现“金融毛细血管”的新状态、新功能、新价值、新定位。
 

上一篇>遭遇数十亿美元损失后 SWIFT成立网络安全小组

下一篇>吴晓灵:信用中介需要牌照管理 必须纳入监管



相关文章


用户评论

游客

自律公约

所有评论

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 180ms