首页 > 调研

DataVisor郑骏:中国反欺诈发展得比美国快 | 兵器谱访谈录

调研 赵越 零壹财经 2019-01-31

关键词:反欺诈美国兵器谱访谈录发展中国

反欺诈是一个持续攻防的过程,需多种技术手段相互融合

互联网领域的欺诈行为也不断发生在金融业,欺诈分子通过复杂的技术和工具在线上发动攻击,进行大规模组织欺诈,欺诈手段也越来越多样化、隐蔽性越来越强。

到底如何才能有效地应对各种欺诈状况的发生?近日,DataVisor中国区首席战略官郑骏在接受零壹财经专访时表示,“
第一,没有高质量的数据,任何技术手段都没有意义;第二,反欺诈是一个持续攻防的过程,从技术上来讲,平台方要做好反欺诈这件事情,需要不断更新技术,将黑名单、设备指纹、规则引擎、有监督机器学习、无监督机器学习等各种技术手段有机结合;第三,要有情报侦察的逻辑,只有知道欺诈分子的技术手段、攻击手段,才能更好地、有针对性地进行防范,否则,永远会非常被动。

零壹财经了解到,黑白名单、规则引擎、有监督机器学习和无监督机器学习是目前的反欺诈手段。黑白名单是最原始的反欺诈手段,覆盖率和准确性有限;规则引擎是通过对样本数据进行分析,利用专家经验总结出一些规则去做风控,但专家的经验也可能出现错误,系统更新速度通常较慢,需大量人工调试规则,无法检测出新的欺诈模式;有监督机器学习和无监督机器学习都是通过机器学习样本,代替人工学习。有监督的机器学习通常需要大量的、有标签的数据来训练模型,数据更新费时费力,且模型主要依赖于以前的欺诈标签,可以检测同类型的欺诈活动,却难以检测出未知的欺诈行为。无监督的机器学习不需训练数据,可自动挖掘和检测各种已知、未知的欺诈行为,自动产生标签,用于模型检测,自动产生规则,免除耗时的人工规则调试,主要适用于欺诈团伙的检测。

DataVisor试图拥有的无监督机器学习技术每小时可分析数十亿用户事件,对新型多变的欺诈进行提前预警,提前发现恶意欺诈行为,以帮助客户大大降低欺诈损失。 截止到目前, DataVisor 全球累计处理超过8干亿的用户事件,检测超过2亿的“坏”用户,保护超过41亿来自全球大型互联网公司的用户,客户包括京东、猎豹移动、今日头条、饿了么、微店、探探和大众点评等。

DataVisor如何进行反欺诈检测?DataVisor经历了怎样的发展历程?反欺诈行业的发展趋势是怎样的?郑骏对这些问题做了详细解答。以下是访谈实录。


一、DataVisor概况

零壹财经:您能介绍一下DataVisor在中国的发展历程吗?

郑骏:DataVisor进入中国已有两年多的时间,目前,中国团队已有五、六十人,在北京和上海设有办事处,无论从中国区员工数量还是业务数量来说,都占据了全球非常大的比例,这两年业务发展非常快。

零壹财经:DataVisor在美国和中国开展的业务有什么差别?

郑骏:本质上都是做同一块业务,用无监督机器学习技术去解决反欺诈和风控领域的痛点问题,产品的核心、面对的客户群等都大致相同。硅谷会更侧重底层算法和技术研发层面,中国会更加侧重业务层面。

DataVisor早期的用户主要集中于互联网行业,中国在商业模式上的创新领先于美国,商业模式上的创新使互联网行业的创业热度非常高,吸引的风投资金也非常大。互联网新业态出现以后,每个新业态都会有一些反欺诈需求和风控需求,所以从业务领域来说,国内比美国走得更快。


零壹财经:与其他反欺诈企业相比,您认为DataVisor最大的优势是什么?

郑骏:最大的优势还是技术,DataVisor的两位创始人都是美国AI领域最领先的学校毕业,毕业后一直在美国的硅谷研究院从事网络安全方面的研究,她们在创业之前,在大公司都是数据科学家的角色。DataVisor在硅谷总部的员工也都是网络安全和人工智能领域的专家,百分之六、七十拥有博士学位,在技术领域的积累非常深。

基于两位创始人在技术上的经验积累,她们很早就选定了无监督机器学习这个方向。起初,在用无监督机器学习解决互联网欺诈问题时,她们也曾尝试使用通用化的无监督算法模型,最后发现这些通用模型效果并不好,后期完全靠自身科技投入,研发了一套有自主知识产权的无监督机器学习技术,并把这套技术很好地应用到了反欺诈领域。无监督机器学习技术虽然从原理上来讲并不复杂,本质上可能是某种聚类的算法,但在实际商业应用过程中门槛非常高。在反欺诈领域,除DataVisor外,将无监督机器学习技术落地应用的公司非常少,所以,核心的技术能力是五年来DataVisor在全球快速发展的主要原因。


二、DataVisor业务

零壹财经:DataVisor的技术核心是无监督机器学习,请问无监督机器学习、有监督机器学习及半监督机器学习是否在不同的场景下都可以发挥各自的优势?

郑骏:反欺诈犹如打仗一样是一个持续攻防的过程,DataVisor作为一个技术提供方,为客户提供反欺诈的服务平台,站在平台方角度,要打赢这场持久战,需要有不同的武器。无监督机器学习技术是一种非常有效的应对团伙欺诈的措施,但是并不能替代其他技术手段。它可以帮助客户应对一些新的、线上的团伙欺诈行为,这是相比其他技术来说,无监督机器学习一个非常独特的地方,但各种技术更多的是一种相互补充的关系,各个技术都可以发挥各自的优势。

这两年无监督机器学习技术在业界越来越受重视,主要与整个行业格局有关。在互联网角度行业中,所有的欺诈攻击都是在线上进行的,对欺诈分子来说,每做一笔交易,收益并不高,为了获得规模化的盈利,他们会进行大规模的复制,比如在薅羊毛时,欺诈团伙会注册几百上千,甚至上万的账户去做攻击。这时,用有监督机器学习和规则引擎等技术来应对就比较困难,而无监督机器学习可以找到大规模复制背后的相关性,然后进行聚类。因此,随着互联网的发展,无监督机器学习在反欺诈领域得到了很好的应用。


零壹财经:DataVisor检测解决方案用到了无监督机器学习引擎、有监督机器学习引擎、规则引擎和全球智能信誉库,请问这几部分在检测过程中是如何协同工作的?

郑骏:应对欺诈行为的技术手段有很多样,DataVisor能够很好地把无监督机器学习技术跟业务场景结合起来落地应用,同时,有监督机器学习、规则引擎等也都是我们可以联用的技术手段。在具体解决客户的问题时,会根据不同的应用场景来判断是否需要配合其他的技术。

在典型的互联网场景下,可能用无监督机器学习就可以达到一个很好的效果,不见得需要结合其他技术。在互联网金融领域或传统金融领域,在某些场景下,往往需要把无监督机器学习和有监督机器学习相结合,将无监督输出的群组特征作为有监督机器模型的输入,另外,还可以将无监督模型的聚类理由变成一种业务的规则,部署到客户的规则系统中,去做更快、更有效的检测。全球智能信誉库是DataVisor基于IP地址、地理位置定位、电子邮件域名、移动设备类型、操作系统、浏览器代理、电话前缀等做全量分析后,输出的数字信号,可以用来增强规则引擎和机器学习解决方案的能力。

因此,无监督机器学习和有监督机器学习、规则引擎、全球智能信誉库是一种相互联动的关系。


零壹财经:DataVisor检测解决方案可以提前发现欺诈行为,请问大概可以提前多长时间?

郑骏:在黑产领域,已经有非常专业的分工,举个例子来说,对于我们常用的互联网平台,比如,京东、淘宝、饿了么等O2O平台,都会存在很多工作室去注册虚假账户,然后将这些账户卖给真正实施攻击的人,他们有的擅长用技术化的手段绕开平台的规则去注册账户,有的擅长利用这些账号去薅羊毛。DataVisor的无监督模型的一个典型应用场景就是识别虚假注册账户,站在攻击者的角度来说,发起攻击的前提是手里有大量账户,如果能够有效地把虚假注册账户找出来,对这些虚假账号进行封号和处理,攻击者就无法实施攻击,这样就在源头上遏制了黑产的行为,这个就是提前阻止欺诈行为。

但具体提前多长时间,这个很难去回答,因为我们就希望欺诈不要发生。我们希望把这些欺诈扼杀在前端,而不是欺诈发生之后再去执行措施。


零壹财经:DataVisor能否提供定制化产品?

郑骏:DataVisor的底层模型和整个大数据架构平台是比较标准化的,本质上是SaaS平台,平台底层从算法、体系架构来说是比较标准的。虽然底层比较标准化,但是会根据业务场景的不同做一些调整,比如,虚假App注册、社交平台广告垃圾、电商平台虚假评论和刷单等都是不同的业务场景,针对不同的场景我们有通用化的模型,并且同一业务场景下,不同公司采集的数据不同,我们还会根据客户所掌握的数据做一些特征层面的调整。可以说,在为客户提供服务的过程中,80%的技术是标准化的,20%的部分会根据客户的实际情况做一些定制。

零壹财经:请问能否透露DataVisor在社交、金融、反洗钱、移动和电商领域的业务占比情况?

郑骏:DataVisor进中国两年多时间,第一年,主要集中于互联网行业,互联网行业又分为各个子行业,第一是社交类的,比如陌陌、探探等,社交类行业比较关注虚假注册、垃圾信息等;第二是电商类的,比如刷单、薅羊毛等;第三是App应用推广注册。这三种是DataVisor第一年在互联网领域的侧重场景。

第二年,开始尝试互金领域和传统金融领域,比如银行的信用卡业务,线上的支付等,同时,也在开拓一些保险行业。非互联网行业的业务增长是非常快的,也是公司重点发力的方向。


三、反欺诈行业

零壹财经:请问金融行业目前面临怎样的欺诈现状?

郑骏:金融行业面临的欺诈现状和整个行业背景有关,现在银行、保险等传统金融行业在互联网化上投入了巨大的资源,传统行业和客户打交道的方式变得越来越互联网化,在这个过程中,面临的欺诈风险也在发生变化。中国的整个互联网行业,特别是移动互联网行业的迅猛发展,客观上养活了一大批黑产,他们在关注互联网平台的基础上,盯上了传统行业。传统行业欺诈的门槛相对高于互联网行业,互联网行业的欺诈团伙少则几十,平均几百,多则上千,甚至上万,在传统行业,欺诈团伙并不会这么大,但是有和互联网行业相同的特点。只要客户有意识地去采集一些线上的行为数据,DataVisor就可以用无监督算法帮助客户找到这些欺诈背后共性的东西,提前防范风险。

零壹财经:您怎样看待反欺诈行业的发展趋势?您觉得未来的反欺诈技术会向哪个方向发展?

郑骏:从DataVisor视角来说,我们的发展非常乐观,欺诈分子极其猖獗,黑产数量非常庞大,从社会层面来说并不是好事,但对从业者来说,市场需求是非常大的。第一,随着传统行业不断互联网化,会面临很多新的欺诈形态和挑战;第二,随着5G时代的来临,5G技术的落地会带来一些新的业态和商业模式,也会有一些新的欺诈模式和风险出现。

从现在来看,未来的反欺诈技术一定是多种技术相融合的体系,任何单一的技术很难应对。无监督机器学习技术可能是这两年在反欺诈领域增长较快的一个细分领域,因为这个技术针对互联网的线上团伙欺诈有很好的效果,无监督并不是终点,新的技术会不断出现,比如神经网络、深度学习等都是有可能的。随着5G的到来,在物联网时代,生活方式也会改变,面临的数据量、欺诈模式也会改变,就会有新的技术出现。


零壹财经:能否分享一个令人意外的欺诈用户特征?

郑骏:我们发现黑产对手进化能力是超乎想象的。在互联网界,欺诈分子用得比较多的一个软件就是所谓的“群控软件”,一个软件可以控制上百台手机,在黑产里,有专门的工作室去研发这种群控软件,把这些软件卖给欺诈团伙,他们的群控软件升级迭代速度非常快。最开始,可能只能操控四、五部机器,支持一种手机类型,慢慢地,可以支持的手机类型不断增多,可以操控几百台机器,并且能够修改IP,篡改信息,从而迷惑平台。因此,对于做的好的平台来说,一定会不断更新技术,通过提高欺诈分子实施欺诈行为的成本,来进行有效反欺诈。

加关注 消息
文章:187 粉丝:22 总阅读数:5376.0k


零壹智库推出“金融毛细血管系列策划”,通过系列文章、系列视频、系列报告、系列研讨会和专著,系统呈现“金融毛细血管”的新状态、新功能、新价值、新定位。
 

上一篇>新颜科技黄向前:重注AI 金融科技的未来是主动创新 | 兵器谱访谈录

下一篇>华夏银行王汉明:金融科技引领银行业的数字化转型 | 兵器谱访谈录


相关文章


用户评论

游客

自律公约

所有评论

点击阅读更多内容

主编精选

more

专题推荐

more

第四届中国零售金融发展峰会(共15篇)


资讯排行

  • 48h
  • 7天



耗时 178ms