宜信大数据负责人Joyce:当金融遇上大数据,能擦出什么火花

2025-11-07 21:08:19 5阅读

来看看目前国内 P2P 平台的征信逻辑:先考虑用户的数据拼图里需要哪些资料,能够电子化获取的就电子化,不能做到的,就让用户自主上传,然后通过其他线上或线下手段验证。目前,以有利、积木盒子等为代表的与线下小贷公司或担保公司合作的 P2B 网贷平台更多是通过合作的小贷公司或担保公司来获取借贷人的征信数据,主要是电话征信和实地考察征信,这都是传统金融机构的风控方式,效率比较低。当然,也有积极践行线上征信的 P2P 平台,比如宜人贷、拍拍贷。可以说,传统的线下征信技术限制了数据来源和信用评估思路,而互联网的技术、工具和思维具备了改变这一切的可能性。

其实,信用数据不仅仅是应用在金融领域中,生活中各种涉及履约的场景都需要人们的信用数据。在一个成熟的信用社会中,人们的每一项商业行为都应与他的信用数据相挂钩,从而形成一个信用数据的良性循环。也正因为如此,很多在美国做的风生水起的商业模式搬到中国来却无法成功,比如各种短租业务,其核心问题之一就是国内缺乏一套完善的信用评估体系。

宜信“大数据金融”的玩法

当金融遇上大数据,这个缺失已久的信用体系有了搭建的可能性,这也是唐宁成立宜信大数据中心的初衷。Joyce 将宜信在大数据金融上的探索方向描述为“金融云平台”。

顾名思义,这会是一个开放的平台架构:既能支撑宜信自己的 P2P 业务(比如宜人贷、与 eBay 合作的商通贷),也能开放给其他生态合作伙伴,让这个生态中的伙伴们共同建设、共同受益。

金融云平台拥有一般云平台的特点:分布式存储、分布式计算框架、虚拟化环境,但与一般的云平台的差别在于,这是一个基于金融业务的云平台,其中必然包含特定的业务逻辑。宜信将风控、反欺诈、获客能力等核心的金融逻辑抽象出来,作为金融云平台的内核。

金融知识图谱是平台的基础,在这个基础上能长出很多应用场景,比如获客、实时授信、产品个性化推荐、贷后管理等。

知识图谱这个概念最早是由 Google 提出的,是搜索引擎往下一阶段演进的过程中发展出来的。这其中包含两个方面:实体的画像,实体间的关系。

实体的画像其实就是我们常说的“用户画像”,很好理解。而实体间的关系是 Joyce 特别强调的一点。原来做用户画像时,画像之间是彼此独立的,但这并不符合现实生活中的场景:人并不是独立存在的,人与环境中的万物都是有关联的。如果说每个人是知识图谱中的节点,那么人与环境所形成的关系就是两点间的线。当把“点和线”综合起来分析时,我们对个人的性格特征、信用状况、财富属性都会有更深层、更全面的理解。

互联网技术和工具的引入使得数据采集从线下逐渐转移到了线上,也使得数据体量迅速变大。目前,宜信金融云平台所采集的数据主要是以下几类:

1、宜信已有的数据

宜信在 P2P 行业有 8 年积累,用户已过百万。实际上,只要与宜信有过接触的用户,不管是在哪个环节终止了接触,都被视为宜信的重要数据资产。他们有的曾提交过信用报告、联系人信息、教育水平、工资单、银行流水等一系列传统征信数据,有的则仅仅留下了一些搜索和访问数据。

值得庆幸的是,宜信自成立以来便非常重视数据的电子化,因此大大减轻了将线下数据进行数字化的工作量。不过,宜信业务线众多,Joyce 告诉我们,将不同业务线里沉淀下来的数据打通也是一件很费劲的事情。

2、搜索引擎抓取

Zest Finance 的 CEO Merill 认为,信贷记录属于强变量,而当强变量缺失的时候,就可以参考多种弱变量(比如互联网上的行为数据),将这些弱变量组合起来也可以服务于信用评估。

同样是基于这种思路,宜信自己做了一个叫做“宜搜”的搜索引擎。在获得用户授权许可的情况下,搜索引擎会抓取用户在互联网上留下的电商购买数据、搜索引擎数据、社交数据等多个维度的数据。除此之外,还有大量散落在网上的公开数据,这些数据也会被宜搜所抓取。这两类数据将通过特定的算法模型转化为信用评估数据。

3、来自合作伙伴的数据

这里的合作伙伴既包括线上的也包括线下的,不过 Joyce 并没有透露现在正在参与合作的公司有哪些。我猜测,线下的合作机构可能包括小贷公司、租车公司、房屋中介等可能产生业务协同的机构,线上的合作对象则有更多可能性了,比如各种互联网金融服务商。

有一个绕不开的问题,那就是如何保证数据的真实性,其实这是所有的大数据分析都会遇到的问题。其实,任何人也无法保证数据完全真实、没有噪音,可以做的就是对不同的数据源进行关联和交叉验证。Joyce 说:“我们并不是在盲目的追求线上实时授信,如果没有足够的数据来做交叉验证,我们还是会采取线上线下相结合的方式。”

采集数据的目的是通过相应的数据分析和挖掘技术输出每个人的信用评估结果。在传统的数据处理领域,分析师们处理的主要是结构化数据,而如今我们面对的是从网上抓取的大量非结构化数据,如社交网络的评论、用户上传的音视频等。这些数据存在于包括文本、图片、视频、音频等众多的数据格式中,其中蕴藏的信息需要深度计算才可以分析出来。这就需要通过机器学习进行智能化分析。

根据过往的业务经验,Joyce 团队会给这个“挖掘机系统”预设一些规则引擎(可以理解为一些基础的算法),引导系统做出一些基本的判断和决策。比如,没有收入的人会被直接排除在借款人群之外。

但是,这都是些基础规则,而且是基于现有数据和经验生成的。一旦充入大量新数据,这些既有规则引擎则会发生变化。无论是修订现有规则还是获得新的规则,都需要通过机器学习来实现。

当然,机器学习是一个动态的过程——要通过不断加大数据变量来修正机器学习的模型。只要池子里变量的维度多到一定程度,模型就会趋于稳定。举个例子,如果你买一支股票,你的收入就全都取决于这只股票的涨跌;但如果你分散投资 1000 支股票,从统计学角度,即使其中一只股票暴跌,也不会对你的整体资产走势产生影响。只要数学逻辑正确,采用的变量越多,模型就越准确。而且,数据维度的不断丰富也能让机器在不断学习的过程中变得越来越智能。

宜信的第一批机器是在今年 4 月上线的,里面正跑着数以万计的变量。未来,收集和整理数据的门槛会降低,而利用机器学习进行数据分析和挖掘的能力会成为关键。

数据的价值

人人有信用,信用有价值。大数据能改变的不仅是金融行业。在一个真正市场化的社会中,各行各业都对个人信用评估有诉求,因此,基于大数据的个人信用评估结果可以成为很多商业活动的基础。如今,通过将用户的互联网行为数据转化为 “互联网信用”后,这些数据也开始变得有价值起来。

既然数据都是有价值的,那么是否可以给数据定价?“应该理解为价值交换”,Joyce 更正了我的说法,“数据的价值刚刚被唤醒,现在谈定价、收费还为时过早。”

目前,宜信已经与一些线下机构和线上互联网服务商建立了数据合作关系,但各家的合作方式都不太一样。尤其是对于不同行业来说,服务提供商的诉求差异巨大。Joyce 说:“我们也希望与不同合作伙伴来探讨适合彼此的价值交换方式。经过一段时间的合作,我们会逐渐建立一套针对不同数据提供商的价值交换模型和方法论。”

Joyce 好几次都提到了“数据变现”的概念。互联网行业里有很多这样的服务提供商:他们有用户、有流量、有数据,但却找不到自己的商业模式。又或者,即使有自己的商业模式,很多服务提供商手中的数据也远没有发挥什么作用。“数据变现”为他们提供了一个通过数据完成价值增值的思路。举两个例子:

不是竞争对手,是盟友

国内想通过大数据做开放金融云平台的不止宜信一家,别忘了最有名的那家——蚂蚁金服。在蚂蚁金服的成立活动上,其 CFO 井贤栋曾说过:“蚂蚁金服将以小微企业和普通消费者为主要用户,建立以数据、技术、交易这三个开放平台为核心的金融生态,支持和帮助合作伙伴,共同为用户创造价值。”

这和宜信的愿景不谋而合,不过,在 Joyce 看来,谈彼此间的竞争还为时过早。在国内,通过大数据搭建信用体系这件事还处于非常早期的探索阶段,大家各自有优势,但还没有谁已经走通了这条路。“如果未来有可能,我们非常乐意与蚂蚁金服合作。”

其实,除了宜信、阿里这样打算做“生态系统”的平台,大数据金融场内的玩家还有不少。比如各种尚未走到生态系统层面的第三方大数据平台,举几个例子:国内最早提出做大数据征信的闪银(类似 Zest Finance)、从 SaaS 系统切入数据服务领域的中科柏诚、为线下 P2P 公司提供大数据服务的数信网。另外,还有一些在利用大数据支撑自身互联网金融业务的公司,比如拍拍贷(类似 Lending Club)、元宝铺(类似 Kabbage)。

但是,所有机构手中的数据都是片面的数据,尤其是对于 BAT 这样的巨头来说。这也是为什么,在 Joyce 看来,平台间的合作远比盲目的竞争更有利于行业的成长。“这个市场非常大,完全可以容纳多个开放平台同时存在。如果有更多的人愿意踏踏实实的做金融开放平台,这对行业、乃至整个小微人群是非常有益的。”

即使是在未来的金融生态中,合作也应该大于竞争。“生态系统” 本身便是一种商业模式。金融业的生态系统长什么样?它将以云计算、大数据为底层,信用体系为基础,支撑包括支付、投融资、理财、保险、银行等在内的多种业务。

“在美国,信用是一张个人通行证。而对于中国来说,这是我们走向一个真正市场化的商业社会的过程中必然会达到的阶段。未来,我们会有多个信用评估机构,每个机构都有自己的一套信用评估体系,而大家对信用的认识能够嵌入到各行各业的商业活动中。”

这大概就是在国外大数据领域钻研了 15 年后却带着团队义无反顾回到国内的 Joyce 想看到的一天吧。

免责声明:由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,深感抱歉,我们会做删除处理。