基于大数据的个人信用评分发展新趋势

互联网+
创新科技
2018年07月17日 05:52

基于大数据的信用评分模型.pdf

韩茜 任丽蓉 刘道瞳 千梦强 杨天尊 郭凯

摘 要:随着互联网的快速发展,国内征信市场涌现出若干互联网征信公司,他们利用大数据等技术创建的个人信用评分与传统个人信用评分相比,在数据维度、获取方式、数据量级、数据时效性和应用场景等方面具有一定优势。

关键词:大数据;个人信用评分

中圖分类号:F832.4 文献标识码:A 文章编号:1671-0037(2018)2-83-3

Abstract: With the rapid development of Internet, the domestic credit market emerged several Internet credit reporting companies, they used big data and other technologies to create personal credit score, which compared with the traditional personal credit score,has certain advantages in data dimension, data access, data scale, timeliness and application scenario and so on.

key words: big data; personal credit score

大数据征信的实质是利用互联网获取信用信息,它不仅能够收集传统征信所能收集到的信息,还能捕获传统征信未能覆盖的信用信息。此外,利用互联网技术能够对不同应用场景的大量信息进行实时获取并归类,以最低的成本和最高的效率获得最有价值的个人信用信息。大数据征信不再局限于征信机构提供的个人基本信息,而是把信用主体在互联网上的行为习惯、消费偏好以及社交关系等多方面的浏览轨迹转化为有利于评估信息主体信用风险的可靠数据信息,在一定程度上将信用风险降到最低。同时大数据征信相对于传统征信还有一个突出的特征,即大数据征信下的个人信用评分模型更看重信用主体信用信息的实时性、动态性、共享性,因为它是基于信用主体的日常行为轨迹来研究的,一定程度上能够较为精确地评估其履约能力、违约系数。随着科学技术的发展,征信体系的建设也应与时俱进,充分利用好大数据使其发挥最大的作用。

1 个人信用评分

如今互联网金融蓬勃发展,人们对于风险建模的技术和应用不断升级,使传统信用评分模型向大数据方向转变,但是从本质上来讲,大数据下的信用评分模型仍是传统信用评分模型的拓展。

1.1 时代背景

21世纪,人类社会高速发展,尤其是互联网应用的日益频繁,信息流通和信息交流密切,人类进入了大数据时代。2012年以来,大数据被越来越多的人所提及。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程[1]。”

随着大数据时代的到来和近几年的发展,可用于评估人们信用的数据越来越丰富,金融机构了解客户的数据更加全面和多元化。

1.2 理论研究

信用评分模型运用先进的数据挖掘技术和统计分析方法,通过对消费者的个人信息和消费历史记录等数据进行综合分析,构建模型以对消费者未来信用表现加以预测,并依据信用评分对消费信贷管理做出决策[2]。而信用评分则是根据消费者的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。

无论是传统信用评分模型还是大数据下的信用评分模型,其本质没有变化,目标也没有变化,都是为了将风险控制在一定范围内,从而让经济平稳运行。信用评分模型的基本原理是确定影响违约概率的因素,然后给予权重,计算其信用分数。

1.3 经典模型

国际上最具代表性的信用评分系统是FICO(费埃哲评分系统),它是由Fair Isaac公司推出的一套评分系统,它以“5C”分析法为理论基础,而国内的芝麻信用在这方面与其类似。因此,以FICO和芝麻信用为例,对比分析传统个人信用评分模型与大数据背景下的个人信用评分模型数据维度的差异。

FICO评分系统信用分数区间是300~850分。若借款人信用分数低于620分,贷款方可要求借款人增加担保,或拒绝贷款;若借款人信用分数介于620~680,贷款方可进一步调查核实,采用其他信用分析方法个案分析;若借款人信用分数高于680分,贷款方可认为该借款人信用非常好,予其贷款。由此,信用分数越高,贷款方所面临信用风险越小。图1是FICO评分系统主要考虑的5个维度。信用评分是不带个人主观偏见的,把种族、性别、宗教等因素排除在外,使FICO评分更具客观公正性[3]。FICO评分主要用于贷款方快速、客观地度量客户的信用风险,缩短授信过程。

芝麻信用的信用评分区间是350~950分。若用户的信用分数介于350~550,则用户信用极差;若用户的信用分数介于550~600,则用户信用中等;若用户的信用分数介于600~650,则用户信用良好;若用户的信用分数介于650~700,则用户信用优秀;若用户的信用分数介于700~950,则用户信用极好。分值越高代表信用越好,相应违约率相对较低,较高的芝麻分可以帮助用户获得更高效、更优质的服务。与FICO评分系统相似,芝麻信用以“5C”分析法为理论基础,其五维数据主要有信用历史、行为偏好、履约能力、身份特质、人脉关系[4]。由于数据来源的不同,芝麻信用收集的数据不仅涉及个体的信用历史情况,还包含了个体的生活方面,而FICO评分系统收集的数据更偏向于金融性,数据维度太单一,不能完整体现个人的信用情况,在大数据时代,个人信用评分收集数据趋向多维化。

2 个人信用评分发展趋势

2.1 征信数据维度

传统的个人信用评分模型一般依托“5C”分析法的“品德”“能力”“资产”“抵押担保”“经济状况”这五方面[5],收集消费者的基本信息、偿债情况、历史支付记录、业务往来等结构化信息,数据维度相当有限,加上受数据时效性等因素的影响,并不能完全体现个人的信用情况。截至2017年5月底,中国人民银行征信中心收录了9.26亿自然人的信用信息,但是由于其采用传统的信用评分模型,过于依赖有限的数据维度,致使只有4亿左右的人拥有信贷记录,这样就无法评价其余5亿自然人的信用情况。随着互联网的快速发展,基于大数据背景下的互联网征信公司不断诞生,其中有8家获得个人征信牌照,主要有芝麻信用、腾讯征信、鹏元征信等机构。这些公司利用云计算技术,对其平台上收集的用户的多维度大数据进行分析,以大规模维度的个人信用信息降低信用风险评估的不准确性,加上数据时效性强,可以较为完整地体现个人的信用情况。

2.2 获取方式、量级及时效性

大数据下的信用评分模型通过一切可行的渠道获取所需数据,在数据获取方式上比传统信用评分模型的维度更广。传统信用评分模型所使用的数据主要来自银行和少数征信机构,而大数据下的征信不仅要用到来自银行征信机构的数据,还有政府相关部门(包括公安部门、税务部门、房屋登记部门等)和第三方机构(包括公共事业单位如医疗机构等、专门从事征信系统建设的公司如京东金融等、社交类公司如腾讯等)。

传统信用评分模型的数据来源少,并且调查维度较为局限,数据量级常以TB为单位,而大数据下信用评分模型由于有互联网和大数据技术作为支撑,各大互联网公司在不同的纬度参与征信系统建设,并且加大了数据挖掘的深度,所以大数据征信所处理的数据量也极大幅度地增长,数据量级已超过PB水平。在互联网尚未普及的年代,传统信用评分模型通常需要采用随机抽样的方式,建立各种模型来预测信用风险,系统误差和抽样误差势必会影响建模结果的精准性。在信息技术发达的今天,云计算技术能轻松分析大量的数据,我们可以直接对总体数据进行分析。大数据思维的特点之一在于“样本=总体”,搜集的征信数据越多,越容易发现一些细节信息和异常情况,对信用风险的预测就越准确[6]。

传统征信和大数据征信对数据源时效性的要求也不一样。大数据征信中数据信息有相当一部分是由征信公司提供(如支付宝的个人交易信息),这些数据具有随着时间变化实时更新的特征,所以数据具有很强的时效性。而传统信用评分模型的时效性较差,由于其获得的是消费者的历史数据,再加上获取数据途径少,导致其信息更新周期更长,且具有严重的滞后性。

2.3 应用场景

大数据与传统信用评分也有良好的交互性和融合性,使其发生了翻天覆地的变化。大数据信用评分的数据信息主要来源于互联网,而传统信用评分是对信用报告的数字解读。因此,采用数据挖掘等技术构建大数据背景下的个人信用评分模型具有更高的价值性和准确性,如芝麻信用分受到了更多的认可和青睐。中国科学院院士、西安交通大学教授徐宗本曾提出关于大数據产业的两种模式,分别是全链条模式和节点聚焦模式,它们也适用于大数据征信。不论是对于拥有雄厚实力采用全链条模式的大公司,还是专注于某一方面使用节点聚焦模式的小公司,这都是大数据背景下个人信用评分模型发展的机遇。

全链条模式下的大公司有着得天独厚的优势,在数据的收集、数据的存储、技术的支持和数据的分析等方面可以无缝衔接自成一套体系。专注于其中某一项的小公司也可以将本公司的产品做好做精,然后出售给其他公司和机构,快速实现变现和赢利。这不仅降低了信用评分的成本,而且大大提高了信用评分的质量,同时促进了这个产业的发展,为构建更为合理有效的个人信用评分模型起到了重要的作用,解决了传统征信下评分模型局限性的问题(如数据的来源方式、数据的不共享、数据的安全性和覆盖人群等各种因素,限制了征信的业务范围[7],导致不能准确地对企业和个人进行良好的信用定位以及分析解读出的信用评分不准确,从而带来一系列的负面影响)。

大数据背景下数据的爆发性增长,容易引起量变产生质变的反应,使数据的价值倍增,通过多维角度对数据分析得出的信用报告将更为合理、准确、有效。构建的个人信用评分模型也更为完善准确,可以应用于生活的各个方面,当然,最终的应用落脚点是企业和个人。通过对数据的分析,不仅可以得出当前该企业或个人的信用系数,而且更注重综合多方情况预测出将来的变化,给出一个让人信服的信用评分报告,减少各方不必要的损失。以最传统的借贷为例,在大数据下每个人都无所遁形,在互联网公司或其他机构存在的信贷记录都一目了然。个人信用评分模型可以给出直观的信用评分数据,为今后的借贷等活动提供更全面的参考。

当然,个人信用评分模型数据的来源和应用不仅是借贷,应用对象也不仅是只拥有借贷记录的人群,它的应用场景十分丰富多元,且直观准确,涉及日常生活的方方面面。不仅在金融领域发挥着重要作用,还在租房租车、酒店住宿、签证和保险等各个生活场景都有着广泛应用,并且对政府政策制定和公共服务水平的提升等都有着重要的促进作用[8]。每个城市的发展情况不一样,借助个人信用评分模型,可以为人们的衣食住行提供更好的保障,同时在此过程中利用互联网获取最为详尽的信息以便充实信用评分模型。

3 结语

建立基于大数据的个人征信已是大势所趋,大数据征信并非替代传统征信,而是两者相辅相成。大数据征信的引入能够弥补传统征信过程中存在的一些不足:一是通过利用获得的大数据保证了信息来源的及时性、全面性和可靠性;二是大数据征信对信息具有更高的保密性;三是大数据征信能够在很大程度上解决当前构建个人信用评分模型所面临的信息不对称造成的信用风险问题。尽管大数据可以从数据维度、覆盖广度和应用场景等方面更精确地进行信用风险评估,但当覆盖范围超过一定限度时将会出现信用主体间信息匹配度低等一系列问题出现,因此,在利用大数据征信的同时也不能忽视传统征信的作用。通过对比分析得出结论,将二者相结合能够最大限度地促进新时代个人信用评分模型建设的发展。

参考文献:

[1] 佚名.带您了解大数据[J].统计与经济,2014(4):61.

[2] 陈建.信用评分模型技术与应用[M].北京:中国财政经济出版社,2007.

[3] 姜琳.美国FICO评分系统述评[M].研究与讨论,2006:81-84.

[4] 张琪,张鑫.我国个人征信体系市场化研究:以芝麻信用分为例[M].政策与商法研究,2015(16):173-175.

[5] Nir Kshetri.Big Datas Role in Expanding Access to Financial Services in China[J].International Journal of Information Management,2016(36):297-308.

[6] 王波,陈标,魏宇航.电信大数据在征信领域的应用研究[J].移动通信,2016(8):80-83.

[7] 卢芮欣.大数据时代中国征信的机遇与挑战[J].金融理论与实践,2015(2):103-107.

[8] 马小林.征信[J].金融理论与实践,2017(8):41-43.

家电之家©部分网站内容来自网络,如有侵权请联系我们,立即删除!
数据 信用 评分
你该读读这些:一周精选导览
更多内容...

TOP

More