现在很多公司开启了大数据征信业务,因为各公司自身的数据来源不同,导致各大数据征信产品使用的数据并不是相同的。我们来看看各公司都是用了哪些数据。
阿里巴巴:代表产品芝麻征信,主要使用的数据包括淘宝的电商交易数据、蚂蚁金服的金融数据、公共机构数据、合作伙伴数据、个人提交数据,基本涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、社交关系等。
腾讯:代表产品腾讯信用,主要使用数据包括社交网络数据,游戏数据,比如在线、财产、消费、社交等数据。
传统金融机构:如鹏元、中诚信等公司,主要还是基于自身的金融数据,如交易数据,转账数据,等
新型大数据公司:如集奥,他们本身并不生产数据,通过与外部合作,接入了包括微博社交数据、运营商数据,金融数据等相关数据;
互联网海量大数据中与风控相关的数据
电商类网站大数据:阿里、京东、苏宁等;
信用卡类网站大数据:我爱卡、银率卡等;
社交类网站大数据:新浪微博、腾讯微信等;
小贷类网站大数据:人人贷、信用宝等;
98征信数据查询平台还挺全面的用的
大家都知道,目前最权威的是来自央行的征信。但 央行征信主要覆盖在持牌金融机构有信用记录的人群中,还有大部分在银行是没有信用记录的。所以大数据征信通过大数据技术刚好覆盖了这些在央行没有征信记录的人群。
征信大数据技术通过互联网留痕协助信用的判断,满足P2P网络借贷、第三方支付及互联网保险等互联网金融新业态身份识别、反欺诈、信用评估等多方面征信需求。
征信大数据主要涉及央行的征信数据(如银行借贷、信用卡使用情况)、经营数据(收入),身份数据(年龄、性别、职业、婚姻状况,工作年限)、社交数据(QQ以及微信使用轨迹)、消费/财务数据(网银流水、信用卡账单等)、乃至日常活动数据、特定场景下的行为数据等。
信用卡,公安网,银行和消费记录的淘宝类
传统信用评估模型是根据一个人的借贷历史和还款表现,通过逻辑回归的方式来判断这个人的信用情况。而大数据征信的数据源则十分广泛,包括电子商务、社交网络和搜索行为等都产生了大量的数据。
大数据征信特点:数据主要来自互联网各大平台,使用互联网技术抓取或接口合作获取征信数据,资质再好一点的企业可以申请接入央行征信。目前国内比较多的就是支付宝跟腾讯两个征信平台。
阿里巴巴:代表产品芝麻征信,主要使用的数据包括淘宝的电商交易数据、蚂蚁金服的金融数据、公共机构数据、合作伙伴数据、个人提交数据,基本涵盖了信用卡还款、网购、转账、理财、水电煤缴费、租房信息、社交关系等。
腾讯:代表产品腾讯信用,主要使用数据包括社交网络数据,游戏数据,比如在线、财产、消费、社交等数据。
大数据征信存在先天缺陷。
首先,重要的不是算法,而是数据。无论大数据征信机构的算法多么牛逼,只要没有掌握和信用强相关的数据,就无法给出靠谱的征信报告。网络上的数据很多,但和信用八竿子打不着。
其次,信用包括两个方面,还款能力、还款意愿。通过电商消费记录,可以间接推断其还款能力,但是还款意愿怎么判断呢?企业信用主要看还款能力,个人信用主要看还款意愿。
美国之所以能做大数据征信,是因为有长期的数据积累和健全的法治环境。至于中国,大数据征信机构想法是好的,可惜巧妇难为无米之炊。包括腾讯、阿里,虽然掌握海量数据,但是这些数据和信用是弱相关的。如果有一天,淘宝花呗、京东白条额度超过银行信用卡额度,大数据征信就算是站住脚了。