【983】大数据实操:社交数据在征信领域的分析应用
先来了解一下传统征信的分析维度。其一是用户的基础信息,如年龄、性别、职业、收入、婚姻状况,工作年限,工作状况等,基本上和每家银行或者每个做征信的机构获得的数据都差不多。其二是信贷情况,看用户申请几张信用卡,最近一个月的征信报告被查询的次数,因为征信报告被查询的次数可以直接代表,最近有没有比较频繁地做贷款的申请或者信用卡申请。如果最近的次数特别多,那说明这个人最近非常缺钱,可能就会影响信用,直接影响授信额度。 上图是某社交网络的数据现状,包含了很多维度的数据,覆盖的用户数相对来说更加全面一些。 某社交网络社交征信SWOT分析 上图为某社交网络社交征信SWOT分析,优势、劣势、机会、风险一目了然。有了这样详细的分析,做个人征信是必然的事情,但做征信之前要清楚的知道征信对象是什么样子,所以开始着手做个体用户画像的研究。 做个体用户画像研究遇到的挑战主要有如下三方面:其一,如何充分利用社交网络各种丰富的数据资源及之间的联系?其二,如何使用户画像适应各种不同的应用场景?其三,如何高效的处理海量的用户数据?相应的解决方案如下: 1.针对不同的底层数据类型设计特定的挖掘算法,挖掘用户的行为特征,形成底层标签。综合考虑不同数据来源的,形成更上层的抽象用户标签。 2.建立完善的用户画像标签体系结构,从不同维度、粒度对用户进行描述。 3.搭建用户画像挖掘系统,基于大规模存储和机器学习计算平台,定期对全量用户数据进行计算和挖掘,并提供用户标签的使用和查询服务。 ? 用户画像系统架构
个人用户画像研究的结果就是把结构化数据,文本分类,LBS数据,社交网络传播扩散这些挖掘之后形成一个比较完整的画像,比如说人口的一些基础属性如年龄、家乡、兴趣等。同时也会对用户婚姻状况来做一个判断。有了这些数据之后,就可以基于这些用户数据去做很多社交征信工作。 四、社交圈子研究 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |