TigerGraph:实时图数据库助力金融风控升级
举个例子,我们的某个银行客户想针对反套现场景的资金回流进行分析,即个人通过信用卡将钱刷给商家,商家再通过其他账户将钱打回给个人的储蓄卡。在这个场景中需要借记卡和信用卡的数据,客户的数据经过数据清洗以后,仅是10个月借记卡数据+1个月信用卡数据规模仍有5个T。这样的数据量过去的图数据库是无法支持的,基于TigerGraph,我们用了12台机器的集群实现了本期数据的存储,并将计算效率从之前的3-4天得到结果缩短到1-30分钟。他们的二期设想是想把借记卡和信用卡各13个月的数据放进去进行分析,场景才能更全面地覆盖到套现群体,而这个数据规模对于TigerGraph来说也不是问题。 第二点就是刚才那个反洗钱的例子也看到了,分析路径每增加一步,都可能揭示更多的链接和隐含的关系,实际业务需要中需要做到3-10步以上的分析,目前的图数据库在企业级场景下,2度到3度查询时就会出现超时或者内存溢出的场景,如此浅层的特征关系欺诈者甚至可以伪造,这样的性能可以说对欺诈甄别的帮助很小。 最后一点就是我们对欺诈等场景是有实时性要求的,而其他数据库难以做到亚秒级查询并支持实时更新操作。尽管目前国家对反洗钱等场景的时限要求并不高(按天计),这也是由于之前的技术发展未能实现更迅速的计算效率而做出的妥协。理论来说金融领域的任何案件在时效性上必然是越快越好。目前我们给国内某支付机构做的反洗钱系统,场景识别已经做到了分钟级。 这三点中每一点目前也都有替代的解决方案,很多公司通过图数据库+大数据平台的方式实现了大数据量+秒级相应的效果,但是这样的解决方案由于技术门槛较高无法轻易掌握。而作为普通企业来说,需要一款简单、成熟的解决方案来满足这三点要求,实时图数据库TigerGraph能够很好的地满足企业这三方面的需求。 TigerGraph的独门武器 第一,在可扩展性和高性能方面,TigerGraph作为全球首家实现原生并行图数据库技术的公司,底层基于原生并行图存储结构,所有的数据都以边和节点的形式进行存储,数据在进入TigerGraph时会进行压缩,加之图分区技术,实现了较之其他图数据库50-200倍的存储规模。边和节点既是存储模型又是计算模型,所有的节点都以内部索引的形式表达以利于快速定位,基于MPP架构支持大规模并行计算。基于以上,TigerGraph在单个项目上实现了千亿节点,万亿边的数据规模下,支持每天20亿次的数据查询和更新。对于深度链接查询更是可以做到6-10+度的查询。 第二,在易用性方面,TigerGraph自主开发了类SQL的图查询语言GSQL,GSQL拥有图灵/SQL完备的表达力,即目前所有的SQL查询和算法都可以通过GSQL实现,支持以天计(不是以周计)的PoC(项目验证)向客户展示价值。 第三, TigerGraph开发了GraphStudio可视化开发工具,这款工具基于浏览器的,从graph schema设计,到关系型数据-Graph映射,数据导入,数据查询均可通过该工具实现,大大降低了使用门槛。数据导入后即可查询N度邻居、最短路径等查询,相对复杂的查询也可以等技术人员写好以后,业务人员通过GraphStudio进行查询。 TigerGraph简介 TigerGraph是2012年由许昱博士创立的,A轮融资3100万美元,排在图数据库领域融资史前列。TigerGraph是业内首家采用原生并行图技术,并且在速度上保持遥遥领先水平,基本上比同行产品快两个数量级以上,获得了全球顶级大数据盛会Strata Data给予的“最具颠覆性初创公司”的荣誉,目前公司已与埃森哲、普华永道达成战略合作,同时也是微软的金牌/共同销售伙伴和Amazon的高级合作伙伴。 TigerGraph产品不仅适用于企业的风控方面,基于图结构的解决方案是一种深层次的查询技术,同样适用于商品实时推荐或者网络设备管理、智能供应链等场景。 【编辑推荐】
点赞 0 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |