范承工:谈基于持续性内存的分布式融合数据平台
范承工:都是很好的问题,也是我们一直在努力的问题,第一个问题RDMA本身有延迟,比起介质的延迟会长,根据我们的测试大概在个位数微秒,确实慢了一个数量级。不少App当你超过内存容量溢出到SSD之后会慢很多,根据我们的经验用RDMA连接远方持久性内存,比起用SSD还是要快,所以还是有它的价值。 第二个问题你说分层的存储,现在我们是有第一版本有一些智能的上下层数据自动迁移,用户不会看到底下有分层,整个是我们来管理的。当然,这个算法还是有上升的空间,我们也会更加智能完成分层存储的管理。 提问:您刚才文件系统,后面的研究系统,咱们也支持HDFS是吧? 范承工:是的。 提问:咱们有内存的API,还有存储的API,如果现在用户需要把程序改一下,这些API怎么用呢? 范承工:持久性内存API是要改程序的,就是我们把底下的API给用户,那个是需要改的,但你不需要用那个,你可以用存储和内存这两个已有的API,这两个API有多种模式,无论是内存和存储,我们都提供了一个访问模式,使得应用不需要修改就能够使用我们这套系统。 提问:很多大数据计算,一个大的数据级超过1TB跑不动了,咱们是把内存扩大,咱们能扩大多大?您测过没有? 范承工:现在DRAM内存越大价格单价上升很快,理论上是一个CPU支持1.5T,但大家不会做1.5T,也甚至不会做750G,最大做到370G。一般来说服务器的内存300G、500多最大了。持久性内存一个节点最多可以到6个T。 由于多节点,如果100多个节点就可以有700个T,理论上700多个T的数据可以全部放在内存里完成这个工作。 提问:我问一下加密的问题,现在SSD有比较成熟的硬件加密的手段,您这边在数据加密方面有没有什么考量,毕竟是700多个T的数据在缓存里的。 范承工:这个现在我们的思考还不够成熟,如果各位有兴趣还可以开一个公司做这个,我们现在做的技术还没有考虑到加密的事情,我觉得这个新硬件的生态有很多好工作可以产生。 【凡本网注明来源非中国IDC圈的作品,均转载自其它媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。】 延伸阅读:
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |