华为侯金龙:打造“融合、智能、合作 ”数据基础设施,携手迈入智能时代
11月19日,华为在深圳举办2019全球数据基础设施论坛,面向鲲鹏计算产业,宣布全面启动数据基础设施战略,并开源数据虚拟化引擎HetuEngine(河图引擎),希望让伙伴像使用“数据库”一样使用“大数据[注]”,让数据治理、使用更简单。这是继今年9月基于“鲲鹏+昇腾”双引擎全面启航计算战略后,华为从数据角度对计算战略的再度阐述。华为数据基础设施战略围绕数据“采-存-算-管-用”的全生命周期,诠释了华为通过提供融合、智能、开放的数据基础设施,使能各行各业客户释放数据价值,让智能无所不及。
华为Cloud & AI产品与服务总裁侯金龙在大会上发表主题演讲
以下是侯金龙演讲全文 女士们、先生们、朋友们,大家上午好!欢迎大家来到深圳,参加首届全球数据基础设施论坛。 人类正迈入万物互联的智能时代,而数据将成为智能世界的关键生产资料。今天,我分享的主题是《打造“融合、智能、开放”数据基础设施,携手迈入智能时代》。 构建万物互联的智能世界 华为公司的愿景与使命是:“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。在智能世界,算力成为新生产力,数据成为新生产资料,“5G、AI、云”成为新生产工具,将使能千行百业迈入智能时代。 两个月前,华为在全联接大会上发布了“一云两翼双引擎”的鲲鹏计算产业布局,基于“鲲鹏+昇腾”双引擎,全面启航计算战略,为世界提供最强算力。 “一云”是指华为云,是生态伙伴发展的黑土地。“两翼”是指智能计算和智能数据。数据作为鲲鹏产业中的关键一翼,华为将围绕数据构建端到端的能力,包括存、算、用的能力,通过5G+云+AI能力,打造“融合、智能、开放”的数据基础设施,释放数据价值,让智能无所不及! 智能世界,从数据管理走向数据运营 首先,数据将驱动客户体验。当你打开一个App,就会收到你感兴趣的内容推送。精准推送的背后,其实就是数据在驱动。比如快手,每天产生1.2亿个内容标签与用户画像实时匹配,数据运营实现内容精准推送。 其次,在企业经营活动中,数据驱动企业生产决策。以大港油田为例,在经历了50年持续开采后,面临资源枯竭、产量下降的挑战。2019年以来,大港油田采用华为大数据和AI技术,利用测井曲线,结合经验模型生成了每口井的孔隙度、渗透率,找到了更多的新的油气层。通过数据运营,为长期稳产500万吨提供了决策支撑。 最后,我介绍下数据驱动企业流程简化。华为每年有近300万人次出差,以前出差涉及考勤、机票、酒店,包括报销等十几个申请流程,现在只需要一个流程就可以真正实现“说走就走”。这是每天45万次后台数据关联碰撞的结果。数据运营,实现“让数据多跑路,员工少跑腿”。 智能世界,需求与资源存在巨大落差 随着5G、AI和云的普及,数据量正以惊人的速度增长:从1080P到4K、8K,视频数据量将提升40倍,从4K到4K VR要增加6倍以上;未来每辆自动驾驶汽车每天就会产生高达64 TB数据;深圳一个城市有超过200万摄像头,每天将产生80 PB数据,平均保存30天,大家希望保存更长时间;大量的数据过去只需存几天,现在需要保存几个月甚至永久保存。 根据预测,全球数据量将从2018年的33 ZB快速增长到2025年的180 ZB。但是,产生的数据中仅有不到2%被保存,而被保存的数据中仅有不到10%被应用。 这些海量数据的增长背后是需要海量存储和计算的资源,数据增长是无限的,而存储资源却是有限的。 数据全生命周期每比特价值最大,每比特成本最优 我们希望对数据的采、存、算、管、用实施端到端的整合和优化,让数据在全生命周期内更好用,数据的每比特发挥价值最大,数据的每比特成本最优! 打造“融合、智能、开放”数据基础设施 为实现这个追求,华为打造融合、智能、开放的数据基础设施,让数据系统从孤立走向融合,从复杂走向智能,从封闭走向开放:
融合:使用极简 数据应用的核心包括存储和分析。烟囱式IT业务系统带来两个问题:存的时候会产生多个冗余副本,且数据无法流动,存储成本高;分析的时候会导致大量数据搬迁,分析效率低。 通过10余年技术积累和创新,华为在存储、数据库和大数据技术上实现了一系列突破,通过打破4堵墙,让数据的每比特发挥价值最大,数据的每比特成本最优。
智能:体验极致 过去,主要依靠人来完成设备配置和运维,运维人员经验和能力的高低决定了管理效率的优劣。华为基于AI芯片、存储和华为云的三层架构,通过云上训练和云下推理,让系统越用越快、越用越省。
开放:开发极简 随着业务类型日益增多,大量业务需要跨平台、跨数据源协同分析。这种场景下,最突出的3个问题是:找数难、取数难、用数难。
为了屏蔽数据类型差异、地域差异、语法差异,让数据治理简单,使用简单,华为推出了“河图引擎”。 HetuEngine,从“大数据”走向“大数据库” 我们将数据虚拟化引擎命名为河图,就是屏蔽数据基础设施的复杂度,让开发者像使用数据库一样使用大数据,复用现有的生态、工具和技能,提升开发效率2到10倍。“大禹得河图后始见清明”,传说中,大禹通过河图掌握河流山川复杂的地形地貌,顺利完成治水大业。 河图引擎,就是要让数据治理简单,使用简单,更方便的挖掘数据价值。它具备4个核心能力:
开源河图引擎HetuEngine 为了更好地发展数据产业,今天我宣布开源河图引擎,开源版本的河图引擎叫openHetu,将于2020年6月上线。我们将开源内核,开发者可以基于开源代码进行定制,包括数据源扩展、SQL执行策略等,实现应用快速对接,提升开发效率。
华为Cloud & AI产品与服务总裁侯金龙宣布开源数据虚拟化引擎HetuEngine
平台+生态,携手迈入智能时代 华为始终践行“平台+生态”策略,通过硬件开放,软件开源,使能伙伴,共建开放、繁荣的鲲鹏计算产业生态,共同迈入智能时代。 谢谢大家! (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |