π2.0背后的全新升级 开启以数据为中心的超算时代

2019-05-22

从以晶体管为中心到以数据为中心,英特尔正在将自己“定义”为一个更广阔的市场的领导者。过去两年中,产生了至今仍在“主宰”全球的90%的数据,预计到2025年全球数据量将攀升至当前的10倍,达到163ZB。然而在连接千亿量级的终端和传感器背后,能够被充分利用并分析的数据却少之又少。数据从何而来?要到哪里去?又该发挥怎样的价值?为了抓住数据洪流带来的机遇,英特尔推出了一系列以数据为中心的产品组合。

这些产品组合包括第二代英特尔至强可扩展处理器、英特尔傲腾数据中心内存和存储解决方案、软件以及平台技术等,广泛适用于云计算、网络基础架构及智能边缘应用等应用场景,支持AI、5G等多种高成长性的工作负载。基于第二代英特尔至强可扩展处理器,其在AI推理、网络功能、持续内存带宽、性能、安全等方面有了巨大的提升。一同亮相的,还有多个经过优化的处理器系列:56核、12内存通道的至强铂金9200、网络优化型英特尔至强可扩展处理器、至强D-1600、10纳米Agilex FPGA等。

就像英特尔公司执行副总裁兼数据中心事业部总经理孙纳颐(Navin Shenoy)所说的,最新发布的产品组合,彰显了英特尔以数据为中心的战略正在稳步推进,也显示了该公司领先的传输、存储以及处理数据的能力,能够满足从数据中心到边缘的严苛的工作负载要求,“第二代英特尔至强可扩展处理器嵌入人工智能加速技术,同时支持革命性英特尔傲腾TM数据中心级持久内存,助力客户业务持续增长。”

当然,这一系列的产品组合到底有多领先?还是要看实际的应用效果,而HPC绝对可以算是检验硬实力和软实力的完美场景。拥有120多年历史的上海交通大学是一所“综合型、研究型、国际化”的国内一流、国际知名大学,与英特尔保持着长期良好的合作关系。早在2013年,上海交大的“π1.0”高性能计算系统就采用了英特尔至强E5系列处理器,并在2017年与英特尔合作建立了英特尔并行计算中心。

π2.0背后的全新升级 开启以数据为中心的超算时代

上海交通大学网络信息中心计算部主任 林新华

林新华,上海交通大学网络信息中心计算部主任,从事HPC行业已有17年的时间,期间一直关注并使用着英特尔的最新技术和产品。相较于最初组建HPC多用IBM、SGI的小型机,直到临近2010年开始有趋势使用英特尔处理器构建集群系统,随之而来的就是配套的网络、存储等技术和产品能否跟上。

“我们和英特尔的团队早在2013年就建立了国内高校当时最快的超级计算机‘π1.0’,这台计算机到目前为止运行已经6年了,受到校内用户的好评,非常稳定。”林新华回忆称,“机器建立以后,英特尔给了很多的支持,(我们在π1.0上)跑了很多的应用,很多程序都在上面跑,机器使用率非常高。”

就像摩尔定律一样,高性能计算领域的发展也有一个“千倍定律”,即差不多每十年性能增长1000倍。相对应的,所部署的集群同样面临着更新换代。考虑到用户规模的不断扩大,需求也越来越高,上海交大在2018年和英特尔的团队开始了“π2.0”超算系统的建设,计划在2019年4月正式投入使用。由此,上海交大也成为最早选用第二代英特尔至强可扩展处理器构建最大规模HPC集群的中国高校。

据了解,π2.0在架构层面有三大创新。首先是采用了第二代英特尔至强可扩展处理器,1316颗金牌6248处理器、658台双路节点的加持,使得该系统双精度浮点数理论性能达到2.1PFlops,同时由于AI特性的增强,让π2.0既可以支持已有的传统HPC应用,也能支持人工智能应用。

在第二代英特尔至强可扩展处理器中,集成的英特尔深度学习加速(英特尔DL Boost)技术,可以加速数据中心、企业和智能边缘计算环境中的人工智能推理工作负载,例如图像识别、对象检测及图像分割等。同时,英特尔与生态系统内的合作伙伴协作,优化了充分利用英特尔深度学习加速技术的框架(TensorFlow、PyTorch、Caffe、MXNet和Paddle Paddle)和应用,客户也可以选择OpenVINO等增强型工具来简化部署。

第二个创新是采用了100Gbps的英特尔Omni-Path架构,不仅单交换机芯片支持48端口,最大支持1152端口,成本更低、扩展性更高,而且MPI应用也可以平滑升级,无需修改代码,OPA高速网络互连技术让π2.0较上一代系统的网络速度提升了一倍左右。

第三个创新是用英特尔 NVMe SSD基于Lustre自行搭建了全闪存存储系统,SSD的高速性能较当前提升五倍。此外,单节点4.5倍、四节点4.7倍的性能提升可以在用户不修改任何一行代码的情况下实现,即使是五六年前运行的程序同样能够使用。一套架构任意应用,英特尔在背后所下的功夫可想而知。

π2.0背后的全新升级 开启以数据为中心的超算时代

计算和存储性能全面提升

“英特尔这一次并不只是提供CPU,在CPU负责把计算算得快之外,还有高速网络负责把数据搬得快,因为有很多的节点一起在做。最后是并行文件系统,这些东西全部弄好,存储读写出来,基本把这三个最核心的环节全部都照顾到,整体的性能就会比较好。三者都能照顾到,在这三个架构上都有创新,我们是比较满意的。”林新华说。

可以看到,π2.0的建设思路是综合性、一体化的解决方案,不局限于CPU。就像英特尔在架构日提出的“六大技术战略支柱”,只做好晶体管的单一策略是难以满足多元化计算需求的,而集合了更快的数据传输、更高效更全面的数据存储、更广泛的数据计算……可以实现系统级的工作负载优化,这也是π2.0的独特性所在。

这一系列的产品组合,如同英特尔开启数据宝藏的多把钥匙,集齐之后让人们看到了前所未有的数据的神秘力量,而其典型应用场景之一就是AI,这也是林新华关注的重点,他对笔者说:“我们非常期望最终能够在一个平台上实现既能够算高性能,又能算AI的应用。此外,我们也比较关心英特尔新推出的指令集,对AI的性能做了定制优化,性能表现应该是非常好的。”

【凡本网注明来源非的作品,均转载自其它媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。】

延伸阅读:

  • “纵横云图万象共生”联想发布企业级混合云产品家族
  • 在物联网中引入区块链的好处
  • 大数据分析&人工智能:技术内容价值观的辨析