Intel面向HPC、AI市场发布了两款新品,开辟了全新的Max系列产品线,一个是PonteVecchioGPU加速计算卡,另一个就是SapphireRapidsHBM至强处理器。
SapphireRapids就是Intel第四代可扩展至强,此前已官宣明年1月10日正式推出,这次发布的至强MaxCPU只是其一个子系列,区别是集成HBM高带宽内存,专门用于加速计算。
规格方面披露得不多,只说最多56核心112线程(还有4个未开启),分为四个部分(Title),彼此通过EMIB互连桥接技术整合在一起。
集成最多64GBHBM,每核心分配超过1GB,可满足绝大多数HPC负载的需求,而且可以灵活选择HBM、DDR两种不同内存模式来运行。
扩展连接方面支持PCIe5.0、CXL1.1。
性能上,官方宣称至强Max的真实HPC负载性能比竞品高出最多4.8倍,HBM内存模式MPAS-A气候建模性能比AMDMilan-X高最多2.4倍,DDR内存模式DeePMD分子动力学性能比精心高最多2.8倍。
还支持AMX扩展指令,提升AI性能,INT8/INT32整数累加运算的峰值吞吐相比AVX-512指令集高出多达8倍。
有趣的是,虽然至强Max的热设计功耗高达350W,Intel宣称,同样的HPCG性能下,可比AMDMilan-X集群可节省68%的功耗。
要知道,AMDGenoaEPYC已经可以做到96核心360W……
至强MaxCPU现在已有30多款系统设计,首要的当然是美国能源部阿拉贡国家实验室旗下的顶级超算“Aorura”(极光),两颗至强MaxCPU搭配六颗MaxGPU组成一个节点,总计超过1万个节点,峰值双精度浮点性能将首次突破2百亿亿次每秒,目前正在建设中,预计明年上线。
作为先行平台,Intel和阿拉贡实验室还打造了一台“Sunspot”(太阳黑子),只有128个节点,今年底开放给研究人员。
此外,美国阿拉莫斯国家实验室Crossroads、劳伦斯利弗莫尔国家实验室CTS-2、桑迪亚国家实验室、日本东京大学Camphor3,也都会使用IntelMax系列产品。