首页 财经 > 内容

Thunderbird将多达6,144个CPU内核装入单个AI加速器中并可扩展至360,000个内核

时间:2024-07-29 10:07:26 来源:
导读 超级计算设计的终极目标是一种将CPU的多功能性和可编程性与GPU的显式并行性相结合的架构,而InspireSemi致力于实现这一目标。InspireSemi的...

超级计算设计的终极目标是一种将CPU的多功能性和可编程性与GPU的显式并行性相结合的架构,而InspireSemi致力于实现这一目标。InspireSemi的Thunderbird“单片超级计算机集群”包含1,536个专为高性能计算设计的RISC-V内核,但它还支持通用CPU编程模型。它还具有令人难以置信的可扩展性——四个可以放置在单个加速器卡上,该卡采用标准的GPU类外形尺寸(AIC),使每张卡的内核总数达到6,144个,可扩展性扩展到每个集群360,000个内核。

InspireSemi的Thunderbird处理器包含1,536个定制的64位超标量RISC-V内核,配备大量高性能SRAM、用于多种加密算法的加速器以及用于间和内连接的片上低延迟网格结构。该还支持LPDDR内存、NVMe存储、PCIe和GbE连接。它已流片,将在台积电制造,然后在ASE封装。

InspireSemi的目标是在一块板上安装四块Thunderbird,为开发人员提供6,144个RISC-V核心。当前的Thunderbird架构支持使用高速串行收发器连接的最多256个处理器的横向扩展能力。

在性能方面,InspireSemi表示其解决方案在50GFLOPS/W(480W)下可提供高达24FP64TFLOPS,这是一个强大的性能。具体来说,Nvidia的A100可提供19.5FP64TFLOPS,而Nvidia的H100可达到67FP64TFLOPS。目前尚不清楚我们处理的是单Thunderbird卡还是4路型号的性能。为附加卡提供1920W几乎是不可能的,因此我们很可能处理的是卡上的四个Thunderbird处理器,每个可提供24FP64TFLOPS。

超标量内核支持矢量张量运算和混合精度浮点数据格式,但目前尚不清楚这些内核是否支持Linux,这就是InspireSemi将Thunderbird称为加速器而不是通用处理器的原因。不过,这款处理器可以像普通的RISC-VCPU一样进行编程,并支持各种工作负载,例如AI、HPC、图形分析、区块链和其他计算密集型应用程序。因此,InspireSemi的客户不必使用专有工具或软件堆栈,例如Nvidia的CUDA。唯一的问题是,行业标准工具和软件堆栈是否足以在各种工作负载中从ThunderbirdI中获得最大性能。

InspireSemi首席执行官RonVanDell表示:“我们为工程和运营团队完成ThunderbirdI设计并将其提交给我们的世界级供应链合作伙伴TSMC、ASE和imec进行生产而感到自豪。我们预计将于第四季度开始向客户交付。”

说到客户和合作伙伴,InspireSemi拥有众多合作公司,其中包括联想、企鹅计算、2CRSI、WorldWideComputing、GigaIO、Cadence和GUC等。

标签:
最新文章