IT商业新闻-通信网
当前位置: 首页 > 资讯 > 正文

Arm Neoverse CSS N3 助力快速实现出色能效

2024-03-27 16:58:24     

  从云到边缘,Arm Neoverse正凭借出色的性能、效率、设计灵活性和总体拥有成本(TCO)优势,革新传统基础设施芯片领域。

  云和超大规模服务运营商正不断增大计算密度。随着Microsoft Cobalt、阿里巴巴的倚天710、AmpereOne等配置128核或以上的CPU设计进入市场,单个封装可实现的性能更强,且下一代的目标还将远高于128核。

  随着CPU性能逐步提高,市场对人工智能(AI)、网络和加密加速器等专用计算的需求也随之持续增长。这显然需要将这些加速器集成在一起,才能更有效地提高性能和效率,与此同时,还需实现模块化设计,以便将加速器与不同的通用计算引擎进行混合搭配。

  基于Neoverse N3 CPU的Neoverse CSS N3

image.png

图1 Neoverse CSS N3概览

  Arm Neoverse计算子系统(CSS)支持在新的工艺节点上快速开发先进的系统级芯片(SoC)。通过在设计中使用预配置、预验证的CSS,合作伙伴节省了80人/年的工程师时间,以及相应的机会成本,使其能够专注于实现助其系统增值的“秘密法宝”。

  Neoverse CSS N3构建在Neoverse CSS N2经过市场验证的优良表现之上,能通过新的架构功能提供更高的性能和效率,为数据中心市场带来更优越的单芯片性能和单TCO性能表现。此外,Neoverse CSS N3还为边缘和网络应用带来了出色的效率。CSS N3以Neoverse S3系统IP为基础,Neoverse S3系统IP包括了一致性网状网络CMN S3、系统内存管理单元MMU S3和片上网络NOC S3。此外,CSS N3还包含系统管理和本地控制处理器,以及CPU和系统IP协同设计与共同开发,以优化PPA和系统级功能的支持。

  Neoverse CSS N3支持32颗Neoverse N3核心,可在低至40W的功率范围内实现优异性能。该产品具备高度可配置性,适用于电信、数据处理单元(DPU)、网络和云等多个领域,可以在8核至32核之间进行扩展配置。

  除了性能和效率的大幅提升之外,Neoverse CSS N3还支持基于芯粒的设计。它支持UCIe晶粒间(die-to-die)连接标准,结合Arm新的AMBA CHI C2C协议,为构建异构加速计算奠定了基础。可以预见的是,Arm Neoverse CSS N3将在当今专用计算领域蓬勃发展。基于CSS N3的芯粒可通过AMBA CHI C2C连接到I/O一致性加速器,从而将加速器封装在一起,进一步提高性能和效率,这一方法可用来取代传统的解决方案。在过往的解决方案中,其加速器是通过PCIe进行板级连接,这会导致更高的延迟、软件复杂性和功耗。

  Neoverse N3 CPU优异的效率表现

  以每瓦性能来衡量的性能效率是CPU评估的一大关键指标。5G/6G无线基础设施要求现代计算解决方案表现出更高的性能,同时功耗预算须保持不变。新一代的DPU需要配备功能更强大的CPU,以便在PCIe设备规范的限制内运行成熟的操作系统、虚拟机、容器及其他数据包处理功能。头部云服务提供商正着手在机架的冷却能力范围内,部署核心数量更多、更密集的CPU。“能效”几乎是所有细分市场的主要设计决策要素。Neoverse N3便是以能效作为其设计核心。

  Neoverse N3 CPU延续了Neoverse N2经过市场验证的效率表现。经过Arm CPU设计团队的不懈努力,他们强化了分支预测器、预取器的性能,并优化了微架构,进而实现了效率的提升。此外,他们还改进了电源管理表现,增加了精度更高的每核动态电压频率调整(DVFS)功能,以实现更出色的性能效率。这些工作成果使得N3在效率表现上比上一代产品提高了20%以上。

  Neoverse N3可以满足多样的SoC设计要求,包括16核网络设计、32核电信RAN或云DPU设计,以及192核超大规模和云CPU等等。Neoverse N3还提供了多种电压和频率选择,与Neoverse N2相比,其每核性能效率提高了20%至近50%。

image.png

图2 Arm Neoverse N3 CPU

  · 延续卓越效率表现:在面积和功耗配置与Neoverse N2大致相同,且采用一样的工艺节点下,Neoverse N3在机器学习(ML)和数据分析工作负载方面的性能约提升了三倍,在SQL数据库、选定压缩应用程序,以及整数运算性能等方面分别约提升了1.3倍、1.2倍,以及1.1倍的性能。

  · 灵活的缓存配置:Neoverse N3提供多种缓存配置,可满足不同计算场景的需求。许多横向扩展的云数据分析和数据库应用均能从更靠近核心的较大缓存中受益,因此我们为这一细分领域推出了2MB L2缓存选项。此外,1MB L2缓存选项主要针对5G/6G无线基础设施、企业网络、DPU和智能网卡(SmartNIC)以及超大规模服务器等各种任务中的通用计算,能够实现性能和面积的良好平衡;而较小的32KB L1和128KB则适合那些对缓存不敏感,但仍希望能以较小占用空间提供良好算力的工作负载。

免责声明: IT商业新闻网遵守行业规则,本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章,请转载时务必注明文章作者和来源“IT商业新闻网”, 不尊重本站原创的行为将受到IT商业新闻网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:post@itxinwen.com
微信公众号:您想你获取IT商业新闻网最新原创内容, 请在微信公众号中搜索“IT商业网”或者搜索微信号:itxinwen,或用扫描左侧微信二维码。 即可添加关注。
标签:

品牌、内容合作请点这里: 寻求合作 ››

相关阅读RELEVANT