副标题#e#
面对持续、快速发展的移动终端市场,各大厂商都在积极布局相关生态,包括NVIDIA收购ARM、英特尔收购SiFive和AMD收购赛灵思(Xilinx)等,高通(Qualcomm)未能收购恩智浦(NXP)、博通(Broadcom)并购高通失败等。
除了收购的快车道外,自主研发也是不错的选择。美满电子(Marvell)的在一年多之前推出OCTEON TX2基础架构处理器,相关生态就以极快的速度发展。Marvell最新推出OCTEON 10系列DPU,采用台积电5nm制程工艺、用上ARM的Neoverse N2 CPU内核,旨在帮助移动和处理那些通过网络传输的数据。
OCTEON 10拥有上一代OCTEON TX2的众多功能构建块阵列,同时还包括集成机器学习推理的引擎、内联加密处理器以及矢量数据包处理器等先进的IP以及功能,而且都能够以虚拟化方式运行。作为DPU的重要补充,Marvell还为OCTEON 10引入内部机器学习(ML)引擎。
OCTEON 10系列DPU是Marvell首款采用台积电N5P工艺制造的DPU和ARM Neoverse N2 CPU核心的产品,同时还支持最新的PCIe 5.0 I/O与DDR5内存。Marvell表示,将推理加速器放到同一芯片、并直接集成到数据管道中,对数据流用例所需的高吞吐量/低延迟处理至关重要。
在2020年底,Marvell已宣布停用自家的CPU IP,转而支持ARM的Neoverse内核。OCTEON 10系列DPU就是业界首款对外公开使用ARM Neoverse N2基础架构的产品。从TX CPU核心切换到N2之后,单线程性能亦有望提升3倍。Marvell在OCTEON 10系列引入矢量数据包处理引擎,与当前一代的标量处理引擎相比,数据包的处理吞吐量大幅提升至5倍。
OCTEON 10系列的Armv9 CPU内核支持SVE2,其包含有利于数据处理和机器学习功能的指令,比英伟达BlueField3 DPU设计具有很大的优势(后者使用Armv8.2+的Cortex-A78内核)。Marvell还为Neoverse N2配备包括64KB L1l和L1D缓存以及完整的1MB L2缓存选项。
但是网络解决方案选择为该SoC集成自家的设计,提供256-bit数据路径,辅以2MB的L3共享缓存,并且能够随着核心数量的增加而加大。在交换集成和网络吞吐量方面,Marvell整合1Tbps交换与多达16路50G MAC,实际产品SKU还是会针对特定场景进行调整。在云和数据中心上,这些解决方案可在计算与网络吞吐量性能方面提供广泛的多功能性。对于企业而言,OCTEON 10系列也可提供深度集成的数据包处理和安全加速特性。
AnandTech在数月前介绍过N2与面向高性能计算的HPC V1,亚马逊Graviton2或Ampere Altra承诺带来40%的性能提升。英伟达下一代BlueField-3 DPU提供优于竞争对手的解决方案,尤其在AI处理性能和产能等方面。AnandTech指出,OCTEON 10系列涵盖广泛的应用,从4G/5G RAN数字/中央单元、到前传网关\vRAN卸载处理器等。
Marvell对OCTEON 10系列的各种设计进行细分,比如DDR5控制器特指40-bit通道(含8-bit ECC),辅以SPECint2006基准测试的性能参考数据。
Marvell准备另外三款OCTEON 10 SKU,包括配备8个N2内核、TDP低至10-25W的入门级CN103XX,两款改进网络连接的高端款CN106XXS以及多达32个N2内核、运算能力和网络连接吞吐量都最高的旗舰级DPU400。规格最强的DPU400产品,其热设计功耗只有60W,远低于当前CN98XX Octeon TX2旗舰SKU的80-120W;DPU400目前尚未流片,预计出样时间为2022年。
#p#副标题#e#
首批OCTEON 10产品预计在2021年底前出样,首个OCTEON 10产品将基于CN106XX设计,在PCIe 5.0外形尺寸上提供24个N2内核、双路100GbE QSFP56端口。CN106XX已经完成流片,预计将于2021下半年出样,且有望在4季度上市。
Marvell表示:Marvell在DPU出货量方面处于行业领先,且在所有大型数据中心都有广泛的部署。随着全新一代OCTEON 10系列产品的到来,将在性能和效率方面拥有更显著的竞争优势。
编辑点评:面对庞大、且拥有极多细分场景的市场,Marvell虽然不能像几大头部公司一样通过收购,迅速走上快车道。但采用最新的架构体系、更先进的制造工艺,在细分场景下建立竞争优势,更好的满足客户需求。