
尽管中国AI落后美国,不过中国国产AI已找到新破口,包括华为、阿里正押注「超节点」,也就是不卷单卡性能追求「系统效率」,有机构指出,中美AI竞争从「单卡性能」走向「系统级效率」。
超节点,即Superpod,是一种用于构建大规模算力集群的技术架构。此概念最早由Nvidia辉达(另称英伟达)
提出,指将数千张GPU集成在一个逻辑单元内,形成类似「超级计算节点」的系统。与传统架构不同的是,超节点可以通过高速互联技术,弥补原先服务器间带宽不足以及高时延等问题,以期实现算力效率的优化。
科创板日报报导,在不久前举行的2025云栖大会上,阿里云发布磐久128超节点AI服务器。该服务器集成阿里自研CIPU 2.0芯片和EIC/MOC高性能网卡,单柜支持128个AI计算芯片。同等算力下,相较于传统架构,该服务器推理性能可提升50%。
除推理场景外,超节点也可用于AI训练。今年4月,华为推出CloudMatrix 384超节点,通过构建超过万片的大集群来提供算力。对于兆、十兆参数的大模型训练任务,在云数据中心,可将432个超节点级联成最高16万卡的超大集群。
在9月召开的华为全连接大会上,华为表示CloudMatrix 384超节点已销售300多套,共服务20多家客户,主要需求来自政企。未来华为还将推出Atlas 950 SuperPoD超节点,算力规模8192卡,预计于2026年第4季上市。新一代产品Atlas 960 SuperPoD算力规模将达到15488卡,预计2027年第4季上市。
华龙证券指出,中美AI竞争正从「单卡性能」走向「系统级效率」,中国正在用集群建设+开源生态+工程化交付的方式完成AI基建方面的弯道超车。实际上,当前还有更多中国国产硬件厂商正在加速布局超节点。
浪潮信息于8月7日发布面向万亿(兆)参数大模型的超节点AI服务器「元脑SD200」。沐曦股份已发布多种超节点形态,包括光互连超节点、耀龙3D Mesh超节点、Shanghai Cube国产高密度液冷整机柜以及高密度液冷算力POD。
百度智能云于8月28日发布百舸AI计算平台5.0版本。在算力方面,昆仑芯超节点正式激活。
从技术方向看,超节点正在成为AI基础设施建设的新常态。民生证券认为,先前市场更多关注芯片算力,但伴随Scale up(纵向扩展)产业趋势崛起,超节点已经重新定义AI基础设施的范式。
该机构进一步指出,当超节点速率大幅提升,AI数据中心(AIDC)功率将迎来新挑战。由于包括华为CloudMatrix 384、辉达GB200NVL72在内的超节点单机柜功耗普遍突破100KW,因此在算力密度指数级增加的情况下,超节点机柜的温控和电源系统将面临挑战。而当Atas950超节点采用全液冷模式时,互联带宽速率和算力速率均迎来大幅提升。