算力是智能的基础,充足的算力被认为是大模型发展的第一性原理。在3月25日至29日召开的2026中关村论坛年会(以下简称年会)上,算力焦虑被众多参会者多次提及。
“我认为,未来12个月,最关键的问题可能还是算力。”在年会举办的AI(人工智能)开源前沿论坛圆桌会议(以下简称圆桌会议)上,智谱CEO(首席执行官)张鹏表示,算力不足使得很多研究进展受到制约,AI的发展转向推理阶段,需求正在以十倍、百倍的速度爆发,大量需求没有被满足。

新华社
从产业趋势来看,超节点产品成为应对持续增长模型推理需求的方案。在年会召开期间,中科曙光发布了一款搭载40张GPU(图形处理器)的中小规模超节点产品。中科曙光将之称为性能与成本平衡的“甜点区”。
另外,北京清微智能科技股份有限公司(以下简称清微智能)联合北京智源人工智能研究院(以下简称智源研究院)发布可重构智算超节点技术,将4096颗可重构计算芯片互联构建成一个超节点。
事实上,放眼整个国产芯片厂商,紫光股份、浪潮信息、百度、华为等都已推出不同的超节点产品。
“超节点已从概念到产品,现在到了怎么用的阶段。”3月29日下午,清微智能研发副总裁李彬对《每日经济新闻》记者表示,券商机构预计2027年至2028年,产业将迎来拐点,随着算力芯片性能的提升,超节点的渗透率预计将从10% ~20%提升至50%~60%。
算力需求日益增加
对大部分人来讲,超节点是个抽象的名词。
公开资料显示,英伟达首创了超节点概念,并持续迭代相关技术及产品。中国科学技术信息研究所发布的《人工智能前沿技术趋势报告2025》显示,2025年,智能算力在体系结构方面创新活跃,包括超节点在内的前沿技术,加速构建十万卡以上大规模算力集群,为人工智能技术创新与产业化提供强力支撑。
何为超节点?今年1月,中兴通讯发布的相关白皮书显示,超节点是通过高速互联协议与专用交换芯片构建的高带宽域,将数十至数百颗GPU芯片,在逻辑上整合为统一编址、低时延、高带宽的协同计算系统。
“一个节点就是一台服务器,超节点就是把很多算力服务器连接在一起,而连接在一起是为了满足大模型的算力需求。”在接受媒体采访时,李彬以通俗的语言对超节点概念进行了介绍,超节点是一个体系化的技术,是从芯片到系统再到网络的整套方案,最终达成的是高性价比、高算力、低时延的超级节点,这其中包含了芯片、集群和软件技术等。
超节点技术的应运而生,背后是算力需求日益增加,进而企业对成本愈加敏感。公开数据显示,中国日均Token(词元)调用量已从2024年年初的1000亿,跃升至2025年底的100万亿,两年间增长超千倍。“大家越来越看重以Token成本为基础的新型算力的商业逻辑。”清微智能方面表示。
在圆桌会议召开期间,无问芯穹联合创始人兼CEO夏立雪表示,OpenClaw(一款开源人工智能体框架,俗称“龙虾”)这类智能体产品,带动了整个Token需求的大增。这种高增长对系统效率提出了更高要求。
“前两天有消息称,我国每天调用140万亿Tokens资源。我大概算了下,按照我们通常所说的算力,每天能有上万台机器在不停运转。”李彬表示,智能体时代,算力的需求越来越高,成本也随之走高。如何降成本,是让智能体真正走入千行百业、千家万户的关键。
“先抛开芯片本身不说,现在资本市场对整个人工智能产业的热情相当高,这不仅局限于中国。我们可以看到,国外的OpenAI、特斯拉等企业,未来3到5年,规划的投资都是万亿美元级别,我国的产业规模只会比美国更大。”李彬进一步表示。
去年10月,曾有国产算力芯片厂商的高管预测,国产算力芯片的使用比例将会超过海外芯片。根据李彬的观察,5年内,不论是大模型公司还是互联网大厂,国产芯片已不再是替代方案,而是必须的选择。
国产厂商探索不同路线
在此背景下,国产算力迎来更大的市场,国产芯片厂商开始进行不同路线的探索。
在年会召开期间,中科曙光发布一款搭载40张GPU的中小规模超节点产品。据中科曙光方面介绍,基于客户调研,公司发现40卡的超节点,处于性能与成本平衡的“甜点区”,可以覆盖大多数人工智能计算的场景。
与此同时,清微智能联合智源研究院发布可重构智算超节点,将4096颗可重构计算芯片紧密互联。据清微智能方面介绍,其设计突破在于通过可重构网格互联技术,使芯片自身具备了智能路由能力,可实现无交换机光纤直连组网。
当前,英伟达在售主力产品为72 卡 NVL72(NVIDIA GB200NVL72),后续有望升级至144卡和576卡。华为则在384卡产品基础上,继续推进8192卡Atlas 950与15488卡Atlas 960。华为Atlas 960超节点预计2027年第四季度上市,与英伟达的超节点产品形成竞争。公开资料显示,NVIDIA GB200NVL72是英伟达发布的一套多节点液冷机架级扩展系统,适用于高度计算密集型的工作负载。
据李彬介绍,芯片与芯片相连需要经过交换机,交换机越多损耗越多,边际效益就会递减,因为“会浪费一些时间在路上”。
华为方面也曾介绍,在定义和设计Atlas 950、Atlas 960这两个超节点的技术规格时,遭遇到了互联技术的巨大挑战,主要体现在两个方面:一是如何做到长距离而且高可靠;二是如何做到大带宽而且低时延。Atlas 950、Atlas 960 最终突破了这两个挑战。
据《每日经济新闻》记者了解,诸多国产厂商都在推出并持续更新超节点产品,不过,当前超节点的部署和应用仍处于早期。
“我们认为,产业拐点将会在2027年至2028年发生。随着算力芯片性能的提升,超节点渗透率预计将从当前的10%~20%,提升至届时的50%~60%。随着NVL576、Atlas 960等头部方案的互联速度要求、单柜功耗进一步提升,各环节量价将迅速增长。”中信证券在3月27日发布的研报中指出。