发布日期:2026-02-22 13:30 点击次数:93

AI像火焰,正在吞吃寰宇,而算力组成了“柴薪”。在国与国之间的东谈主工智能竞争日益浓烈确当下,算力成为国力的遑急体现。
围绕着这个话题,不久前,华为在北京组织了2026新春媒体沙龙。现在,狡计产业已经成为华为公司最遑急的业务主航谈之一,华为狡计居品线营销运作部部长张爱军示意,但愿明天为中国构建一个坚实的算力底座,“为寰宇提供一个新的聘用”。
“超节点”成为他演讲的关键词。
什么是超节点?超节点在行业内如故一个新惹事物,行业内对超节点还未酿成圭臬界说,张爱军示意,华为但愿在行业界酿成共鸣,界说什么样的建造是超节点。
现在业界有些想法,以为超节点访佛“大型机”,或者贯穿的狡计卡弥漫多,即是超节点了。张爱军以为这些想法是对超节点的扭曲,从华为的角度来说,“超节点”是狡计节点通过高速互联左券组成更大内存空间的狡计系统,约略提供大带宽、低时延的互联才气。
传统狡计架构中,卡间互联依赖PCIe或以太网,跨办事器互联带宽多为200-400Gb/s且时延达数十微秒,在千亿参数模子考试的并行狡计场景中,时时的GB级数据通讯顽固,导致狡计恭候通讯,成为性能瓶颈。
比如下图中,CPU-AI处理器之间通过PCIe互联,AI处理器之间通过RoCE互联,单跳通讯时延只可作念到微秒级,RTT通讯时延会更高,高达几十微秒;假如要从32卡升级到64卡限制,需要增多二层交换,组网复杂;况且不救助内存斡旋编址,无法作念到全局的内存池化以及AI处理器之间的内存语义拜谒,总共访存齐需要通过音信语义通讯,优化存在瓶颈。
而超节点借助高效的互联左券松懈传统架构死心,能作念到大带宽、低时延、内存斡旋编址,救助更大限制AI处理器的高效协同,收场更大范围、更高流量的数据传输,从而突破系统性能瓶颈。
张爱军作念了个譬如:“有弥漫大的带宽,就像中国的经济为什么约略起飞,基础智商包括高速公路、高速铁路功不可没,一个好的超节点一定要有弥漫大的带宽;高速公路路修得宽,还不可堵车,要有弥漫低的时延,长安街也很宽,然则经不起天天堵,时延不及够好很难构建起来后果;能不可酿成有用的逻辑上的单一系统,关键是内存能不可简直宗一编址,有斡旋内存编址的技能才能简直称得上超节点。”
以昇腾384超节点为例,相较于传统办事器架构,通讯带宽晋升15倍、RTT通讯时延从7微秒作念到3微秒,裁减了50%以上。
施行情况中,还需要具备散热技能、模块化架构、冗余才气、贯穿技能、供电才气等工程才气,以及大限制、高可靠、天暴露分等系统才气,才是简直可商用的超节点。
为什么需要超节点?超节点的出现,是AI发展的势必产物。
张爱军在演讲中提议了三个趋势不雅察:
开始,模子的限制正变得越来越大。东谈主工智能的中枢在于压缩与泛化,压缩是通过狡计将物理寰宇的多元信息映射为函数抒发,这还是过需销耗多数算力,跟着大模子从单模态转向多模态,其对算力的需求会进一步高潮。
其次,输入长度显赫增多,模子高下文长度,将从K级迈入兆级。干涉多模态期间,输入从翰墨到加入视频和图片,导致序列长度大幅晋升,在狡计经过中更长的输入意味着更长的矩阵维度,进而推高狡计量。
第三,在数据层面,泛化才气决定了智能上限,而晋升泛化离不开更多数据,幸运飞艇app欺骗东谈主工智能生成合成数据以执续扩展考试资源已成为趋势,考试数据限制也从 10TB 级升级为 100TB 级。
“总共的一切齐决定了明天对算力的需求会指数性增长,,今天算力的需求远远未被餍足,无论是在行业里干涉到坐褥系统的经过当中,如故在ToC的消费端,咱们看到token销耗的数目不是倍增,而是指数级增长。旧年国度数据局发布的数据,2024岁首,我国每天销耗的AI有关“Token”(可暴露为AI处理的基础数据单位)惟有1千亿;可到了2025年6月底,这个数字已经突破30万亿,短短1年半时刻就涨了300多倍。”张爱军说谈。
但当咱们将视野移向算力的供给端,跟着半导体制造技能接近波及物理极限,摩尔定律正在失效,导致单一芯片的晋升难以餍足东谈主类对算力的需求。这种情况下,多芯片互联的大限制狡计节点就成为惩办问题的关键。
这就回到了上文中提到的问题,传统集群通过“办事器堆叠和以太网沟通”的方法晋升算力限制,办事器之间带宽不及、时延大,集群限制越大,算力欺骗率反而越低。Meta公布的Llama 3.1论文流露,在1.6万卡H100集群上考试时,算力欺骗率低。同期,集群限制膨胀还带来了可靠性问题,在54天的考试经过中,总共这个词集群累计中断419次,平均每天中断8次,也即是说每3小时就会出现一次故障。
此外,在推理端,对低时延的条款日益严苛。比如金融风控场景时延条款小于20毫秒,反讹诈的时延更是要在10毫秒以下。而Agentic AI需要更多任务协同和多轮次推理迭代,传统的狡计架构也难以餍足低时延条款。
因此,超节点应时而生,通过新的互联左券及架构突破办事器扩展的硬件死心,来增强算力的供给。经华为考据,在DeepSeek、Qwen等多模态、MoE模子上,超节点相较于传统集群不错达到3倍以上考试性能的晋升,同期在强化学习场景下,不错将训推权重的传输从小时级降到60s。
{jz:field.toptypename/} 华为的算力攻坚2019年,华为干涉狡计产业,其时提议了“硬件绽放、软件开源、使能伙伴、发展东谈主才”的十六字野心。时隔六年,鲲鹏的注册开辟者数达到了约380万,昇腾约有400万,同期,华为还和约9800家ISV伙伴打造了朝上2万个惩办决策,这些惩办决策庸碌应用在金融、运营商、动力、制造等界限。
但比起数目的增长,简直的攻坚源于底层技能的突破,以及新技能的到手贸易化,超节点即是这么的一个案例。
采访中,张爱军提到了一个细节,光模块是比拟“娇嫩”的系统,灰尘、温度变化齐会导致系统的闪断和不结识,而华为昇腾384的超节点光模块有快要几千颗,通过模块化的遐想和冗余技能等,收场了限制化的商用。
据了解,自旧年老成上市以来,昇腾已经限制部署了快要数百套,庸碌应用在互联网、金融、动力、制造等百行万企中。
昔时一年,华为还在业界开创了将超节点技能引入到通用狡计中,是大众第一家发布了通算超节点的厂商。华为还将构建超节点的灵衢左券统统绽放,以鼓动在中国酿成竣工的产业链方法。
今日受邀参加行为的工业和信息化部新闻宣传中心(东谈主民邮电报社)总裁剪王保平在会议初始时讲谈:“算力四肢数字经济的中枢坐褥力,已经成为像水电相通的基础资源。刻下算力需求从通用狡计向智能狡计蔓延,从中心向边际扩展,这既需要芯片、办事器、数据中心等硬件界限的执续突破,也需要架构软件、调遣平台等系统层面的协同编削。”
而华为,在这个历史进度中,作念出了遑急的鼓动。
面向明天,张爱军示意,就像在迁移互联网期间,华为给寰宇提供了最初的5G居品,面向明天AI期间,华为将通过“集群+超节点”的编削,为中国包括全寰宇提供算力新聘用。