发布日期:2026-05-05 05:27 点击次数:181

开始:半导体行业不雅察
正如黄仁勋 (Jensen Huang) 可爱说的那样,摩尔定律已死——而在本月的 Nvidia GTC 大会上,这位 GPU 大佬的首席履行官意外中夸耀了计划缩放定律的树大根深。
黄仁勋站在台上,不仅展示了这家芯片想象公司的下一代Blackwell Ultra处理器,还夸耀了相关其将来两代加快计划平台的大皆细节,其中包括一个包含576 个 GPU 的600kW 机架级系统。咱们还了解到,行将于 2028 年问世的 GPU 系列将以Richard Feynman的名字定名。你深信在开打趣!
芯片制造商往往夸耀其发展道路图并不陌生,但咱们通常不会一次性赢得这样多信息。这是因为 Nvidia 堕入了窘境。它际遇的抨击不单一个,而是好几个。更糟糕的是,除了插足资金措置问题外,这些抨击基本上皆不受 Nvidia 的限度。
这些挑战关于那些关注的东说念主来说并不虞外。散播式计划一直是瓶颈打地鼠游戏,而东说念主工智能可能只是终极的打地鼠游戏。
一切皆从这里脱手
其中第一个亦然最昭彰的挑战是围绕计划扩展(scaling compute)。
比年来,工艺时间的卓著仍是放缓。自然仍有一些可以改变的成分,但改变的难度却呈指数级增长。
面对这些末端,Nvidia 的策略很浅易:尽可能扩大每个计划节点的硅片数目。如今,Nvidia 最密集的系统(或真确的机架)使用其高速 1.8TB/s NVLink 结构将 72 个 GPU 整合到一个计划域中。然后使用 InfiniBand 或以太网将八个或更多机架流畅在一说念,以达成所需的计划和内存容量。
在 GTC 上,Nvidia夸耀了其诡计将 GPU 数目普及至每机架 144 个,最终达到 576 个。不外,范围扩大并不仅限于机架;芯片封装也相似如斯。
一年前 Nvidia推出Blackwell 加快器时,这少许就变得不言而喻。这些芯片的性能比 Hopper 高出 5 倍,这听起来很棒,但你果断到它需要两倍的芯片数目、新的 4 位数据类型和 500 瓦以上的功率智力达成。
事实是,以 FP16 为模范,Nvidia 顶级规格的 Blackwell 芯片仅比 GH100 快 1.25 倍,密度为 1,250 teraFLOPS,而密度为 989 —— 只是适值有两个良友。
到 2027 年,Nvidia 首席履行官黄仁勋预测,跟着 Rubin Ultra NVL576 的初次亮相,机架功率将飙升至 600kW
咱们尚不澄澈 Nvidia 诡计在其下一代芯片中使用哪种工艺时间,但咱们知说念 Rubin Ultra 将延续这一趋势,从两个光罩末端芯片增多到四个。即使完毕提高了约 20%,黄仁勋预测台积电 2nm 仍将是一个热点时间。
这不单是是计划,还有内存。眼尖的读者可能仍是瞩目到 Rubin 和 Rubin Ultra 之间的容量和带宽有了格外大的普及——每个封装的288GB 对 1TB。其中大致一半来自更快、容量更大的内存模块,但另一半来自内存专用硅片数目翻倍,从 Blackwell 和 Rubin 上的 8 个模块增多到 Rubin Ultra 上的 16 个。
更高的容量意味着 Nvidia 可以将更多的模子参数(FP4 时约 2 万亿)塞进一个封装中,或者每个“GPU”中 5000 亿个,因为他们当今计划的是单个芯片而不是插槽。HBM4e 还有望灵验地将内存带宽提高一倍,卓著 HBM3e。带宽预测将从咫尺每个 Blackwell 芯片的约 4TB/s 跃升至 Rubin Ultra 的约 8TB/s。
晦气的是,如果工艺时间莫得紧要冲破,将来 Nvidia GPU 封装很可能会占用更多的硅片。
好音尘是,工艺改进并不是扩展计划或内存的独一情势。一般来说,从 16 位精度降至 8 位精度可以灵验地使迷糊量翻倍,同期还可以将给定模子的内存需求减半。问题是 Nvidia 仍是莫得裕如的位数可以镌汰来提高性能了。从 Hopper 到 Blackwell,Nvidia 镌汰了 4 位,使硅片增多了一倍,并宣称浮点性能提高了 5 倍。
但在四位精度以下,LLM 推答理变得相称鄙俚,困惑度分数会速即上升。话虽如斯,围绕超低精度量化,咫尺有一些意旨的究诘正在进行中,精度低至 1.58 位,同期保抓准确性。
这并不虞味着镌汰精度并不是提高 FLOPS 的独一情势。您还可以将较少的芯单方面积分派给 AI 使命负载不需要的更高精度数据类型。
咱们在 Blackwell Ultra 上看到了这少许。Nvidia 加快计划业务部副总裁 Ian Buck 在一次采访中夸耀,他们本体上收缩了芯片的双精度 (FP64) 张量中枢肠能,以沟通 50% 以上的 4 位 FLOPS。
这是否标明 FP64 行将被 Nvidia 淘汰还有待不雅察,但如果您简直热心双精度运算,AMD 的 GPU 和 APU 应该位于您的首选名单之首。
不管何如,Nvidia 的前进说念路是明确的:从当今脱手,其计划平台只会变得更大、更密集、更热、更耗电。正如上周在新闻发布会上不吃热量的黄仁勋所说,机架的本体极限是你八成为其提供若干电量。
“当今一个数据中心的功耗是 250 兆瓦。这差未几等于每个机架的功耗末端。我觉得剩下的只是细节问题,”黄仁勋说说念。“如果你说一个数据中心的功耗是 1 千兆瓦,那么我会说 1 千兆瓦/机架听起来是个可以的末端。”
无法走避电力问题
自然,600kW 机架关于数据中心运营商来说是一个极其令东说念主头痛的问题。
需要明确的是,冷却兆瓦级超密集计划并不是一个新问题。Cray、Eviden 和联念念的东说念主们多年来一直在措置这个问题。变化的是,咱们驳倒的不是每幼年数几个极品计划集群。咱们驳倒的是数十个集群,其中一些集群相称大,如果将 200,000 个 Hopper GPU 与 Linpack 系结在一说念可以赢利的话,它们足以取代 Top500 中最高大的超等集群。
在这种范围下,高度专科化、小容量的热治理和电力运输系统压根无法自负需求。晦气的是,数据中心供应商——你知说念那些销售那些让你的数百万好意思元的 NVL72 机架平方使命所需的不那么性感的碎裂东西的东说念主——当今才赶上需求。
咱们怀疑这等于为什么到咫尺为止晓示的 Blackwell 部署中有好多皆是针对风冷 HGX B200,而不是黄一直大力宣传的 NVL72。这些八 GPU HGX 系统可以部署在许多现存的 H100 环境中。Nvidia 多年来一直在出产 30-40kW 机架,因此跃升至 60kW 并不是什么难事,事实上,每个机架减少到两到三台就业器仍然是一种聘任。
NVL72 是一种机架式想象,其灵感主要来自超大范围计划征战,配有直流母线、电源滑轨和前端荟萃。在 120kW 的液冷计划下,在现存步调中部署卓著几个这样的征战很快就会出现问题。而一朝 Nvidia 的 600kW 巨型机架于 2027 年底初次亮相,这只会变得愈加费劲。
这等于黄仁勋不休驳倒的“东说念主工智能工场”发达作用的场合——与施耐德电气等相助伙伴共同想象的专用数据中心,以自负东说念主工智能的电力和散热需求。
令东说念主惊诧的是,在详备先容了将来三年的 GPU 道路图一周后,施耐德晓示在好意思国进行 7 亿好意思元的推广,以提高救助 GPU 所需的通盘电源和冷却套件的产量。
自然,领有为这些超密集系统供电和冷却所需的基础步调并不是独一的问题。最初,为数据中心供电也相似是个问题,而这在很猛进程上不受 Nvidia 的限度。
每当 Meta、甲骨文、微软或其他任何公司晓示另一个 AI 比特仓库时,通常皆会有一份丰厚的电力购买公约。Meta 在河口出生的大型 DC与一座 2.2GW 的自然气发电厂同期晓示——这些可抓续性和碳中庸得意就到此为止了。
尽管咱们但愿看到核能的致密,但即使最乐不雅的预测也觉得微型模块化反映堆将在 2030 年代支配部署,因此咱们很难肃穆对待微型模块化反映堆。
云厂商的决定,带来压力
关于黄仁勋和英伟达来说,他们还在碰到的一个问题是:云厂商似乎正在放缓他们的数据中心诞生次第。
投资银行 TD Cowen 的最新阐昭彰示,微软仍是毁掉了在好意思国和欧洲租借价值 2 千兆瓦数据中心容量的谈判,而且仍是推迟和取消了其他数据中心的租借。该银行的分析师觉得,微软取消租约“主若是由于其决定不救助增量式敞开东说念主工智能查考使命量”。就在统一个月前,统一分析师夸耀微软已拒绝了好意思国数百兆瓦数据中心容量的租约。
关于某些东说念主来说,这些取消意味着东说念主工智能飞腾行将落空。
但是,咱们觉得微软可能撤退其数据中心租借的原因有一个更浅易的讲明:许多数据中心无法自负高端东说念主工智能硬件产生的电力和冷却需求。
Nvidia 的大范围 NVL72机架级系统得意,推理使命负载的性能将达到其 Hopper GPU 的 30 倍或更高,查考性能将达到其 Hopper GPU 的 4 倍。这种性能是以更密集的机架、更高的功耗和更多的废热产生为代价的。装配 Nvidia 最新家具的机架额定功率为 120kW,是典型 Hopper 机架的三倍。液体冷却不再是一种聘任,而是一种不可幸免的条目。
正如 TD Cowen 所指出的,超大范围企业和云提供商必须再行想象他们的数据中心,以顺应超密集、耗电的征战——而这样作念绝非易事。
因此,微软签署的数据中心租约并不成处理 Nvidia 的最新套件(以及接下来的套件)——不管后者是作念什么的——皆是短视的。
Omdia 首席分析师 Alan Howard 向The Register暗示,数据中心容量操办“是一个相称辣手的游戏,最不但愿出现的情况是需求卓著容量。与履行比拟,获取地盘和确保电力的通盘这个词进程本钱较低。”
如果微软诡计租借的数据中心或主机托管步调无法自负这些更密集系统的需求,那么不难理会为什么这家软件巨头会毁掉并专注于诞生专用步调或调动到更适合的地点。
微软仍是暗示信托需要全新的数据中心想象,以致在 2024 年详备制定了此类步调的诡计。
但是,TD Cowen 指出,让新建数据中心的容量插足使用需要时候。关节部件和动力供应的枯竭也对这一情况不利。Omdia 的 Howard 暗示,咫尺从新脱手构建一个数据中心大致需要 24 个月,并指出 xAI 在田纳西州的 Colossus 集群是在 10 个月内建成的。
TD Cowen 宣称,微软已指引其数据中心相助伙伴脱手调动现存步调以救助液体冷却。而且,咱们瞩目到,可以使用过说念内冷却剂储存器、分派单位和液体-空气热交换器来救助现存征战大厅中的液体冷却系统。
事实上,该银行的分析标明,跟着东说念主工智能使命负载从查考转向推理,调动可能比新租约更能体现增长。
该文献指出:“咱们越来越信托,推理需求的驱动方针将是超大范围调动的速率,而不是主要阛阓中第三方租借在现存可用区域内增量子部署的速率。”
不外,由于 Nvidia 仍是在操办 600kW 机架,调动后是否能自负用户的需求还有待不雅察。
除了改创新步调除外,值得瞩目的是,微软仍是领有大皆 Hopper GPU,其中许多皆用于运行 OpenAI 的查考使命负载。
如果微软照实像 TD Cowen 所宣称的那样减少了对 OpenAI 的查考使命,那么雷德蒙德可以将计划才略调理为我方的推理使命负载,或将其出租给客户。
微软发言东说念主在声明中暗示,该公司仍得意在 2025 财年在基础步调上插足 800 亿好意思元。
“收获于咱们迄今为止所作念的大皆投资,咱们实足有才略自负现时和不休增长的客户需求。仅旧年一年,咱们增多的产能就卓著了历史上任何一年。自然咱们可能会在某些鸿沟政策性地调整基础步调,但咱们将赓续在通盘地区保抓矫健增长。这使咱们八成投资和分派资源到将来的增长鸿沟,”该发言东说念主暗示。
陪同领头羊
需要明确的是,这些抨击并非 Nvidia 独到。AMD、英特尔以及通盘其他争夺 Nvidia 阛阓份额的云提供商和芯片想象师不久后必定会际遇相似的挑战。Nvidia 适值是第一个际遇这些挑战的公司之一。
自然这照实有其瑕玷,但它也使 Nvidia 处于一个寥落的地位,可以影响将来数据中心电源和热想象的标的。
正如咱们之前提到的,黄仁勋之是以高傲夸耀其下一代三代 GPU 时间并预报其第四代时间,是为了确保其基础步调相助伙伴八成在这些时间最终问世时为其提供救助。
黄仁勋暗示:“我之是以向全宇宙公布 Nvidia 将来三至四年的发展道路图,是为了让其他东说念主皆可以进行操办。”
另一方面,这些悉力也为竞争芯片制造商扫清了说念路。如果 Nvidia 想象出 120kW 或当今的 600kW,机架和主机托管提供商以及云运营商高傲救助这少许,那么 AMD 或英特尔当今就可以将相似多的计划才略装入他们我方的机架级平台,而无须惦念客户会把它们放在那儿。
写在临了
关于英伟达来说,还有一个不笃定成分,那等于他们在中国的业务。
在曩昔几年,拜登发布了多项禁令,抨击英伟达向中国出售伊始进的芯片。当今,英伟达可以销售到国内的数据中心包括 A100 和 H100功能收缩版块的A800 和 H800 芯片,以及其后的功能更高大的H20。其中,H20更是成为当今中国最为热销的GPU。因为自然H20 的中枢数目减少,性能较低,但仍八成提供 AI 功能。以致连谷歌和 Meta 等大公司皆在使用这种GPU。
把柄 Nvidia 的10-K 表,中国大陆和香港是该芯片制造商的第四大阛阓,占其 2025 财年收入的约 13%(即 171 亿好意思元)。
但是,据《金融时报》报说念,中国监管机构将出台先进芯片的能效规则。这些规则将退却中国客户在诞生或扩建数据中心时使用 Nvidia 的 H20 芯片。《金融时报》称,自然新规尚未全面实施,但监管机构正在规劝中国科技巨头订购 H20。
据英国《金融时报》报说念,英伟达正在寻求与中国监管机构进行谈判,并计议进行时间变革以自负规则。但是,这些变化可能会收缩芯片的性能。这就让英伟达濒临销售额被华为等中国国内竞争敌手抢走的风险。
Nvidia 在给英国《金融时报》的一份声明中暗示:“咱们的家具在咱们就业的每个阛阓皆具有极佳的能效和价值。跟着时间的快速发展,出口管制政接应该进行调整,以允许好意思国公司提供尽可能节能的家具,同期仍能达成政府的国度安全成见。”
END]article_adlist-->👇半导体极品公众号推选👇]article_adlist-->▲点击上方柬帖即可关注专注半导体鸿沟更多原创内容
]article_adlist-->▲点击上方柬帖即可关注关注内行半导体产业动向与趋势
*免责声明:本文由作家原创。著作内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或救助,如果有任何异议,接待猜想半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第4079期内容,接待关注。
推选阅读
★一颗改变了宇宙的芯片
★好意思国商务部长:华为的芯片没那么先进
★“ASML新光刻机,太贵了!”
★悄然崛起的英伟达新敌手
★芯片暴跌,全怪特朗普
★替代EUV光刻,新决策公布!
★半导体征战巨头,工资暴涨40%
★外媒:好意思国将建议退却中国制造的汽车软件和硬件



及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”共享给小伙伴哦
海量资讯、精确解读,尽在新浪财经APP
包袱剪辑:王若云 体育游戏app平台
上一篇:体育游戏app平台生东谈主勿近但忍不住思勾通-开云官网切尔西赞助商(2025已更新(最新/官方/入口)
下一篇:开yun体育网 “中国在半固态电板规模已处于民众逾越地位-开云官网切尔西赞助商(2025已更新(最新/官方/入口)
Powered by 开云官网切尔西赞助商(2025已更新(最新/官方/入口) @2013-2022 RSS地图 HTML地图