WWW.YOUINFO.SITE
标签聚合 Rubin

/tag/Rubin

cnBeta全文版 · 2026-06-08 19:05:09+08:00 · tech

投行伯恩斯坦近日发布报告称,随着英伟达下一代Vera Rubin人工智能芯片在2027年进入大规模出货周期,高带宽内存(HBM4)价格将大幅上涨,推高整机柜系统成本。该机构预计,用于AI算力集群的英伟达Vera Rubin NVL72机柜整体价格或将达到约910万美元,其中仅存储与内存部分就可能占据约320万美元开支。这一最新估算明显高于此前摩根士丹利给出的约780万美元单柜价格预测。 早前,摩根士丹利在一份关于英伟达Rubin NVL72机柜的研究报告中指出,该系统的总价约为780万美元,其中机柜中搭载的外置存储与内存芯片成本约为200万美元,并据此测算相关内存支出同比大涨约435%。值得注意的是,摩根士丹利所引用的数据主要覆盖GPU之外的内存组件,并不充分反映Vera Rubin NVL72整套系统中高带宽内存的成本结构。 伯恩斯坦则认为,目前市场上对Vera Rubin相关内存价格的普遍预期已“过时”,尤其是在HBM价格假设方面存在较大偏差。该机构测算称,如果仍按每GB约16.6美元的HBM4价格来推算,NVL72机柜总价大致可以落在摩根士丹利此前所给出的区间附近。但伯恩斯坦强调,这一价格区间已无法反映市场最新走势,其对2027年的基准判断是HBM4价格将上升至每GB约53美元,涨幅超过三倍。 在此基础上,伯恩斯坦对NVL72机柜中存储与内存部分的成本进行了重新估算,认为相关支出将从摩根士丹利所假设的200万美元水平进一步抬升至约320万美元,从而把整机柜总价推高至约910万美元。该机构同时指出,此前部分测算中隐含的成本假设更多是基于历史价格数据,并未充分体现AI大规模建设周期下的最新供需情况。 伯恩斯坦还预计,英伟达在面对HBM4等关键元件成本上升时,倾向于将涨价压力直接转嫁给下游客户。在当前AI基础设施建设持续升温、高端内存供给偏紧的背景下,高带宽内存与存储组件正在成为继先进封装产能之后的又一关键约束因素。该行的判断显示,围绕Vera Rubin等新一代AI GPU平台的整机柜价格中,内存成本的权重将显著提高,并进一步拉升大规模AI集群的总体投入门槛。 查看评论

cnBeta全文版 · 2026-06-08 14:05:37+08:00 · tech

英伟达最新AI平台Vera Rubin进入量产阶段,SK海力士、三星和美光之间的竞争正从层数比拼转向技术攻坚,芯片内部热管理已成为HBM5时代的关键突破口。 AI硬件加速迭代,英伟达、AMD新一代AI服务器GPU单芯片功耗逼近1000W。HBM4已堆叠12至16层,HBM5将迈向20层堆叠。 堆叠层数越高,HBM内部热量积聚越严重,过热会触发芯片降频、算力缩水、整机稳定性下降。 英伟达和AMD等客户已明确要求HBM供应商加强散热管理。 SK海力士近期发布iHBM散热技术,将集成冷却元件内嵌到HBM中,在芯片内部开辟直通散热通道。 与传统设计相比,该技术可将热阻降低30%以上。SK海力士计划将iHBM应用于其HBM5及后续产品。 三星电子在Computex 2026上首次公开HBM5原型,并推出HPB散热方案,将导热块埋入多层DRAM裸片之间,相当于在堆叠芯片内部搭建多条独立散热烟囱。 该技术已在第七代HBM4E上完成验证,样品已于5月底首次交付客户。 三星表示,该技术可将热阻降低16%,HBM5预计在2028年左右实现量产。 美光则主攻低功耗HBM设计,并辅以硅通孔沟槽冷却技术。通过在AI加速器芯片的硅芯片内部蚀刻微型沟槽,使冷却液在其中循环流动,从而降低内部热积累。 业内人士指出,散热技术升级将带动高导热材料、先进封装制程需求爆发,重塑半导体供应链。低功耗和热管理技术将是未来HBM研发的核心方向。 查看评论

IT之家 · 2026-06-06 16:10:15+08:00 · tech

IT之家 6 月 6 日消息,半导体行业独立研究公司 SemiAnalysis 于 6 月 4 日发布一份晨间简报, 预估英伟达 Rubin NVL72 的 SOCAMM 容量从 55TB 降至 28TB,引发美光股价盘中跌超 10%。 该简报指出英伟达下一代 Vera Rubin NVL72 的 SOCAMM 内存配置或低于预期。 IT之家注:Rubin NVL72 每柜含 72 颗 Rubin 图形处理器和 36 颗 Vera 处理器,理论上 36 颗处理器可配约 54TB 的 LPDDR5X 内存。 SemiAnalysis 称,实际出货配置大概率不会满配 192GB 模块,多数系统会采用 96GB SOCAMM 模块。这样每颗处理器为 768GB,整柜约 28TB。 报告强调,此次缩减不会影响 HBM4 的需求。每颗 Rubin GPU 搭载 288GB HBM4,72 颗 GPU 合计约 20.7TB,这一数字保持不变。 市场随即反应激烈,美光科技的股价盘中暴跌超过 10%,从前一日创下的历史新高 1089 美元跌至 971 美元,市值在一天之内蒸发超过 1000 亿美元(现汇率约合 6792.76 亿元人民币)。 不过多家媒体指出,市场误读了“初始配置下调”,降配主因不是客户不需要内存,更主要的原因是 2026 年 LPDDR5X 供应极度紧张。 而且 SOCAMM(可插拔内存模块)不是焊死在主板上的内存。Rubin 平台采用 JEDEC 标准化 SOCAMM2 模块,可拆卸、可替换、可升级。客户可以先装 96GB,后续仍可换成 192GB 或 256GB 模块。

IT之家 · 2026-06-01 11:55:26+08:00 · tech

IT之家 6 月 1 日消息,在今日的 2026 台北国际电脑展主题演讲中,英伟达 CEO 黄仁勋宣布 Vera Rubin 全面投产。 Vera Rubin 为下一代 AI 工厂提供了 POD 规模的基础架构 —— 与上一代 Grace Blackwell 平台相比, 其大规模智能体吞吐量提高了 10 倍 。 凭借成熟的开源 MGX 设计,英伟达供应链生态系统的数百家合作伙伴正在 30 多个国家 / 地区的 350 多家工厂中加速 Vera Rubin 的生产, 黄仁勋表示供应链规模是 Grace Blackwell 的两倍 。 Vera Rubin 是英伟达迄今为止规模最大的 POD 级平台 —— 五个专用机架组成一个庞大的 AI 超级计算机,专为智能体工作负载而设计。 该平台将 NVIDIA Vera Rubin NVL72 系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX 存储和 NVIDIA Spectrum-6 SPX 以太网机架整合到一个完全集成的系统中。 IT之家从英伟达官方公告获悉, Vera Rubin 的产品预计将于今年秋季开始发货 。

IT之家 · 2026-06-01 08:58:43+08:00 · tech

IT之家 6 月 1 日消息,综合 Dell、CoreWeave 双方社媒动态, 戴尔近日向 CoreWeave 交付了全球首套可运行的 NVIDIA(英伟达)Vera Rubin NVL72 AI 超级计算机系统 ,该产品成功通过所有测试。 戴尔基于 Vera Rubin NVL72 打造了 PowerEdge XE9812 液冷服务器,集成 72 个 Rubin GPU、36 颗 Vera CPU,支持 T 级参数超大规模 AI 模型、MoE AI 模型训练,并可在大规模 AI 推理中实现更低的单位 Token(词元)成本。 参考英伟达此前公告,CoreWeave 这家代表性 "Neocloud" 企业 将从 2026H2 开始把基于 NVIDIA Rubin 的系统集成至其 AI 云平台中 。 相关阅读: 《 CoreWeave 率先全面提供英伟达 RTX PRO 6000 Blackwell 服务器版云实例 》 《 云服务新贵 CoreWeave 拔得头筹:率先部署英伟达 GB300 NVL72 系统 》

IT之家 · 2026-05-21 13:08:54+08:00 · tech

IT之家 5 月 21 日消息,英伟达美东时间周三美股盘后宣布,截至 2026 年 4 月 26 日的第一季度营收创下 816 亿美元的新纪录,较上一季度增长 20%,较去年同期增长 85%。 财报发布后,英伟达总裁兼 CEO 黄仁勋(Jensen Huang)和执行副总裁兼 CFO 科莉特 · 克雷斯(Colette Kress)等高管出席随后召开的财报电话会议,解读财报要点,并回答分析师提问。 科莉特 · 克雷斯确认, 英伟达下一代超级 AI 芯片 Vera Rubin 将于今年下半年推出 ,第三季度开始首批交付,第四季度上量速度将持续加快,已经有明确的需求计划和订单。 黄仁勋则表示,英伟达在推理领域的市场份额正在增长,而且增长速度非常快。原因在于,今年前沿模型公司的数量有所增加。“我想不出有任何一家前沿模型公司会从一开始不选择 Vera Rubin,而之前 Blackwell 的情况并非如此。因此, Vera Rubin 开局良好,它肯定会比 Grace Blackwell 更加成功 。” 据 Wccftech 此前报道,产业链消息人士透露,英伟达已经与 ODM 厂商敲定 Vera Rubin 平台的最终生产方案。 据报道,Vera Rubin 的上市计划将分为多个阶段稳步推进。试产预计在下个月(2026 年 6 月)启动,首批产品将于今年 7 月运往北美大型 AI 数据中心和云服务企业, 微软、谷歌、亚马逊、Meta 和甲骨文等客户预计将成为首批客户 。 同时,台积电已在今年早些时候,基于 3nm 制程工艺量产 Vera Rubin 芯片。富士康、广达、纬创资通等合作伙伴将在下半年启动全面量产,预计第三季度大规模出货。 业内人士预计,英伟达 Vera Rubin AI 服务器机柜的价值约为 1.8 亿美元(IT之家注:现汇率约合 12.26 亿元人民币),配备强大的软件生态系统。

cnBeta全文版 · 2026-05-21 13:06:23+08:00 · tech

英伟达近日发布 2027 财年第一季度财报,营收创下 816.15 亿美元的新高,同比大增 85%。其中,数据中心业务贡献了 752.46 亿美元收入,同比暴涨 92%,继续成为公司最核心的增长引擎;边缘计算业务收入则达到 63.69 亿美元,同比增长 29%。 在财报电话会上,英伟达重点强调了 Blackwell GB300 以及 NVL72 系统的强劲需求,称其在前沿大模型以及超大规模云厂商中“动能十足”。目前,全球范围内已经有“数十万颗” Blackwell GPU 部署落地,功率超过 10 兆瓦的数据中心数量在一年内几乎翻倍,已超过 80 个站点,成为公司历史上爬坡速度最快的产品之一。 随着 AI 算力紧缺,旧一代 GPU 也出现了“涨价潮”。英伟达管理层指出,被誉为“好酒效应”的现象正在上演:Hopper 架构 H100 租用价格今年以来上涨约 20%,而基于 Ampere 架构的 A100 云端价格也较去年同期上涨近 15%。在算力需求高企的背景下,云服务提供商正进一步向 AI 公司开放其旧一代硬件资源,以满足训练和推理的持续需求。 不过,Blackwell、Hopper 与 Ampere 虽然仍然炙手可热,市场目光已经开始转向下一代 Vera Rubin 平台。该平台属于英伟达所谓的“极致协同设计”生态的一部分,涵盖多种芯片与软件方案,被定位为面向“Agentic AI 工厂”的一站式基础设施平台。官方确认,Vera Rubin 已经进入量产阶段,预计 2026 年三季度开始向客户发出首批出货,四季度进入放量阶段,并在 2027 年上半年持续扩大交付规模。 英伟达 CEO 黄仁勋表示,公司“一年一代”的产品节奏仍在高速推进,且“几乎无人能及”。在 Vera Rubin 之后,英伟达还计划于 2027 年推出 Rubin Ultra,2028 年推出 Feynman,再次拉长 AI 基础设施产品路线图。与此同时,英伟达也在大规模量产 Vera CPU,并按计划部署到整机机柜方案中,首批 Vera CPU 已向 OpenAI、SpaceXAi、Oracle 与 Anthropic 等早期客户交付,用于新一代 Agentic AI 场景。 在业务结构上,推理已成为英伟达当前增长最迅猛的板块。黄仁勋表示,公司在推理市场的份额“正在快速提升”,并称 Vera Rubin 相比 Grace Blackwell 将取得“更大的成功”。在他看来,几乎所有前沿大模型公司都会在第一时间采用 Vera Rubin,而这一点在此前的 Blackwell 世代并未完全出现,由此也为新平台奠定了“开局即高点”的市场预期。 综合来看,英伟达正多线齐发:一方面,Blackwell 平台带动数据中心收入屡创新高,同时推高 Hopper 与 Ampere 等旧卡价格;另一方面,Vera Rubin 平台则将于 2026 年三季度率先落地,并在 2026 年四季度至 2027 年上半年进入加速放量阶段,为即将到来的 Agentic AI 工厂浪潮提供核心算力基础设施。在 AI 基础设施竞赛持续升温之际,英伟达通过高速产品迭代与完整生态布局,继续巩固其在全球 AI 算力市场中的主导地位。 查看评论

cnBeta全文版 · 2026-05-17 23:05:14+08:00 · tech

市场研究机构 Citrini Research 最新报告显示,到 2027 年,英伟达下一代 Rubin 人工智能平台单一平台的 LPDDR 内存需求,将超过苹果和三星两大智能手机巨头的合计用量,意味着服务器与 AI 领域对低功耗 DRAM 的争夺,将全面压过智能手机行业,甚至可能引发供应紧张与价格上涨等连锁反应。 报告指出,随着 Agentic AI(具备更强自主决策能力的 AI)等新型应用兴起,DRAM 在未来 AI 服务器中的核心地位将进一步巩固,服务器平台为满足不断扩大的模型规模,将持续堆高内存配置。 其中,以英伟达 Rubin 为代表的新一代平台,以及 AMD MI400 等面向 AI 的产品,所需的 LPDDR 容量被描述为“极为惊人”。 Citrini Research 的预测显示,英伟达 Rubin AI 平台在 2027 年预计将消耗超过 6000 万 GB 级别的 LPDDR 内存。 相比之下,在智能手机阵营中,苹果被认为仍将是当年最大的 LPDDR 采购方,其 iPhone 系列预计将消耗约 2966 万 GB 的 LPDDR DRAM,而三星则紧随其后,需求约为 2724 万 GB。 这意味着苹果与三星合计约 5720 万 GB 的 LPDDR 需求,仍略低于 Rubin 平台单独一家的消耗,后者高出约 6%。 从技术路线看,LPDDR 已成为 AI 服务器的“标配”,原因在于其高容量、封装紧凑以及功耗相对较低,适合大规模部署在高密度机架与模块化系统中。 当前业界的重心集中在 LPDDR5 与 LPDDR5X 标准上,多家存储厂商正针对新一代 AI 服务器场景加速推出大容量解决方案。 例如,美光已经推出容量高达 256 GB 的 LPDDR5X SOCAMM2 模组,定位于高性能 AI 与数据中心应用。 SK 海力士则为英伟达 Vera Rubin 平台大规模生产 192 GB 容量的 LPDDR5X SOCAMM2 模组,为 Rubin 以及相关 AI 架构提供高密度、低功耗的内存支撑。 这些产品共同指向一个趋势:AI 平台的单节点内存配置正快速抬升,远超传统服务器与消费终端设备。 在 AMD 阵营,面向 AI 的 Verano 系列 CPU 以及用于 Helios 机架的 MI455X 加速卡,同样支持 LPDDR5X 内存,为其 AI 负载提供更高的带宽与能效比。 与英伟达类似,这些平台的兴起进一步推高了对 LPDDR 的整体需求,加重了整个 DRAM 产业链的供应压力。 报告指出,三星、SK 海力士与美光等主要厂商已经在最新 LPDDR 技术上“全力押注”,持续扩产以应对下一轮 AI 生态的爆发性增长。 不过,从当前产能与建设节奏来看,现有工厂难以完全满足未来几年的爆发式需求,新建产线与新设施仍在推进中。 供给侧扩张与需求侧爆发之间的时间差,意味着在一段时期内,LPDDR 供应极有可能维持紧张状态,AI 平台与手机厂商之间的竞争将日趋激烈。 特别是在高端 LPDDR5X 段位,AI 服务器与旗舰智能手机的配置需求存在明显冲突。 对智能手机行业而言,AI 服务器对 LPDDR 的巨大吞吐有可能带来多重冲击,包括产品供应受限、成本上升、以及中高端机型内存配置策略的被动调整等。 报告认为,类似的供需失衡已在部分技术领域有所显现,例如价格波动与部分组件短缺,未来在 LPDDR 市场可能进一步放大。 随着 AI 厂商加速部署 Rubin、MI400 等新一代平台,智能手机厂商可能不得不在成本与配置之间做出更艰难的平衡。 总体来看,Rubin 等 AI 平台对 LPDDR 市场的“鲸吞式”需求,正在重塑 DRAM 产业的结构重心,从以智能手机为主,快速转向以 AI 服务器与数据中心为核心。 在这一新格局中,存储厂商通过扩产与技术升级争取话语权,AI 与手机厂商则在相同资源池中竞逐,未来几年的 LPDDR 供应形势与价格走势,很可能将由 AI 领域的扩张节奏所主导。 查看评论

IT之家 · 2026-05-16 14:36:29+08:00 · tech

IT之家 5 月 16 日消息,瑞银(UBS)昨日(5 月 15 日)发布最新研报,指出 英特尔有望借 EMIB-T(嵌入式多芯片互连桥)先进封装切入英伟达 Rubin Ultra 供应链。 IT之家注:EMIB-T 是英特尔的先进封装方案,在基板中嵌入硅桥实现芯片互连,相比台积电的 CoWoS,EMIB 不需要大面积硅中介层,成本更低。技术优势是适合异构集成,可封装不同制程的芯片在一起。 NVIDIA Rubin AI 平台示意图 该技术封装尺寸限制更少,更适合更大规模芯片设计,也能减少把多组件硬拼到一起带来的额外复杂度。对需要更高算力密度的 AI 芯片来说,这种路线具备明显吸引力。 瑞银判断,英伟达到 2027 年前后的毛利率,大体可维持在约 75% 区间。与此同时,利润空间会在一定程度上受到 Rubin 产品组合影响,尤其取决于 Rubin Ultra 是否会同时提供 2 芯片和 4 芯片两个版本。其中,4 芯片版被认为较可能采用英特尔 EMIB-T。 不过,这一判断仍属推测,不代表英伟达已经正式拍板。报道也引用其他分析称,EMIB-T 能否大规模导入,还要看基板产能与良率表现。此前市场已有观点指出,原材料与基板生产能力,可能决定该技术能否满足当代半导体制造对规模化的要求。

cnBeta全文版 · 2026-05-11 13:05:07+08:00 · tech

英伟达正在加速推进下一代AI旗舰平台Vera Rubin的上市进程,最新消息显示,该平台最早将于今年7月开始向北美主要云服务和AI客户发货,并在2026年下半年进入全面量产阶段。此前关于Vera Rubin在设计与规格上出现问题的传闻,如今基本被新的生产与出货时间表所否定。 几天前,业内曾流传关于Vera Rubin在设计与规格上可能出现调整甚至问题的消息,被形容为类似当年Blackwell GPU服务器在发布前遭遇的风波。不过,凭借与供应链伙伴在次世代AI机架与服务器交付方面积累的经验,英伟达再次展示了其快速解决量产前技术瑕疵的能力。来自台湾《经济日报》援引产业链人士的报道指出,英伟达已经与ODM合作伙伴敲定了Vera Rubin的最终量产版本,并排定了明确的导入节奏。 根据这一报道,英伟达将于今年6月启动Vera Rubin平台的试产,随后从7月开始,首批服务器将运往北美多个大型云服务提供商及AI数据中心客户。首批客户名单包括微软、Google、亚马逊、Meta以及甲骨文,英伟达很可能会在即将到来的Computex 2026主题演讲中,重点展示与这些云巨头围绕Vera Rubin展开的深度合作。报道同时提到,台积电已经在今年较早时间启用3nm制程,为Vera Rubin芯片展开量产,而富士康、广达、纬创等代工伙伴则将从今年下半年起全面铺开整机与机架的生产,并最快在2026年三季度实现大规模出货。 随着最终量产规格的尘埃落定,先前关于Vera Rubin平台可能进行设计或规格大幅修改的说法被认为“与事实不符,或基于已被后续修正的早期信息”。产业界预估,每一套Vera Rubin AI服务器机架的成本高达约1.8亿美元,而借助这一平台,英伟达在全球AI基础设施市场的潜在渗透规模有望触及1万亿美元级别。这不仅将显著放大利润空间,也将为包括存储与内存供应商在内的合作伙伴带来新一轮成长动能。 围绕Vera Rubin平台,芯片与内存生态正在同步升级:合作厂商计划为Rubin GPU导入新一代HBM4高带宽内存,同时在CPU侧则提供最高可达256GB容量的SOCAMM2 LPDDR5X解决方案,以满足大型模型训练与推理对带宽与容量日益严苛的需求。在硬件架构层面,Vera Rubin被描述为一个由七颗芯片协同构成的复杂平台,并配套强大的软件栈支撑,被认为在行业内暂时难逢对手。英伟达对外宣称,依托Vera Rubin,未来十年内有望实现算力产出提升至当前的四千万倍,而从早前的技术预览情况来看,业界也普遍预期这一平台将为AI算力带来新一轮跨越式跃升。 从时间表来看,Vera Rubin正在从传闻与不确定性中走出,转而进入实质性的试产与出货阶段。随着7月起首批机架落地北美云服务商数据中心,以及下半年台系代工全面量产,Vera Rubin将成为英伟达在下一阶段AI基础设施竞争中的核心砝码,也将对全球云计算与AI产业格局产生深远影响。 查看评论

IT之家 · 2026-05-11 10:06:41+08:00 · tech

IT之家 5 月 11 日消息,据科技媒体 Wccftech 今天报道,产业链消息人士透露,英伟达已经与 ODM 厂商敲定 Vera Rubin 平台的最终生产方案。 据报道,Vera Rubin 的上市计划将分为多个阶段稳步推进。试产预计在下个月启动, 首批产品将于今年 7 月运往北美大型 AI 数据中心和云服务企业 ,微软、谷歌、亚马逊、Meta 和甲骨文等客户预计将成为首批客户。 同时,台积电已在今年早些时候,基于 3nm 制程工艺量产 Vera Rubin 芯片。 富士康、广达、纬创资通等合作伙伴将在下半年启动全面量产 , 预计第三季度大规模出货 。 业内人士预计,英伟达 Vera Rubin AI 服务器机柜的价值约为 1.8 亿美元(IT之家注:现汇率约合 12.25 亿元人民币),配备强大的软件生态系统。

IT之家 · 2026-05-07 16:05:53+08:00 · tech

IT之家 5 月 7 日消息,AMD 在其当地时间 5 月 6 日的博客中对 Instinct MI400 系列显卡加速器中的 MI430X 分支进行了预览介绍。IT之家注意到,这款 GPU 已被多款超算宣布应用。 与专为大规模 AI 训推设计的 MI455X 不同, MI430X 兼顾 AI 与传统 HPC 工作负载 。而该区别也体现在 MI430X 对 FP64 这一高精度数据格式的原生支持上。 AMD 称 MI430X 的原生 FP64 算力预计将超过 200 TFLOPs 。MI430X 有望提供 NVIDIA(英伟达)Rubin 架构 6 倍以上的 FP64 算力,成为有史以来性能最高的 FP64 GPU。 AMD 表示,对于气候学、材料科学、核科学、流体力学等应用场景,计算精度非常重要。唯有 FP64 这样的高精度数据才能 为基于 AI 的科学探索提供“高保真”的基础 , 捕获底层科学的真实结构 。

linux.do · 2026-05-05 21:45:42+08:00 · tech

高端硬件还是要在自己手里才行,不能任由外国卡脖子,希望国产显卡努力吧。 原文(翻译版) 英伟达 CEO 黄仁勋明确表示,中国不应获得其"最新最强大"的 AI GPU 技术,特别是 Blackwell 和 Rubin 系列产品。据日经亚洲报道 ,黄仁勋称英伟达是"美国拥有第一、最多和最好 AI 技术的坚定支持者"。 这位英伟达掌门人在洛杉矶米尔肯研究所全球会议上发表了上述言论,与会者包括银行家、企业家和投资者。他指出美国 AI 加速器的全球影响力有助于增加税收,从而强化经济,进而支撑国家安全 。与此同时,黄仁勋强调中国不应获得"最新最强大"的 AI 加速器,例如当前一代 Blackwell 或下一代 Rubin。这正是美国保持前沿 AI 模型领先地位的重要方式。 去年 11 月,美国政府批准向中国获批客户销售英伟达 H200 处理器 ,条件是这些客户需向美国政府支付 25%的分成。该公司今年 2 月确认已收到来自中华人民共和国众多客户的订单。然而在最近的财报电话会议上,英伟达表示近期未向中国客户发运任何 H200 处理器。相比之下,同样获得销售许可的 AMD 则向中国客户出售了价值 3.9 亿美元的 Instinct MI308X 人工智能 GPU。 近期, 黄仁勋承认英伟达 AI 加速器在中国市场份额已降至零 ,这意味着该公司在 2026 年第一季度未向中国出货任何 H200 GPU。英伟达避免向中国出货 Hopper GPU 可能存在深层原因:Hopper 与 Blackwell 处理器均由台积电在同一晶圆厂的 N4/N5 制程产线生产,由于产能分配有限,英伟达更倾向于向美国客户销售更先进、更昂贵的 Blackwell 处理器,从而避免向美国政府支付 25%的抽成,而非向中国客户出售 Hopper GPU。 一旦英伟达开始使用台积电的 N3 制程技术提高下一代 Rubin GPU 的产量,这家总部位于台湾的晶圆代工厂将能分配更多 N4/N5 产能给 Hopper GPU。可以推测,英伟达可能恢复向中国出货 Hopper 加速器。 无论如何,今年早些时候黄仁勋曾表示中国客户将及时获得 Blackwell GPU,但未详细说明,这意味着当 Rubin GPU 全面上市时,部分精简版 Blackwell 可能会供应给中华人民共和国的客户 原文链接: Nvidia CEO Jensen Huang says China should not have Blackwell or Rubin AI GPUs — firmly states US should have 'the first, the most, and the best' when it comes to AI hardware | Tom's Hardware 1 个帖子 - 1 位参与者 阅读完整话题

www.ithome.com · 2026-04-28 17:58:21+08:00 · tech

IT之家 4 月 28 日消息,谷歌云服务部门 Google Cloud 在上周的 Google Cloud Next 大会上宣布推出由 NVIDIA(英伟达)Vera Rubin 机架级系统驱动的 A5X 裸金属实例。 IT之家注: 裸金属可理解为云上的物理服务器,资源独立,不存在虚拟化开销和性能损失。 A5X 将采用英伟达的 ConnectX-9 SuperNIC 以及谷歌最新的 Virgo Network 超大规模扩展型 AI 数据中心架构,单站点集群中可扩展至多达 8 万个 Rubin GPU,而 多站点集群中则可支持多达 96 万个 GPU ,助力客户运行超大规模的 AI 工作负载。 Google Cloud AI 和计算基础设施副总裁兼总经理 Mark Lohmeyer 表示: 在 Google Cloud,我们相信未来十年的 AI 将取决于客户在真正集成、AI 优化的基础设施堆栈上运行其要求高度严苛的工作负载能力。 通过将 Google Cloud 可扩展的基础设施和托管 AI 服务与 NVIDIA 先进的平台、系统和软件相结合,我们为客户提供了极大的灵活性,使其能够训练、调优和部署从前沿模型、开放模型到智能体和物理 AI 工作负载在内的各种场景,同时优化性能、成本和可持续性。

www.ithome.com · 2026-04-27 10:07:54+08:00 · tech

IT之家 4 月 27 日消息,台媒《经济日报》今日援引业界消息表示,DRAM 制造商南亚科技 (Nanya) 在台积电 (TSMC) 的支持协助下打入 NVIDIA(英伟达)Vera Rubin 平台的 LPDDR 内存供应链。 从 Vera Rubin 平台的设计规格来看, 南亚科技有望向英伟达供应与 Vera CPU 配套的 LPDDR5X SOCAMM2 内存模组 。 对于英伟达来说,在三大 DRAM 内存原厂外获得第四家供应商有利于稳定供应;而南亚科技则可扩大在高利润企业 / 数据中心 / 服务器 DRAM 领域的存在,迎来新的业绩增长点。 IT之家注意到,Vera Rubin 平台参考设计中一颗 Vera CPU 与 8 个 128-bit 的 SOCAMM2 相配对,总内存带宽达 1.2TB/s,这需要 9600MT/s 的高速 LPDDR5X;而南亚科技当前在官网公示的 LPDDR5X 至高仅有 7500MT/s。

plink.anyfeeder.com · 2026-04-22 12:36:35+08:00 · tech

英伟达下一代AI芯片Vera Rubin尚未正式发布,就已经被客户疯狂预定。 AI基础设施服务商Nscale最新宣布,将额外追加3万颗Rubin GPU,使得其为微软等客户部署的总量达到13万颗。 这13万颗芯片的具体构成是:Nscale此前已公布要在其数据中心部署10万颗Vera Rubin芯片,如今又新增3万颗,全部计划在2027年完成部署。 新增的3万颗将重点投向挪威纳尔维克园区,其余10万颗则分布在欧洲多地的Nscale站点,包括英国和挪威其他地区。 凭借这波扩容,Nscale与微软的合作进一步扩大,纳尔维克园区的AI芯片总算力容量将达到230兆瓦。该公司称这是挪威最大的陆上基础设施项目。 Nscale创始人兼CEO Josh Payne表示,各市场对先进AI基础设施的需求持续加速,公司重点是在合适地点以真实规模上线最新技术,纳尔维克部署正是客户强劲需求的体现。 英伟达Vera Rubin平台瞄准的是AI推理场景,尤其是正在兴起的智能体AI(Agentic AI)。 英伟达超大规模与高性能计算副总裁Ian Buck指出,部署智能体型和实体型AI需要新一代超算基础设施,既要规模大又要效率高。 Nscale部署的Vera Rubin NVL72平台将为欧洲开发者提供关键AI算力。 Vera Rubin NVL72系统每套集成72颗Rubin GPU和Vera CPU,采用机架级AI数据中心架构。 Nscale是首批宣布部署该平台的全球供应商之一,同时融合了英伟达Grace Blackwell和Vera Rubin两大先进架构。 尽管Rubin芯片尚未正式发布,但13万颗的超级订单已经证明,英伟达下一代AI芯片的抢手程度丝毫不减。 查看评论