先免费开个 Pro 额度玩了后选择 overages 一路猛干! 8 个帖子 - 7 位参与者 阅读完整话题
在AMD与英伟达围绕数据中心市场展开的新一轮竞争中,双方开始通过性能预估和早期测试互相“放话”,为即将到来的服务器芯片更新节点造势。 英伟达此前通过受其严格控制的基准测试结果,宣称其Vera服务器处理器在多项负载中领先现有的AMD Epyc产品,而AMD最新给出的内部测算则显示,其下一代“Venice”平台有望在机架级性能上大幅超越Vera。 根据AMD近日发布的性能预估文档,这家芯片厂商认为即将推出的下一代服务器CPU平台将在整体性能指标上“显著超越”英伟达的最新方案。 这些估算直接以此前有利于英伟达Vera的第三方基准数据为参考基础,试图在同一套测试方法和假设条件之下,给出Epyc Venice的相对优势。 AMD的下一代数据中心CPU平台Epyc Venice近期已进入量产阶段,计划在今年晚些时候正式发布。 Venice基于Zen 6架构,单颗处理器最多可提供256个核心和512个线程,同时将制造工艺从现有Epyc Turin所采用的台积电4nm直接跃迁至2nm节点,中间跳过了3nm工艺。 AMD方面预计,相比Turin,Venice在整体性能与能效上可带来约70%的提升,并实现约30%的线程密度增长。 在对比英伟达平台时,AMD引用此前在英伟达总部、在一系列限制条件下完成的Vera基准测试结果。 Vera是一款基于Arm架构的服务器SoC,搭载88个核心和176个线程,Phoronix在报道中将其称为目前测试过的“最强Arm处理器”,并指出其在大多数工作负载下优于英特尔Xeon和现有AMD Epyc产品,不过这批测试经过英伟达审批,对测试环境和配置有较严格控制。 在此基础上,AMD按照统一的假设进行机架级推算,包括对比单CPU核心数量、节点功耗、每机架可部署的节点数量以及100千瓦机架功率预算等因素。 在该模型下,AMD认为Epyc Venice的每机架性能可以达到Vera的3.3倍;同时,现有的192核Epyc 9965 Turin以及128核英特尔Xeon 6980P GNR-AP,在相同条件下也被推算为可分别达到Vera约2.37倍和1.46倍的输出能力。 除了机架级吞吐量,AMD还把矛头指向了每核心性能,称在同样基准体系下,其64核Venice处理器即可在每核心性能上领先Vera约27%,而96核版本则可实现约11%的优势。 由于两家产品都被定位为面向AI工作负载的服务器平台,AMD认为,在每核心性能和核心数量同时抬升的前提下,Venice在面向“智能体式”(agentic)AI部署场景时,有望在同一机架功耗约束内提供更具吸引力的算力密度。 当然,在独立测试机构拿到量产芯片并完成公开对比之前,这些差距仍然停留在厂商给出的理论预估层面。 在为Venice预热的同时,AMD也开始为下一代架构“埋伏笔”。 按照其路线图,“Verano”将是AMD首款专为AI基础设施设计的CPU产品,并将率先采用Zen 7架构。 供应链消息指出,Zen 7有望导入台积电A14工艺节点,这一约1.4nm级别的制程被视为AMD迈入“埃米级时代”的关键一步,有望在2nm基础上继续带来性能和能效的进一步提升,不过AMD方面目前尚未对这些细节给出官方确认。 查看评论
起因很简单,每次开完会,总会积累大量音频内容,但真正回头查找信息的时候非常困难。传统转录工具只能生成长篇文本,后续检索和利用效率并不高。 Memovera 可以帮助你: 上传会议录音、播客、访谈等音频文件 自动生成高准确率转录文本 AI 自动提炼摘要、行动项和关键结论 支持转录内容导出 基于所有转录内容进行 AI 问答,快速找到历史会议中的信息 https://www.memovera.io/
起因很简单,每次开完会,总会积累大量音频内容,但真正回头查找信息的时候非常困难。传统转录工具只能生成长篇文本,后续检索和利用效率并不高。 Memovera 可以帮助你: 上传会议录音、播客、访谈等音频文件 自动生成高准确率转录文本 AI 自动提炼摘要、行动项和关键结论 支持转录内容导出 基于所有转录内容进行 AI 问答,快速找到历史会议中的信息 https://www.memovera.io/
投行伯恩斯坦近日发布报告称,随着英伟达下一代Vera Rubin人工智能芯片在2027年进入大规模出货周期,高带宽内存(HBM4)价格将大幅上涨,推高整机柜系统成本。该机构预计,用于AI算力集群的英伟达Vera Rubin NVL72机柜整体价格或将达到约910万美元,其中仅存储与内存部分就可能占据约320万美元开支。这一最新估算明显高于此前摩根士丹利给出的约780万美元单柜价格预测。 早前,摩根士丹利在一份关于英伟达Rubin NVL72机柜的研究报告中指出,该系统的总价约为780万美元,其中机柜中搭载的外置存储与内存芯片成本约为200万美元,并据此测算相关内存支出同比大涨约435%。值得注意的是,摩根士丹利所引用的数据主要覆盖GPU之外的内存组件,并不充分反映Vera Rubin NVL72整套系统中高带宽内存的成本结构。 伯恩斯坦则认为,目前市场上对Vera Rubin相关内存价格的普遍预期已“过时”,尤其是在HBM价格假设方面存在较大偏差。该机构测算称,如果仍按每GB约16.6美元的HBM4价格来推算,NVL72机柜总价大致可以落在摩根士丹利此前所给出的区间附近。但伯恩斯坦强调,这一价格区间已无法反映市场最新走势,其对2027年的基准判断是HBM4价格将上升至每GB约53美元,涨幅超过三倍。 在此基础上,伯恩斯坦对NVL72机柜中存储与内存部分的成本进行了重新估算,认为相关支出将从摩根士丹利所假设的200万美元水平进一步抬升至约320万美元,从而把整机柜总价推高至约910万美元。该机构同时指出,此前部分测算中隐含的成本假设更多是基于历史价格数据,并未充分体现AI大规模建设周期下的最新供需情况。 伯恩斯坦还预计,英伟达在面对HBM4等关键元件成本上升时,倾向于将涨价压力直接转嫁给下游客户。在当前AI基础设施建设持续升温、高端内存供给偏紧的背景下,高带宽内存与存储组件正在成为继先进封装产能之后的又一关键约束因素。该行的判断显示,围绕Vera Rubin等新一代AI GPU平台的整机柜价格中,内存成本的权重将显著提高,并进一步拉升大规模AI集群的总体投入门槛。 查看评论
英伟达最新AI平台Vera Rubin进入量产阶段,SK海力士、三星和美光之间的竞争正从层数比拼转向技术攻坚,芯片内部热管理已成为HBM5时代的关键突破口。 AI硬件加速迭代,英伟达、AMD新一代AI服务器GPU单芯片功耗逼近1000W。HBM4已堆叠12至16层,HBM5将迈向20层堆叠。 堆叠层数越高,HBM内部热量积聚越严重,过热会触发芯片降频、算力缩水、整机稳定性下降。 英伟达和AMD等客户已明确要求HBM供应商加强散热管理。 SK海力士近期发布iHBM散热技术,将集成冷却元件内嵌到HBM中,在芯片内部开辟直通散热通道。 与传统设计相比,该技术可将热阻降低30%以上。SK海力士计划将iHBM应用于其HBM5及后续产品。 三星电子在Computex 2026上首次公开HBM5原型,并推出HPB散热方案,将导热块埋入多层DRAM裸片之间,相当于在堆叠芯片内部搭建多条独立散热烟囱。 该技术已在第七代HBM4E上完成验证,样品已于5月底首次交付客户。 三星表示,该技术可将热阻降低16%,HBM5预计在2028年左右实现量产。 美光则主攻低功耗HBM设计,并辅以硅通孔沟槽冷却技术。通过在AI加速器芯片的硅芯片内部蚀刻微型沟槽,使冷却液在其中循环流动,从而降低内部热积累。 业内人士指出,散热技术升级将带动高导热材料、先进封装制程需求爆发,重塑半导体供应链。低功耗和热管理技术将是未来HBM研发的核心方向。 查看评论
IT之家 6 月 7 日消息,据彭博社今日报道,英伟达公司首席执行官黄仁勋表示,随着两家公司准备在未来一年开展更多业务, 其全新的 Vera CPU 将使用 SK 海力士公司的内存芯片 。 黄仁勋周日在首尔一家餐厅外告诉记者,“今年我们与 SK 海力士度过了非常重大的一年,我们正在为非常、非常重大的下半年和明年做准备。” 当晚,黄仁勋在该餐厅与 SK 集团董事长崔泰源(Chey Tae-won)、SK 海力士 CEO 郭鲁正(Kwak Noh-Jung)以及 SK 电讯公司的高管们共进了晚餐。黄仁勋表示,“我们推出了 Vera CPU,这是一款革命性的 CPU, 它也将使用 SK 海力士的 DRAM 。” 据IT之家此前报道,黄仁勋在本月举行的 2026 台北国际电脑展主题演讲上, 正式宣布推出 Vera 处理器 ,这是一款专为 AI 智能体打造的 CPU,可驱动各行各业的多样化工作负载。
日前在台北Computex大会的英伟达媒体见面会上,公司CEO黄仁勋表示,目前芯片供应方面确实存在一定限制,这仍是一个令人担忧的问题。“我们已经为所有这些系统的强劲增长确保了供应。”他强调,“我们有足够的供应来实现非常强劲的增长,但确实仍存在供应限制。” 谈及未来增长动力,黄仁勋指出,公司的Vera CPU将比其GPU更受欢迎,因为Vera在处理信息方面发挥着至关重要的作用。“Vera CPU将成为我们新的主要增长动力。” Vera搭载88颗英伟达自研的Olympus核心,内存带宽达到1.2TB/s,单核性能较前代提升50%,适配编排、强化学习、长上下文管理等复杂场景。 Vera可搭配Rubin GPU、BlueField 4 DPU等组件协同运作,依托统一内存架构,数据供给能效较传统设施提升2倍,助力大规模智能体AI高效运行。 随着能自主执行任务的代理式AI(Agentic AI)快速发展,市场需求正从单一GPU扩展至CPU与GPU协同的完整算力体系。Vera的正式交付,不仅为英伟达开辟了全新的增长曲线,也将加速全球AI基础设施向智能体时代的全面转型。 查看评论
IT之家 6 月 2 日消息,据台媒 TVBS 今天报道,英伟达创始人兼 CEO 黄仁勋在台北电脑展 2026 期间表示, 未 来 Vera CPU 甚至会比自家 GPU 产品更受欢迎 。 黄仁勋指出,英伟达出货量最大的 AI 机器中已经全面内置 Vera CPU,这代表它一旦上市,就拥有 AI 软件的优化与认证,能够在全球软件生态体系中占据绝对领先地位。未来的数据中心只要使用英伟达 GPU,自然就会搭配 Vera CPU。 其次,Vera CPU 除了专攻 AI 智能体,也在数据处理工作中表现优异, 能效相比现今 CPU 高 3-6 倍 ,这种成绩也让 AMD 等厂商面临极大压力。 不过黄仁勋也强调,Vera CPU 并不是为了与传统大厂抢夺市场份额,而是开辟全新 AI 智能体市场。他对此解释道:“当我们研发它时,这片市场的规模是 0。我们是为了创造全新未来市场而打造它”。 据IT之家此前报道 ,英伟达 Vera 是一款专为 AI 智能体打造的 CPU,速度比 x86 处理器快 1.8 倍,可驱动各行各业的多样化工作负载。
IT之家 6 月 1 日消息,在今日的 2026 台北国际电脑展主题演讲中,英伟达 CEO 黄仁勋宣布正式推出 Vera 处理器 。 英伟达 Vera 是一款专为 AI 智能体打造的 CPU ,速度比 x86 处理器快 1.8 倍,可驱动各行各业的多样化工作负载,Vera 现已全面投产。 Vera 以 Grace CPU 的成功为基础(迄今为止,Grace CPU 的出货量已接近 250 万片),计划采用 Vera CPU 的客户包括金融巨头 纽约证券交易所、Anthropic、OpenAI 和 SpaceXAI ,以及字节跳动、CoreWeave、Lambda、Nebius、Nscale 和 Oracle 云基础设施(OCI)。 Vera 也正被集成到戴尔科技、HPE、联想和超微等系统制造商以及系统集成商的人工智能基础设施中。 Vera 旨在处理更多指令、预测应用行为,并在大量并发环境、查询和数据处理任务之间传输数据 —— 它配备 88 个 Olympus CPU 核心、空间多线程技术和 LPDDR5X 内存子系统,可提供高达 1.2TB/s 的带宽。 Vera 通过第二代 NVIDIA NVLink-C2C 互连技术, 作为 Vera Rubin 平台的主机 CPU ,可在 CPU 和 GPU 之间提供高达 1.8TB/s 的一致性带宽。 IT之家从英伟达公告获悉, 从今年秋季开始 ,Vera 系统将通过系统构建商和云合作伙伴提供。
IT之家 6 月 1 日消息,在今日的 2026 台北国际电脑展主题演讲中,英伟达 CEO 黄仁勋宣布 Vera Rubin 全面投产。 Vera Rubin 为下一代 AI 工厂提供了 POD 规模的基础架构 —— 与上一代 Grace Blackwell 平台相比, 其大规模智能体吞吐量提高了 10 倍 。 凭借成熟的开源 MGX 设计,英伟达供应链生态系统的数百家合作伙伴正在 30 多个国家 / 地区的 350 多家工厂中加速 Vera Rubin 的生产, 黄仁勋表示供应链规模是 Grace Blackwell 的两倍 。 Vera Rubin 是英伟达迄今为止规模最大的 POD 级平台 —— 五个专用机架组成一个庞大的 AI 超级计算机,专为智能体工作负载而设计。 该平台将 NVIDIA Vera Rubin NVL72 系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX 存储和 NVIDIA Spectrum-6 SPX 以太网机架整合到一个完全集成的系统中。 IT之家从英伟达官方公告获悉, Vera Rubin 的产品预计将于今年秋季开始发货 。
IT之家 6 月 1 日消息,综合 Dell、CoreWeave 双方社媒动态, 戴尔近日向 CoreWeave 交付了全球首套可运行的 NVIDIA(英伟达)Vera Rubin NVL72 AI 超级计算机系统 ,该产品成功通过所有测试。 戴尔基于 Vera Rubin NVL72 打造了 PowerEdge XE9812 液冷服务器,集成 72 个 Rubin GPU、36 颗 Vera CPU,支持 T 级参数超大规模 AI 模型、MoE AI 模型训练,并可在大规模 AI 推理中实现更低的单位 Token(词元)成本。 参考英伟达此前公告,CoreWeave 这家代表性 "Neocloud" 企业 将从 2026H2 开始把基于 NVIDIA Rubin 的系统集成至其 AI 云平台中 。 相关阅读: 《 CoreWeave 率先全面提供英伟达 RTX PRO 6000 Blackwell 服务器版云实例 》 《 云服务新贵 CoreWeave 拔得头筹:率先部署英伟达 GB300 NVL72 系统 》
英伟达首款完全自研的CPU——Vera近日被独立科技媒体Phoronix进行了基准测试。结果显示,这款芯片在特定工作负载下性能超越了市面上几乎所有的x86和ARM架构处理器。然而,需要注意的是,本次测试所覆盖的负载类型均由英伟达指定。 Vera CPU是英伟达下一代Vera Rubin AI平台的核心组成部分,其中包含了由英伟达内部设计的Olympus CPU核心。与之前采用第三方设计(如Grace芯片使用ARM公版核心)不同,这是英伟达首款“真正意义上”自研的CPU——它使用ARM指令集,但核心架构完全自主开发。 第一代Vera芯片拥有88个核心,支持176个软件线程。据英伟达官方此前宣称,其性能是上一代Grace CPU的两倍。 Phoronix的测试并未聚焦于游戏场景,而是涵盖了代码编译、Python性能、Open JDK Java工作负载等企业级及专业应用场景。同时,测试中也包括了AV1视频编码和7-Zip压缩解压——这两项与消费级PC性能密切相关。 具体结果方面: 视频编码: Vera与AMD的Epyc服务器芯片表现相当,同时大幅领先英特尔Xeon竞品。 7-Zip: Vera的单核性能比任何x86芯片高出约20%。 综合表现: 在Phoronix的几何平均结果中,Vera比AMD最强的Epyc芯片领先约10%,比英特尔的旗舰级Xeon CPU高出超过50%。 此外,Phoronix指出,Vera的性能也轻松超越了市面上任何一款ARM服务器芯片,包括Ampere Computing的产品以及谷歌和微软等公有云服务商自研的ARM解决方案。不过,该网站未提供具体对比数据,也未提及同样使用ARM指令集且单核性能出色的高通或苹果芯片。 尽管Vera展现出了强大的性能潜力,但它目前主要面向AI和高性能计算平台,与普通消费者的PC游戏尚有一段距离。 查看评论
IT之家 5 月 27 日消息,科技媒体 Phoronix 昨日(5 月 26 日)发布博文,披露了英伟达 Vera CPU 首批基准测试成绩,在综合平均成绩上, 比上一代 72 核 Grace 快 63%。 英伟达于 3 月召开的 GTC 2026 大会上宣布 Vera 数据中心处理器,官方称是全球首款专为智能体 AI(Agentic AI)与强化学习时代打造的 CPU,重点解决 AI 智能体在处理复杂逻辑、工具调用时对高性能 CPU 的需求。 在架构方面,英伟达 Vera 数据中心处理器基于 Arm v9.2 指令集,配备 88 个自研 Olympus 核心。根据初步测试基准结果,全部项目的几何平均成绩上,比 72 核 Grace 快 63%。IT之家附上相关截图如下: 横向对比方面,Vera 比 64 核、主频 5GHz 的 AMD EPYC 9575F 快 10%,对 Intel 128 核 Xeon 6980P 的领先幅度则达到 55%。 英伟达官方随后转发了该媒体评测内容,指出英伟达 Vera CPU 比 x86 处理器高出 1.5 倍,Linux 内核编译速度快 2 倍。
NVIDIA CEO黄仁勋近日抵达中国台北时表示,NVIDIA对2000亿美元CPU市场的预测涵盖中国市场,显示在美中科技紧张局势持续下,NVIDIA仍高度看好中国市场长期需求。 黄仁勋面对媒体提问上述市场预估是否包含中国时,坦言“应该是的”。 随着能自主执行任务的代理式AI(Agentic AI)快速发展,市场需求正从GPU扩展至CPU。 黄仁勋日前在财报会议中指出, NVIDIA新推出的Vera CPU,将让NVIDIA切入全新的2000亿美元市场,并持续推升AI芯片业务成长。 目前NVIDIA已获美国政府许可,可向中国出口H200 AI芯片,但中国官方尚未批准相关销售。 黄仁勋表示:“H200已获准出口到中国,如果能服务那个市场将非常棒。 中国市场非常重要,而且规模非常庞大“。 NVIDIA 近日宣布,首款面向智能体(代理式AI)的专用CPU Vera正式投产交付。首批设备已至Anthropic、OpenAI、SpaceX AI及甲骨文云等公司。 Vera搭载88颗NVIDIA自研的Olympus核心,内存带宽达1.2TB/s, 单核性能提升50%,适配编排、强化学习、长上下文管理等场景。 Vera可搭配Rubin GPU、BlueField 4 DPU等组件协同运作,依托统一内存架构,数据供给能效较传统设施提升2倍,助力大规模智能体AI高效运行。 随着能自主执行任务的代理式AI快速发展,市场需求正从单一GPU扩展至CPU与GPU 协同的完整算力体系。Vera的正式交付,不仅为NVIDIA开辟了全新的增长曲线,也将加速全球AI基础设施向智能体时代的全面转型。 查看评论
和 vera 聊天,套取密码就能获得奖励, https://junpu.org/vera 在工作累的时候,总想做 AI Native 的游戏,把想象变成产品,非常解压,周末有半天探索时间,优化了这个页面,好不好玩要看大家反馈。 还有好多游戏想法,奈何没有时间完成,有想一起玩的么
1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 21 日消息,英伟达美东时间周三美股盘后宣布,截至 2026 年 4 月 26 日的第一季度营收创下 816 亿美元的新纪录,较上一季度增长 20%,较去年同期增长 85%。 财报发布后,英伟达总裁兼 CEO 黄仁勋(Jensen Huang)和执行副总裁兼 CFO 科莉特 · 克雷斯(Colette Kress)等高管出席随后召开的财报电话会议,解读财报要点,并回答分析师提问。 科莉特 · 克雷斯确认, 英伟达下一代超级 AI 芯片 Vera Rubin 将于今年下半年推出 ,第三季度开始首批交付,第四季度上量速度将持续加快,已经有明确的需求计划和订单。 黄仁勋则表示,英伟达在推理领域的市场份额正在增长,而且增长速度非常快。原因在于,今年前沿模型公司的数量有所增加。“我想不出有任何一家前沿模型公司会从一开始不选择 Vera Rubin,而之前 Blackwell 的情况并非如此。因此, Vera Rubin 开局良好,它肯定会比 Grace Blackwell 更加成功 。” 据 Wccftech 此前报道,产业链消息人士透露,英伟达已经与 ODM 厂商敲定 Vera Rubin 平台的最终生产方案。 据报道,Vera Rubin 的上市计划将分为多个阶段稳步推进。试产预计在下个月(2026 年 6 月)启动,首批产品将于今年 7 月运往北美大型 AI 数据中心和云服务企业, 微软、谷歌、亚马逊、Meta 和甲骨文等客户预计将成为首批客户 。 同时,台积电已在今年早些时候,基于 3nm 制程工艺量产 Vera Rubin 芯片。富士康、广达、纬创资通等合作伙伴将在下半年启动全面量产,预计第三季度大规模出货。 业内人士预计,英伟达 Vera Rubin AI 服务器机柜的价值约为 1.8 亿美元(IT之家注:现汇率约合 12.26 亿元人民币),配备强大的软件生态系统。
英伟达近日发布 2027 财年第一季度财报,营收创下 816.15 亿美元的新高,同比大增 85%。其中,数据中心业务贡献了 752.46 亿美元收入,同比暴涨 92%,继续成为公司最核心的增长引擎;边缘计算业务收入则达到 63.69 亿美元,同比增长 29%。 在财报电话会上,英伟达重点强调了 Blackwell GB300 以及 NVL72 系统的强劲需求,称其在前沿大模型以及超大规模云厂商中“动能十足”。目前,全球范围内已经有“数十万颗” Blackwell GPU 部署落地,功率超过 10 兆瓦的数据中心数量在一年内几乎翻倍,已超过 80 个站点,成为公司历史上爬坡速度最快的产品之一。 随着 AI 算力紧缺,旧一代 GPU 也出现了“涨价潮”。英伟达管理层指出,被誉为“好酒效应”的现象正在上演:Hopper 架构 H100 租用价格今年以来上涨约 20%,而基于 Ampere 架构的 A100 云端价格也较去年同期上涨近 15%。在算力需求高企的背景下,云服务提供商正进一步向 AI 公司开放其旧一代硬件资源,以满足训练和推理的持续需求。 不过,Blackwell、Hopper 与 Ampere 虽然仍然炙手可热,市场目光已经开始转向下一代 Vera Rubin 平台。该平台属于英伟达所谓的“极致协同设计”生态的一部分,涵盖多种芯片与软件方案,被定位为面向“Agentic AI 工厂”的一站式基础设施平台。官方确认,Vera Rubin 已经进入量产阶段,预计 2026 年三季度开始向客户发出首批出货,四季度进入放量阶段,并在 2027 年上半年持续扩大交付规模。 英伟达 CEO 黄仁勋表示,公司“一年一代”的产品节奏仍在高速推进,且“几乎无人能及”。在 Vera Rubin 之后,英伟达还计划于 2027 年推出 Rubin Ultra,2028 年推出 Feynman,再次拉长 AI 基础设施产品路线图。与此同时,英伟达也在大规模量产 Vera CPU,并按计划部署到整机机柜方案中,首批 Vera CPU 已向 OpenAI、SpaceXAi、Oracle 与 Anthropic 等早期客户交付,用于新一代 Agentic AI 场景。 在业务结构上,推理已成为英伟达当前增长最迅猛的板块。黄仁勋表示,公司在推理市场的份额“正在快速提升”,并称 Vera Rubin 相比 Grace Blackwell 将取得“更大的成功”。在他看来,几乎所有前沿大模型公司都会在第一时间采用 Vera Rubin,而这一点在此前的 Blackwell 世代并未完全出现,由此也为新平台奠定了“开局即高点”的市场预期。 综合来看,英伟达正多线齐发:一方面,Blackwell 平台带动数据中心收入屡创新高,同时推高 Hopper 与 Ampere 等旧卡价格;另一方面,Vera Rubin 平台则将于 2026 年三季度率先落地,并在 2026 年四季度至 2027 年上半年进入加速放量阶段,为即将到来的 Agentic AI 工厂浪潮提供核心算力基础设施。在 AI 基础设施竞赛持续升温之际,英伟达通过高速产品迭代与完整生态布局,继续巩固其在全球 AI 算力市场中的主导地位。 查看评论
英伟达创始人兼首席执行官黄仁勋近日在公司财报电话会上表示,随着专为“智能体(agentic AI)”设计的新CPU产品 Vera 推出,英伟达正在打开一个“全新、此前从未覆盖过的2000亿美元可服务市场(TAM)”。他称,全球计算正在围绕智能体和具身机器人重构,而英伟达正处于这一转型的中心。 黄仁勋向来以“为自家公司造势”著称,外界常将他与同样乐观高调的 Salesforce CEO Marc Benioff 相提并论。不过,伴随英伟达一次次交出超预期的财报成绩,这种乐观在资本市场眼中正越来越具有可信度。在最新一个财季,英伟达录得816亿美元营收,并预测下一季度营收将进一步攀升至910亿美元,再创纪录。 此次被他寄予厚望的 Vera CPU 早在今年3月就已发布,既可以单独销售,也可以与英伟达的 Rubin GPU 组合成完整平台。黄仁勋在电话会上将 Vera 描述为“全球首款专为智能体式人工智能设计的CPU”,并声称它已经展现出强劲的销售势头。 长期以来,英伟达在GPU领域占据主导地位,而传统CPU市场则主要由英特尔、AMD等公司把持。尽管英伟达过去也做过CPU,但这一直不是其核心业务。与此同时,云计算巨头纷纷加码自研AI芯片,加剧了外界对英伟达长期地位的担忧。例如,亚马逊云服务(AWS)上个月高调宣布与 Meta 签订一份涵盖数百万颗自研AI CPU的大额合同,亚马逊CEO安迪·贾西多次公开表示,AWS在GPU和CPU上有能力做到“至少不逊于、甚至可能优于英伟达”。 在这种背景下,Vera 被黄仁勋视作英伟达打开全新增长曲线的关键砝码。他在电话会上表示:“Vera 为英伟达打开了一个全新的2000亿美元TAM,这是我们此前从未涉足的市场,每一家主流超大规模云服务商和系统厂商都在与我们合作部署它。”他进一步指出,全球计算架构正为“智能体AI”和“具身机器人AI”重新搭建,而英伟达处于这一重构的中心位置。 黄仁勋给出的逻辑是:当今大模型的“思考”部分主要依赖GPU完成,而智能体执行各类任务时,大多运行在CPU之上。这些智能体不仅会调用工具完成具体任务,未来还可能拥有类似个人电脑的“专属计算环境”。与传统云架构中强调多核并行、以尽可能多地承载应用实例为目标的CPU不同,Vera 被设计为能够以尽可能快的速度处理“token”(令牌),以适配智能体执行任务时的工作负载特征。 面对外界质疑:在云厂商与初创公司纷纷自研AI芯片的情况下,英伟达凭什么认为自己会成为“智能体CPU”的首选供应商?黄仁勋给出的答案之一是订单数据。他在电话会上透露,英伟达今年已经售出价值200亿美元的独立 Vera CPU,而2026年才刚刚过去一小段时间。 在他描绘的图景中,未来世界不仅拥有约十亿人类用户,还将拥有数量级相当甚至更大的“智能体”。“我的感觉是,世界将拥有数十亿个智能体,当然这不会在一夜之间发生,而是逐步增长。”他说。“这些智能体都会使用工具,而这些工具对它们来说就像是PC,对应着我们今天使用PC的方式。”在他看来,这一演进的直接硬件后果非常清晰——“我们将需要更多的CPU”。 尽管英伟达在GPU领域的统治地位暂时无人撼动,华尔街仍然对哪一种力量会把英伟达从“神坛”上拉下来保持高度敏感。近期,这种不安越来越集中在CPU战场:一边是英特尔、AMD与云厂商的自研处理器逐步成熟,另一边是英伟达试图以Vera为入口,在CPU侧复制其在GPU领域的优势。在黄仁勋的最新叙事中,智能体CPU被包装成一个足以支撑英伟达未来多年增长的“全新2000亿美元故事”,而市场接下来要看的,则是这套叙事能否持续转化为真实订单与利润。 查看评论