GPT 5.5 发布复盘 —— 所以 GPT 5.5 是 Spud 吗?进行全新的预训练了吗? OpenAI Deployment Safety Hub GPT-5.5 System Card - OpenAI Deployment Safety Hub GPT-5.5 is a new model designed for complex, real-world work, including writing code, researching online, analyzing information, creating documents and spreadsheets, and moving across tools to get things done. Relative to earlier models, GPT-5.5... 4 个帖子 - 4 位参与者 阅读完整话题
OpenAI 本周四正式发布其迄今最强大的大模型 GPT‑5.5,内部代号“Spud”,距离竞争对手 Anthropic 推出最新模型仅一周时间。 这一发布被视为人工智能发展中的重要节点,标志着更高效、更强大的通用智能系统正加速走向实际应用场景。 OpenAI 联合创始人 Greg Brockman 在对媒体的简报中表示,GPT‑5.5 代表着“一类全新的智能”,是迈向更具自主性和直觉式计算形态的重要一步。 他称,与上一代 GPT‑5.4 相比,GPT‑5.5 是一个“更快、更敏锐的思考者,同时消耗更少的 tokens”,在多步骤任务处理方面能够以更少的人为干预,更自主地完成复杂工作流程。 尽管整体能力有显著跃升,OpenAI 表示,在真实使用场景中,GPT‑5.5 的响应速度与 GPT‑5.4 基本持平。 在产品开放节奏上,GPT‑5.5 自周四起面向付费用户登陆 ChatGPT 与 Codex,API 接口则将在 OpenAI 完成额外网络安全防护措施部署后陆续开放。 OpenAI 称,本次模型升级带来的性能提升在代码编写、电脑操作、通用办公以及前期科研等需要长上下文推理与持续执行任务的领域尤为明显。 与过去需要用户逐步拆解提示词的交互方式不同,用户现在可以直接抛给 GPT‑5.5 结构混乱、包含多子任务的复杂需求,由模型自行规划步骤、调用工具、自检结果并持续推进直至产出可用结论。 获得早期试用权限的团队已经利用 GPT‑5.5 对带有“情绪色彩”的创意性工作进行校验,批量审阅额外数千份文档,并在每周的工作中节省出最多可达 10 小时的时间。 在底层算力方面,GPT‑5.5 延续了 OpenAI 以往模型采用英伟达(NVIDIA)GPU 训练的路线。 部分英伟达员工已参与该模型为期数周的测试,随后英伟达全体员工也将获得访问权限。 英伟达企业计算部门副总裁 Justin Boitano 向 Axios 表示,GPT‑5.5 可以在企业内部扮演类似“幕僚长”(chief of staff)的角色,为已经在英伟达内部以“数字员工”形式运行的 AI 代理提供能力支撑。 他透露,英伟达与 OpenAI 合作制定了一套“蓝图”,旨在帮助各类企业更轻松地在自身业务体系中落地部署这类模型。 英伟达方面称,其新一代芯片可将运行 GPT‑5.5 等先进 AI 模型的成本最多压缩至此前每 token 的 1/35,这一指标对希望扩大 AI 使用规模、同时又不希望 IT 预算失控的企业而言至关重要。 在更宏观的层面上,Brockman 提出,人类正在迈向一个“由算力驱动的经济”,未来的工作将越来越多依托 AI 产能,从而使算力本身成为经济体系的核心底座。 对 OpenAI 而言,当前一个重要关注点是,此次 GPT‑5.5 的发布能否进一步推动企业用户的采用,这也与其近来的战略转向密切相关。 此前,OpenAI 高管曾将竞争对手 Anthropic 的快速崛起形容为“红色警报”和“警钟”,并以此为契机,将公司策略更明确地转向面向企业客户的业务落地。 随着越来越多 AI 系统开始承担时长更久、结构更复杂的任务,运行这些系统的经济性正变得与模型能力本身同等重要。 在英伟达降本技术、OpenAI 模型迭代和企业需求三方交织之下,新一轮围绕大模型能力与算力成本的竞争,正在成为全球科技及商业版图重塑的关键变量。 查看评论
自昨日起X上出现了大量关于GPT-5.4 Pro响应速度变快且风格变化的报告 OpenAI员工在今天下午13:53的帖子基本相当于承认了当前的GPT-5.4 Pro由一款新的模型驱动 https://x.com/ericmitchellai/status/2045742449939951699 暂时不确定新的模型是什么,极有可能是GPT-5.5/Spud 目前的评论汇总: 速度明显变快(GPT-5.4 Pro 的 ~60分钟 vs 新模型的 15~20分钟) 绝大多数情况下智商变高 广度降低、相较于5.4 Pro显得有些懒惰 编码能力与审美提升 SVG能力提升 从评论中可以看出模型的Scale变小了,不像是Pro模型,同时速度变快了,很有可能是GPT-5.5 二编:应该是新的GPT-5.5 Pro 25 个帖子 - 23 位参与者 阅读完整话题
IT之家 4 月 14 日消息,科技媒体 The Decoder 昨日(4 月 13 日)发布博文,报道称在一份泄露的内部备忘录中, OpenAI 首席营收官丹尼斯 · 德莱瑟(Denise Dresser)规划 2026 年第 2 季度战略蓝图,明确五大核心优先事项。 聚焦企业 AI 落地 IT之家援引博文介绍,在这份内部备忘录中,德莱瑟支持企业 AI 正步入“更成熟阶段”,仅靠模型性能已不足以打动客户, 企业更关注 AI 如何融入现有工作流、控制系统及日常运营。 OpenAI 目前面临的最大瓶颈并非需求不足,而是产能限制,九位数美元规模的多年度合作订单正在增加。 代号为 Spud 的 AI 模型,可能是 GPT-5o/GPT 5.5 消息称该模型对标 Anthropic 公司的 Claude Mythos 模型,上市后可能名为 GPT-5o 或者 GPT-5.5,使用英伟达的 Blackwell 训练。 早期客户反馈显示,该模型在推理能力、意图与依赖关系理解方面表现更强,生产环境输出更可靠。德莱瑟表示,OpenAI 将通过迭代部署策略,将 Spud 融入核心产品,最终向“超级应用”(SuperApp)演进。 图源:The Decoder Agent 平台 Frontier 市场风向已从单一提示词转向自主 Agent,而公司在算力上的优势已转化为更高的 Token 限制、更低的延迟及更稳定的复杂工作流执行。 客户需要能自主调用工具、跨工作流运行且在真实商业环境中稳定可靠的系统,这对编排、控制、安全及治理提出了更高要求。 OpenAI 为此正在构建名为 Frontier 的 Agent 平台,定位“企业 Agent 的默认平台”。德莱瑟表示,更优的模型提升平台价值,更深的集成优化迁移成本,最终让 OpenAI 从产品供应商转型为运营基础设施。 和亚马逊的合作 德莱瑟强调与微软的合作虽是“成功的基石”,但也限制了 OpenAI 触达客户常用工作场景的能力。自 2 月底宣布合作以来,Amazon Bedrock 平台的需求“惊人”。 德莱瑟特别提到 Amazon Stateful Runtime Environment,该环境超越简单的模型访问,支持跨交互的记忆、上下文与连续性,让系统在复杂业务流程中运行更稳定。这为 AWS 原生客户降低了采用门槛,并在受监管行业建立了更稳固的立足点。 对抗 Anthropic 备忘录最尖锐的部分直指 Anthropic。德莱瑟指责对手将叙事建立在“恐惧、限制及少数精英应控制 AI”的观念上,并称 Anthropic 因未锁定足够算力而犯下“战略错误”,导致客户遭遇限流、可用性不稳定等问题。 她认为,Anthropic 早期聚焦编程工具虽抢占先机,但在平台之争中,这种狭窄定位可能成为劣势。 德莱瑟声称 Anthropic 的营收运行率虚高约 80 亿美元,原因是其将支付给 Amazon 和 Google 的收入分成计入总额,而非净额。 Anthropic 报告的营收运行率为 300 亿美元,OpenAI 按净额确认微软收入分成,更符合上市公司标准。由于两家公司均未上市,这些指控尚无法独立验证。