Anthropic 最强模型 Fable5 公开,订阅用户率先体验

Anthropic 最强模型 Fable5 公开,订阅用户率先体验
Anthropic 最强模型 Fable5 公开,订阅用户率先体验

Anthropic 最强模型 Fable 5 公开:能力确实封顶,但普通人的订阅额度可能真不够它烧

最近 Anthropic 悄悄发布了新模型 Claude Fable 5 。之所以想发个帖聊聊,一方面是因为 Anthropic 终于把他们之前一直藏着掖着的、内部最强的那档能力开放给所有人了;另一方面是刚发布没多久,就有不少订阅用户在吐槽,说开着它干活,那额度掉得肉眼可见。

今天就和大家盘一盘 Fable 5 到底强在哪,以及为什么它这么吃额度。大家也可以看完后自己评估下,以后在什么场景下才舍得用它。

核心定位:解禁的内部“大杀器”

Fable 5 的核心突破不在于又去刷了什么新榜单,而在于它的“血统”。它出自 Anthropic 内部被称为 Mythos (或者 Mus )的顶级能力系列。

过去因为能力太强、破坏力有点大,官方一直不敢公开,只在一个叫 Project Blastwing 的项目里,小范围给安全从业者和基础设施方做强审计使用。它在找漏洞、写攻击代码这方面非常强,在安全圈子里引起过不小的震动。而这次发布的 Fable 5 ,是这档能力第一次做成人人可用的正式版。

性能表现:任务越复杂,甩开同行的差距就越大

官方对它的评价是:能力超越了以往任何一个公开过的模型。特别是在软件工程、知识工作、视觉理解和科学研究这几个方面,基本都站到了第一梯队。

在实际测评分数上,它的表现确实有点夸张:

  • SWE-bench Pro (真实 GitHub 硬核编程测试): 它跑出了 80.3 的高分。作为对比,Opus 4.8 是 69.2 ,而 GPT-5.5 只有 58.6 。
  • SWE-bench Verified (更主流的基准): 它的分数直接逼近封顶的 95 分。
  • Frontier Code Diamond (最拉开差距的顶尖 Agent 编程): 它拿到了 29.3 分,而第二名 Opus 4.8 只有 13.4 ,GPT-5.5 更是只有 5.7 。

简单来说,看起越是复杂、越需要自主多步跑完的 Agent 编程任务,它的优势就越降维打击。

日常应用中也有现成的例子。比如 Stripe 在早期测试时,用它做了一次老代码迁移,一天时间就搞定了 5000 万行的 Ruby 代码。而这笔工作,Stripe 原本预计要派团队啃两个多月。

安全机制:三道防线与自动“降级”

能力太强带来的副作用就是容易被滥用。为了能合规公开,Anthropic 给它套了三道安全防线,分别盯着:网络安全(防漏洞利用和攻击类请求)、生物化学(拦截危险病毒设计)以及防盗流(拦截用它的输出来训练其他模型)。

如果你提的问题触发了这三道防线,Fable 5 并不会直接拒绝你,而是会把任务自动“降级”,转交给更保守、更安全的 Opus 4.8 来处理。虽然偶尔会误伤一些正常提问,但官方称 95% 以上的会话全程都会由 Fable 5 自己跑完,不会触发回退。

额度迷局:为什么感觉额度掉得像火箭一样快?

模型很强没有争议,但这两天吐槽“订阅额度瞬间被吸干”的人也确实不是错觉。背后主要有两个现实原因:

  1. 官方单价直接翻倍: Fable 5 的 API 定价是输入 10 美元/百万 token ,输出 50 美元/百万 token 。这个价格正好是 Opus 4.8 的两倍,也是目前主流模型里最贵的一档。
  2. 它在你看不到的地方“想得太多”: 越能干的模型,单轮跑得就越久。它为了把一件事做得更完整,会在后台自己推演很多步。你可能只提了一个简单要求,它在后台深构、深思吐出来的 token 却是以前的好几倍。所以哪怕 Anthropic 没改订阅计费规则,它自己干的活变多了,额度自然消耗得极快。
划重点:免费窗口期马上关闭

目前在 Claude Web 端,Fable 5 在订阅计划里还是限时免费的,不额外收钱。但大家注意看界面提示,这个免费窗口期截止到 6 月 23 日。

到了 6 月 23 日之后,它就会被移出目前的订阅额度计划。想继续用,就得改走预付费的 usage credits 模式,直接按 API 的真实消耗价格从你充进去的钱里扣。

一点使用建议

Fable 5 把大模型的能力上限又往上推了一截,这肯定是好事。但在两周的免费期过后,大家可能得精打细算一下了:

  • 那些真正复杂的、难搞的、能产生实际高价值的硬核代码和长任务,再交给他去交底。
  • 至于日常聊天、轻量级的日常任务,还是留给更便宜的 Opus 4.8 或其他模型吧。

大家这两天体验下来感觉如何?欢迎在帖子里聊聊。

来源: V2EX - 技术查看原文