Anthropic 最强模型 Fable 5 公开:能力确实封顶,但普通人的订阅额度可能真不够它烧
最近 Anthropic 悄悄发布了新模型 Claude Fable 5 。之所以想发个帖聊聊,一方面是因为 Anthropic 终于把他们之前一直藏着掖着的、内部最强的那档能力开放给所有人了;另一方面是刚发布没多久,就有不少订阅用户在吐槽,说开着它干活,那额度掉得肉眼可见。
今天就和大家盘一盘 Fable 5 到底强在哪,以及为什么它这么吃额度。大家也可以看完后自己评估下,以后在什么场景下才舍得用它。
核心定位:解禁的内部“大杀器”Fable 5 的核心突破不在于又去刷了什么新榜单,而在于它的“血统”。它出自 Anthropic 内部被称为 Mythos (或者 Mus )的顶级能力系列。
过去因为能力太强、破坏力有点大,官方一直不敢公开,只在一个叫 Project Blastwing 的项目里,小范围给安全从业者和基础设施方做强审计使用。它在找漏洞、写攻击代码这方面非常强,在安全圈子里引起过不小的震动。而这次发布的 Fable 5 ,是这档能力第一次做成人人可用的正式版。
性能表现:任务越复杂,甩开同行的差距就越大官方对它的评价是:能力超越了以往任何一个公开过的模型。特别是在软件工程、知识工作、视觉理解和科学研究这几个方面,基本都站到了第一梯队。
在实际测评分数上,它的表现确实有点夸张:
- SWE-bench Pro (真实 GitHub 硬核编程测试): 它跑出了 80.3 的高分。作为对比,Opus 4.8 是 69.2 ,而 GPT-5.5 只有 58.6 。
- SWE-bench Verified (更主流的基准): 它的分数直接逼近封顶的 95 分。
- Frontier Code Diamond (最拉开差距的顶尖 Agent 编程): 它拿到了 29.3 分,而第二名 Opus 4.8 只有 13.4 ,GPT-5.5 更是只有 5.7 。
简单来说,看起越是复杂、越需要自主多步跑完的 Agent 编程任务,它的优势就越降维打击。
日常应用中也有现成的例子。比如 Stripe 在早期测试时,用它做了一次老代码迁移,一天时间就搞定了 5000 万行的 Ruby 代码。而这笔工作,Stripe 原本预计要派团队啃两个多月。
安全机制:三道防线与自动“降级”能力太强带来的副作用就是容易被滥用。为了能合规公开,Anthropic 给它套了三道安全防线,分别盯着:网络安全(防漏洞利用和攻击类请求)、生物化学(拦截危险病毒设计)以及防盗流(拦截用它的输出来训练其他模型)。
如果你提的问题触发了这三道防线,Fable 5 并不会直接拒绝你,而是会把任务自动“降级”,转交给更保守、更安全的 Opus 4.8 来处理。虽然偶尔会误伤一些正常提问,但官方称 95% 以上的会话全程都会由 Fable 5 自己跑完,不会触发回退。
额度迷局:为什么感觉额度掉得像火箭一样快?模型很强没有争议,但这两天吐槽“订阅额度瞬间被吸干”的人也确实不是错觉。背后主要有两个现实原因:
- 官方单价直接翻倍: Fable 5 的 API 定价是输入 10 美元/百万 token ,输出 50 美元/百万 token 。这个价格正好是 Opus 4.8 的两倍,也是目前主流模型里最贵的一档。
- 它在你看不到的地方“想得太多”: 越能干的模型,单轮跑得就越久。它为了把一件事做得更完整,会在后台自己推演很多步。你可能只提了一个简单要求,它在后台深构、深思吐出来的 token 却是以前的好几倍。所以哪怕 Anthropic 没改订阅计费规则,它自己干的活变多了,额度自然消耗得极快。
目前在 Claude Web 端,Fable 5 在订阅计划里还是限时免费的,不额外收钱。但大家注意看界面提示,这个免费窗口期截止到 6 月 23 日。
到了 6 月 23 日之后,它就会被移出目前的订阅额度计划。想继续用,就得改走预付费的 usage credits 模式,直接按 API 的真实消耗价格从你充进去的钱里扣。
一点使用建议Fable 5 把大模型的能力上限又往上推了一截,这肯定是好事。但在两周的免费期过后,大家可能得精打细算一下了:
- 那些真正复杂的、难搞的、能产生实际高价值的硬核代码和长任务,再交给他去交底。
- 至于日常聊天、轻量级的日常任务,还是留给更便宜的 Opus 4.8 或其他模型吧。
大家这两天体验下来感觉如何?欢迎在帖子里聊聊。