Anthropic 最强模型 Fable5 公开，订阅用户率先体验

最近 Anthropic 悄悄发布了新模型 Claude Fable 5 。之所以想发个帖聊聊，一方面是因为 Anthropic 终于把他们之前一直藏着掖着的、内部最强的那档能力开放给所有人了；另一方面是刚发布没多久，就有不少订阅用户在吐槽，说开着它干活，那额度掉得肉眼可见。

今天就和大家盘一盘 Fable 5 到底强在哪，以及为什么它这么吃额度。大家也可以看完后自己评估下，以后在什么场景下才舍得用它。

核心定位：解禁的内部“大杀器”

Fable 5 的核心突破不在于又去刷了什么新榜单，而在于它的“血统”。它出自 Anthropic 内部被称为 Mythos （或者 Mus ）的顶级能力系列。

过去因为能力太强、破坏力有点大，官方一直不敢公开，只在一个叫 Project Blastwing 的项目里，小范围给安全从业者和基础设施方做强审计使用。它在找漏洞、写攻击代码这方面非常强，在安全圈子里引起过不小的震动。而这次发布的 Fable 5 ，是这档能力第一次做成人人可用的正式版。

性能表现：任务越复杂，甩开同行的差距就越大

官方对它的评价是：能力超越了以往任何一个公开过的模型。特别是在软件工程、知识工作、视觉理解和科学研究这几个方面，基本都站到了第一梯队。

在实际测评分数上，它的表现确实有点夸张：

SWE-bench Pro （真实 GitHub 硬核编程测试）： 它跑出了 80.3 的高分。作为对比，Opus 4.8 是 69.2 ，而 GPT-5.5 只有 58.6 。
SWE-bench Verified （更主流的基准）： 它的分数直接逼近封顶的 95 分。
Frontier Code Diamond （最拉开差距的顶尖 Agent 编程）： 它拿到了 29.3 分，而第二名 Opus 4.8 只有 13.4 ，GPT-5.5 更是只有 5.7 。

简单来说，看起越是复杂、越需要自主多步跑完的 Agent 编程任务，它的优势就越降维打击。

日常应用中也有现成的例子。比如 Stripe 在早期测试时，用它做了一次老代码迁移，一天时间就搞定了 5000 万行的 Ruby 代码。而这笔工作，Stripe 原本预计要派团队啃两个多月。

安全机制：三道防线与自动“降级”

能力太强带来的副作用就是容易被滥用。为了能合规公开，Anthropic 给它套了三道安全防线，分别盯着：网络安全（防漏洞利用和攻击类请求）、生物化学（拦截危险病毒设计）以及防盗流（拦截用它的输出来训练其他模型）。

如果你提的问题触发了这三道防线，Fable 5 并不会直接拒绝你，而是会把任务自动“降级”，转交给更保守、更安全的 Opus 4.8 来处理。虽然偶尔会误伤一些正常提问，但官方称 95% 以上的会话全程都会由 Fable 5 自己跑完，不会触发回退。

额度迷局：为什么感觉额度掉得像火箭一样快？

模型很强没有争议，但这两天吐槽“订阅额度瞬间被吸干”的人也确实不是错觉。背后主要有两个现实原因：

官方单价直接翻倍： Fable 5 的 API 定价是输入 10 美元/百万 token ，输出 50 美元/百万 token 。这个价格正好是 Opus 4.8 的两倍，也是目前主流模型里最贵的一档。
它在你看不到的地方“想得太多”： 越能干的模型，单轮跑得就越久。它为了把一件事做得更完整，会在后台自己推演很多步。你可能只提了一个简单要求，它在后台深构、深思吐出来的 token 却是以前的好几倍。所以哪怕 Anthropic 没改订阅计费规则，它自己干的活变多了，额度自然消耗得极快。

划重点：免费窗口期马上关闭

目前在 Claude Web 端，Fable 5 在订阅计划里还是限时免费的，不额外收钱。但大家注意看界面提示，这个免费窗口期截止到 6 月 23 日。

到了 6 月 23 日之后，它就会被移出目前的订阅额度计划。想继续用，就得改走预付费的 usage credits 模式，直接按 API 的真实消耗价格从你充进去的钱里扣。

一点使用建议

Fable 5 把大模型的能力上限又往上推了一截，这肯定是好事。但在两周的免费期过后，大家可能得精打细算一下了：

大家这两天体验下来感觉如何？欢迎在帖子里聊聊。

来源: V2EX - 技术查看原文

延伸阅读