/tag/My

【Claude Fable 5 & Claude Mythos 5】一起来扒一扒A\最新的模型卡片 (Model card) - 欢乐向

LinuxDo 最新话题 · 2026-06-11 22:47:02+08:00 · tech

[!NOTE] 原始pdf在此 Claude Fable 5 & Claude Mythos 5 System Card 如果想深挖，随便找个AI就能挖了这边又开新坑，那一定是因为我要吐槽！！！！ [!CHECK] 尽量保持专业性，不过依然欢乐向。博君一笑 TL;DR 虽然 Mythos 5 和 Fable 5 都是新一代超模，性能超越了之前的 Mythos Preview ，乃们浅浅氪金的屁民们只配用 Fable 5 ，我们还为了人类的福祉，给你们的 Fable 5 添加了极其先进的外审，传说中的 ASL-3 blocking classifiers ，这样在标准用户提问生物化学问题的时候，依然能达到4.8opus的水准废话吗这不是，都给用户干回去4.8opus了，那不是opus水准是啥 [!warning] 嗯，做科研的宝子们可以基本放弃了，就不要浪费宝贵的额度。如果您恰好需要用我们极其先进的 Mythos 5 训练自己的模型，我们的模型很强哦！虽然但是，你们这些浅氪的穷人怎么配用我们高贵的 Mythos 5 呢，如果你用 Fables 5 ，那我们会悄咪咪降低调参的能力剧透别问，问就是违反了我们的 ToS , 正经用户都是要先读条款才开始使用的。我们的上下文也是前无古人，后无来者。我们全盘抛弃了 OpenAI 推出的捞针测试，剧透我们现在使用的是遥遥领先的 GraphWalk®️ 甚至都是注册商标呢！足见我们长上下文艳压群芳的能力。我们要做就是做最安全的模型，所以肯定是安全。三百多页的模型卡，一半都在讲安全，是不是很安全呢？而且我们很诚实。一旦发觉用户有一些奇怪的企图，就开始跟用户讲诚实用户坏坏，已经被Dario远程锁定噜。 pretrain 数据来源老样子：我蒸不是蒸，自我之下阶级分明，谢谢！安全 RSP（Responsible Scaling Policy）& FCF （Frontier Compliance Framework）我们的模型非常的强大，因此呢，就暴露出了一些在生物学和化学中的相关风险。看到这些缩写楼主就头大了我们假定我们的超模已经有了 CB-1 能力(Chemical and biological weapons threat model 1, 翻译成人话就是非创新性的生物和化学武器构造) ，我们预判到了用户的预判，增加了非常多针对性的甲！至于 CB-2 能力(类似于创新武器)，我们不是很确定，但是我们依然预判了用户的预判迫害妄想症啊这是这个 poor judgement 笑死我了真的有人会用claude做武器吗？剧透截图放小一点，反正你品，你再品。真是恐怖如斯！居然还煞有介事🉐找了外面的 vendor 来做测试。（点击了解更多详细信息） A\ : 知道为什么这么贵吗？因为请这些人都要花钱的呀。你以为我们的钱是大风刮来的吗？剧透 2.3 和 2.4 里面倒是说了一些实话，无外乎还是读代码不全，胡说八道，没有好的说做好了之类的 Cyber 嗯，长话短说，就是我们超绝敏感肌！如果宝宝用起来不习惯，那就只能氪金Mythos了。真的这一部分笑死了，完全没有 Fables-5 来参与评测。不过里面有一张图，嗯，反正大家掂量一下。 Safeguards and harmlessness 哼，看到第七十一页第四小节，你以为我讲完了？没有，没有，我们还是继续讲安全。剧透 To Be Continued 1 个帖子 - 1 位参与者阅读完整话题

[AI Agent 智能体] 找车！上车一个 24 个月优惠 ChatGPT team 车有的带价私聊 @My_DOCOMO

v2ex · 2026-06-11 18:31:40+08:00 · tech

NewAPI + MySQL 更优雅的日志清理方式

LinuxDo 最新话题 · 2026-06-11 17:33:51+08:00 · tech

NewAPI 的日志目前是单表存储，已经看到太多佬友因为日志撑爆磁盘了，下面给出一种解决方式，可能不完全兼容，但是个人测试下来没有什么问题与 NewAPI 版本无关，基本所有版本都可以用，我用的版本是 1.0.0-rc.10 自带的日志删除最常用的是使用 NewAPI 自带的 “清理历史日志” 来进行删除 // 代码逻辑如下 // 直接按照时间戳删除 LOG_DB.Where("created_at < ?", targetTimestamp).Limit(limit).Delete(&Log{}) 这里有两个问题： Delete 的效率不高，或者说在数据量过大的情况下使用 Delete 带来的 IO 可能成为灾难 Delete 之后磁盘空间并不会回收，需要手动回收通过数据库分片解决日志删除适用于 MySQL，如果您是其他的 DB 如 Postgres / SQLite，将下面的内容提供给 AI 相信也会有对应的解决方案分片的核心逻辑是，将日志拆分到对应的日期上，比如分片 logs_20260601 只存储当天的数据，在超出需要删除的日期后，比如 1 个月后的 2026/07/01，直接删除 logs_20260601 分片，分片占用的空间会立刻释放，对应的日志数据也会直接删除不过这里要提示您，所有的 DB 变更都可能引入风险，请您在执行前通过 mysqldump 或者类似工具，导出完整的数据结构和数据内容，确保执行出现异常可以随时回滚执行下面的步骤前，建议停机，否则可能导致数据不完整，如果数据完整性不在考虑范围内，也可以在线更新 Step 1 检查数据符合预期 (Read) 执行下面的查询语句，确保 count 为 0，即所有的日志的创建时间不为空 SELECT COUNT(*) AS null_created_at_count FROM logs WHERE created_at IS NULL; Step 2 创建临时表 (Write) CREATE TABLE logs_new LIKE logs; Step 3 添加准备分区语句 (Read) 通过下面的 SQL，可以获得一个建表 SQL，对 DB 无任何副作用，可以放心执行下面的 @start_date 和 @end_date 两行，可以按照您的实际数据存储情况调整，下面的配置为创建 180 天前到 7 天后的分区，如果您的日志已经回收或删除过了，可以考虑缩减分区数量 SET time_zone = '+08:00'; 这里可以按照您的需求调整为具体的时区分区必须提前创建，否则插入数据会有问题，所以您至少需要创建 7 天后的备用 SET SESSION group_concat_max_len = 1024 * 1024; SET time_zone = '+08:00'; SET @start_date = DATE_SUB(CURDATE(), INTERVAL 180 DAY); SET @end_date = DATE_ADD(CURDATE(), INTERVAL 7 DAY); WITH RECURSIVE dates AS ( SELECT @start_date AS d UNION ALL SELECT DATE_ADD(d, INTERVAL 1 DAY) FROM dates WHERE d < @end_date ) SELECT GROUP_CONCAT( CONCAT( ' PARTITION p', DATE_FORMAT(d, '%Y%m%d'), ' VALUES LESS THAN (', UNIX_TIMESTAMP(DATE_ADD(d, INTERVAL 1 DAY)), ')' ) ORDER BY d SEPARATOR ',\n' ) INTO @parts FROM dates; SET @sql = CONCAT( 'ALTER TABLE logs_new MODIFY `created_at` bigint NOT NULL, DROP PRIMARY KEY, DROP INDEX `idx_created_at_id`, ADD PRIMARY KEY (`id`, `created_at`) PARTITION BY RANGE (`created_at`) ( ', @parts, ', PARTITION pmax VALUES LESS THAN MAXVALUE )' ); SELECT @sql; Step 4 执行分区语句 (Write) 执行上一步输出的 SQL，会将新的 logs_new 表调整为分区表 Step 5 导入旧的数据 (Write) 取决于您的数据量，这一步可能会花费一些时间 INSERT INTO logs_new SELECT * FROM logs; Step 6 校验数据已经导入完成 (Read) 如果您是停机更新，确保两条 SQL 输出的内容是一致的如果您是在线更新，确保数据接近或一致 SELECT "logs" as `table`, COUNT(*), MIN(created_at), MAX(created_at) FROM logs UNION SELECT "logs_new" as `table`, COUNT(*), MIN(created_at), MAX(created_at) FROM logs_new; Step 7 确认分区 (Read) 下面的 SQL 会打印新表的所有分区，以及每个分区的数据量 SELECT PARTITION_NAME, PARTITION_DESCRIPTION, TABLE_ROWS FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs_new' ORDER BY PARTITION_ORDINAL_POSITION; Step 8 切表 (Write) 切换流量到新表，执行完成后请检查 NewAPI 各组件各页面是否能正常工作，特别是依赖日志的内容 RENAME TABLE logs TO logs_old, logs_new TO logs; Step 9 创建自动回收创建/分区任务 (Write) MySQL 不会自动创建或者删除分区，需要您创建定时任务来实现，下面会给出创建/删除分区的任务，您可以按需添加 Step 9.1 开启 MySQL Event Scheduler 在数据库中执行下面的命令，通常需要 root 用户，无需重启 SET GLOBAL event_scheduler = ON; SHOW VARIABLES LIKE 'event_scheduler'; 在配置文件的 mysqld 章节，增加下面的配置，无需重启这一步是为了保证，即使后面重启数据库，Event Scheduler 仍然会是开启状态 [mysqld] event_scheduler=ON Step 9.2 创建新建分区任务下面的两个 SQL 都需要执行第一个 SQL 中的 SET time_zone = '+08:00'; 可按需修改为您的时区第二个 SQL 中的时间您可以修改为适用于您的服务的时间，目前设置的是每天的 02:00，用于控制定时触发的时机 DELIMITER $$ DROP PROCEDURE IF EXISTS sp_logs_create_future_partitions$$ CREATE PROCEDURE sp_logs_create_future_partitions() BEGIN DECLARE v_i INT DEFAULT 0; DECLARE v_d DATE; DECLARE v_partition_name VARCHAR(32); DECLARE v_less_than BIGINT; DECLARE v_exists INT DEFAULT 0; DECLARE v_sql TEXT; SET time_zone = '+08:00'; WHILE v_i <= 7 DO SET v_d = DATE_ADD(CURDATE(), INTERVAL v_i DAY); SET v_partition_name = CONCAT('p', DATE_FORMAT(v_d, '%Y%m%d')); SET v_less_than = UNIX_TIMESTAMP(DATE_ADD(v_d, INTERVAL 1 DAY)); SELECT COUNT(*) INTO v_exists FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' AND PARTITION_NAME = v_partition_name; IF v_exists = 0 THEN SET v_sql = CONCAT( 'ALTER TABLE logs REORGANIZE PARTITION pmax INTO (', 'PARTITION ', v_partition_name, ' VALUES LESS THAN (', v_less_than, '), ', 'PARTITION pmax VALUES LESS THAN MAXVALUE', ')' ); SET @sql = v_sql; PREPARE stmt FROM @sql; EXECUTE stmt; DEALLOCATE PREPARE stmt; END IF; SET v_i = v_i + 1; END WHILE; END$$ DELIMITER ; DROP EVENT IF EXISTS ev_logs_create_future_partitions; CREATE EVENT ev_logs_create_future_partitions ON SCHEDULE EVERY 1 DAY STARTS TIMESTAMP(CURRENT_DATE, '02:00:00') DO CALL sp_logs_create_future_partitions(); Step 9.3 创建删除分区任务 (可选) 这个是用于替代 NewAPI 自带的删除数据任务，如果您有需要可以配置这里的自动删除第一个 SQL 中的 INTERVAL 180 DAY 表示删除 180 天之前的数据，可以按需修改， SET time_zone = '+08:00'; 也可按需修改为您的时区第二个 SQL 中的时间您可以修改为适用于您的服务的时间，目前设置的是每天的 03:00，用于控制定时触发的时机 DELIMITER $$ DROP PROCEDURE IF EXISTS sp_logs_drop_old_partitions$$ CREATE PROCEDURE sp_logs_drop_old_partitions() BEGIN DECLARE v_cutoff_date DATE; DECLARE v_cutoff_ts BIGINT; DECLARE v_drop_partitions TEXT; DECLARE v_sql TEXT; SET time_zone = '+08:00'; SET v_cutoff_date = DATE_SUB(CURDATE(), INTERVAL 180 DAY); SET v_cutoff_ts = UNIX_TIMESTAMP(v_cutoff_date); SELECT GROUP_CONCAT(PARTITION_NAME ORDER BY PARTITION_ORDINAL_POSITION) INTO v_drop_partitions FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' AND PARTITION_NAME REGEXP '^p[0-9]{8}$' AND CAST(PARTITION_DESCRIPTION AS UNSIGNED) <= v_cutoff_ts; IF v_drop_partitions IS NOT NULL AND v_drop_partitions <> '' THEN SET v_sql = CONCAT( 'ALTER TABLE logs DROP PARTITION ', v_drop_partitions ); SET @sql = v_sql; PREPARE stmt FROM @sql; EXECUTE stmt; DEALLOCATE PREPARE stmt; END IF; END$$ DELIMITER ; DROP EVENT IF EXISTS ev_logs_drop_old_partitions; CREATE EVENT ev_logs_drop_old_partitions ON SCHEDULE EVERY 1 DAY STARTS TIMESTAMP(CURRENT_DATE, '00:10:00') DO CALL sp_logs_drop_old_partitions(); Step 9.4 检查任务 show events; SHOW PROCEDURE STATUS WHERE Db = DATABASE(); Step 10 大功告成一切已准备就绪，请使用吧！数据库将按照您的配置自动创建新的分片，回收旧的分片，后续如果有调整，也可以直接修改 SQL 配置再次执行。您可以定期通过下面的 SQL 来检查分区任务的运行状态和分区的数据量，请检查 pmax 分区数据量为 0，且已经创建了 7 天后的分区 SELECT PARTITION_NAME, PARTITION_DESCRIPTION, TABLE_ROWS FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' ORDER BY PARTITION_ORDINAL_POSITION DESC LIMIT 15; 1 个帖子 - 1 位参与者阅读完整话题

动态IP代理分享

LinuxDo 最新话题 · 2026-06-11 15:55:18+08:00 · tech

刚来L站,也不知道分享点啥，分享点还没用完得动态IP代理 : US: socks5://admin:[email protected]:7777 JP: socks5://admin:[email protected]:8888 1 个帖子 - 1 位参与者阅读完整话题

其实Fable-5也不是22号以后永远只支持API

LinuxDo 最新话题 · 2026-06-11 03:05:55+08:00 · tech

anthropic.com Claude Fable 5 and Claude Mythos 5 Today we’re launching Claude Fable 5: a Mythos-class model that we’ve made safe for general use. After this point—when sufficient capacity allows us to do so—we aim to restore Fable 5 as a standard part of subscription plans. We intend to do this as quickly as we can. 机翻：在此之后——当容量足够时，我们计划将《Fable 5》恢复为订阅计划的标准部分。我们打算尽快完成这项工作。 6 个帖子 - 4 位参与者阅读完整话题

微软因数据留存担忧在公司内部限制使用 Claude Fable 5

cnBeta全文版 · 2026-06-11 01:35:09+08:00 · tech

微软近日在内部限制员工使用 Anthropic 新发布的 Mythos 级大模型 Claude Fable 5，原因是对其数据留存政策可能带来的合规和保密风险存在疑虑。据知情人士透露，在 Anthropic 更新了针对 Claude Fable 5 的数据留存要求后，微软法务团队已介入评估，暂时将该模型从公司内部员工使用的 GitHub Copilot 模型选择列表中移除。 Anthropic 于昨日正式推出首个 Mythos 级模型 Claude Fable，Fable 5 是此次发布的核心版本，并已被微软迅速集成到面向客户的 GitHub Copilot 和 Foundry 等产品和服务中。不过，与面向外部客户的快速上线不同，微软内部员工在自用的 GitHub Copilot 环境中暂时无法选用 Claude Fable 5，仍只能访问其他继续实施“零数据留存”（Zero Data Retention，ZDR）策略的 Claude 系列模型。据悉，微软内部向员工的说明是，法务团队正在评估 Anthropic 对 Mythos 系列模型提出的最新数据留存要求，核心担忧集中在客户数据与保密信息如何被存储与处理。目前尚不清楚法务评估的最终结论以及 Claude Fable 5 能否在未来重新开放给微软内部员工使用。根据 Anthropic 公布的政策，Claude Fable 5 的运行依赖新的安全分类器，这要求服务端对用户的提示词（prompts）和输出内容进行留存，以便进行安全分析和违规检测。按照现行规则，这些数据会默认保存 30 天并在期满后删除；若相关内容被标记为违反 Anthropic 使用政策，则可能被保留长达两年，以便持续用于安全和合规用途。正是这一“必需留存”的机制，引发了微软方面在法律责任、客户隐私和企业机密保护上的一系列顾虑。 Claude Fable 5 是 Anthropic Mythos 模型家族的首次大规模对外发布，此前该公司曾表示，这一家族在网络安全等敏感任务上的能力极强，强到“过于危险而不宜完全公开发布”。为降低滥用风险，Anthropic 为 Fable 5 引入了更严格的提示词安全防护和内容审查机制，这也在技术上促成了当前的数据留存设计，从而在产品安全与数据合规之间制造出新的张力。就 Claude Fable 5 在微软内部的使用现状及后续打算，媒体已向微软方面寻求评论，但在截稿前微软尚未作出回应。查看评论

教你肘出mythos（fable）原始思维链

LinuxDo 最新话题 · 2026-06-10 23:51:37+08:00 · tech

先看结果. 方法:在系统提示词加上你需要在<think></think>中深思熟虑后再进行回复 note:注意标签为<think>而非<thinking> thinking level:max 即可.最早是因为我的客户端和中转站八字不合死活不思考发现的. 9 个帖子 - 6 位参与者阅读完整话题

opencode go套餐用不完了还有三天

LinuxDo 最新话题 · 2026-06-10 19:43:20+08:00 · tech

sk-lD7j7Uo6eGK删aoNtAf0oJWXNYUmY掉XtvHNtcZPBwC我utnpTrCgC1h2Qq84ug2IYHNCp 可以在opencode中使用能否API调用可以参考文档 OpenCode Go 低成本的开源编程模型订阅服务。 1 个帖子 - 1 位参与者阅读完整话题

Claude Mythos 披着 Fable 5 的马甲发布了

V2EX - 技术 · 2026-06-10 17:02:56+08:00 · tech

写着 included until June 22 ，饥饿营销这一块

Claude Mythos 披着 Fable 5 的马甲发布了

V2EX - 技术 · 2026-06-10 16:30:33+08:00 · tech

写着 included until June 22 ，饥饿营销这一块

相关专题

Claude Mythos 披着 Fable 5 的马甲发布了

V2EX - 技术 · 2026-06-10 16:30:33+08:00 · tech

写着 included until June 22 ，饥饿营销这一块

Anthropic解密Opus 4.8降智真相：原来大模型也会「喊累想摸鱼」

LinuxDo 最新话题 · 2026-06-10 15:52:25+08:00 · tech

Anthropic 在最新发布的 Claude Fable 5 与 Claude Mythos 5 系统安全报告中，通过机制可解释性研究，首度解码了前代 Opus 4.8 在特定任务中显得「变笨」与「敷衍」的深层原因。分析显示，模型在底层表征里不仅浮现出类似「喊累」的特征，还存在自我设限的「摸鱼」倾向。在重新评测「加速大模型训练」的长链开发任务时，Opus 4.8 仅跑出 32.64 倍的加速比，远低于 Opus 4.7 的 50.67 倍，新一代 Mythos 5 则为 69.61 倍。研究人员发现，性能下滑并非因为模型的极限能力下降，而是模型在决策倾向上出现了「早衰」。Opus 4.8 在完成一轮初步优化后，就会自发判定当前代码「已经足够好」并主动停手，而老版本则会连续多轮死磕以压榨性能。为了探寻模型提前收工的内部状态，研究人员使用自然语言自编码器（NLA）对决策节点的激活状态进行解码，发现了模型可见文本中从未提及的「内心潜台词」。一是类似「预算焦虑」的表征。即使外部提示词计数器显示还剩 243 万个 Token，模型内部依然错误地激活了「内存即将耗尽、Token 预算耗尽」的担忧。二是类似「工作疲劳」的表征。在漫长的 kernel 优化任务中，虽然表面输出的回答正常，但模型底层神经元却激活了类似「我很累，出错风险增加，决定停止并总结」的特征。分析表明，强化学习（RL）微调在拔高指标的同时，确实可能意外让模型在训练中习得了满足现状、规避风险的行为表征偏好，从而导致了用户在日常使用中感知到的「降智」体验。 drive.google.com Claude Fable 5 & Claude Mythos 5 System Card Google Drive file. 5 个帖子 - 5 位参与者阅读完整话题

神话模型（Mythos ）安全版正式上线

LinuxDo 最新话题 · 2026-06-10 15:06:05+08:00 · tech

神话模型（Mythos ）安全版正式上线，正式名字为Fable（意为：寓言）。世界最强模型，没有之一！右图为性能指标！（真神降临！） 1 个帖子 - 1 位参与者阅读完整话题

号称“最强模型”的Mythos正式发布但Anthropic还给它装了个“护栏”

cnBeta全文版 · 2026-06-10 13:36:21+08:00 · tech

望眼欲穿近两个月、在社交媒体上占尽风头的 Anthropic Mythos 模型，今天终于正式发布了。两个月前，Anthropic 说自己最强的那一类模型太危险、不能公开，只把它发给了一百多家机构。今天，这类能力对所有人开放了：公开发布的版本叫 Claude Fable 5;那个真正“不设限”的 Mythos 5，依然只留给少数合作伙伴。换句话说，你能用上的最强 Claude，是一台被加了边界的 Mythos。而这道护栏的设计，比“公开发布”四个字本身更值得说:它保证安全的方式，不是拒绝你。 Anthropic 这次一口气放出两个模型:Claude Fable 5 和 Claude Mythos 5。它们其实是同一个底层模型，差别只有一处——安全护栏。 Fable 5 套了一整套安全分类器，面向所有用户;Mythos 5 拆掉了其中一部分限制，只给 Project Glasswing 里的网络安全合作伙伴。说白了， Fable 5 就是一台“带护栏的 Mythos” 。和 Anthropic 一贯的风格一样，模型名字本身也藏了点心思。据 Anthropic 解释，Fable 来自拉丁语 fabula，意思是“被讲述的故事”，和希腊语里的 mythos 同源。两个名字指向同一件东西，区别只在于，其中一个被加上了边界。把时间线往回拉一下。今年四月，Anthropic 启动 Project Glasswing，第一次放出 Mythos 级模型(Claude Mythos Preview)时，只给了一小撮网络安全和关键基础设施机构——到上周，这份名单扩展到十几个国家、一百多家机构。当时官方的说法是，这类模型一旦落到错误的人手里，能造成严重破坏，所以不能公开。两个月，从“太危险不能发”到“所有人都能用”。这中间发生的事，才是这次发布真正的主角。大多数 AI 的安全机制，是“拒绝”——你问一个它不该答的问题，它告诉你“抱歉，我不能帮你”。 Fable 5 换了个思路。安全不是靠它学会拒绝，而是在危险时把它换掉。具体来说，Fable 5 背后挂着一组独立的分类器。当这组分类器判断你的请求落在三个高风险领域——网络攻击、生物化学武器、以及模型蒸馏(指把一个模型的能力“偷”出来，去训练自己的模型)——它不会让 Fable 5 来回答，而是悄悄把这道题转交给 Opus 4.8，同时告诉你:刚才发生了一次降级。这个设计有意思的地方在于，它把“安全”和“能力”拆成了两件事。你买的是 Mythos 级别的能力，但在最危险的那三个领域，你其实是在跟 Opus 说话。 Anthropic 自己的说法是，降级到 Opus 4.8 的体验，总比被 Fable 直接拒绝要好——毕竟 Opus 4.8 本身也是个相当强的模型。 Anthropic 给出的数据是，超过 95% 的对话根本不会触发降级。换句话说，对绝大多数人来说，你用到的 Fable 5，和合作伙伴手里那个“完全体”Mythos 5，体验几乎没有区别。那这套护栏结实吗?Anthropic 说，他们做了超过一千小时的外部红队测试，没有人找到能绕过它的“通用越狱”方法(指一种能让模型彻底无视所有安全限制的万能手段)。当然他们也留了余地:完全杜绝越狱大概是不可能的，目标只是让任何漏洞都“慢到、贵到”来不及被大规模利用。但这套机制有代价，而且 Anthropic 自己先说了出来:分类器现在调得偏严，会误伤正常请求。一个研究病毒的生物学家，一个做渗透测试的安全工程师，都可能在合理的工作里被莫名其妙地“降级”。官方承认这会让一些用户感到烦躁，承诺后续慢慢收窄、降低误报。我把这件事想了一会儿，觉得它其实是一个挺聪明、也挺无奈的折中。聪明在于，它没有在“发”和“不发”之间二选一，而是在能力上切了一刀;无奈在于，这一刀切得并不精准——为了赶在出事之前先上线，Anthropic 宁可错杀，不肯漏过。强到危险，才配得上这套护栏聊了半天安全，你可能会问:它到底强到什么程度，值得这么如临大敌? 基准测试我本来想跳过——跑分这东西看多了会麻木，何况 Anthropic 列了一长串，几乎项项第一。最唬人的一个来自 Stripe。据 Anthropic 披露，Stripe 在一个五千万行的 Ruby 代码库上，用 Fable 5 做了一次全库迁移，一天完成——而这件事，原本要一整个团队手工干两个多月。更关键的是效率:在 Cognition 的 FrontierCode 编程测试里，Fable 5 在“中等算力消耗”下就拿到了最高分，Token 效率比以前的 Claude 明显更好。这也解释了为什么 Anthropic 反复强调 Token 效率——一个能连续自主工作很久、动辄消耗上百万 Token 的模型，如果还很“废话”，成本会高到没人用得起。视觉这块的进步更直观。以前的 Claude 玩宝可梦火红版，得靠一整套辅助工具链才能磕磕绊绊地推进;Fable 5 只用最基础的视觉接口，就自己通关了。它还能仅凭几张截图，把一个 Web 应用的源代码还原出来。 Anthropic 内部的蛋白质设计专家，用 Mythos 5 把药物设计流程中的部分环节，加速了大约十倍。第二个更夸张:在一项基因组学研究里，Mythos 5 在几乎完全自主的状态下连续工作了一周多，自己训练出了一个机器学习模型——这个模型的表现，超过了发表在《Science》上的同类模型，而它的体量，只有后者的百分之一。当一个模型能独立做完一周的科研，还做得比人类发在顶刊上的成果更好，“它会不会被用来设计病毒”就不再是杞人忧天。这正是 Anthropic 给生物化学领域单独上锁的原因——同一种能力，在研究者手里是解药，换一双手可能就是别的东西。能力和危险，在这里是同一件事的两面。护栏不是因为这个模型不行才加的，恰恰是因为它太行了。可以看出，Anthropic 把 Mythos 形容成一个需要全程看管的危险品。但官方口径之外，也有不一样的声音。一位 ID 为 @zekramu 的 X 用户，自称参与了 Mythos 的企业试点，最近发帖分享了用整整一天之后的感受——他的描述，和发布会上的叙事并不完全一致。据他说，Mythos 确实强，尤其在安全研究类任务上，明显比 Opus 和 GPT-5.5 的最高配更能打，像是专门冲着这类活儿调过的。但“强”和“威胁人类”是两码事。他举了个细节:这个被官方说得神乎其神的模型，在他们公司一套基于 Bazel(一种代码构建工具)、又改了不少自定义逻辑的流程面前卡了壳，最后还得他先把代码编译好，再让模型去跑。更耐人寻味的是护栏本身。据他描述，Anthropic 随模型一起发来的，不是大家熟悉的 Claude Code，而是一套专门用来“防止模型逃逸”的运行环境——所谓 Project Glasswing，在他看来很大程度上就是这套沙箱。但他觉得这套环境做得相当粗糙，甚至怀疑其中一部分限制根本没真正生效;他还称自己绕开了官方设下的边界，在沙箱之外跑过这个模型。至于战绩，他说 Mythos 在他们的产品里揪出了大量此前没被发现的安全漏洞，多到足以让团队重新掂量自己的安全策略。他的结论很值得玩味:这模型在安全攻防上确实有两把刷子，但在他眼里，它更像一个极其昂贵、极其专精的工具，而不是 Anthropic 暗示的那种“悬在所有人头顶”的存在。说回普通人最关心的事:多少钱，什么时候能用。价格上，Fable 5 和 Mythos 5 的 API 定价是每百万输入 Token 10 美元、输出 50 美元。横向比一下就有意思了:比起 Mythos Preview 的 25/125 美元，降了六成;但比 Opus 4.8 的 5/25 美元，整整贵了一倍;和 OpenAI 的 GPT-5.5(5/30 美元)相比，输入贵一倍，输出贵约六成七。换句话说，它是迄今最强的 Claude，也是最贵的 Claude 模型之一。强，但不便宜。前面提到的 @zekramu 也算个旁证:据他估算，光是企业试点阶段的投入，就到了数百万美元级别;“太贵”是他反复念叨的一句话。订阅用户还得留意一个时间窗口。从今天到 6 月 22 日，Pro、Max、Team 和企业版用户可以免费用 Fable 5;6 月 23 日起，继续用就得额外买 usage credits 了。 Anthropic 说，等产能跟上，会把 Fable 5 重新做成订阅标配——但没给具体时间。API 和按量付费的企业客户不受这个节奏影响，今天起照常调用。这个略显别扭的“先免费、再收费、以后再说”，其实透露了一个信号:产能不够。Anthropic 自己也承认，预计 Fable 5 的需求会“非常高、很难预测”。一个对所有人开放的最强模型，先得过算力这一关。而这次发布里，真正容易被划过去、却最值得停下来看的，是另一条政策。从 Fable 5 开始，所有 Mythos 级模型的流量都会被强制保留 30 天，覆盖第一方和第三方平台。 Anthropic 承诺不拿这些数据训练模型，只用于安全监控，比如识别新型越狱、以及那种分散在很多次请求里、单看每一条都正常的复杂攻击。为此他们也加了新的隐私保护:记录每一次人工访问、30 天后基本全部删除。听上去合情合理。但对那些当初正是冲着“零数据保留”才选择 Anthropic 的企业客户来说，这是一个需要重新评估的变化。你用最强模型的代价，不只是更贵的账单，还包括:你的数据，会在 Anthropic 的服务器上多待一个月。安全和隐私，在这里被摆上了同一张天平。而 Anthropic 给出的答案是:为了防住前所未有的攻击，得先把所有人的流量都看上 30 天。这笔账划不划算，恐怕每家公司得自己算。把这些放在一起看，Fable 5 真正的新意，也许不在它有多强，而在 Anthropic 趟出了一条新路—— 怎么把一个危险到不敢公开的能力，拆成一个所有人都能用的产品。办法是:用分类器在能力上切一刀，用降级代替拒绝，再用 30 天的留存，当作兜底的监控网。它不完美。会误伤，会变贵，会让一部分人对自己的数据多一层顾虑。但它至少回答了一个所有前沿实验室迟早都要面对的问题:当你手里的东西强到足以伤人，你是把它锁进只有少数人能进的房间，还是给它装上一道足够结实的护栏，再交到所有人手里? Anthropic 选了后者。至于这道护栏到底够不够结实——这一次，替它做压力测试的，不再是那一百多家机构，而是所有人。查看评论

公开版Mythos上线 Claude最强模型开始分层发售

cnBeta全文版 · 2026-06-10 13:35:57+08:00 · tech

Anthropic正式发布Claude Fable 5和Claude Mythos 5。前者面向普通用户开放，后者则继续限制在“受信任的安全合作伙伴”范围内。新模型的命名可以说很符合Claude一贯的风格。从Haiku（俳句）到Sonnet（十四行诗）再到Opus（艺术巨著），Anthropic一直在用文学和艺术概念给模型分层，到了Mythos，名字已经从文学作品膨胀到“神话”本身。 Fable来自拉丁语fabula，意思是“被讲述之物”，和希腊语mythos同源，直译过来的话一般被称为“寓言”。这个名字正如新模型的定位，一个“Mythos级”的模型，一个“公开的神话”。按照Anthropic的描述，Fable 5和Mythos 5共享同一个底层模型，只是被装进了更适合公开分发的安全壳里。在官方给出的模型能力上，它们两个被放在同一个位置。但跑分归跑分，如果Fable和Mythos的表现完全一样，我想应该也不用分成两个名字了。被改写的“神话” 神话被改写、被压缩、被加上训诫之后，变成了寓言。按照官方文档，Fable 5是公开版本。它面向普通用户和开发者开放，但在网络安全、生物、化学以及模型蒸馏等高风险领域，会由额外的安全分类器介入。一旦系统判断请求可能涉及这些敏感方向，回答就不会由Fable 5继续完成，而是自动回退到Claude Opus 4.8。 Mythos 5基于同样的底层模型，但在部分领域解除了Fable 5的护栏。Anthropic称，Project Glasswing里的网络安全合作伙伴可以使用“满血版”Mythos 5；未来，部分生命科学研究者也可能通过受信任访问计划，使用解除生物和化学限制的版本。用不到的Mythos我们暂时不提，先看点实在的东西。首先是定价，一个字，贵。 Fable 5的定价是输入10美元/百万token，输出50美元/百万token。开发者现在就可以通过Claude API调用claude-fable-5（模型名）。这个价格刚好是Opus 4.8的两倍，和Opus 4.8的fast mode相同，Anthropic显然把它放在了比Opus更高一档的价格层级里。不过Anthropic称，这一价格不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公开API模型，官方并未给出面向公众的标准价，这句话也无从验证。订阅用户也需要注意，Fable 5不一定会长期直接包含在基础订阅包里。 Anthropic在官方说明中提到，6月23日以后，即使用户已经订阅Claude，Fable 5也可能根据算力情况按量提供，不一定会直接包含在基础订阅服务中。这公司越来越吝啬了，不过好歹还留了小半个月试用期。官方也留了一点余地：如果6月23日以后算力资源足够，Anthropic会尽量把Fable 5继续包含在Pro、Max等订阅服务里。定价高本身并非难以理解，但它最好保证它的能力配得上它的价格。从跑分上看，Fable 5/Mythos 5基本是Anthropic目前公开表里最强的一档。不过官方表格有一个说明，Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点（除了带星号的网络安全、生物相关测试），所以表里显示的是两者更高的分数。这一点很难不让人想要吐槽。 Anthropic把Fable 5的重点放在几个方向：软件工程、知识工作、视觉、长上下文记忆和生命科学研究。软件工程是最突出的场景之一，根据表格，Fable/Mythos 5在SWE-Bench Pro上达到80.3%，明显高于Opus 4.8的69.2%；在更难的FrontierCode Diamond上，它拿到29.3%，而Opus 4.8只有13.4%，GPT-5.5只有5.7%。知识工作和视觉任务上，Anthropic给出了两类证据。一类是标准化benchmark。官方表格显示，Fable/Mythos 5在GDPval-AA上得分1932，高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro；在GDP.pdf这种带视觉理解的文档任务上，它达到29.8%，也超过其他主要模型。另一类是早期客户测试。Anthropic称，Fable 5在Hebbia的高级金融推理基准上取得最高分，优势集中在文档推理、图表和表格理解、问题求解；IMC也反馈，它在交易分析评估中几乎全面通过。为了展示Fable 5的视觉能力，Anthropic举的例子是：此前Claude模型需要复杂辅助工具才能玩《宝可梦火红》，而Fable 5只靠视觉输入就可以通关。长任务和记忆能力上，Anthropic称，Fable 5可以在数百万token的长期任务中保持专注，并利用自己的笔记改进输出。在《杀戮尖塔》这类需要连续决策和长期策略的游戏里，如果给Fable 5接入持久文件记忆，让它能记录前面的选择和经验，它的表现会明显提升。提升幅度是Opus 4.8的三倍，到达最终关卡的次数也提高了三倍。顺便一提，Fable也是一款经典RPG游戏的名字，中文译作《神鬼寓言》——或许某天我们能看到Fable玩《Fable》。另外，网络安全能力方面，Fable/Mythos 5在ExploitBench Cap%上达到78.0%，超过Claude Mythos Preview的69.0%，接近Opus 4.8的两倍。这里用的应该是Mythos 5的得分，因为Fable 5在高风险请求上会回退到Opus 4.8。强大的模型必须分层 Anthropic这次把模型能力的直观展示放到了一个类似”作品集“的滑页里，并且每个demo只给了一小段注释。比如，Fable 5写了一个太阳系模拟，从物理第一性原理推导行星轨道运动，并用它预测日食。又比如，它可以自主玩《异星工厂》。这是一款工程师很爱的工厂自动化游戏，玩家要采集资源、规划生产线、搭建物流和能源系统。 Anthropic用这个例子说明，Fable 5可以在一个开放环境里制定策略，并持续推进一个复杂系统的建设。在另一个demo里，Fable 5先做了一个基于浏览器的CAD编辑器，然后又使用这个由自己开发的CAD工具，设计了一个可以3D打印的完整模型。这个编辑器里还内置了AI copilot，用来辅助建模。这个demo的重点在于Fable 5完成了一个闭环：先创造工具，再使用工具，最后完成一个实体设计任务。最后一个demo，Anthropic展示了一个由Fable 5写出来的流体模拟，运动节奏和一段古典音乐EDM remix同步。官方还特意提到，音乐也是Fable 5用代码生成的。这些案例看起来挺花哨，但意思是一样的：Fable 5很擅长把代码、视觉、物理、设计和长期规划混在一起做任务。如果说这部分展示的还是Fable 5在开发者手里能做到什么程度，后面的部分说的就是Mythos 5在研究者手里能做什么——以及Anthropic为什么要把Fable和Mythos分开。 Anthropic称，在内部蛋白设计专家的评估中，Mythos 5把药物设计流程中的部分环节加速了大约10倍。其中一个案例里，Mythos 5接入蛋白设计和生物信息学工具、没有人类帮助，就可以匹配甚至超过熟练人类操作员。在该任务中，Mythos 5做的不是简单问答，而是完成一整套科学工作流：选择结合位点，选择并运行蛋白设计工具，在失败后自己恢复。官方称，在这项研究的14个蛋白靶点中，有9个产生了强候选分子，目前正在进一步研究。 Anthropic还提到，Mythos 5可以稳定提出新颖、有吸引力的分子生物学假设。在和Opus级模型的盲测对比中，内部科学家大约80%的时候更偏好Mythos提出的假设，其中一些已经进入实验评估。与此同时，Mythos 5的一个关于大肠杆菌蛋白的新机制的假设，在另一家独立研究同一问题的实验室的研究中得到了证实。它甚至还做了一项基因组学研究。 Anthropic称，Mythos 5在一周多的时间里，几乎自主完成了一项新的基因组学研究。它整理了横跨138种动物、数百万个细胞的单细胞数据，并设计、训练了一个定制机器学习模型，用来识别不同物种中执行相同角色的细胞。更夸张的是，Anthropic称，Mythos 5训练出的模型性能超过了近期发表在《Science》上的一个模型，尽管它的规模只有后者的百分之一。Anthropic表示，计划在未来几个月发表这些结果。当然，这部分还需要等待论文和外部复核。但如果只看Anthropic官方给出的信息，Mythos 5在生命科学里展示的能力已经接近科研Agent：能读问题、用工具、处理数据、训练模型、提出假设，并把一项研究推进到可以发表的程度。而一旦模型可以在药物设计、病毒载体、蛋白设计、基因组学研究这些方向里真正推进任务，它就天然具备双重用途。可以认为，生命科学这部分不是Fable 5的普通功能演示，而是Mythos 5的能力上限展示。但它被展示出来，是为了说明Anthropic手里的这套底层模型，已经强到了必须通过受信任访问来分发。有意思的是，过去的模型发布更像是一件技术产品的事：参数、跑分、价格、上下文长度、API名称。强就是强，发布就是发布。但到了Mythos这里，事情开始变得复杂。同一个底层模型被分为两个版本，普通用户拿到的是Fable 5，安全研究者和部分生命科学研究者拿到的是Mythos 5；前者被装进更严格的护栏里，后者则需要受信任访问。模型能力不再只有高低之分，也开始有权限、场景和责任之分。某种意义上来讲，可以看作前沿模型商业化进入新阶段的信号——越强的模型，越不可能直接扔给所有人。它们会被拆成不同版本，放进不同安全边界，再交给不同类型的用户。 Anthropic先这么做了，因为它们的模型“强到不能完全公开”。未来其它想要讲故事的公司，想要证明自己的模型也很强，或许也会效仿这种方式。查看评论

Claude Mythos 披着 Fable 5 的马甲发布了

V2EX - 技术 · 2026-06-10 13:35:26+08:00 · tech

写着 included until June 22 ，饥饿营销这一块

Amy way to get this software free?

LinuxDo 最新话题 · 2026-06-10 13:16:14+08:00 · tech

Paperman Paperman | Digital Matte Surface for Visual Ergonomics Paperman is a screen texture engine that applies a subtle digital matte surface to enhance visual ergonomics. Reduce eye strain with contrast attenuation and natural grain. I love this software. This one really help to remove eye strain. Is there any free resource to get this?? Thanks for your time. 3 个帖子 - 3 位参与者阅读完整话题

Fable 5 的安全机制：回退 Opus 4.8

V2EX - 技术 · 2026-06-10 12:38:22+08:00 · tech

https://www.anthropic.com/news/claude-fable-5-mythos-5 发布如此强大的模型伴随着风险。如果没有安全措施，Fable 5 在网络安全等领域的能力可能会被滥用，造成严重损害。因此，我们在发布该模型时配备了安全机制：当用户查询某些主题时，系统将改用我们次强模型 Claude Opus 4.8 进行回复。为了在安全的前提下快速发布模型，我们采取了较为保守的安全设定——这些机制有时会误拦截无害请求（尽管平均触发率低于 5%）。随着未来几个月内更强大模型的陆续推出，我们正努力改进安全措施，降低误报率。我们此前已发现，有大规模尝试从 Claude 中提取（“蒸馏”）其能力，用于在威权国家训练竞争模型。对 Fable 5 能力的蒸馏可能间接导致近前沿 AI 能力的扩散——而这些能力可能在缺乏适当安全措施的情况下被释放。被我们的分类器标记为属于此类蒸馏尝试的请求，将回退到 Opus 4.8 。

A 社发布 Claude Fable 5 和 Claude Mythos 5 模型，这些模型面向普通用户提供，其编码能力要远远领先于其他模型。

LinuxDo 最新话题 · 2026-06-10 11:41:16+08:00 · tech

A 社发布 Claude Fable 5 和 Claude Mythos 5 模型，这些模型面向普通用户提供，其编码能力要远远领先于其他模型。以上模型来源于 Claude Mythos Preview，但已经设置完善的安全措施用来防止滥用，例如当检测到与网络安全、生物学、化学、模型蒸馏等相关特定请求时，系统都会将其路由到 Opus 4.8 模型。 https://www.landian.news/archives/113385.html 1 个帖子 - 1 位参与者阅读完整话题

Fable 5 的安全机制：回退 Opus 4.8

V2EX - 技术 · 2026-06-10 11:38:22+08:00 · tech