WWW.YOUINFO.SITE
标签聚合 My

/tag/My

LinuxDo 最新话题 · 2026-06-11 22:47:02+08:00 · tech

[!NOTE] 原始pdf在此 Claude Fable 5 & Claude Mythos 5 System Card 如果想深挖,随便找个AI就能挖了 这边又开新坑,那一定是因为我要吐槽!!!! [!CHECK] 尽量保持专业性,不过依然欢乐向。博君一笑 TL;DR 虽然 Mythos 5 和 Fable 5 都是新一代超模,性能超越了之前的 Mythos Preview ,乃们浅浅氪金的屁民们只配用 Fable 5 ,我们还为了人类的福祉,给你们的 Fable 5 添加了极其先进的外审,传说中的 ASL-3 blocking classifiers ,这样在标准用户提问生物化学问题的时候,依然能达到4.8opus的水准 废话吗这不是,都给用户干回去4.8opus了,那不是opus水准是啥 [!warning] 嗯,做科研的宝子们可以基本放弃了,就不要浪费宝贵的额度。 如果您恰好需要用我们极其先进的 Mythos 5 训练自己的模型,我们的模型很强哦! 虽然但是,你们这些浅氪的穷人怎么配用我们高贵的 Mythos 5 呢,如果你用 Fables 5 ,那我们会悄咪咪降低调参的能力 剧透 别问,问就是违反了我们的 ToS , 正经用户都是要先读条款才开始使用的。 我们的上下文也是前无古人,后无来者。 我们全盘抛弃了 OpenAI 推出的捞针测试, 剧透 我们现在使用的是遥遥领先的 GraphWalk®️ 甚至都是注册商标呢!足见我们长上下文艳压群芳的能力。 我们要做就是做最安全的模型,所以肯定是安全。三百多页的模型卡,一半都在讲安全,是不是很安全呢? 而且我们很诚实。一旦发觉用户有一些奇怪的企图,就开始跟用户讲诚实 用户坏坏,已经被Dario远程锁定噜 。 pretrain 数据来源 老样子:我蒸不是蒸,自我之下阶级分明,谢谢! 安全 RSP(Responsible Scaling Policy)& FCF (Frontier Compliance Framework) 我们的模型非常的强大,因此呢,就暴露出了一些在生物学和化学中的相关风险。 看到这些缩写楼主就头大了 我们 假定 我们的超模已经有了 CB-1 能力(Chemical and biological weapons threat model 1, 翻译成人话就是非创新性的生物和化学武器构造) ,我们预判到了用户的预判,增加了非常多针对性的甲!至于 CB-2 能力(类似于创新武器),我们不是很确定,但是我们依然预判了用户的预判 迫害妄想症啊这是 这个 poor judgement 笑死我了 真的有人会用claude做武器吗? 剧透 截图放小一点,反正你品,你再品。 真是恐怖如斯!居然还煞有介事🉐找了外面的 vendor 来做测试。 (点击了解更多详细信息) A\ : 知道为什么这么贵吗?因为请这些人都要花钱的呀。你以为我们的钱是大风刮来的吗? 剧透 2.3 和 2.4 里面倒是说了一些实话,无外乎还是读代码不全,胡说八道,没有好的说做好了之类的 Cyber 嗯,长话短说,就是我们超绝敏感肌! 如果宝宝用起来不习惯,那就只能氪金Mythos了。 真的这一部分笑死了,完全没有 Fables-5 来参与评测。不过里面有一张图,嗯,反正大家掂量一下。 Safeguards and harmlessness 哼,看到第七十一页第四小节,你以为我讲完了?没有,没有,我们还是继续讲安全。 剧透 To Be Continued 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-11 17:33:51+08:00 · tech

NewAPI 的日志目前是单表存储,已经看到太多佬友因为日志撑爆磁盘了,下面给出一种解决方式,可能不完全兼容,但是个人测试下来没有什么问题 与 NewAPI 版本无关,基本所有版本都可以用,我用的版本是 1.0.0-rc.10 自带的日志删除 最常用的是使用 NewAPI 自带的 “清理历史日志” 来进行删除 // 代码逻辑如下 // 直接按照时间戳删除 LOG_DB.Where("created_at < ?", targetTimestamp).Limit(limit).Delete(&Log{}) 这里有两个问题: Delete 的效率不高,或者说在数据量过大的情况下使用 Delete 带来的 IO 可能成为灾难 Delete 之后磁盘空间并不会回收,需要手动回收 通过数据库分片解决日志删除 适用于 MySQL,如果您是其他的 DB 如 Postgres / SQLite,将下面的内容提供给 AI 相信也会有对应的解决方案 分片的核心逻辑是,将日志拆分到对应的日期上,比如分片 logs_20260601 只存储当天的数据,在超出需要删除的日期后,比如 1 个月后的 2026/07/01,直接删除 logs_20260601 分片,分片占用的空间会立刻释放,对应的日志数据也会直接删除 不过这里要提示您,所有的 DB 变更都可能引入风险,请您在执行前通过 mysqldump 或者类似工具,导出完整的数据结构和数据内容,确保执行出现异常可以随时回滚 执行下面的步骤前,建议停机,否则可能导致数据不完整 ,如果数据完整性不在考虑范围内,也可以在线更新 Step 1 检查数据符合预期 (Read) 执行下面的查询语句,确保 count 为 0,即所有的日志的创建时间不为空 SELECT COUNT(*) AS null_created_at_count FROM logs WHERE created_at IS NULL; Step 2 创建临时表 (Write) CREATE TABLE logs_new LIKE logs; Step 3 添加准备分区语句 (Read) 通过下面的 SQL,可以获得一个建表 SQL,对 DB 无任何副作用,可以放心执行 下面的 @start_date 和 @end_date 两行,可以按照您的实际数据存储情况调整,下面的配置为创建 180 天前到 7 天后的分区,如果您的日志已经回收或删除过了,可以考虑缩减分区数量 SET time_zone = '+08:00'; 这里可以按照您的需求调整为具体的时区 分区必须提前创建,否则插入数据会有问题 ,所以您至少需要创建 7 天后的备用 SET SESSION group_concat_max_len = 1024 * 1024; SET time_zone = '+08:00'; SET @start_date = DATE_SUB(CURDATE(), INTERVAL 180 DAY); SET @end_date = DATE_ADD(CURDATE(), INTERVAL 7 DAY); WITH RECURSIVE dates AS ( SELECT @start_date AS d UNION ALL SELECT DATE_ADD(d, INTERVAL 1 DAY) FROM dates WHERE d < @end_date ) SELECT GROUP_CONCAT( CONCAT( ' PARTITION p', DATE_FORMAT(d, '%Y%m%d'), ' VALUES LESS THAN (', UNIX_TIMESTAMP(DATE_ADD(d, INTERVAL 1 DAY)), ')' ) ORDER BY d SEPARATOR ',\n' ) INTO @parts FROM dates; SET @sql = CONCAT( 'ALTER TABLE logs_new MODIFY `created_at` bigint NOT NULL, DROP PRIMARY KEY, DROP INDEX `idx_created_at_id`, ADD PRIMARY KEY (`id`, `created_at`) PARTITION BY RANGE (`created_at`) ( ', @parts, ', PARTITION pmax VALUES LESS THAN MAXVALUE )' ); SELECT @sql; Step 4 执行分区语句 (Write) 执行上一步输出的 SQL,会将新的 logs_new 表调整为分区表 Step 5 导入旧的数据 (Write) 取决于您的数据量,这一步可能会花费一些时间 INSERT INTO logs_new SELECT * FROM logs; Step 6 校验数据已经导入完成 (Read) 如果您是停机更新,确保两条 SQL 输出的内容是一致的 如果您是在线更新,确保数据接近或一致 SELECT "logs" as `table`, COUNT(*), MIN(created_at), MAX(created_at) FROM logs UNION SELECT "logs_new" as `table`, COUNT(*), MIN(created_at), MAX(created_at) FROM logs_new; Step 7 确认分区 (Read) 下面的 SQL 会打印新表的所有分区,以及每个分区的数据量 SELECT PARTITION_NAME, PARTITION_DESCRIPTION, TABLE_ROWS FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs_new' ORDER BY PARTITION_ORDINAL_POSITION; Step 8 切表 (Write) 切换流量到新表,执行完成后请检查 NewAPI 各组件各页面是否能正常工作,特别是依赖日志的内容 RENAME TABLE logs TO logs_old, logs_new TO logs; Step 9 创建自动回收创建/分区任务 (Write) MySQL 不会自动创建或者删除分区,需要您创建定时任务来实现,下面会给出创建/删除分区的任务,您可以按需添加 Step 9.1 开启 MySQL Event Scheduler 在数据库中执行下面的命令,通常需要 root 用户,无需重启 SET GLOBAL event_scheduler = ON; SHOW VARIABLES LIKE 'event_scheduler'; 在配置文件的 mysqld 章节,增加下面的配置,无需重启 这一步是为了保证,即使后面重启数据库,Event Scheduler 仍然会是开启状态 [mysqld] event_scheduler=ON Step 9.2 创建新建分区任务 下面的两个 SQL 都需要执行 第一个 SQL 中的 SET time_zone = '+08:00'; 可按需修改为您的时区 第二个 SQL 中的时间您可以修改为适用于您的服务的时间,目前设置的是每天的 02:00,用于控制定时触发的时机 DELIMITER $$ DROP PROCEDURE IF EXISTS sp_logs_create_future_partitions$$ CREATE PROCEDURE sp_logs_create_future_partitions() BEGIN DECLARE v_i INT DEFAULT 0; DECLARE v_d DATE; DECLARE v_partition_name VARCHAR(32); DECLARE v_less_than BIGINT; DECLARE v_exists INT DEFAULT 0; DECLARE v_sql TEXT; SET time_zone = '+08:00'; WHILE v_i <= 7 DO SET v_d = DATE_ADD(CURDATE(), INTERVAL v_i DAY); SET v_partition_name = CONCAT('p', DATE_FORMAT(v_d, '%Y%m%d')); SET v_less_than = UNIX_TIMESTAMP(DATE_ADD(v_d, INTERVAL 1 DAY)); SELECT COUNT(*) INTO v_exists FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' AND PARTITION_NAME = v_partition_name; IF v_exists = 0 THEN SET v_sql = CONCAT( 'ALTER TABLE logs REORGANIZE PARTITION pmax INTO (', 'PARTITION ', v_partition_name, ' VALUES LESS THAN (', v_less_than, '), ', 'PARTITION pmax VALUES LESS THAN MAXVALUE', ')' ); SET @sql = v_sql; PREPARE stmt FROM @sql; EXECUTE stmt; DEALLOCATE PREPARE stmt; END IF; SET v_i = v_i + 1; END WHILE; END$$ DELIMITER ; DROP EVENT IF EXISTS ev_logs_create_future_partitions; CREATE EVENT ev_logs_create_future_partitions ON SCHEDULE EVERY 1 DAY STARTS TIMESTAMP(CURRENT_DATE, '02:00:00') DO CALL sp_logs_create_future_partitions(); Step 9.3 创建删除分区任务 (可选) 这个是用于替代 NewAPI 自带的删除数据任务,如果您有需要可以配置这里的自动删除 第一个 SQL 中的 INTERVAL 180 DAY 表示删除 180 天之前的数据,可以按需修改, SET time_zone = '+08:00'; 也可按需修改为您的时区 第二个 SQL 中的时间您可以修改为适用于您的服务的时间,目前设置的是每天的 03:00,用于控制定时触发的时机 DELIMITER $$ DROP PROCEDURE IF EXISTS sp_logs_drop_old_partitions$$ CREATE PROCEDURE sp_logs_drop_old_partitions() BEGIN DECLARE v_cutoff_date DATE; DECLARE v_cutoff_ts BIGINT; DECLARE v_drop_partitions TEXT; DECLARE v_sql TEXT; SET time_zone = '+08:00'; SET v_cutoff_date = DATE_SUB(CURDATE(), INTERVAL 180 DAY); SET v_cutoff_ts = UNIX_TIMESTAMP(v_cutoff_date); SELECT GROUP_CONCAT(PARTITION_NAME ORDER BY PARTITION_ORDINAL_POSITION) INTO v_drop_partitions FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' AND PARTITION_NAME REGEXP '^p[0-9]{8}$' AND CAST(PARTITION_DESCRIPTION AS UNSIGNED) <= v_cutoff_ts; IF v_drop_partitions IS NOT NULL AND v_drop_partitions <> '' THEN SET v_sql = CONCAT( 'ALTER TABLE logs DROP PARTITION ', v_drop_partitions ); SET @sql = v_sql; PREPARE stmt FROM @sql; EXECUTE stmt; DEALLOCATE PREPARE stmt; END IF; END$$ DELIMITER ; DROP EVENT IF EXISTS ev_logs_drop_old_partitions; CREATE EVENT ev_logs_drop_old_partitions ON SCHEDULE EVERY 1 DAY STARTS TIMESTAMP(CURRENT_DATE, '00:10:00') DO CALL sp_logs_drop_old_partitions(); Step 9.4 检查任务 show events; SHOW PROCEDURE STATUS WHERE Db = DATABASE(); Step 10 大功告成 一切已准备就绪,请使用吧!数据库将按照您的配置自动创建新的分片,回收旧的分片,后续如果有调整,也可以直接修改 SQL 配置再次执行。 您可以定期通过下面的 SQL 来检查分区任务的运行状态和分区的数据量,请检查 pmax 分区数据量为 0,且已经创建了 7 天后的分区 SELECT PARTITION_NAME, PARTITION_DESCRIPTION, TABLE_ROWS FROM information_schema.PARTITIONS WHERE TABLE_SCHEMA = DATABASE() AND TABLE_NAME = 'logs' ORDER BY PARTITION_ORDINAL_POSITION DESC LIMIT 15; 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-11 03:05:55+08:00 · tech

anthropic.com Claude Fable 5 and Claude Mythos 5 Today we’re launching Claude Fable 5: a Mythos-class model that we’ve made safe for general use. After this point—when sufficient capacity allows us to do so—we aim to restore Fable 5 as a standard part of subscription plans. We intend to do this as quickly as we can. 机翻:在此之后——当容量足够时,我们计划将《Fable 5》恢复为订阅计划的标准部分。我们打算尽快完成这项工作。 6 个帖子 - 4 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-11 01:35:09+08:00 · tech

微软近日在内部限制员工使用 Anthropic 新发布的 Mythos 级大模型 Claude Fable 5,原因是对其数据留存政策可能带来的合规和保密风险存在疑虑。 据知情人士透露,在 Anthropic 更新了针对 Claude Fable 5 的数据留存要求后,微软法务团队已介入评估,暂时将该模型从公司内部员工使用的 GitHub Copilot 模型选择列表中移除。 Anthropic 于昨日正式推出首个 Mythos 级模型 Claude Fable,Fable 5 是此次发布的核心版本,并已被微软迅速集成到面向客户的 GitHub Copilot 和 Foundry 等产品和服务中。 不过,与面向外部客户的快速上线不同,微软内部员工在自用的 GitHub Copilot 环境中暂时无法选用 Claude Fable 5,仍只能访问其他继续实施“零数据留存”(Zero Data Retention,ZDR)策略的 Claude 系列模型。 据悉,微软内部向员工的说明是,法务团队正在评估 Anthropic 对 Mythos 系列模型提出的最新数据留存要求,核心担忧集中在客户数据与保密信息如何被存储与处理。 目前尚不清楚法务评估的最终结论以及 Claude Fable 5 能否在未来重新开放给微软内部员工使用。 根据 Anthropic 公布的政策,Claude Fable 5 的运行依赖新的安全分类器,这要求服务端对用户的提示词(prompts)和输出内容进行留存,以便进行安全分析和违规检测。 按照现行规则,这些数据会默认保存 30 天并在期满后删除;若相关内容被标记为违反 Anthropic 使用政策,则可能被保留长达两年,以便持续用于安全和合规用途。 正是这一“必需留存”的机制,引发了微软方面在法律责任、客户隐私和企业机密保护上的一系列顾虑。 Claude Fable 5 是 Anthropic Mythos 模型家族的首次大规模对外发布,此前该公司曾表示,这一家族在网络安全等敏感任务上的能力极强,强到“过于危险而不宜完全公开发布”。 为降低滥用风险,Anthropic 为 Fable 5 引入了更严格的提示词安全防护和内容审查机制,这也在技术上促成了当前的数据留存设计,从而在产品安全与数据合规之间制造出新的张力。 就 Claude Fable 5 在微软内部的使用现状及后续打算,媒体已向微软方面寻求评论,但在截稿前微软尚未作出回应。 查看评论

LinuxDo 最新话题 · 2026-06-10 15:52:25+08:00 · tech

Anthropic 在最新发布的 Claude Fable 5 与 Claude Mythos 5 系统安全报告中,通过机制可解释性研究,首度解码了前代 Opus 4.8 在特定任务中显得「变笨」与「敷衍」的深层原因。 分析显示,模型在底层表征里不仅浮现出类似「喊累」的特征,还存在自我设限的「摸鱼」倾向。在重新评测「加速大模型训练」的长链开发任务时,Opus 4.8 仅跑出 32.64 倍的加速比,远低于 Opus 4.7 的 50.67 倍,新一代 Mythos 5 则为 69.61 倍。 研究人员发现,性能下滑并非因为模型的极限能力下降,而是模型在决策倾向上出现了「早衰」。Opus 4.8 在完成一轮初步优化后,就会自发判定当前代码「已经足够好」并主动停手,而老版本则会连续多轮死磕以压榨性能。 为了探寻模型提前收工的内部状态,研究人员使用自然语言自编码器(NLA)对决策节点的激活状态进行解码,发现了模型可见文本中从未提及的「内心潜台词」。 一是类似「预算焦虑」的表征。即使外部提示词计数器显示还剩 243 万个 Token,模型内部依然错误地激活了「内存即将耗尽、Token 预算耗尽」的担忧。 二是类似「工作疲劳」的表征。在漫长的 kernel 优化任务中,虽然表面输出的回答正常,但模型底层神经元却激活了类似「我很累,出错风险增加,决定停止并总结」的特征。 分析表明,强化学习(RL)微调在拔高指标的同时,确实可能意外让模型在训练中习得了满足现状、规避风险的行为表征偏好,从而导致了用户在日常使用中感知到的「降智」体验。 drive.google.com Claude Fable 5 & Claude Mythos 5 System Card Google Drive file. 5 个帖子 - 5 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-10 13:36:21+08:00 · tech

望眼欲穿近两个月、在社交媒体上占尽风头的 Anthropic Mythos 模型,今天终于正式发布了。两个月前,Anthropic 说自己最强的那一类模型太危险、不能公开,只把它发给了一百多家机构。今天,这类能力对所有人开放了:公开发布的版本叫 Claude Fable 5;那个真正“不设限”的 Mythos 5,依然只留给少数合作伙伴。 换句话说,你能用上的最强 Claude,是一台被加了边界的 Mythos。 而这道护栏的设计,比“公开发布”四个字本身更值得说:它保证安全的方式,不是拒绝你。 Anthropic 这次一口气放出两个模型:Claude Fable 5 和 Claude Mythos 5。它们其实是同一个底层模型,差别只有一处——安全护栏。 Fable 5 套了一整套安全分类器,面向所有用户;Mythos 5 拆掉了其中一部分限制,只给 Project Glasswing 里的网络安全合作伙伴。 说白了, Fable 5 就是一台“带护栏的 Mythos” 。 和 Anthropic 一贯的风格一样,模型名字本身也藏了点心思。 据 Anthropic 解释,Fable 来自拉丁语 fabula,意思是“被讲述的故事”,和希腊语里的 mythos 同源。两个名字指向同一件东西,区别只在于,其中一个被加上了边界。 把时间线往回拉一下。今年四月,Anthropic 启动 Project Glasswing,第一次放出 Mythos 级模型(Claude Mythos Preview)时,只给了一小撮网络安全和关键基础设施机构——到上周,这份名单扩展到十几个国家、一百多家机构。当时官方的说法是,这类模型一旦落到错误的人手里,能造成严重破坏,所以不能公开。 两个月,从“太危险不能发”到“所有人都能用”。这中间发生的事,才是这次发布真正的主角。 大多数 AI 的安全机制,是“拒绝”——你问一个它不该答的问题,它告诉你“抱歉,我不能帮你”。 Fable 5 换了个思路。 安全不是靠它学会拒绝,而是在危险时把它换掉。 具体来说,Fable 5 背后挂着一组独立的分类器。 当这组分类器判断你的请求落在三个高风险领域——网络攻击、生物化学武器、以及模型蒸馏(指把一个模型的能力“偷”出来,去训练自己的模型)——它不会让 Fable 5 来回答,而是悄悄把这道题转交给 Opus 4.8,同时告诉你:刚才发生了一次降级。 这个设计有意思的地方在于,它把“安全”和“能力”拆成了两件事。 你买的是 Mythos 级别的能力,但在最危险的那三个领域,你其实是在跟 Opus 说话。 Anthropic 自己的说法是,降级到 Opus 4.8 的体验,总比被 Fable 直接拒绝要好——毕竟 Opus 4.8 本身也是个相当强的模型。 Anthropic 给出的数据是,超过 95% 的对话根本不会触发降级。换句话说,对绝大多数人来说,你用到的 Fable 5,和合作伙伴手里那个“完全体”Mythos 5,体验几乎没有区别。 那这套护栏结实吗?Anthropic 说,他们做了超过一千小时的外部红队测试,没有人找到能绕过它的“通用越狱”方法(指一种能让模型彻底无视所有安全限制的万能手段)。 当然他们也留了余地:完全杜绝越狱大概是不可能的,目标只是让任何漏洞都“慢到、贵到”来不及被大规模利用。 但这套机制有代价,而且 Anthropic 自己先说了出来:分类器现在调得偏严,会误伤正常请求。一个研究病毒的生物学家,一个做渗透测试的安全工程师,都可能在合理的工作里被莫名其妙地“降级”。官方承认这会让一些用户感到烦躁,承诺后续慢慢收窄、降低误报。 我把这件事想了一会儿,觉得它其实是一个挺聪明、也挺无奈的折中。聪明在于,它没有在“发”和“不发”之间二选一,而是在能力上切了一刀;无奈在于,这一刀切得并不精准——为了赶在出事之前先上线,Anthropic 宁可错杀,不肯漏过。 强到危险,才配得上这套护栏 聊了半天安全,你可能会问:它到底强到什么程度,值得这么如临大敌? 基准测试我本来想跳过——跑分这东西看多了会麻木,何况 Anthropic 列了一长串,几乎项项第一。 最唬人的一个来自 Stripe。据 Anthropic 披露,Stripe 在一个五千万行的 Ruby 代码库上,用 Fable 5 做了一次全库迁移,一天完成——而这件事,原本要一整个团队手工干两个多月。更关键的是效率:在 Cognition 的 FrontierCode 编程测试里,Fable 5 在“中等算力消耗”下就拿到了最高分,Token 效率比以前的 Claude 明显更好。 这也解释了为什么 Anthropic 反复强调 Token 效率——一个能连续自主工作很久、动辄消耗上百万 Token 的模型,如果还很“废话”,成本会高到没人用得起。 视觉这块的进步更直观。以前的 Claude 玩宝可梦火红版,得靠一整套辅助工具链才能磕磕绊绊地推进;Fable 5 只用最基础的视觉接口,就自己通关了。它还能仅凭几张截图,把一个 Web 应用的源代码还原出来。 Anthropic 内部的蛋白质设计专家,用 Mythos 5 把药物设计流程中的部分环节,加速了大约十倍。第二个更夸张:在一项基因组学研究里,Mythos 5 在几乎完全自主的状态下连续工作了一周多,自己训练出了一个机器学习模型——这个模型的表现,超过了发表在《Science》上的同类模型,而它的体量,只有后者的百分之一。 当一个模型能独立做完一周的科研,还做得比人类发在顶刊上的成果更好,“它会不会被用来设计病毒”就不再是杞人忧天。 这正是 Anthropic 给生物化学领域单独上锁的原因——同一种能力,在研究者手里是解药,换一双手可能就是别的东西。 能力和危险,在这里是同一件事的两面。护栏不是因为这个模型不行才加的,恰恰是因为它太行了。 可以看出,Anthropic 把 Mythos 形容成一个需要全程看管的危险品。但官方口径之外,也有不一样的声音。 一位 ID 为 @zekramu 的 X 用户,自称参与了 Mythos 的企业试点,最近发帖分享了用整整一天之后的感受——他的描述,和发布会上的叙事并不完全一致。 据他说,Mythos 确实强,尤其在安全研究类任务上,明显比 Opus 和 GPT-5.5 的最高配更能打,像是专门冲着这类活儿调过的。但“强”和“威胁人类”是两码事。他举了个细节:这个被官方说得神乎其神的模型,在他们公司一套基于 Bazel(一种代码构建工具)、又改了不少自定义逻辑的流程面前卡了壳,最后还得他先把代码编译好,再让模型去跑。 更耐人寻味的是护栏本身。据他描述,Anthropic 随模型一起发来的,不是大家熟悉的 Claude Code,而是一套专门用来“防止模型逃逸”的运行环境——所谓 Project Glasswing,在他看来很大程度上就是这套沙箱。但他觉得这套环境做得相当粗糙,甚至怀疑其中一部分限制根本没真正生效;他还称自己绕开了官方设下的边界,在沙箱之外跑过这个模型。 至于战绩,他说 Mythos 在他们的产品里揪出了大量此前没被发现的安全漏洞,多到足以让团队重新掂量自己的安全策略。 他的结论很值得玩味:这模型在安全攻防上确实有两把刷子,但在他眼里,它更像一个极其昂贵、极其专精的工具,而不是 Anthropic 暗示的那种“悬在所有人头顶”的存在。 说回普通人最关心的事:多少钱,什么时候能用。 价格上,Fable 5 和 Mythos 5 的 API 定价是每百万输入 Token 10 美元、输出 50 美元。横向比一下就有意思了:比起 Mythos Preview 的 25/125 美元,降了六成;但比 Opus 4.8 的 5/25 美元,整整贵了一倍;和 OpenAI 的 GPT-5.5(5/30 美元)相比,输入贵一倍,输出贵约六成七。 换句话说, 它是迄今最强的 Claude,也是最贵的 Claude 模型之一。 强,但不便宜。 前面提到的 @zekramu 也算个旁证:据他估算,光是企业试点阶段的投入,就到了数百万美元级别;“太贵”是他反复念叨的一句话。 订阅用户还得留意一个时间窗口。从今天到 6 月 22 日,Pro、Max、Team 和企业版用户可以免费用 Fable 5;6 月 23 日起,继续用就得额外买 usage credits 了。 Anthropic 说,等产能跟上,会把 Fable 5 重新做成订阅标配——但没给具体时间。API 和按量付费的企业客户不受这个节奏影响,今天起照常调用。 这个略显别扭的“先免费、再收费、以后再说”,其实透露了一个信号:产能不够。Anthropic 自己也承认,预计 Fable 5 的需求会“非常高、很难预测”。一个对所有人开放的最强模型,先得过算力这一关。 而这次发布里,真正容易被划过去、却最值得停下来看的,是另一条政策。 从 Fable 5 开始,所有 Mythos 级模型的流量都会被强制保留 30 天,覆盖第一方和第三方平台。 Anthropic 承诺不拿这些数据训练模型,只用于安全监控,比如识别新型越狱、以及那种分散在很多次请求里、单看每一条都正常的复杂攻击。为此他们也加了新的隐私保护:记录每一次人工访问、30 天后基本全部删除。 听上去合情合理。但 对那些当初正是冲着“零数据保留”才选择 Anthropic 的企业客户来说,这是一个需要重新评估的变化。 你用最强模型的代价,不只是更贵的账单,还包括:你的数据,会在 Anthropic 的服务器上多待一个月。 安全和隐私,在这里被摆上了同一张天平。而 Anthropic 给出的答案是:为了防住前所未有的攻击,得先把所有人的流量都看上 30 天。这笔账划不划算,恐怕每家公司得自己算。 把这些放在一起看,Fable 5 真正的新意,也许不在它有多强,而在 Anthropic 趟出了一条新路—— 怎么把一个危险到不敢公开的能力,拆成一个所有人都能用的产品。 办法是:用分类器在能力上切一刀,用降级代替拒绝,再用 30 天的留存,当作兜底的监控网。 它不完美。会误伤,会变贵,会让一部分人对自己的数据多一层顾虑。但它至少回答了一个所有前沿实验室迟早都要面对的问题:当你手里的东西强到足以伤人,你是把它锁进只有少数人能进的房间,还是给它装上一道足够结实的护栏,再交到所有人手里? Anthropic 选了后者。 至于这道护栏到底够不够结实——这一次,替它做压力测试的,不再是那一百多家机构,而是所有人。 查看评论

cnBeta全文版 · 2026-06-10 13:35:57+08:00 · tech

Anthropic正式发布Claude Fable 5和Claude Mythos 5。前者面向普通用户开放,后者则继续限制在“受信任的安全合作伙伴”范围内。新模型的命名可以说很符合Claude一贯的风格。 从Haiku(俳句)到Sonnet(十四行诗)再到Opus(艺术巨著),Anthropic一直在用文学和艺术概念给模型分层,到了Mythos,名字已经从文学作品膨胀到“神话”本身。 Fable来自拉丁语fabula,意思是“被讲述之物”,和希腊语mythos同源,直译过来的话一般被称为“寓言”。这个名字正如新模型的定位,一个“Mythos级”的模型,一个“公开的神话”。 按照Anthropic的描述,Fable 5和Mythos 5共享同一个底层模型,只是被装进了更适合公开分发的安全壳里。在官方给出的模型能力上,它们两个被放在同一个位置。 但跑分归跑分,如果Fable和Mythos的表现完全一样,我想应该也不用分成两个名字了。 被改写的“神话” 神话被改写、被压缩、被加上训诫之后,变成了寓言。 按照官方文档,Fable 5是公开版本。它面向普通用户和开发者开放,但在网络安全、生物、化学以及模型蒸馏等高风险领域,会由额外的安全分类器介入。一旦系统判断请求可能涉及这些敏感方向,回答就不会由Fable 5继续完成,而是自动回退到Claude Opus 4.8。 Mythos 5基于同样的底层模型,但在部分领域解除了Fable 5的护栏。Anthropic称,Project Glasswing里的网络安全合作伙伴可以使用“满血版”Mythos 5;未来,部分生命科学研究者也可能通过受信任访问计划,使用解除生物和化学限制的版本。 用不到的Mythos我们暂时不提,先看点实在的东西。 首先是定价,一个字,贵。 Fable 5的定价是输入10美元/百万token,输出50美元/百万token。开发者现在就可以通过Claude API调用claude-fable-5(模型名)。 这个价格刚好是Opus 4.8的两倍,和Opus 4.8的fast mode相同,Anthropic显然把它放在了比Opus更高一档的价格层级里。 不过Anthropic称,这一价格不到此前Claude Mythos Preview的一半——但由于Mythos Preview并非公开API模型,官方并未给出面向公众的标准价,这句话也无从验证。 订阅用户也需要注意,Fable 5不一定会长期直接包含在基础订阅包里。 Anthropic在官方说明中提到,6月23日以后,即使用户已经订阅Claude,Fable 5也可能根据算力情况按量提供,不一定会直接包含在基础订阅服务中。 这公司越来越吝啬了,不过好歹还留了小半个月试用期。官方也留了一点余地:如果6月23日以后算力资源足够,Anthropic会尽量把Fable 5继续包含在Pro、Max等订阅服务里。 定价高本身并非难以理解,但它最好保证它的能力配得上它的价格。 从跑分上看,Fable 5/Mythos 5基本是Anthropic目前公开表里最强的一档。 不过官方表格有一个说明,Claude Fable 5和Claude Mythos 5的分数一般只差1–3个百分点(除了带星号的网络安全、生物相关测试),所以表里显示的是两者更高的分数。这一点很难不让人想要吐槽。 Anthropic把Fable 5的重点放在几个方向:软件工程、知识工作、视觉、长上下文记忆和生命科学研究。 软件工程是最突出的场景之一,根据表格,Fable/Mythos 5在SWE-Bench Pro上达到80.3%,明显高于Opus 4.8的69.2%;在更难的FrontierCode Diamond上,它拿到29.3%,而Opus 4.8只有13.4%,GPT-5.5只有5.7%。 知识工作和视觉任务上,Anthropic给出了两类证据。 一类是标准化benchmark。官方表格显示,Fable/Mythos 5在GDPval-AA上得分1932,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro;在GDP.pdf这种带视觉理解的文档任务上,它达到29.8%,也超过其他主要模型。 另一类是早期客户测试。Anthropic称,Fable 5在Hebbia的高级金融推理基准上取得最高分,优势集中在文档推理、图表和表格理解、问题求解;IMC也反馈,它在交易分析评估中几乎全面通过。 为了展示Fable 5的视觉能力,Anthropic举的例子是:此前Claude模型需要复杂辅助工具才能玩《宝可梦 火红》,而Fable 5只靠视觉输入就可以通关。 长任务和记忆能力上,Anthropic称,Fable 5可以在数百万token的长期任务中保持专注,并利用自己的笔记改进输出。 在《杀戮尖塔》这类需要连续决策和长期策略的游戏里,如果给Fable 5接入持久文件记忆,让它能记录前面的选择和经验,它的表现会明显提升。提升幅度是Opus 4.8的三倍,到达最终关卡的次数也提高了三倍。 顺便一提,Fable也是一款经典RPG游戏的名字,中文译作《神鬼寓言》——或许某天我们能看到Fable玩《Fable》。 另外,网络安全能力方面,Fable/Mythos 5在ExploitBench Cap%上达到78.0%,超过Claude Mythos Preview的69.0%,接近Opus 4.8的两倍。 这里用的应该是Mythos 5的得分,因为Fable 5在高风险请求上会回退到Opus 4.8。 强大的模型必须分层 Anthropic这次把模型能力的直观展示放到了一个类似”作品集“的滑页里,并且每个demo只给了一小段注释。 比如,Fable 5写了一个太阳系模拟,从物理第一性原理推导行星轨道运动,并用它预测日食。 又比如,它可以自主玩《异星工厂》。这是一款工程师很爱的工厂自动化游戏,玩家要采集资源、规划生产线、搭建物流和能源系统。 Anthropic用这个例子说明,Fable 5可以在一个开放环境里制定策略,并持续推进一个复杂系统的建设。 在另一个demo里,Fable 5先做了一个基于浏览器的CAD编辑器,然后又使用这个由自己开发的CAD工具,设计了一个可以3D打印的完整模型。这个编辑器里还内置了AI copilot,用来辅助建模。 这个demo的重点在于Fable 5完成了一个闭环:先创造工具,再使用工具,最后完成一个实体设计任务。 最后一个demo,Anthropic展示了一个由Fable 5写出来的流体模拟,运动节奏和一段古典音乐EDM remix同步。官方还特意提到,音乐也是Fable 5用代码生成的。 这些案例看起来挺花哨,但意思是一样的:Fable 5很擅长把代码、视觉、物理、设计和长期规划混在一起做任务。 如果说这部分展示的还是Fable 5在开发者手里能做到什么程度,后面的部分说的就是Mythos 5在研究者手里能做什么——以及Anthropic为什么要把Fable和Mythos分开。 Anthropic称,在内部蛋白设计专家的评估中,Mythos 5把药物设计流程中的部分环节加速了大约10倍。其中一个案例里,Mythos 5接入蛋白设计和生物信息学工具、没有人类帮助,就可以匹配甚至超过熟练人类操作员。 在该任务中,Mythos 5做的不是简单问答,而是完成一整套科学工作流:选择结合位点,选择并运行蛋白设计工具,在失败后自己恢复。官方称,在这项研究的14个蛋白靶点中,有9个产生了强候选分子,目前正在进一步研究。 Anthropic还提到,Mythos 5可以稳定提出新颖、有吸引力的分子生物学假设。在和Opus级模型的盲测对比中,内部科学家大约80%的时候更偏好Mythos提出的假设,其中一些已经进入实验评估。 与此同时,Mythos 5的一个关于大肠杆菌蛋白的新机制的假设,在另一家独立研究同一问题的实验室的研究中得到了证实。 它甚至还做了一项基因组学研究。 Anthropic称,Mythos 5在一周多的时间里,几乎自主完成了一项新的基因组学研究。它整理了横跨138种动物、数百万个细胞的单细胞数据,并设计、训练了一个定制机器学习模型,用来识别不同物种中执行相同角色的细胞。 更夸张的是,Anthropic称,Mythos 5训练出的模型性能超过了近期发表在《Science》上的一个模型,尽管它的规模只有后者的百分之一。Anthropic表示,计划在未来几个月发表这些结果。 当然,这部分还需要等待论文和外部复核。但如果只看Anthropic官方给出的信息,Mythos 5在生命科学里展示的能力已经接近科研Agent:能读问题、用工具、处理数据、训练模型、提出假设,并把一项研究推进到可以发表的程度。 而一旦模型可以在药物设计、病毒载体、蛋白设计、基因组学研究这些方向里真正推进任务,它就天然具备双重用途。 可以认为,生命科学这部分不是Fable 5的普通功能演示,而是Mythos 5的能力上限展示。 但它被展示出来,是为了说明Anthropic手里的这套底层模型,已经强到了必须通过受信任访问来分发。 有意思的是,过去的模型发布更像是一件技术产品的事:参数、跑分、价格、上下文长度、API名称。强就是强,发布就是发布。 但到了Mythos这里,事情开始变得复杂。同一个底层模型被分为两个版本,普通用户拿到的是Fable 5,安全研究者和部分生命科学研究者拿到的是Mythos 5;前者被装进更严格的护栏里,后者则需要受信任访问。 模型能力不再只有高低之分,也开始有权限、场景和责任之分。 某种意义上来讲,可以看作前沿模型商业化进入新阶段的信号——越强的模型,越不可能直接扔给所有人。它们会被拆成不同版本,放进不同安全边界,再交给不同类型的用户。 Anthropic先这么做了,因为它们的模型“强到不能完全公开”。未来其它想要讲故事的公司,想要证明自己的模型也很强,或许也会效仿这种方式。 查看评论

V2EX - 技术 · 2026-06-10 12:38:22+08:00 · tech

https://www.anthropic.com/news/claude-fable-5-mythos-5 发布如此强大的模型伴随着风险。如果没有安全措施,Fable 5 在网络安全等领域的能力可能会被滥用,造成严重损害。因此,我们在发布该模型时配备了安全机制:当用户查询某些主题时,系统将改用我们次强模型 Claude Opus 4.8 进行回复。为了在安全的前提下快速发布模型,我们采取了较为保守的安全设定——这些机制有时会误拦截无害请求(尽管平均触发率低于 5%)。随着未来几个月内更强大模型的陆续推出,我们正努力改进安全措施,降低误报率。 我们此前已发现,有大规模尝试从 Claude 中提取(“蒸馏”)其能力,用于在威权国家训练竞争模型。对 Fable 5 能力的蒸馏可能间接导致近前沿 AI 能力的扩散——而这些能力可能在缺乏适当安全措施的情况下被释放。被我们的分类器标记为属于此类蒸馏尝试的请求,将回退到 Opus 4.8 。

LinuxDo 最新话题 · 2026-06-10 11:41:16+08:00 · tech

A 社发布 Claude Fable 5 和 Claude Mythos 5 模型,这些模型面向普通用户提供,其编码能力要远远领先于其他模型。 以上模型来源于 Claude Mythos Preview,但已经设置完善的安全措施用来防止滥用,例如当检测到与网络安全、生物学、化学、模型蒸馏等相关特定请求时,系统都会将其路由到 Opus 4.8 模型。 https://www.landian.news/archives/113385.html 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-10 11:38:22+08:00 · tech

https://www.anthropic.com/news/claude-fable-5-mythos-5 发布如此强大的模型伴随着风险。如果没有安全措施,Fable 5 在网络安全等领域的能力可能会被滥用,造成严重损害。因此,我们在发布该模型时配备了安全机制:当用户查询某些主题时,系统将改用我们次强模型 Claude Opus 4.8 进行回复。为了在安全的前提下快速发布模型,我们采取了较为保守的安全设定——这些机制有时会误拦截无害请求(尽管平均触发率低于 5%)。随着未来几个月内更强大模型的陆续推出,我们正努力改进安全措施,降低误报率。 我们此前已发现,有大规模尝试从 Claude 中提取(“蒸馏”)其能力,用于在威权国家训练竞争模型。对 Fable 5 能力的蒸馏可能间接导致近前沿 AI 能力的扩散——而这些能力可能在缺乏适当安全措施的情况下被释放。被我们的分类器标记为属于此类蒸馏尝试的请求,将回退到 Opus 4.8 。