WWW.YOUINFO.SITE
标签聚合 红绿色盲

/tag/红绿色盲

LinuxDo 最新话题 · 2026-06-10 12:57:04+08:00 · tech

继 【any的opus4.8测试】红绿色盲仍不对, 糖果测试 之后,any今天也更新了claude-fable-5模型,我们使用这个模型继续测试红绿色盲与糖果问题: 测试模型: claude-fable-5[1m] effort: high 题目1:红绿色盲问题 (点击了解更多详细信息) 正确 题目2:糖果问题 (点击了解更多详细信息) 正确 欢迎各位佬补充更多问题的测试结果~~ 上面问题的答案(来自gpt5.5 cherry studio) (点击了解更多详细信息) 更多方法见 如何判断Claude中转是否满血 5 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-29 12:42:39+08:00 · tech

继 【any】Any上架了opus-4-8【已成功调用】 后,使用了any的claude-opus-4-8 测试了一下几个经典问题。 测试模型: claude-opus-4.8[1m] effort: max 题目1:红绿色盲问题 (点击了解更多详细信息) 错误 题目2:糖果问题 (点击了解更多详细信息) 错误 更新的opus 4.8 其实有个 effort: ultra code 模式,于是我试了一下这个模式下对于糖果的测试 输入同样的糖果测试问题,这个effort下 自动启用了下面的工作流(有种大炮打蚊子的感觉) ● 工作流已在后台启动(9 个代理:5 个独立求解 + 4 个对抗验证)。等待结果。 大炮打蚊子,没打到,依旧29 本话题测试中耗费token数 (点击了解更多详细信息) 欢迎各位佬补充更多问题的测试结果~~ 上面问题的答案(来自gpt5.5 cherry studio) (点击了解更多详细信息) 更多方法见 https://linux.do/t/topic/1854373 11 个帖子 - 7 位参与者 阅读完整话题