Claude Mythos/Fable 5 糖果问题测试

Claude Mythos/Fable 5 糖果问题测试
Claude Mythos/Fable 5 糖果问题测试

测试模型:Claude Mythos/Fable 5
模型思考强度:xhigh

image

测试平台:claude官网

结果如下:
一遍正确:white_check_mark:
通过看思考链发现能够直接推理出21这个正确答案,而不是通过纠正得到,这点比 opus 4.7/4.8要强不少。

image
image

7 个帖子 - 4 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文