最近两天发现codex变得很蠢,一个简单的前端修改要好几轮对话才能达到之前一轮对话的效果,于是参考网上的方法问了它训练数据截止日期,选择的模型是5.5,思考强度xhigh,如图: 我的账号是老账号用gopay开的一个月免费plus,降智可能和这个有关吗? 6 个帖子 - 5 位参与者 阅读完整话题
别说思考能力了,连指令遵循都做不到。 我是接入到claude code里用,已经开始乱飙框架提示词了。 感觉以后可以沿用这种思路,用低智力模型把闭源agent项目的提示词都套出来。 2 个帖子 - 2 位参与者 阅读完整话题
上周开始降智非常明显,真的是气坏了 最开始的时候是上下文长的时候会完全放弃思考,且只关注最最最最最近的上下文 现在出现了答非所问(请你写一个codex的 xx命令,回答是好的已经为您生成claude xx命令) 糊弄人(下午发一个amd64,还能知道切平台编译,现在发amd64自己直接一个重命名) 速度巨巨巨巨巨巨慢 高危操作也开始随意发挥了 突然很sad,AI逐渐成为信息化的基建设施,而算做明星的LLM,OPUS、CODEX、GEMINI、KIMI、DS降智却都无法得到保障,大家coding看大公司脸色。 17 个帖子 - 10 位参与者 阅读完整话题
我看到站内佬友提到了mermaid,我想深入了解一下,问gemini3.1pro,它的回答如图所示, 我感觉我的脑子瞬间被核弹气化了 3 个帖子 - 3 位参与者 阅读完整话题
对话两句直接把思考过程当输出 6 个帖子 - 6 位参与者 阅读完整话题
体感速度大概有 5 倍的提升,而且输出文字的速度也比 5.4 Thinking 快多了 之前用基本上都是问完后切别的窗口干别的事去了,现在可以等在这里,很快就回答完了 不清楚思考这么快,对能力是否有影响 与之前的不严谨对比(思考时间) GPT-5.5 Thinking GPT-5.4 Thinking
体感速度大概有 5 倍的提升,而且输出文字的速度也比 5.4 Thinking 快多了 之前用基本上都是问完后切别的窗口干别的事去了,现在可以等在这里,很快就回答完了 不清楚思考这么快,对能力是否有影响 与之前的不严谨对比(思考时间) GPT-5.5 Thinking GPT-5.4 Thinking
体感速度大概有 5 倍的提升,而且输出文字的速度也比 5.4 Thinking 快多了 之前用基本上都是问完后切别的窗口干别的事去了,现在可以等在这里,很快就回答完了 不清楚思考这么快,对能力是否有影响 与之前的不严谨对比(思考时间) GPT-5.5 Thinking GPT-5.4 Thinking
体感速度大概有 5 倍的提升,而且输出文字的速度也比 5.4 Thinking 快多了 之前用基本上都是问完后切别的窗口干别的事去了,现在可以等在这里,很快就回答完了 不清楚思考这么快,对能力是否有影响 与之前的不严谨对比(思考时间) GPT-5.5 Thinking GPT-5.4 Thinking
在做题对照答案让两个 ai 讲解(习惯性对比),对照到一半疑惑怎么 gemini 缺步骤了,转头看豆包和答案发现确实是缺了步骤,回去质问 gemini 它才急急忙忙 剧透 认错 。 明明在 2.5pro 时期一鸣惊人,3flash 全力综合也还挺不错,现在已经降智的流口水了,令人感叹。 2 个帖子 - 2 位参与者 阅读完整话题
自从claude 4.7更新,原本4.6全流程跑通的项目,4.7直接一个小功能写了几个bug,各种流程需要我逐个解决它的卡点才再次跑通,上来L站一看骂声一片,赶紧切回4.6. 结果我今天又让4.6优化一些细节,碰到一个UI小修改:将时间筛选框和关键字搜索框分开,分别放在左侧和右侧。就这么一个非常简单的需求,结果改了几遍没改成功,最后我用trae一次修改好了。 实在绷不住了,这就是技术领先的快乐吗,这就是垄断的快乐吗,为所欲为,把用户当猴耍当日本人整。还是太缺少竞争对手了,国产自主性的确需要加强 19 个帖子 - 9 位参与者 阅读完整话题