一直有个疑问,之前用opus4.6,或者4.7,4.8,在Claude Code桌面端中都分别有4.8和4.8 1M,我就很好奇,它们除了上下文不同之外,能力上会有差别吗? 比如说opus4.8或者最新出来的fable5会不会比带1M上下文的要聪明些呢? 然后现在这个fable5模型不能开fast,感觉好慢啊。动不动一个问题就处理个四五十分钟啥的。 6 个帖子 - 3 位参与者 阅读完整话题
我已经无语了,这个状态之前从未有过。4.7和4.8都没他敏感 5 个帖子 - 5 位参与者 阅读完整话题
背景:java全栈,codex+5.4或者claudeCode + deepseek/opus4.6,以及一个清澈愚蠢的我。 需求:我想要的把一整个模块都能丢给ai去自动完成,完成一个比较大的长时间任务 这些东西基本是增删改查,实际上人工拆任务拆下来都不难。但真正生成往往不让我满意,出现的结果包括但不限于: 没有完成明确写出的任务 写的东西莫名奇妙超出边界 功能不理解怎么做就全删了 自己尝试造早就实现的轮子(CLAUDE.md中甚至就写了有这个模块) 非常糟心。 我先后尝试过: superpowers:执行结果是最好的,但慢的说实话还不如我自己写 ECC:感觉什么东西都要审批,太麻烦了 Speckit:目前感觉最好用的,但是很多东西审查的挺累,也是最明显理解一点点跑歪掉的,而且这个写plan的能力感觉忽高忽低的 CLAUDE.md现在用的是那个karpathy的CLAUDE.md+项目技术栈+一些索引,说实话感觉用处好像也不是很大,有问题ai还是不会停下问问题 4 个帖子 - 4 位参与者 阅读完整话题
现在写文章哪家模型好,opus4.6还是gemini 5 个帖子 - 4 位参与者 阅读完整话题
我之前知道Opus4.8、4.7和4.6、4.5的风格完全不一样,反正都是拿来coding,没什么区别,但今天问个问题但没想到回复风格给我看到很恶心 ,就让4.6输出了一版,这个语言风格是不是差距太大了点,今天终于有了实感, 感觉最近所有的模型都在押宝agentic和coding,导致语言能力大幅倒退 。点名GPT、Claude、Deepseek,唯一语言能力进步的竟然是GLM5.1。 不想再被“稳稳接住”“一句话总结”“堵住”“按住”“先…否则后面…”“逐条拆解”“赌”折磨了,看多了,我都怀疑我认不认识中文了,真的能这样用吗。 最好笑的是最近看B站,大量的稿子都有这些黑话和语癖,真的很出戏… 就像看小说出现“投石”和“指尖泛白”一样,让我顿时没兴趣了 展开查看图片 (点击了解更多详细信息) 有没有提示词能遏制这些语癖和黑话,真的受不了了 不否认模型能力的提高,但是模型最终还是和人交互,语言能力越来越拉,越来越不受重视,目前的模型各种奇怪表述看的人恼火。 2 个帖子 - 2 位参与者 阅读完整话题
目前就一个cursor pro 还有反重力用点opus4.6 还有其他渠道能爽用opus的没 1 个帖子 - 1 位参与者 阅读完整话题
今年高考作文已经新鲜出炉啦,感觉时间真的过得好快啊,闲来无事,让ClaudeOpus4.6,Gemini3.1pro,GPT5.5-xhigh生成了全国一卷和全国二卷的作文,佬友来选选,哪篇文章能打动你呢?也欢迎各位分享你生成的版本啊? 是否含人工智能生成内容:是 全国二卷: 阅读下面的材料,根据要求写作。(60分) “日月不失其体,故蔽而复明;江汉不失其源,故穷而复通。” 在个人成长、社会发展乃至文明演进中,总会出现困顿、挫折,甚至会有风高浪急、惊涛骇浪的考验。然而,日月虽有被遮蔽之时,只要本体未失,终能重放光明;江河即使遭遇险阻,只要源头不竭,终能贯通入海。 以上材料引发了你怎样的联想和思考?请写一篇文章。 要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。 Gemini GPT claude 全国I卷: 阅读下面的材料,根据要求写作。(60分)词语是表达思想情感的载体,也是展现社会生活变化的窗口。当前,世界之变、时代之变、历史之变正以前所未有的方式展开。青年是常为新的,在你的成长过程中,你对哪一个词语的理解发生了变化?这变化有你成长的印记,对你有特殊的意义……以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。 gpt : Claude: Gemini(重新链接) 现在是投票时间 gemini gpt Claude 点击以查看投票。 19 个帖子 - 10 位参与者 阅读完整话题
它自己卡bug为什么要吃我的额度啊 吃了我60%的5h限额 我还在欣喜opus4.6也能开子代理,结果它卡死了,过了半小时给退了,然后额度居然还在飞。 我又把全部Claude Code登录授权revoke了还是在跑额度 现在终于停了也不知道为啥停了,给官方反馈了哎 1 个帖子 - 1 位参与者 阅读完整话题
看来这种能力是Claude code赋予的,国产你快抄啊! 然后发现Opus4.6也能用auto mode了,美好 1 个帖子 - 1 位参与者 阅读完整话题
抽奖主题:[快速抽一个kiro反代的opus4.6 4.8和一些杂七杂八的模型] 奖品详情: [奖品]:kiro反代的opus4.6 4.8和其他模型*100刀 活动时间: 开始时间:[ Sat, Jun 6, 2026 10:19 AM CST ] 截止时间:[ Sat, Jun 6, 2026 12:00 PM CST ] 参与方式: 在本贴下回复“任意内容”即可参与。 抽奖规则: 每位用户仅允许参与一次。 将使用 LINUX DO 抽奖工具 在所有回复中随机抽取中奖者。 注意事项: 本活动将在活动截止时间后关闭回帖,以确保公正性。 中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。 所有规则及抽奖结果由 @Little_100 及论坛 管理团队 最终解释。 发起人承诺: 作为本次抽奖的发起人 @Little_100 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则 。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。 期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @Little_100 或论坛 管理团队 。 模型有: 剧透 13 个帖子 - 12 位参与者 阅读完整话题
下午三点开始claudecode调用opus4.6模型就老出现问题,看了看sub2api里面的测试发现除了4.6其余模型都正常?这啥问题?有佬碰到吗?我看论坛里面没人讨论,难道是我自己的问题? 6 个帖子 - 5 位参与者 阅读完整话题
谷歌大体并不想让我们用Claude模型 每次都报错上下文溢出或者是服务繁忙 感觉和IP没啥关系 Gemini3.5flash又那么难绷,哎 1 个帖子 - 1 位参与者 阅读完整话题
如题。站上面也有不少的各种中转公益站的帖子,但是又多又杂。我也不是拿来当agent大量用,就聊聊天试试,各位佬友有什么好路子吗? 16 个帖子 - 9 位参与者 阅读完整话题
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。
公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。