WWW.YOUINFO.SITE
标签聚合 Opus4.6

/tag/Opus4.6

LinuxDo 最新话题 · 2026-06-10 15:41:57+08:00 · tech

背景:java全栈,codex+5.4或者claudeCode + deepseek/opus4.6,以及一个清澈愚蠢的我。 需求:我想要的把一整个模块都能丢给ai去自动完成,完成一个比较大的长时间任务 这些东西基本是增删改查,实际上人工拆任务拆下来都不难。但真正生成往往不让我满意,出现的结果包括但不限于: 没有完成明确写出的任务 写的东西莫名奇妙超出边界 功能不理解怎么做就全删了 自己尝试造早就实现的轮子(CLAUDE.md中甚至就写了有这个模块) 非常糟心。 我先后尝试过: superpowers:执行结果是最好的,但慢的说实话还不如我自己写 ECC:感觉什么东西都要审批,太麻烦了 Speckit:目前感觉最好用的,但是很多东西审查的挺累,也是最明显理解一点点跑歪掉的,而且这个写plan的能力感觉忽高忽低的 CLAUDE.md现在用的是那个karpathy的CLAUDE.md+项目技术栈+一些索引,说实话感觉用处好像也不是很大,有问题ai还是不会停下问问题 4 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-09 16:53:38+08:00 · tech

我之前知道Opus4.8、4.7和4.6、4.5的风格完全不一样,反正都是拿来coding,没什么区别,但今天问个问题但没想到回复风格给我看到很恶心 ,就让4.6输出了一版,这个语言风格是不是差距太大了点,今天终于有了实感, 感觉最近所有的模型都在押宝agentic和coding,导致语言能力大幅倒退 。点名GPT、Claude、Deepseek,唯一语言能力进步的竟然是GLM5.1。 不想再被“稳稳接住”“一句话总结”“堵住”“按住”“先…否则后面…”“逐条拆解”“赌”折磨了,看多了,我都怀疑我认不认识中文了,真的能这样用吗。 最好笑的是最近看B站,大量的稿子都有这些黑话和语癖,真的很出戏… 就像看小说出现“投石”和“指尖泛白”一样,让我顿时没兴趣了 展开查看图片 (点击了解更多详细信息) 有没有提示词能遏制这些语癖和黑话,真的受不了了 不否认模型能力的提高,但是模型最终还是和人交互,语言能力越来越拉,越来越不受重视,目前的模型各种奇怪表述看的人恼火。 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-07 12:41:02+08:00 · tech

今年高考作文已经新鲜出炉啦,感觉时间真的过得好快啊,闲来无事,让ClaudeOpus4.6,Gemini3.1pro,GPT5.5-xhigh生成了全国一卷和全国二卷的作文,佬友来选选,哪篇文章能打动你呢?也欢迎各位分享你生成的版本啊? 是否含人工智能生成内容:是 全国二卷: 阅读下面的材料,根据要求写作。(60分) “日月不失其体,故蔽而复明;江汉不失其源,故穷而复通。” 在个人成长、社会发展乃至文明演进中,总会出现困顿、挫折,甚至会有风高浪急、惊涛骇浪的考验。然而,日月虽有被遮蔽之时,只要本体未失,终能重放光明;江河即使遭遇险阻,只要源头不竭,终能贯通入海。 以上材料引发了你怎样的联想和思考?请写一篇文章。 要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。 Gemini GPT claude 全国I卷: 阅读下面的材料,根据要求写作。(60分)词语是表达思想情感的载体,也是展现社会生活变化的窗口。当前,世界之变、时代之变、历史之变正以前所未有的方式展开。青年是常为新的,在你的成长过程中,你对哪一个词语的理解发生了变化?这变化有你成长的印记,对你有特殊的意义……以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。 gpt : Claude: Gemini(重新链接) 现在是投票时间 gemini gpt Claude 点击以查看投票。 19 个帖子 - 10 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-06 10:21:06+08:00 · tech

抽奖主题:[快速抽一个kiro反代的opus4.6 4.8和一些杂七杂八的模型] 奖品详情: [奖品]:kiro反代的opus4.6 4.8和其他模型*100刀 活动时间: 开始时间:[ Sat, Jun 6, 2026 10:19 AM CST ] 截止时间:[ Sat, Jun 6, 2026 12:00 PM CST ] 参与方式: 在本贴下回复“任意内容”即可参与。 抽奖规则: 每位用户仅允许参与一次。 将使用 LINUX DO 抽奖工具 在所有回复中随机抽取中奖者。 注意事项: 本活动将在活动截止时间后关闭回帖,以确保公正性。 中奖者将在活动结束后在本帖公布,并通过论坛站内信由发起人通知领奖方式。 所有规则及抽奖结果由 @Little_100 及论坛 管理团队 最终解释。 发起人承诺: 作为本次抽奖的发起人 @Little_100 ,我承诺本话题的抽奖活动严格遵守 LINUX DO 社区抽奖规则 。因违反上述规定引发的公平性争议或其他问题,均由我独立承担相应的道德与法律责任。 期待您的积极参与,祝您好运!如有任何疑问,欢迎随时联系 @Little_100 或论坛 管理团队 。 模型有: 剧透 13 个帖子 - 12 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-31 01:58:45+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-31 01:58:45+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-30 22:58:45+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-30 21:58:45+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-30 20:58:45+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-30 20:20:19+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。

V2EX - 技术 · 2026-05-30 20:12:26+08:00 · tech

公司用的是 Cursor ,平时工作都会选择 Opus4.6 处理,自己平时订阅了 MiniMax 和 Kimi Code 俩个 49 元档的计划。使用 MiniMax 主要是给 Hermes Agent 用的,因为除了语言大模型还支持图片、语音生成、歌曲/歌词生成,还有翻唱,感觉作为日常助手很不错,Kimi Code 的话是因为在使用了一段时间 Claude Code + MiniMax-M2.7 进行编码任务后发现它对上下文理解和代码理解能力确实不如 Kimi 。尤其最近在使用 playwright-mcp 结合 AI 去做自动化测试发现,一些操作,使用 Cursor 中的高级模型或者使用 Kimi ,这些操作都能自己顺利完成,而使用 MiniMax 的话老是说不能操作,需要人工复验。 我觉得抛开国外的不谈,现在 Kimi Code 已经算不错的了。