严谨 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-05-28 13:22:27+08:00 · tech

家里长辈最近迷上豆包了，不得不说豆包语音和人情味这一块做的还是不错的，就是幻觉和严谨性实在是太差了。长辈在上面求医问药什么的，太不靠谱了，我怕早晚问出事来。有没有可以用豆包语音还能自己接好一点的模型api的方案？ 5 个帖子 - 4 位参与者阅读完整话题

面试官说我的AI知识体系不完善

LinuxDo 最新话题 · 2026-05-24 15:11:36+08:00 · tech

请教一下作为一名开发，如何学习AI？这看上去是一个很不严谨的话题，因为AI很大类，而我聚焦的严格意义只是作为一个偏算法、应用的那个类别，求职的岗位也是agent、应用开发这些，使用的开发工具和一般vibe coding也别无二致，这次面试聊到的话题包括如何写出高质量的prompt，让llm更精准的写出需求，后期debug应该怎么做，如何获取新的ai技术，rag，mcp，skills等概念。面试给的反馈就是相关资讯很多，但是更需要个人有一个较为完整的知识体系和开发思路，包括前后端测试等，老实说，现在的开发岗位默认是全栈了都。所以，我的问题是，这种知识体系应该如何构建，以及如何将这种体系可复制到其他岗位，比如不一定只做agent，当一个api接口大师等。 12 个帖子 - 9 位参与者阅读完整话题

小米 mimo-v2.5-pro 居然是从别的模型迁移的？

LinuxDo 最新话题 · 2026-05-11 10:34:14+08:00 · tech

先叠个甲：非严谨测试，纯属个人奇思妙想~ 故事是这样的，我在 cursor 中接入了 mimo-v2.5-pro 输入图片，他输出了这样的东西。由输出的文字如图所示,根据图片中的设计 ,这些输出词，我们可以知道，模型认为自己读取了图片，获取了图片的信息。但我们由官网信息可知，模型其实不支持读图。这就有意思了。论证首先我们先看看真正的不支持图片的模型，它是怎么输出的。然后我们再看看 mimo2.5pro 。哈哈哈，有意思~ 总结大概率说明底座模型本身具备多模态基因，但 API 接口层限制了视觉输入。也就是，虽然“眼睛”被蒙住了，但“大脑”还记得自己当年看图说话的样子。如果是自己训的模型，就不会出现这种情况。 9 个帖子 - 8 位参与者阅读完整话题

[Codex] Codex 疑似降智

v2ex · 2026-05-09 09:41:36+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

[Codex] Codex 疑似降智

v2ex · 2026-05-09 09:37:59+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

[Codex] Codex 疑似降智

v2ex · 2026-05-09 09:04:51+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

[Codex] Codex 疑似降智

v2ex · 2026-05-09 08:02:18+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

Codex 疑似降智

V2EX - 技术 · 2026-05-09 04:04:43+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

Codex 疑似降智

V2EX - 技术 · 2026-05-09 03:04:43+08:00 · tech

最近一周明显感觉 Codex 智力低下，即便我输入的内容如哲学论文一样严谨，它都可能看不懂字面的意思。前端的内容更是改得我吐血了，比 Gemini 差远了。隔壁说可以询问它的知识库到什么时候，来检验是否降智，如果回答是 24 年，那么就是降智了。结果我分别问了 CHatGPT 网页版，Codex App 和 Codex Cli ，发现答案分别是 2025 年 8 月，2024 年 6 月，2024 年 6 月。也就是说我的感觉可能是对的，Codex 疑似降智了。以后考虑御三家分散买会员了，各有缺陷。这是我总结的 AI 三大概念神：不封号的 Claude ，不降智的 ChatGPT ，不断网的 Gemini 。

【真诚求教】如何建立良好的vibe习惯~~

LinuxDo 最新话题 · 2026-05-08 13:50:44+08:00 · tech

平时都是上手直接干，但是总感觉不够严谨不够专业，感觉自己就是野路子风格，想要规范一下自己的开发流程，但是各种TDD,SDD,BDD模式，opensec，superpower看得眼花缭乱看佬友们vibe的方式好像都很优雅0.0 还有如何利用好规则，Agent.md这些的~ 想来真诚取取经，听听佬友们的心得，想要建立一个良好的开发习惯，或者是推荐些优秀的神帖学习一下 9 个帖子 - 6 位参与者阅读完整话题

怎么防止AI在一次性超长生成时前后文风差异过大

linux.do · 2026-05-06 17:43:09+08:00 · tech

比如：最开始还是严谨的科研用语和研究结果，过了几万字之后就这样了，有没有prompt能完全解决这个问题 6 个帖子 - 2 位参与者阅读完整话题

个人不严谨盲测：ChatGPT 5.4 Xhigh VS DeepSeek V4 Pro

linux.do · 2026-04-24 15:18:47+08:00 · tech

叠甲：这是本人第一次尝试横向评估模型能力，测试方式可能有明显的不严谨，仅作为分享，大家看个乐子即可测试结果 github.com GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——... AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比省流没有明确的代码规划，在仓库中从零开始自由发挥的情况下，V4 和 5.4 的代码能力有明显可见的差距。实际上还应测试：有明确规划的情况下，长期遵循规划的能力根据代码库 + 需求编写具体的规划的能力 Brainstorm 能力才能对整体的代码能力有一个准确的评估。 2 个帖子 - 2 位参与者阅读完整话题

领导不午休员工应该午休吗

linux.do · 2026-04-21 13:37:43+08:00 · tech

今年换了个新领导，新领导作风严谨，我们一般是11点30-1点30午休，新领导一般12点半吃饭，1点回来继续工作，很喜欢这个时间和大家一起开个会或者讨论一些业务，久而久之在工位午休，刷会抖音，负罪感特别强烈。而且我晕碳很严重，中午吃了饭不睡个15分钟下午就会很难受，有点苦恼。楼主是一个末级部门经理，35岁，在坎儿上，压力比较大，不知道如何自处。 10 个帖子 - 10 位参与者阅读完整话题

不严谨记录一下自用windsurf pro的额度

linux.do · 2026-04-21 11:33:14+08:00 · tech

联动一下羊毛区的 windsurf pro 试用2周能用opus 4.6 来个大佬出注册机 - #37，来自 Ampere 同样的一个小模块，gpt plus用5.4 high需要至少1.5个五小时额度，windsurf使用现在的opus4.7xhigh的每日额度消耗了20%，跑了大半个小时，每周额度消耗不到20% 不过整个项目的测试，切换到windsurf的opus4.7max后，一个小时跑完了剩下的80%每日额度每周额度消耗到一半 1 个帖子 - 1 位参与者阅读完整话题

/tag/严谨