WWW.YOUINFO.SITE
标签聚合 严谨

/tag/严谨

LinuxDo 最新话题 · 2026-05-24 15:11:36+08:00 · tech

请教一下作为一名开发,如何学习AI? 这看上去是一个很不严谨的话题,因为AI很大类,而我聚焦的严格意义只是作为一个偏算法、应用的那个类别,求职的岗位也是agent、应用开发这些,使用的开发工具和一般vibe coding也别无二致,这次面试聊到的话题包括如何写出高质量的prompt,让llm更精准的写出需求,后期debug应该怎么做,如何获取新的ai技术,rag,mcp,skills等概念。 面试给的反馈就是相关资讯很多,但是更需要个人有一个较为完整的知识体系和开发思路,包括前后端测试等,老实说,现在的开发岗位默认是全栈了都。 所以,我的问题是,这种知识体系应该如何构建,以及如何将这种体系可复制到其他岗位,比如不一定只做agent,当一个api接口大师等。 12 个帖子 - 9 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-11 10:34:14+08:00 · tech

先叠个甲:非严谨测试,纯属个人奇思妙想~ 故事是这样的,我在 cursor 中接入了 mimo-v2.5-pro 输入图片,他输出了这样的东西。 由输出的文字 如图所示,根据图片中的设计 ,这些输出词,我们可以知道,模型 认为 自己读取了图片,获取了图片的信息。 但我们由 官网信息 可知,模型其实不支持读图。 这就有意思了。 论证 首先我们先看看真正的不支持图片的模型,它是怎么输出的。 然后我们再看看 mimo2.5pro 。 哈哈哈,有意思~ 总结 大概率说明底座模型本身具备多模态基因,但 API 接口层限制了视觉输入。也就是,虽然“眼睛”被蒙住了,但“大脑”还记得自己当年看图说话的样子。 如果是自己训的模型,就不会出现这种情况。 9 个帖子 - 8 位参与者 阅读完整话题

v2ex · 2026-05-09 09:41:36+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

v2ex · 2026-05-09 09:37:59+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

v2ex · 2026-05-09 09:04:51+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

v2ex · 2026-05-09 08:02:18+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

V2EX - 技术 · 2026-05-09 04:04:43+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

V2EX - 技术 · 2026-05-09 03:04:43+08:00 · tech

最近一周明显感觉 Codex 智力低下,即便我输入的内容如哲学论文一样严谨,它都可能看不懂字面的意思。前端的内容更是改得我吐血了,比 Gemini 差远了。 隔壁说可以询问它的知识库到什么时候,来检验是否降智,如果回答是 24 年,那么就是降智了。 结果我分别问了 CHatGPT 网页版,Codex App 和 Codex Cli ,发现答案分别是 2025 年 8 月,2024 年 6 月,2024 年 6 月。也就是说我的感觉可能是对的,Codex 疑似降智了。 以后考虑御三家分散买会员了,各有缺陷。 这是我总结的 AI 三大概念神:不封号的 Claude ,不降智的 ChatGPT ,不断网的 Gemini 。

LinuxDo 最新话题 · 2026-05-08 13:50:44+08:00 · tech

平时都是上手直接干,但是总感觉不够严谨不够专业,感觉自己就是野路子风格,想要规范一下自己的开发流程,但是各种TDD,SDD,BDD模式,opensec,superpower看得眼花缭乱 看佬友们vibe的方式好像都很优雅0.0 还有如何利用好规则,Agent.md这些的~ 想来真诚取取经,听听佬友们的心得,想要建立一个良好的开发习惯,或者是推荐些优秀的神帖学习一下 9 个帖子 - 6 位参与者 阅读完整话题

linux.do · 2026-04-24 15:18:47+08:00 · tech

叠甲:这是本人第一次尝试横向评估模型能力,测试方式可能有明显的不严谨,仅作为分享,大家看个乐子即可 测试结果 github.com GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——... AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比 省流 没有明确的代码规划,在仓库中从零开始自由发挥的情况下,V4 和 5.4 的代码能力有明显可见的差距。 实际上还应测试: 有明确规划的情况下,长期遵循规划的能力 根据代码库 + 需求编写具体的规划的能力 Brainstorm 能力 才能对整体的代码能力有一个准确的评估。 2 个帖子 - 2 位参与者 阅读完整话题

linux.do · 2026-04-21 13:37:43+08:00 · tech

今年换了个新领导,新领导作风严谨,我们一般是11点30-1点30午休,新领导一般12点半吃饭,1点回来继续工作,很喜欢这个时间和大家一起开个会或者讨论一些业务,久而久之在工位午休,刷会抖音,负罪感特别强烈。而且我晕碳很严重,中午吃了饭不睡个15分钟下午就会很难受,有点苦恼。楼主是一个末级部门经理,35岁,在坎儿上,压力比较大,不知道如何自处。 10 个帖子 - 10 位参与者 阅读完整话题

linux.do · 2026-04-21 11:33:14+08:00 · tech

联动一下羊毛区的 windsurf pro 试用2周 能用opus 4.6 来个大佬出注册机 - #37,来自 Ampere 同样的一个小模块,gpt plus用5.4 high需要至少1.5个五小时额度,windsurf使用现在的opus4.7xhigh的每日额度消耗了20%,跑了大半个小时,每周额度消耗不到20% 不过整个项目的测试,切换到windsurf的opus4.7max后,一个小时跑完了剩下的80%每日额度 每周额度消耗到一半 1 个帖子 - 1 位参与者 阅读完整话题