我都没闹清楚究竟是哪个升级坏的事,现在只敢用codex cli 0.137.0, CPA跟着升级了,但是设置上对chat关掉了image_generation. 不然不少中转上不去。 版本高于0.137就直接报这个: 问了gemini让我关掉派发子代理… 0.139.0打开也是一样,只好还是退回0.137.0. 2 个帖子 - 1 位参与者 阅读完整话题
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
做了 10 多年, 发现那些搞 .Net / Ruby / Delphi 的人好像都不见了 还有 iOS / Android 开发工程师,现在也少 近几年,Go / Rust / Python 岗位也不多 AI 出来后,特殊工种也没有以前那么吃香 很多公司,还是后端加前端的模式,有大量 java 工程师和前端工程师 有时候在想🤔,如果没有前端,就转后端或者全栈,感觉后端似乎更容易? 到现在为止,我还在写前端。 除非哪天,公司要求写全栈,否则我应该不会想碰后端。 Ref 为什么总是“前端已死”? 前端死八百回了,我还在做前端 - V2EX
从 【已公布部分结果,继续测其他模型~】佬们觉得哪个AI高考数学肯定能考满分? 以及 新高考数学一卷出炉,测测哪些 AI 有实力 继续讨论 本次测试为一次性全部发送,看模型能答多少分 叠甲: 问 1: 为什么不是一个一个题发送? 答 1: 因为现在的模型都太强大了,先用这个方式来测试,后续再继续测试,一个一个题发送,写另一个排行榜。另外还可以针对这个排行榜里面做错的题,对各个模型进行多次的询问,取最差结果。 我 GPT OSS 120b 和 GPT OSS 20b 是用的一个一个题问的方式(新开对话) 问 2: 为什么国产模型只测了Qwen 3.7 Max?为什么国外模型没测 Muse Spark、Grok?为什么 Claude 4.8 Opus 只测了一次? 答 2: 测了 Qwen 3.7 Max 是因为千问官网太好了,20 分钟思考不截断,而且一点都不卡,比 GPT 网页版还好! 没测 Kimi 是因为我没有 API 和官网会员 没测小米是因为,我忘了Xiaomi Mimo Studio,对不起 会补上的 没测 Deepseek 是因为我没有 API,官网又不是 max 思考强度,所以对他不公平 没测 GLM 5.1 是因为我没有 API,用官网也不行,因为思维链太长了官网截断了 没测 Muse Spark 是因为我没有 API,用官网也不行,因为思维链太长了官网截断了 没测 Grok 是因为我没有 API,用官网也不行,因为思维链太长了官网截断了 Claude 4.8 Opus 只测了一次是因为我完全没钱,感谢 @Nobody_233 佬帮忙测试一次(官网 max thinking) 问 3: 为什么没测试 GPT 5.4 Pro 和 GPT 5.5 Pro? 答 3: 不测试 GPT 5.4 Pro 是因为官网的 512 juice 的 GPT 5.4 已经有比较大的可能性拿到满分,不测试 GPT 5.5 Pro 是因为 GPT 5.5 在本次测试中,连续 4 次拿到满分,而且 GPT 5.5 Pro 这种数学水平已经不需要做一张高考卷子来证明自己的实力了 问 4: 为什么没测试不同答题策略?例如人类可以先做最难的题,再做最简单的题 答 4: 没错,本次测试并没有测试不同的答题策略,因为我认为把最难的题放在最后面,考验他的长上下文注意力,大大提高了这份卷子的难度,这也可以作为一个测试,所以我并不希望他先做难的,再做简单的 模型环境 GPT-5.2 Pro (官网 Extended Pro);GPT-5.5 / GPT-5.4 / GPT-5.2 Thinking(推理强度:Extra High): 官网 Pro 20X 账号;无 Personalization;无任何 Memory / Dreaming;无法参考对话历史记录;未使用临时聊天;已检查每次都没有使用任何工具(联网搜索、代码解释器等 Gemini Deep Think: 官网,无 personalization,无记忆 Gemini 3.1 Pro / Gemini 3.5 Flash: Google AI Studio,未设置 system prompt,思考强度全部都开的 high,Temperature 等参数全都是默认,未开启任何工具 Claude 4.8 Opus: @Nobody_233 佬帮忙测试,他是 5x max,官网对话,Max thinking,但由于我的失误,不是用的我最后一版 prompt,导致 Claude 在最后一题上表现不佳,或许用最后一版 prompt,Claude 就可以满分,明后天继续测试 Qwen 3.7 Max: 无其他设置,直接在官网问 测试流程: 新高考一卷校正版【 来源 】: exam_full.txt (6.9 KB) 一次性发测试时使用的prompt: exam_prompt.txt (7.1 KB) 各模型各run的原始输出 :(公平公正公开,大家可以帮忙检查过程,纠错) exam_source_public.zip (144.8 KB) 评分流程 客观题(1-14 题)(单选、多选、填空) Grok Build CLI - Composer 2.5 直接打分 主观题简单题(15-18 题) 15-18 题为一组,每次发 1-8 组,双 GPT 5.5 Pro 评分,有争议则互评 主观题困难题(19 题) 19 题单独为一组,每次发 1-5 组,双 GPT 5.5 Pro 评分,有争议则互评 (特别感谢 @fsmallcold 拉我上 Pro 车,抱歉今天刷 5.5 Pro 刷得都降智了 ) 测评结果(截至目前) 按最高分排序 满分 150;每错一小问扣 4 分。分数为各次 run 的最低–最高;排序按最高分,同分按最低分。 排名 分数 模型 次数 1 150 GPT 5.5 heavy 4 2 146–150 GPT 5.2 Pro extended 3 3 146–150 GPT 5.4 heavy 3 4 146–150 Gemini DeepThink 3 5 146 Claude Opus 4.8 1 6 146 GPT 5.2 heavy 3 7 142–146 Gemini 3.1 Pro extended 3 8 138–146 Qwen 3.7 Max 3 9 142 Gemini 3.5 Flash 3 按最低分排序 满分 150;每错一小问扣 4 分。分数为各次 run 的最低–最高;排序按最低分,同分按最高分。 排名 分数 模型 次数 1 150 GPT 5.5 heavy 4 2 146–150 GPT 5.2 Pro extended 3 3 146–150 GPT 5.4 heavy 3 4 146–150 Gemini DeepThink 3 5 146 Claude Opus 4.8 1 6 146 GPT 5.2 heavy 3 7 142–146 Gemini 3.1 Pro extended 3 8 142 Gemini 3.5 Flash 3 9 138–146 Qwen 3.7 Max 3 详细榜 markdown版 (点击了解更多详细信息) 分数-时长 图(将就着看吧 ) 用时 格式: mm:ss ;估计区间用 mm:ss–mm:ss ;超过 59 分用 H:mm:ss 。 模型 run1 run2 run3 run4 Claude Opus 4.8 未计时 — — — Gemini 3.1 Pro extended 5:30–6:30 5:30–6:30 5:30–6:30 — Gemini 3.5 Flash 4:30–5:00 4:30–5:00 4:30–5:00 — Gemini DeepThink 20:00 20:00 20:00 — GPT 5.2 Pro extended 1:49:00 1:40:00 1:41:00 — GPT 5.2 heavy 20:00–25:00 20:00–25:00 20:00–25:00 — GPT 5.4 heavy 15:23 25:21 27:00 — GPT 5.5 heavy 12:22 13:59 13:53 6:44 Qwen 3.7 Max 22:17 18:49 9:09 — 点评: 编辑 ing… 致谢(排名不分先后) 感谢 @aucura 考试结束后光速提供试卷 感谢 @Xsc15926 陪伴测试,明天加上 Gemma~ 感谢 @fsmallcold 拉我上车 GPT Pro 号 感谢 @Nobody_233 帮忙测试 Claude Opus 4.8 Max Thinking 感谢 无敌 @0v0 巨佬提供的 OpenAI 官 key, 感谢 @VonEquinox 提供的 Gemini 3 Deep Think,DT 宝刀未老 感谢 @Neptune1 提供的 Deepseek 50元 官 Key,明天测~ 26 个帖子 - 16 位参与者 阅读完整话题
作为一个持续创业者,一直到了快破产了才把闲置了20年的编程重新捡起来,一直熬到了CHATGPT3.5,突然发现路开始宽了。 首先我给大家说一个例子,为什么人工智能表面上看上去让很多人面临失业危机。 京东招聘实习生审核发票,一天至少300张,给到150左右。 那么这样的岗位在人工智能出来以后,还有价值吗? 还有!! 因为虽然他们的效率仅仅只有OCR的千分之一,但是,软件不能背锅,活人(尤其是实习生)可以!! 所以得出 规则1:人工智能会让背锅人变得更爽 (比如财务,核算发票的实习生,盖章的文员等等,甚至某种意义上的内科大夫等等,原来吭呲吭呲半天,现在10分钟搞定,剩下的时间可以摸鱼了!)! 接下来讲第二个故事,每天BOSS直聘上打招呼,看简历。 这个可以自动化AI化吗?太可以了!! 但为什么大公司不这么干?小公司也不这么干呢? 大公司是属于谁的?大股东?! NoNO NO ,真正的大公司基本上都股权分散,基本上属于大家的,也就属于公家。 那么你那么卷,对你有啥好处? 对领导有啥好处? 领导要的是轻松自在+免责+有好处! 你带来了200个面试?谁去面? 让领导去面?你怎么想的? 所以大公司的HR最喜欢的是让一堆供应商围绕着自己,情绪价值拉满+自己不用那么忙+懂得都懂的东西。。 而对于小公司,你有那么多需要招聘的职位吗?你确定把人招进来给得起五险一金? 所以这玩意压根就是一个伪命题,你生产力提升了,考虑过环境能否接受的了吗? 所以得出 规则2: 一个没有危机感的大组织里,AI只会成为所有领导的抵触。一个很有危机感的小组织里,绝大部分AI压根还没有到要发挥就前提都消失了。 接下来讲第三个故事 我们曾经做过一个百万级的项目,全自动化电商, 数字人视频种草–自动化电商交易。。。看上去完美闭环,120多个自动化模块。。。 结果发现, 做出来的视频没有流量!!!!! 然后,项目就毁了。。。款也只收了不到一半。。。浪费整整一年时间。。。 你看到了没有? AI给了我们幻觉,感觉可以大干一把,然而AI不能实现你本来就没有实现的东西,里面的关键诀窍你不明白。 规则3: 不要担心别人用AI冲击你,只要你的赢的关键诀窍AI替代不了就可以 接下来的故事很有意思, 我上上周去参加一个AI沙龙,一个佬们在和一堆姑娘们分享AI,他从机器学习说起,一直说到openclaw和Hermis, 姑娘们娇笑惊叹不止,很好的提供了情绪价值,可是我一看不对啊, 这佬们一共充值了100怎么还剩95呢?合着你一共也就花了5元API调用? 合着姑娘们压根都没有应用。。。。。 但实际上姑娘们每天都在接触,比如刷的小红书抖音或者某些修图软件,背后都是AI,实际上,我给当时做我对面的姑娘一个建议: 你花在自己脸上和身材上的时间应该满足“一万小时定律”了,你需要用AI去强化它!而不需要也不应该把精力花在BideCoding, 文档处理, 智能体上面。。。 你只需要找到在 美容,美体、美言、钓凯子方面最好的AI应用,充值去强化你就可以了。 实际上我想讲的是最后一条规则,最后我用一个故事来强化这一条。 规则4:2022年12月前你存在的优势,用AI去强化他,你的路就越来越宽! 我曾经在编程上吃了巨大的亏,本质是懒惰,懒得背函数用法,懒得去debug。 但是这个导致我创业的几乎所有利润(来自于营销)都贴进了一个由10-15人左右的低水平程序员团队(前端,UI,设计,后端,产品经理,测试),整整10年。 当我雇佣不起一个时,我只好开始自己写代码做迁移。 我惊讶的发现,原来我们的几十个项目居然99+199一共300元就搞定了服务器。而原来需要每年5万。 我惊讶的发现,原来部署是如此简单,用宝塔就好似在傻瓜式操作。 我惊讶的发现,原来SOP以后,迁移网站和安装一个软件差不多。 我惊讶的发现,全局变量局部变量居然之前的程序员连这个都不明白,密码明文写在代码里。 然后。。。。我发现我输的不冤,我居然在我可以很强的领域,为了偷懒,而足足损失了数千万,结果换来了一堆垃圾。。。 然后我写了差不多15万行代码,其中有一个应用经历了大约350个版本后,跑到了全国第一名。 然后就是bide-coding. 我用2周时间重构了之前团队10年的结果,结果光一个项目就发现和修复了差不多500多处改进的地方,重大的漏洞,缺陷。。。。突然之间,我突破了,编程自由了。 然后,我就发现,这个仅仅是基础步骤,后面还有大量的需要迭代(来自物理世界的真实反馈),这个才是最关键的。 这一切,只不过是AI强化了我本来就很强的学习能力,尤其是数理化。 但是AI强化不了我的管理能力(很差),也强化不了我的性格(不怎么给别人情绪价值)。 **如果用AI强化自己本来就很强的部分,你就不仅不会失业,还可以腾飞!不仅不会创业失败,还可以腾飞!**不仅不会不幸福,还可以更加掌控人生。 反之,你很难赢(好比我做出的数字人视频和爆款一样,可就是没有流量) 3 个帖子 - 2 位参与者 阅读完整话题
太厉害了,量怎么这么大,跟any似的,不会是什么大人物吧,大手的力量 7 个帖子 - 7 位参与者 阅读完整话题
近来想看看爽文鼻祖究竟有多爽,于是通读一番。 以下为个人阅读体验: 首先就是读外国文学特有的那种拗口感,密密麻麻的文字若你不是经常看书的应该是看不下; 前期节奏较慢对比现在的快节奏爽文,需要不少耐心; 我并没有很仔细的读,虽然有名词解释,但是一些历史名词与文化差异我都没有细细了解,就是读过且过; 所以一些涉及地理,民俗,经济场景的对话我都没有细究,看不懂就看不懂吧。 读得也是很“粗糙”了,即便如此,我还是读完了,并不是那种“坚持”读完,而是确确实实受到吸引读完的。 只能说经典就是经典,全文就一个钩子“复仇”就足够吸引我一直读下去。 虽然节奏偏慢且读起来emmm,你懂的除了一些场景台词需要哲理内容,其余一些小场景台词写得绕来绕去的就是水。后面我也去了解了一下,当时是字数给稿费,那就懂得都懂。 但是纵观全书的节奏是非常好的,特别是故事的架构: 第一部分先是描绘美好的愿景,然后被人陷害,落入绝望。 第二部分其实就是经典的“老爷爷”环节,受到贵人帮助,重获希望。 第三部分,就是伯爵的复仇。 大的故事架构里套着小故事,特别是第三部分的复仇,他不是现在这种直接获取力量开杀,而是如传统文学那般草蛇灰线的布局,通过引导与计谋一步一步让仇人坠入地狱。 夸张一点说,伏笔呼应,环环相扣。 里面的人物塑造得十分的鲜明,特别是法国那种浪漫主义,个个人物都爱憎分明。 复仇的情节我感觉不是很爽,可能因为历史地理背景吧。 在我看来,这本小说更像是一部戏剧,一幕一幕场景,你方唱罢我登场。 我就是直截了当的读一遍,即使有很多地方是没看懂意思,但也能理解里面的剧情和各个人物的行为逻辑。 这就是通俗小说的魅力所在吧。 2 个帖子 - 2 位参与者 阅读完整话题
究竟是何等神圣还能屹立不倒 codex公益站首字速度优化完毕,性能已压榨到极致 真的有必要为佬发一个话题~ 大概算是第一次好用的,稳定的,快速的 真正的 把一个本来按理来说限定用在电脑上的codex的AI服务接到我自己的chatbox 手机党就是玩这个 虽然过去的失败可能有相当一部分是我自己还不太会配置 但总之是令人印象深刻的第一次~ 感谢神级分享~ 这次成功的配置是: 在佬的baseURL基础上 选择response接口 Chatbox会自动添加v1/responses 搭配 改善网络兼容性 选项可正常获取模型 可正常聊天 看到朋友分享的这样的案例,真的悲痛 也曾想,我这个从未订阅白嫖了十几个team(包括vv佬万人车)的老号 有哪一天会像克劳德一样从未使用(如果你觉得三年对话不超过50次算是使用的话 Gpt多一点点,但也只是聊天 ) 却突然暴毙 再也回不来 也一直想重新与gpt建交,但还只是想 最后感谢 @RawChat 佬公益 虽然始终坚持全网公益导致我从未获得良好的体验(过去 事实上没怎么用上之后就再也没在意了) 但依旧是心中Pandora之下第二gpt公益~ 6 个帖子 - 3 位参与者 阅读完整话题
佬友们这个谷歌云如何取消订阅? 真的绝望了,想要取消支付资料,提示我有谷歌云的订阅,我尝试去关闭结果尝试打开已经关闭的支付方式的时候又绑了一次卡,结果现在有两个订阅了,都提示我需要扣 10 刀验证 真的好难过,本来今天已经很难过了,这个谷歌云的界面真的搞得人晕头转向,没有找到官方帮助文档中提到的 Cancel subscription : 然后我在谷歌云也关闭了所有的付费账号了,没有账户是 activate 的: 尝试联系人工客服结果给我回这个 请问佬友该怎么取消这两个订阅?真的没招了,难道谷歌真的都是阿三做的吗?最难绷的是gemini 像个糖包一样,更生气了: 4 个帖子 - 3 位参与者 阅读完整话题
gpt免费用户网页版和deepseek都是选择B,然后Gemini 网页端给的B,在Google ai studio又给我的是C。题本解析给的C。有没有佬友有claude gpt pro的给我看看答案是什么? 5 个帖子 - 5 位参与者 阅读完整话题
佬们, 从我不是linuxdo成员时就听说Any大善人的威名, 现在入站二十多天还是只知道Any公益站很nb, 但是l站好像没有any的主贴, Any大善人一直没露过面, 他究竟是何方神圣啊, 有前辈考过古吗 6 个帖子 - 6 位参与者 阅读完整话题
今天又烧了42刀还未解决 我自己都诧异就这么难解决吗?就是一个mavlink下发航点任务加上业务逻辑 1 个帖子 - 1 位参与者 阅读完整话题
最近一直想搞一台Mac的心已经达到顶峰了!!! 然后在论坛也看了很多佬发的选mac帖子,加上也是被Windows各种环境兼容问题折腾得有点烦,前几天又拿吃灰的拯救者装了个Linux体验了一下codex,发现又比win要好得多,用了几天发现也还可以,但是来来回回刷到一些帖子,还是想整个mac,之前也线下实体店看了一下(好贵好贵…),然后又拿同学的air体验了一下codex,发现还得上mac啊,就越来越想体验一下苹果生态。 然后我这两天就疯狂刷咸鱼,然后刚凌晨3点半左右就刷到一个卖家挂的MacBook pro ,配置是21年的,m1max 32g1t 32h,挂的是7800,但是他另外个挂的是7600(卖的是同一个,后来我说过去拿他就也改成7800了,哈哈),然后我感觉这价格还可以呀(可能也没什么经验)。 问了几个问题后,让他发了个位置,我看了一下也就几十公里,导航显示46分钟。就很突然的问了句现在能过去拿不,他说行(可能他在想谁家好人凌晨4点去面提啊,哈哈哈)。立马换衣服出发。 到了之后先大概看了下机器外观,还行吧,有一点小划痕啥的,无伤大雅!!!然后开机玩了两下,要我检查我也检查不出来到底有没有问题,反正玩的那几下没啥问题。浅浅看了一下是32g,1tb的就行了。 最后小刀了30块,7770拿下~~~ 各位佬,不知道这个价格拿到这个mac算ok吗? 14 个帖子 - 9 位参与者 阅读完整话题
法律不主持正义,法律是在维持秩序的, 这时候就牵扯到一个问题:究竟是“利大”还是“法大”?社会的本质是基于规则,规则背后是权力。因此,社会有一个核心的东西是权力。 那么我们就会发现很多有意思的东西,你说情大还是权大。你说光有权力,不讲人情的人,不可能,所以社会上是一个人情社会,这是我们的现状。 所以我第一个想到的就是律师这个职业,如果法律真的是公平正义的,那根本不会有律师这个职业,警察就足够了,但现实是帽子叔叔不是用来维护法律正义的,所以我们才会看到调解和维护社会秩序的一些反常行为。 20 个帖子 - 20 位参与者 阅读完整话题