做大 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-05-31 15:26:01+08:00 · tech

首先感谢前端时间分享api使用的几位佬这两天用几位佬的api的时候出现个使用codex中出现的比较常见的问题：上下文丢失。 codex在进行比较大型的项目，或者是工作量比较大的任务时，当进行上下文太多，则会进行上下文压缩。压缩后的上下文可能会丢失一部分你所给的提示词，或者你的提示词中的要求他就观察不到从而直接结束任务。这两天实践出来的几个方法，第一，goal模式，goal模式可以让codex一直朝着这个方向前进，这个goal被遗忘的概率会比较低。所以我们其实可以在goal里面告诉他我们的工作流程，这样用goal设计一条工作流。第二，goal，有字符限制，并且在goal中你说太多实操细节，可能会导致你真正要实现的goal被忽略。那么我们可以把提示词放在markdown文档中，设计一条工作流，由goal来规定整体的工作流，把提示词放在markdown文档中，作为某一步的具体提示词。也就是goal告诉codex markdown文档的地址，你先去读这个markdown文档，把这个markdown文档作为提示词输入。那么就可以保证codex按照你的流程去做，并且每一步的提示词都不会损失，因为是储存在markdown文档中的，需要时再读。第三，虽然上述可以让codex较好的完成工作流了，但是你上下文会包括不同阶段的输入输出，其实不利于codex完成任务，每个任务的上下文会被污染。那么我的解决办法是，主对话只进行组织调度，也就是只是按照goal的流程走，而不参与各个阶段的任务工作，具体每一步的工作让主对话使用spawn agent生成子agent，并把对应阶段的markdown文档中的提示词输入给子agent，那么这样就可以实现模型完成具体任务时，上下文只有这个任务的提示词，并且主对话也只有每个流程是否完成，当然如果需要知道对应阶段的结果，主对话也可以去查看子agent的结果，这是可以做到的。最后，因为我们隔绝了上下文的影响，子agent不可避免的对我们现在的项目的了解就比较少，那它想要更好的完成任务，我觉得可以再加一步。思路是，在每个阶段的提示词中加一个约束，做之前，有不了解的地方，应该进行提问（这里的提示词根据个人需要去写就可以）。然后在主agent增加一个约束，即回答子agent。这样就可以保证子agent是在主agent的指导下，完成的这个任务，他就会更加贴近于我们的项目需要。上述就是我这两天实操下来的一些经验，如果各位佬又更好的想法，可以回复指导 1 个帖子 - 1 位参与者阅读完整话题

奥特曼这意思是又要做大善人了是吧

LinuxDo 最新话题 · 2026-05-29 13:46:26+08:00 · tech

是不是又要准备重置了，赶紧蹬 5 个帖子 - 5 位参与者阅读完整话题

谷歌做大模型是完全放弃coding领域了吗

LinuxDo 最新话题 · 2026-05-21 13:10:31+08:00 · tech

QA能力长期霸榜的谷歌，不信没能力做好coding。从2.5pro起，基模推理能力和知识广度已经是领先了。但模型还喜欢搞降智。网页端做的又很烂，harness agent也不好好做，大模型的coding能力又不优化，不理解公司现在的战略是什么？ 16 个帖子 - 13 位参与者阅读完整话题

「CodeRelay中转」不仅要做大做强，还要必须有爱心

LinuxDo 最新话题 · 2026-05-12 10:57:40+08:00 · tech

** 「CodeRelay中转」正式运营时间2026.4.18。 ** 今天5.12是汶川地震18年。本站决定，从即日起每月12号，用户消费金额的1%全部捐入韩红基金会。捐赠转账备注为：「CodeRelay中转」全体用户！ ** 欢迎各位大佬使用本站本站唯一QQ群：649937242 ** coderelay.cn New API 统一的 AI 模型聚合与分发网关，支持将各类大语言模型跨格式转换为 OpenAI、Claude、Gemini 兼容接口，为个人与企业提供集中式模型管理与网关服务。 6 个帖子 - 4 位参与者阅读完整话题

ChatGPT也开始做大善人了吗？之前薅的羊毛plus账号又给1个月会员？

linux.do · 2026-04-30 09:56:07+08:00 · tech

我在3月26日薅了个gpt的pls会员，然后在paypal取消了订阅，然后最近到期了，每天提醒我扣款失败，但是GPT又没有取消会员资格。有佬遇到这种情况吗？是怎么处理的呢？ 3 个帖子 - 2 位参与者阅读完整话题

如果有朝一日知道你朋友是人上人，你会感到有厚障壁吗？

linux.do · 2026-04-27 08:41:53+08:00 · tech

比如说，家里的当官的，做大生意的，完全躺平就不愁下半辈子，而你只能靠自己混个温饱我接着便有许多话，想要连珠一般涌出：角鸡，跳鱼儿，贝壳，猹，……但又总觉得被什么挡着似的，单在脑里面回旋，吐不出口外去。他站住了，脸上现出欢喜和凄凉的神情；动着嘴唇，却没有作声。他的态度终于恭敬起来了，分明的叫道： “老爷!……” 我似乎打了一个寒噤；我就知道，我们之间已经隔了一层可悲的厚障壁了。我也说不出话。 16 个帖子 - 15 位参与者阅读完整话题

赵长江称智界 V9 会做大 MPV 蛋糕：让顶级的价值物超所值，是我们的追求

www.ithome.com · 2026-04-23 17:12:08+08:00 · tech

IT之家 4 月 23 日消息，4 月 23 日，智界汽车举行了“安全不止所见 · 智界 V9 豪华科技全解析”主题直播。智界汽车执行董事及执行副总裁赵长江、产品经理李鑫悦以及资深车评人韩路共同参与，对鸿蒙智行首款旗舰 MPV 智界 V9 进行了实车全方位解析。此次直播首度公开展示了智界 V9 的白车身与半剖座椅展具，向外界解读阐述该车型在车身骨架、气囊布局、主被动防护以及压铸工艺等方面的技术细节。据直播介绍，智界 V9 在研发之初便确立了“安全平权”的核心目标。在基础车身用料上，该车采用了 11 横 6 纵的结构布置，其高强度钢、热成型钢与铝合金的整体占比达到了 91.6%。其中，热成型钢的占比为 25.1%，2000MPa 及以上强度的热成型钢使用长度达到 15.7 米。面对各类碰撞场景，智界 V9 针对性地进行了结构强化。例如，在正面碰撞防护中，车辆配备了覆盖率达 76% 的目字型全铝前防撞梁，以及 211mm 的超宽吸能盒，同时 A 柱内嵌了 2000MPa 热气胀管柱，以此有效分散撞击能量并降低乘员舱变形风险。侧面防护方面，智界 V9 在 MPV 品类中首发应用了 8 根 2200MPa 热成型钢侧门防撞梁，并结合 5mm 超厚 11 宫格挤出铝门槛梁及双 2000MPa 热成型钢车身横梁，对车厢内乘员及底部电池包提供高强度的物理隔离。针对 MPV 第三排乘客在追尾事故中面临的安全风险，智界 V9 首发搭载了电磁热控压铸技术，将电磁技术与模具内纳米热控层方案相融合，在一体化后地板的制造环节中，使得材料的屈服强度提升了 55% 以上。同时，该工艺将 78 个独立零部件集成为一个整体，实现了 15.5% 的减重。这一底部防护结构与车身上方的潜艇级热成型钢三排核心骨架相配合，能够在车辆后部遭遇碰撞时，将冲击力分散至整个车身，进而保障第三排乘员的头部生存空间并防止滑移门轨道变形，铸就“铁布衫”式安全防护。内部乘员的被动约束系统同样是本次直播的核心内容。智界 V9 全舱配备了 13 个安全气囊。其中包括 MPV 首发的二排全维包裹安全气囊。该气囊在特定躺姿下可将乘客头部与膝盖隔开，并在充气后形成两侧的缓冲气袋，以降低头颈胸部的伤害值，充分诠释“安全无死角”的“金钟罩”防护。为配合二排零重力座椅的使用，车辆构建了包含座椅集成安全带 ABTS、腰部收紧器 AH2、坐垫气囊 BAB 在内的七重安全防护技术。当感知系统预判到碰撞风险时，Pre-Crash 系统能够在 0.7 秒内触发座椅快速回位，将乘员从零重力姿态调整至趋于直立状态，确保安全带和气囊能够准确发挥缓冲作用。此外，第三排座椅配备了靠背预警碰撞回位技术，在预测到不可避免的碰撞时，系统会自动前向调节三排靠背，从而增加 80 毫米的头部生存空间。在主动安全与电池防护层面，智界 V9 搭载了全维防碰撞 4.0 系统，具备全天候、全时速及全方向的感知能力。其 eAES 系统在驾驶员无转向动作时，可主动通过紧急方向干预联合纵向紧急制动，最大避险速度可达 130km/h。电池系统方面，车辆采用华为“巨鲸”电池平台，应用了五层电芯安全包覆设计。车辆同步配置了高压闪断保险开关，能够在整车发生碰撞时于 3 毫秒内切断高压回路，保障极端碰撞场景下的电气安全。配合独立的 CPM 碰撞冗余解锁模块，智界 V9 确保了事故后车门仍能正常解锁，并会执行碰撞后自动降窗 50mm 及主动接通急救电话的程序，为事后救援提供支持。直播尾声，赵长江聊了智界 V9 的市场定位和背后的商业思考。他说，虽然是 MPV 市场的后发者，但智界 V9 要做的，是整个行业的颠覆者和规则重塑者，目标就是开辟科技豪华 MPV 的新赛道，树立起新时代的行业标杆。“我们希望在科技豪华 MPV 这个新赛道里，智界 V9 能站稳领先位置，做出一个真正属于新时代的标杆产品。”赵长江在直播中说道。而对于大家最关心的定价问题，赵长江也直白地讲清了品牌对价格和价值的衡量标准。他坦言，消费者不排斥买高价的好产品，但绝对不该“买贵了”。一台高端车值不值这个价，核心看它能不能给到对等的产品价值、使用体验和安心感，要是这些都跟不上，那就是典型的付出和回报不匹配。智界 V9 把核心资源都砸在了高刚性车身、全舱气囊、多项行业首发技术这些关键地方，就是要让用户花的每一分钱，都能落到实实在在的用车体验上，真正做到“顶级价值，物超所值”。

5个月MaaS收入增长15倍，阿里云找到了做大Token生意的办法

36氪 · None · tech

文｜邓咏仪编辑｜张雨忻 “阿里云MaaS业务的Token收入，在2026年的过去5个月里增长了15倍，月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词：Agent。这一天，阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品，这距离Qwen 3.6 Max的面世仅仅过去了一个月。为什么这么着急？随着今年2月OpenClaw的爆火，各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化，阿里也必须端出一款在Coding方面能打的模型，保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。无独有偶，大洋彼岸的硅谷，Google I/O大会也在同一天举办，主题同样是Agent Cloud，Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。 Agent Coding，已经成为全球现阶段的AI共识。 △图源：阿里云狠狠做Agent 发布会第一个端上来的新“千问云”官网，这是一个为Agent设计的网页，也是阿里云成立17年以来，第一次为单独业务做的独立官网。 △图源：千问云 “千问云是为Agent设计的，而不是人类。”阿里云公共云事业部负责人刘伟光说，这来自2024年底，阿里云内部的一个判断：未来云计算产品的主要使用对象，也会逐渐从人类工程师变成Agent。在过往，一个开发者或企业想要在云上部署服务，需要打开官网，注册之后，然后面对上百个产品分类，自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断，上手门槛不低。但在千问云官网上线背后，动线会发生变化：Agent会先找模型，再找工具和skills，最后才是底层云资源。顺序反过来了。一个例子是，在龙虾上线后，阿里云发现Agent可以在一天之内自动完成云计算资源的开通，这在过去，是人类要干两周的活。“未来不需要人来开通了，Agent自动就在后台把云计算资源激活了。”刘伟光说。官网只是前菜。阿里云从上层的模型到Infra到底层的芯片，都围绕Agent重新完成了一次适配。首先是新一代旗舰模型Qwen 3.7 Max的推出，这距离Qwen 3.6 Max的发布仅一个月时间。尽管一直以来阿里在开源领域建立了不错的影响力和口碑，但相较国内的智谱GLM、Kimi，阿里的旗舰模型并没有享受到小龙虾带来的最大红利。而Qwen 3.7 Max的发布，则阿里在Coding领域试图扳回一城的动作。在目前业界最权威的代码能力测试中，Qwen 3.7 Max已经追平了DeepSeek的最强版本，在难度更高的复杂工程任务测试中，Qwen 3.7 Max也排到了第一的位置。 △Qwen3.7-Max可独立执行长达35小时的长程复杂任务，工具调用数量也在各大模型中位于前列，图源：阿里云相较上一代Qwen 3.6 Max Preview，Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务，而不需要人类中途介入。长程任务能力越强，意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。阿里云CTO周靖人举的一个例子是：在平头哥的新芯片平台上，Qwen3.7-Max通过自主编程和超1000次工具调用，实现了平台关键内核的自我进化，推理速度较原版本提升10倍。这意味着，模型能够像成熟的工程师一样，独立解决代码中间缺陷的问题，也可以帮助工程师开发复杂的功能。而这些任务能够完成，也离不开芯片和Infra的适配：在芯片层，阿里云的新一代训推一体AI芯片真武M890，以及自研互联芯片ICN Switch 1.0，都搭载在超节点服务器上，主打的就是Agent的大规模并发场景。而现在，阿里平头哥PPU芯片出货已经超过54万片，并且在悟空、秒悟等AI应用中已经开始提供推理服务。怎么把Token生意越做越大 Agent爆发带来了Token消耗的爆发——Agent本质是代码生成，一次任务调用的Token量，是普通对话场景的十倍甚至百倍。所以，Agent共识也直接演变成了模型市场的一场明牌战争：谁的模型在Agent场景下被调用得多，谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic，据华尔街日报，Anthropic的营收预计将在第二季度增长一倍以上，达到109亿美元。 △图源：华尔街日报阿里云也受益于此。2025年，阿里云自然年全年营收超1466亿元，当年营收增速28.6%，后者主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上透露，6月份季度，包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入（ARR）将突破100亿元，年底突破300亿元。不过，在这场Token战争中，阿里和字节选择了两种不一样的打法。 “Token带来的收入主要来自两端，一端是以Coding为代表的大语言模型，另一端是视频模型。但在过去一段时间，很多人会把两个市场的Token增量混为一谈，这是不合适的。”刘伟光强调。字节占住了视频模型市场——有研究机构测算，Seedance 2.0爆火后，字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿，但在Seedance 2.0爆火之后，这个目标已经再度上调。相较之下，阿里云则在大语言模型上占据优势。“有开发者的公司，才会需要云，所以阿里云的存量客户（肯定有开发者）几乎都是Coding的潜在用户。”刘伟光说。 2025年底，阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力，集中在了Coding领域。“今年前5个月，我们可以说，阿里云已经拿到了LLM模型市场增量的80%。” 为了配合这一目标，阿里云对销售的考核方式也在变—— 不是看谁卖出去的Token量最大，而是比谁卖出去的Token最值钱。简单来说，阿里云现在追求的，并不是简单聊天产生的Token消耗，因为这类模型的价格已经到了地板价。相反，阿里云如今的一个核心指标是：模型接入客户的核心业务系统数量。这意味着，阿里云希望卖出去的Token，是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程，Token消耗量是指数级上升的，单价更高，复购更稳定，对应的也是更高质量的收入。这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频，任务结束。代码场景则更像一个自我进化的过程：模型写出代码，代码变成应用，应用部署到云上，应用运行起来后又需要调用模型，模型再生成更多代码。如今的大模型竞赛，已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合，已经成为影响模型训练、提供推理服务系效率的最重要因素；商业竞争也在加速，则是迅速验证场景价值，为模型反哺智能。 “芯片、模型和云，现在三者就像是齿轮要和在一起、螺旋上升的过程。”刘伟光表示，如果未来拼的是每一块芯片都能跑出比竞争对手更多的Token、更高质量的Token，“那我们就胜利了。” 以下为刘伟光关于阿里云、Agent趋势Token之战的更多分享，经《智能涌现》编辑整理： 1、云计算的天花板因为Agent再度被打开了云计算时代，我们的商业模式相对简单，但有一个长期痛点：盘点客户IT预算时，企业内部的软件开发和人力外包这块，我们是吃不到的。现在正好反过来，这些预算恰恰是AI Coding能100%命中的。我们看到，互联网企业的Token支出已经达到IT支出的15%~20%，传统企业还在5%以下，空间还很大。阿里云今年的目标，是在每一个客户的收入中，Token收入占比不低于20%。以汽车行业为例，过去我们能做的就是ERP上云，后来是智驾算力，再后来是大模型对话，现在连广告营销都能做了。原来汽车行业最大IT投入在ERP，现在变成AI。金融领域也一样，以前做券商客户，我们很难跟客户谈业务，那是专业领域。现在是客户主动找我们，因为头部投研、量化、私募的业务场景，都必须跟大模型深度结合。 Agent已经成为带动模型市场、甚至带动存量云市场的最大推动力。所以Token和云这两件事，在阿里云这里是天然绑定的。这也是为什么Coding是我们最重要的方向，它几乎for everything。 2、Agent天然是云业务的增长飞轮 Token和GPU是有换算比例的。我们从实际数据发现，Agent爆发后，一张GPU卡的消费基本上带动了一张CPU卡的消费，假如100块钱的GPU推理消耗，会同时产生200块钱的GPU+CPU云资源消耗——因为Agent生成的应用要部署、要运行、要弹性扩容。这意味，厂商没有强大的CPU云，就没法服务这些Agent。这就是为什么我们一直在说Agent Cloud这个概念，这中间是存在真实的收入闭环的。 3、阿里云的销售体系需要迅速变革我们现在单独给大客户配纯MaaS销售，和原来卖IaaS的销售打配合。哪怕一个客户身上出现两三个销售重叠，这个代价也可以接受，最重要的是不能让机会错失。坦白讲，在云这个产业经营太久，每个人都有思维惯性。过去做云，版图是很清晰的——客户线下多少台服务器，搬上来要花多少钱，答案不会差太大。但做MaaS，你进去之后可能发现答案远超想象。而且MaaS需要跟业务部门、跟CEO打交道，不是跟IT人员打交道，这本身就是挑战。有意思的是，越传统的企业越容易拥抱AI，因为AI让他们一些工作变简单了。现在，做畜牧的企业，都在大规模拥抱AI，这在过去是不可想象的。 4、Token之战要追求数量，更要追求质量调用量可以靠对话堆出来，但我们不看这个，我们看三个指标：付费Token客户数是不是每天在增长；每个客户是不是在核心系统接入模型、解决刚需；Agent自主完成任务闭环的效率。美国那边的共识也一样——用最少Token完成最有效任务，而不是用更多Token完成更多任务。正因为追求高质量Token，MaaS从第一天起就应该是有利润的生意。现在，我们的百炼平台（Infra）和模型团队本身就在一起，每天做推理框架的极致优化。中国目前还是按量为主，但我们的终极目标一定是希望让客户为结果付费。封面来源｜AI生成欢迎交流本文来自微信公众号 “智能涌现” ，作者：邓咏仪，36氪经授权发布。

/tag/做大