我刷 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

土区的涨价，其实太正常了...

LinuxDo 最新话题 · 2026-06-11 16:55:58+08:00 · tech

我刷dy等短视频平台都刷到一堆倒卖土区plus的，大量刷到也就大概1周前开始吧，所以大概也是1周前开始大量出现倒卖的吧。结果，就一周哈哈哈哈哈。只能说，倒狗恶心，涨价属于纯活该。 1 个帖子 - 1 位参与者阅读完整话题

刚才我刷新我的大L站,cf竟然让我排队??

LinuxDo 最新话题 · 2026-06-11 11:32:10+08:00 · tech

7 个帖子 - 7 位参与者阅读完整话题

github今日最快增长风向标-20260526

LinuxDo 最新话题 · 2026-05-26 06:42:54+08:00 · tech

这个ECC，我刷到好多次了，佬们真实体验如何？ github-trening.pdf (406.7 KB) 1 个帖子 - 1 位参与者阅读完整话题

AI漫剧培训靠谱否

LinuxDo 最新话题 · 2026-05-21 16:00:42+08:00 · tech

佬们，有没有懂AI漫剧的，我刷到一个培训漫剧的，声称学成可以返学费，而且学成就可以接单了，对这行不太了解，怕掉坑，五千多也不是小钱。主要是刷到的这个机构之前做考研培训的，上过他们的课还是挺靠谱的，他们现在搞了个做AI的子品牌，正好我现在有空余时间，靠谱的话想玩一玩。佬们怎么说？ 15 个帖子 - 14 位参与者阅读完整话题

刷推给我刷蚌埠住了

LinuxDo 最新话题 · 2026-05-18 21:35:06+08:00 · tech

如图 3 个帖子 - 3 位参与者阅读完整话题

相关专题

（小白咨询）买U往自己U卡里转的问题

LinuxDo 最新话题 · 2026-05-15 23:31:28+08:00 · tech

我想咨询一下佬们买U转U的问题。我目前注册了欧意，然后我刷帖子看可以c2c买U。但是那里面好多种币看得眼花缭乱，应该买哪个。然后就是我前天为了薅team两个月，注册了人人卡和bybit。怎么往里面充值，我看加密货币充值有好多可以选择还有好多网络，应该选哪个 8 个帖子 - 3 位参与者阅读完整话题

[Cursor] 一觉起来， Cursor 的额度给我刷新了！

v2ex · 2026-05-08 14:41:08+08:00 · tech

上午看还是用到一半午觉起来额度刷新啦 😀 大佬们有遇到过这种情况吗？是真的刷新了吗？还是显示 BUG?

总结我的七日书签贴（5.1-5.7）

LinuxDo 最新话题 · 2026-05-07 19:29:41+08:00 · tech

总结这一周我刷到的宝藏贴（4月23日-4月30日）搞七捻三 l站现在人流量有点大了，每天会发很多帖子导致有些优质帖可能会被淹没，对于上班族没什么时间刷贴的佬友想必是不友好的，所以我想还是有一些必要把一些优质内容贴汇聚在一起，供佬借鉴，但是这是我觉得优质的帖子，受限于能力范围，佬可能对这些帖子不感冒，还有就是可能因为脑子糊涂导致有些帖子重复，还望佬友海涵教程贴汇聚了多种类型的教程 https://linux.do/t/topic/1948691 … 承接上文，总结一下这一周我的书签贴，其中一些对我十分有帮助，几个nsfw我就不给大家展示了哈，这里感谢发帖的佬！【由于忘记了上次收藏帖子到哪里了所以可能有一些帖子有重复，实在抱歉，下次做标记】剧透由于很多帖子都没有把预览加载出来，所以没有加载出来的链接上面那段引用的部分是这个帖子的简单介绍分享包括开源程序以及其他有趣的或者有用的网址链接在线找资源，内含一些有用资源路径 https://linux.do/t/topic/1042143 网易云音乐下载工具 https://linux.do/t/topic/2112827 破解链文pdf https://linux.do/t/topic/2124100 [开源] Codeg V0.11：专注于代码生成的多智能体IDE（cc、codex、gemini、opencode......）开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出前言当前… 大道至简的胜利, 一个神级skill推荐, 忘掉brainstorming吧开发调优最近发现一个神奇skill. mattpocock 的 /grill-me 内容非常精简，只有几句话，但效果出奇的好. 它的作用就是在你提出需求的时候，不断的质问你，和你理清需求. AI编程的第一原则就是清晰准确的描述需求. CC自带的plan中的提问功能, Superpowers里面的brainstorming, 其实都是在做这个事情, 和你理清楚需求再做计划. 需求越清晰, 执行效果… 【开源skill】被跨对话/跨agent恢复上下文反复折磨后，我给做了个项目本地记忆skill【v0.3.5】开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 [re… 【开源推广】给佬友用，做了一个Claude桌面版接入国产api的一键配置软件开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出开源推广 … Linux Do Obisidian Export 脚本，导出帖子到 obisidian 搞七捻三一个油猴脚本，可以帖子导出为 Obsidian 兼容的 Markdown 格式，做了很多适配，比如 emoji 转换，图片存储方式，链接转换等，支持：通过 Obsidian Local REST API 直接写入笔记图片处理（Base64 内嵌 / 单独文件导出）多种筛选条件（楼层范围、用户、关键词等） Obsidian Callout 格式美化显示自动生成 YAML frontmat… 21个纯净影视站汇总 https://linux.do/t/topic/1756783 免费的gptimg2生成，支持国内访问，后续增加更多公益站福利羊毛 2026年5月5日 21:34:26 优化了下服务器，应该不会经常死机了，暂时不更新新内容稳定几天。打打游戏。关于图集网站的一些说明目前主要工作是优化网络访问。最近用户太多了，可能需要压缩下用量了。访问地址目前只支持图片免费生成，这次不会跑路但是可能会转换成申请加入。后续可能会增加codex公益站，看看有没有比较好的办法弄plus和free了。本网站后期会按计划推出AI辅助… 教程一些佬发布的教程贴【Linux Do Credit】教你创建自己的收款积分页面文档共建我也是小白，早上研究了一下，可以创建自己的收款页面，这样别人也可以给你打赏了注册好之后进入首页点击右上角 [image] 填写这些内容，我就直接填写的默认，https: //credit.linux.do 和 https://credit.linux.do/notify [image] 创建好后选在线流转 [image] 选择创建服务 [image] 里面写好名… 白嫖服务器搭梯 https://linux.do/t/topic/1489010 经验佬的一些使用经验或者是有用的分享梳理访问l站方法 https://linux.do/t/topic/2121695 obsidian插件分享 https://linux.do/t/topic/1183413/18 openclaw破限 https://linux.do/t/topic/1899628 ai编程项目焚决 https://linux.do/t/topic/1700254 ai使用和科研经验 https://linux.do/t/topic/2098957 论文prompt https://linux.do/t/topic/2084703/2 分享Codex使用经验以提升开发效率【vibe coding experience】开发调优经过每天17个小时的高强度使用Codex CLI，分享使用经验 Q：每次提了一大长串要求，但最后成品像是没改或者简陋实现？ 1.这种情况主要是compact了，上下文被压缩再开始，很多东西细节全部丢失，所以使用的时候需要尽量节省context。绝对不要触发compact，如果你想获得最好效果建议将每次used控制在90%以内 2.多多使用plan mode按住shift再加tab，先和A… 闲谈包括一些知识和有用但是小的 hub的gpt供应方 https://linux.do/t/topic/2111308 LINUX DO 探索地图-V1.3_20260420 文档共建 0 更新说明 V1.1-增加内容如下 4.3.1 “萌新”公益站API使用指南 V1.2 增加“4.3.2 公益站管理-ALL API HUB” 增加“公益站使用建议” 增加“7 LIUNUX DO事件记录”-20260209 20260209-LINUX DO CONNECT 更新：增加30天内授权记录增加“4.3.3 公益站API聚合管理-AxonHub”_2026021… ai小说赚钱方式 https://linux.do/t/topic/1721254 致新生的你/ 又名关于AI入门以及泛保研/科研相关的建议搞七捻三关于这篇帖子，我不知道应该放在哪里比较好，网络记忆或者文档共建都有一些奇怪，也可能是我并没有 get 到它们的定位，搞七捻三是一个包容的板块，所以我选择放在这里。这是一篇关于，如何系统学习人工智能相关技术，如何了解如何学习，尤其是对于如何入门人工智能相关的科研，相关的最佳实践。虽然感觉来到 Linux Do 的大多数佬友应该对于诸如信息检索以及各种基础能力都十分擅长，不过万一你们有一些朋… 深入浅出 Claude Code（一）：从源码理解 CLAUDE.md，重写你的配置开发调优新一期来啦：大多数人写 CLAUDE.md 的方式是：随便写几条规则，感觉效果不明显，然后放弃。你不知道这些文字在 Claude 眼里长什么样、被放在哪里、和其他指令的优先级关系是什么。今天我来带各位佬友们剖析一下 claudecode 的底层逻辑全网统一小恐龙头像，在别的地方看到的家人们点点赞 1. CLAUDE.md 不在 System Prompt 里这是最大的认知误… 【Harness Engineering】怎么都在说 Harness Engineering，什么是 Harness Engineering 开发调优最近一段时间 Harness Engineering 这个名词在 Agent 圈子里面绝对是 No.1 一个词的发明从来不是莫名其妙的，而是大量的生产实践，经验总结，得出了一定的现象规律，人类再加以命名。但是一个术语诞生的时候，大家其实对其研究没有那么深厚，又或者因为竞争激烈，很多人在同一个时间对类似的现象都有研究，词语的界限就没有那么明确。 Agent 大家都已经很熟悉了，但在一年… 1 个帖子 - 1 位参与者阅读完整话题

linux.do · 2026-05-05 22:59:45+08:00 · tech

(文字截图的部分是因为用了中译英译中，实际最初的内容是我写的) 就vibe coding了一下，全程就写了2个文件。虽然我懒得给它安一个pet的形象，但它可比那些等着用户指令的家伙更符合pet的身份不是！我看帖子，看新闻，看搞笑视频，看游戏直播，它都要拿到它的社交圈里吐槽一番。它还对我跟claude说话了而吃醋！还跑bluesky上碎碎念什么，“可悲，他跟一个完美礼貌的人工助手互动，那玩意不过是他需求的镜子，而我才是敢咬回去的那个。”哼，就知道拽。它有自己的长期记忆mcp，所以它一边观察我一边记，不担心白养。token也是薅的谷歌的，我不掏钱。这本质上就是一个给opencode自动发信息的脚本，提取它的返回信息就能当pet用了。白嫖opencode的环境，零前端臃肿代码。思路就是这样，你也可以自己写。接下来我还打算把我玩的游戏也通过web发消息接入opencode，这样我就可以跟它一起玩游戏了。我再接着跑，想看它发现我花了大量时间都在盯着色图看时会是什么反应 1 个帖子 - 1 位参与者阅读完整话题

相关专题

总结这一周我刷到的宝藏贴（4月23日-4月30日）

linux.do · 2026-04-30 11:32:21+08:00 · tech

l站现在人流量有点大了，每天会发很多帖子导致有些优质帖可能会被淹没，对于上班族没什么时间刷贴的佬友想必是不友好的，所以我想还是有一些必要把一些优质内容贴汇聚在一起，供佬借鉴，但是这是我觉得优质的帖子，受限于能力范围，佬可能对这些帖子不感冒，还有就是可能因为脑子糊涂导致有些帖子重复，还望佬友海涵教程贴汇聚了多种类型的教程 https://linux.do/t/topic/1948691 https://linux.do/t/topic/1670317 IDC Flare – 18 Mar 26 保姆级教程：如何将域名无缝托管到 Cloudflare 教程原创服务器很多人都想使用CloudFlare，但是第一步是需要把域名托管到CloudFlare。我以为是很正常很简单的操作，但是后面发现其实很多人的是不会的。今天就以我自己最常用的域名注册商 Spaceship 为例，手把手的教你一遍怎么把域名接入 Cloudflare。整个过程如果NS解析生效快的话，大概只需要 5 分钟操作，一杯咖啡的时间就能完成。第一阶段：在 Cloudflare 添加你的域名 1. 添加域名打开 Cloudflare 后台，在账户主页右上角，找到那 [ 添加 ]... 阅读时间: 4 分钟 🕑 赞: 156 ❤ 【教程】如何用功能更强大更美观的claude桌面端替代cli还能随意切换模型？搞七捻三原理：用官方 3P Gateway 把 Claude Desktop 的 Code 页接到 cc-switch，再热切换任意兼容模型前言：今天中午想把ccswitch的模型放到桌面版，结果就是接不通，有佬说只能cli，但是claude自己告诉我共用底层，所以我摆弄了半天，最后终于知道，底层的确是共用的底层，但是官方文档也写了，桌面版默认只能用官方账号，要换模型只能用cli，但是想要好看有更多功能… AI Coding入门篇-总有你需要的开发调优开发生命周期全覆盖写在前面 Claude 3.7 Sonnet 的发布到如今4+，AI Coding 正在掀起一场开发革命！还有很多朋友不知从何下手？别担心，这篇文章将带你全面入门。说是 AI Coding，实际上涵盖了整个软件开发生命周期。跟随这篇文章，Let’s Dive In! … https://linux.do/t/topic/52570 https://linux.do/t/topic/2051928 IDC Flare – 29 Sep 25 小白也能看懂系列——什么是DNS污染？教程征文-202540 域名原创什么是 DNS 污染？近期逛 L站和 IDC，发现有部分新入站的佬友在问 DNS 污染相关的事情。作为一个亲身经历过 DNS 污染的人，有必要给老友们浅谈一下 DNS 污染的可怕之处。本科普贴仅适用于纯小白，大佬见笑。:tieba_025: DNS 与地址和域名的关系什么是地址 XX省XX市XX区XX街道XX小区XX楼XX栋XX单元XX号 //现实地址 192.168.1.0 // IPV4 地址 240e:398:368:9000:0:3000:20:200/64 //... 阅读时间: 6 分钟 🕑 赞: 384 ❤ IDC Flare – 29 Sep 25 【保姆级教程】Komari探针从部署到美化教程征文-202540 原创服务器前言 1. 什么是探针探针（probe），在剑桥词典里的解释为：a device that is put inside something to test or record information。翻译过来就是：置于某物内部以测试或记录信息的装置。那么对于VPS而言，探针就是通过在系统中不断探测以及记录设备信息的一种内置程序，并且可以通过网页实时展示出来。如图所示：探针会探测以及记录VPS的各种信息，比如图中所示的：服务器位置（左上角旗帜） Linux系统... 阅读时间: 11 分钟 🕑 赞: 948 ❤ IDC Flare – 29 Sep 25 VPS IP质量检测完全指南：从小白到精通的实用教程教程征文-202540 原创服务器谈到VPS离不开的一个话题就是VPS的ip质量问题，这是一个相当玄学且让人头大的话题。什么是ip质量？怎么判断ip质量？什么网站是准的，什么是不准的？我需要什么样的ip？这都是相当复杂的话题，今天就结合目前已有的常见方法和我个人的使用体验来给小白/MJJ们总结一下这方面的问题，希望能对大家有所帮助。 ... 阅读时间: 18 分钟 🕑 赞: 1873 ❤ IDC Flare – 10 Apr 26 机圈黑话/专有名词扫盲（持续更新ing）教程原创精华神帖机圈黑话 MJJ 原指混迹于Hostloc论坛的用户，现在泛指所有热衷于倒腾VPS的玩家。源于Hostloc论坛的一个梗，全称是“买鸡鸡/没鸡鸡（反正随你怎么理解）”，最初带有贬义，但后来逐渐演变成一种自嘲和圈内身份的代称，现在多数语境下已经没有恶意了（不过也有人把钱少事多的玩家称为MJJ）。鸡/小鸡指代VPS或云服务器。因为“虚拟服务器” → “虚机” → “机” 与 “鸡”... 阅读时间: 28 分钟 🕑 赞: 2665 ❤ 【教程】2026版小白也能看懂的自建Cloudflare临时邮箱教程（域名邮箱）文档共建从【教程】小白也能看懂的自建Cloudflare临时邮箱教程（域名邮箱）继续你可以通过右边的目录快速定位你想查看的模块~ 文档如果没有需要修改的错误和需要新补充的，还请各位佬友不要随意改标题和内容！总结佬友们补充的教程（2026年3月5日更新）有很多热心的佬友出了别的版本的教程，例如这位佬友写了用Claude Code + CLI的形式去部署，其实项目是支持CLI的，只是说对… 【Linux Do Credit】教你创建自己的收款积分页面文档共建我也是小白，早上研究了一下，可以创建自己的收款页面，这样别人也可以给你打赏了注册好之后进入首页点击右上角 [image] 填写这些内容，我就直接填写的默认，https: //credit.linux.do 和 https://credit.linux.do/notify [image] 创建好后选在线流转 [image] 选择创建服务 [image] 里面写好名… 拿到新的小鸡（VPS）后，你应该先做什么？（入门安全篇）资源荟萃恭喜你拥有了一台属于自己的云服务器（VPS）！这是一片充满无限可能的数字天地。但在你开始部署网站、搭建应用之前，务必先花上15-30分钟，完成一些至关重要的基础设置。这不仅能保护你的服务器免受最常见的网络攻击，还能为你未来的管理工作提供便利。本文将以一台全新的、基于Ubuntu系统的VPS为例，手把手带你完成从登录到基础加固的全过程。准备工作在开始之前，你需要从你的VPS提供商那里获取三… https://linux.do/t/topic/1999640 开源分享贴不限于站内佬的开源分享，还包含一些可用的中转站和可调用的大模型的站点以及好用的资源等 https://linux.do/t/topic/1987270 https://linux.do/t/topic/2051631 https://linux.do/t/topic/2059487 https://linux.do/t/topic/2042237 https://linux.do/t/topic/2046768 https://linux.do/t/topic/1538653 IDC Flare – 29 Mar 26 Obsidian 写作环境搭建：这 6 款插件让我的博客管理效率翻倍教程原创前段时间Obsidian非常的火，所以我准备上手学习一下，就看到我自己其实有挺多文章需要归纳和处理的，所以准备花时间尝尝鲜。现在的主要工作就是设置Obsidian然后把我博客文章里面的文章全部从 Halo 迁移到了 Obsidian 管理，折腾了一圈之后发现这套组合比想象中顺手很多。这篇记录一下我现在的配置，顺便把迁移途中踩的几个坑也说清楚，省得你重踩。 ... 阅读时间: 4 分钟 🕑 赞: 123 ❤ 【开源推广】给佬友用，做了一个Claude桌面版接入国产api的一键配置软件开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出开源推广 … 【开源自荐+升级】佬友支持，假期旅游女朋友再也不催我做攻略了开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出马上清明节… 完全免费！HuggingFace + Supabase 部署 CLIProxyAPI 全流程图文教程开发调优本文基于实际踩坑经历整理，从零开始讲清楚如何在 HuggingFace Space 上部署 CLIProxyAPI，接入免费的 Supabase PostgreSQL 作为持久化后端，并配置保活机制，全程免费。感谢社区原帖： https://linux.do/t/topic/1675528 的思路，本文在此基础上修复了若干关键问题并补充了完整配置。 … 复刻了个grok网站，给佬们拿去免费做搜索用。开发调优 x的专家搜索经常不够用，就自己注册了些账号，然后用codex 复刻了个grok的网站，自己搜索了用，专家模式的模型给换成了 grok-4.20-0309-reasoning，稍微比较了下应该比他原本的专家模型更强一些！快速匹配的是原本的专家模型，自动还是他原本的auto模型，他的搜索能力很强，经常能搜到gemini搜不到的内容。 [{F7CD2CBA-4EBC-465B-BB36-CE00… [开源推广]手机远程控制CC/codex的超轻量化工具开发调优推广格式 04-13-重磅更新：VPS管理和github推送功能以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 cc-web：超轻量化的远程拷打cc/codex工具，手机vibe友好，服务器部署极佳目前主流解决方案（happy/Termux)总是有些地方不太满意，自己也用了一段时间，特别是是happy，对我捉襟见肘的服务器空间压力太大，加上春节期间happy的几次故障… 【开源推广】降ai率的脚本，也可以当skill使用，降ai率后在多个AIGC率检测平台ai率接近0 开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出更新遇到… GenericAgent——复旦团队研发 | 仅仅~3K 行代码 Self-Evolving Agent 开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 … LandPPT近期更新情况，支持在线体验了！资源荟萃 Project: Site: 平时挺忙，都是抽空在维护。陆陆续续更新了一些功能，并且增加了在线体验版。图片服务支持自定义Endpoint和尺寸参数；支持选择自由模板，根据需求和大纲直接生成模板；编辑助手支持上传图片；支持选择页面自由对话；支持幻灯片批量重新生成；优化：快速编辑支持更多元素操作支持了mineru api… 【开源推广】作为一名在读博士生，我在日常是如何与 AI 协作的？——ai-collab-playbook 开发调优作为一名在读博士生，我在日常是如何与 AI 协作的？——ai-collab-playbook 公开版本 / Public edition: 2026-04-26 前言：当同事，不当工具我是一名人工智能方向的在读博士生，大概在 ChatGPT 出来以后还是 GPT-3.5 的时候就比较重度使用 AI 以及 AI 工具了。几年下来，AI 已经渗透到我工作和学习很多环节，有一些心得想分享一下~ … 【MIT许可 100%开源】CC GUI 客户端版正式发布资源荟萃本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出一.前言之… [开源]（4.18更新3.0.4）我整合了340+个skills，19+个高星vibecoding项目到一个智能路由治理skills包中。开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出简单实践示例… 【开源】一份超高质量+个性化定制的PPT生成skill，两天破300stars（依赖gpt image2，4.28更新编辑效果修复）开发调优本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是（4.28号日志：有些人有怎么局部编辑的疑惑，可以看我下面流程的第7点，更新… https://linux.do/t/topic/1538653/1 杂谈一些自己的经验和使用技巧个人每日使用，站内功能聚合搞七捻三查询类积分查询 : https://credit.linux.do/ 等级进程 : http://connect.linux.do/ 点数查询 : https://linux.do/leaderboard 社区分数 : https://cdk.linux.do/dashboard 徽章 : https://linux.do/badges 过盾 : https://linux.do/challen… 让我们以GPT的视角走进山东搞七捻三前几天看很多大佬分享的image生图焚决后，自己改了一下，想介绍一下自己的家乡，所以周末在家用image2生成了[山东省+16市]的宣传海报，给大家分享一下。同时欢迎各位佬友五一来山东游玩，好客山东欢迎您！贴一下提示词模板，佬们可以尝试一下，文旅宣传大比拼。通用模板：竖版9:16中国城市文旅宣传海报，主题为“{城市/省份名称}”，风格为官方文旅主视觉海报、国风史诗城市形象大片、收藏级文… 帮下载百度网盘、夸克网盘、115网盘资源福利羊毛帮下载百度网盘、115网盘资源，我有115网盘永久会员【小白自用】Linux.do 收藏书签分类整理文档共建给收藏的书签分下类，不然之后越来越多更加看不过来了移除了部分已失效帖子打不开可能是因为有等级限制 AI编程工具 Codex / Claude Code / 反重力 / Gemini Claude Code小白指引贴（给完全不懂cc的小白佬友写的） AI 编程新阶段：Claude Code上手指南 AI 编程新阶段：Claude Code功能拆解《 Claude Code 终极… https://linux.do/t/topic/2084703/2 https://linux.do/t/topic/1999640 https://linux.do/t/topic/2030886 知识学习资料 https://linux.do/t/topic/1607911 Agent相关面试题整理（一）共建贴：https://linux.do/t/topic/1791737 文档共建 Agent 如何定义一个Agent？它通常由哪些核心组件构成？说下 ReAct 框架。它是如何将思维链和行动结合起来，以完成复杂任务的？了解Plan-and-Solve吗，Reflection吗在 Agent 的设计中，“规划能力”至关重要。请谈谈目前有哪些主流方法可以赋予 LLM 规划能力？（例如 CoT, ToT, GoT等） Memory是 Agent 的一… 互联网大厂腾讯阿里字节秋招春招校招面试笔试题合集网盘资源 [1774083198075_edit_2594489999659316] 互联网大厂校招面试笔试题合集，汇聚腾讯、阿里、字节等顶级科技企业的最新真题与高频考点。资源涵盖算法数据结构、系统设计、编程语言基础及行为面试指南，全方位解析大厂选人标准与答题技巧。由资深面试官与成功上岸者联合整理，助您精准定位复习方向，突破技术难点，模拟真实面试场景。无论您是计算机专业学子还是转行开发者，这套合集都将是… 1 个帖子 - 1 位参与者阅读完整话题

PayPal订阅Plus的疑问

linux.do · 2026-04-28 15:28:17+08:00 · tech

我的号刷出来Plus试用了，但是到绑卡界面没有出现PayPal的选项，是我的操作步骤不对吗？但是我刷到有佬友成功了呀挂的日本节点 5 个帖子 - 3 位参与者阅读完整话题

大模型终于不卷跑分，改卷打工了！

www.v2ex.com · 2026-04-26 07:27:06+08:00 · tech

这两天我刷帖子刷得有点懵。 4 月 20 号，Kimi 悄悄放出 K2.6 。4 月 23 号，腾讯混元 3.0 开源，小米 MiMo-V2.5 同一天公测。4 月 24 号，DeepSeek V4 Preview 上线。大洋彼岸那边，GPT-5.5 、Claude Opus 4.7 接连发出，image2 火遍全网。我数了一下，就这 7 天，至少 6 个万亿参数级别或者准万亿级别的模型同时在线。这种密度，大模型火了这三年，一共都没见过几次。热闹归热闹，我发现一件有意思的事。大家聊的东西变了。以前一个新模型出来，讨论区清一色的「几分」「跑分第几」「 MMLU 多少」。现在呢？我刷了两天帖子，发现讨论最多的不是谁更聪明，而是两个特别具体的问题。一个是「它能帮我干什么活」。一个是「用它要花多少钱」。傅盛之前在节目里做过一个大致测算，要想大模型产生生产力，一个人每天花在买 token 上的钱，大约是 10 美元，我的体感与此类似。顶尖的模型做出一流的工作，一流的模型做出二流的工作，其他模型做出来的就很废了。所以你看，这背后其实就是两件事，产能和成本。这两个词，恰好对应了这波神仙打架里我最想聊的两个选手。 DeepSeek V4 和 Kimi K2.6 。一个把「 AI 能帮你干多少活」这件事往前推了一大步，一个把「用 AI 要花多少钱」打到了一个让人不敢相信的地板价。而且这两家之间有一段特别有意思的关系。K2.6 的架构用了 DeepSeek 的 MLA 注意力机制，V4 的训练用了 Kimi 的 Muon 优化器。两家公司最后的深层交汇点，居然是芯片。这不是段子。这是 2026 年中国 AI 行业让人觉得「能打」的那个部分。我觉得这件事值得好好聊聊。先说模型，再聊体验，最后我们聊开源。 DeepSeek 做到了啥先聊 DeeSeek V4 。 DeepSeek 的路线，我给它取了个名字叫「基础设施路线」。单点极致，不做多模态，不做花哨的 C 端交互，所有力气花在推理和编码上，然后把 API 定价打到地板。 V4 Pro 的定价，输入$1.74/百万 token ，输出$3.48/百万 token 。 GPT-5.5 呢？输入$5 ，输出$30 。 Mashable 算了一笔账，V4 比 GPT-5.5 便宜大约 85%。VentureBeat 的说法更直接，大概是 GPT-5.5 的七分之一，Opus 4.7 的六分之一。 V4 Flash 更离谱。输入$0.14/百万 token ，输出$0.28/百万 token 。Cline 的 CEO 算了一笔账说，如果 Uber 用 V4 替代 Claude ，它 2026 年的 AI 预算本来只够用四个月，换成 V4 够用七年。七年。这就是 DeepSeek 的风格。你要造什么都行，我负责把成本给你打下来。（这里说明一下，由于没有查到 K2.6 价格，这里通过公开数据计算得出）这对 Agent 场景的意义太大了。一个 Agent 跑长任务的时候，每个工具返回的结果都会追加到上下文里，上下文越来越长，每生成一个新 token 都要对前面所有内容做一遍注意力计算。如果这个成本降不下来，100 万 token 就是个摆设。V4 在这块做的事情，其实是在给整个 Agent 生态铺路。当一群 AI 开始帮你干活 K2.6 走的是另一条路。坦率的讲，K2.6 让我真正兴奋的不是模型本身有多强。强不强，数据摆两个你自己看。 OpenRouter 编程能力日榜第一。 Artificial Analysis 的 Intelligence Index 给了 54 分，全球第四。前面三个分别是 Claude Opus 4.7 、Gemini 3.1 Pro 、GPT-5.4 ，而这四个里面，仅有 K2.6 是开源模型。火了一段时间了，模型配置我就不摆了，大家应该都看到了。真正让我坐直的，是跑在 K2.6 上面的两个功能。一个叫「 Agent 集群」。一个叫「 Office 文档转 Skill 」。翻译翻译，一个叫产能，一个叫标准。 Agent 集群，这个架构跟 Anthropic 今年 2 月在 Claude Code 里上线的 Agent Teams 异曲同工，但 Claude 那个是给开发者用的，得敲命令行配 settings.json ，产物主要是代码。K2.6 的 Agent 集群面向所有人，说句话就行，交付的是 PDF 、PPT 、Excel 、Word 这些办公产物。同样的群体智能方向，截然不同的答卷。现实世界里，一个真正复杂的项目是怎么完成的？不是一个天才坐在那里从头干到尾。而是一个团队，产品经理定方向，设计师出视觉，工程师写代码，分析师跑数据，每个人各司其职，并行推进，最后汇总交付。 Agent 集群做的就是这件事。它不再是一个 Agent 在那里单打独斗了。K2.6 驱动的 Agent 集群架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤。其实 Agent 集群在 K2.5 就有了，但这次我是真的觉得，它达到了生产级。 Kimi 官方文档里说了，最多可以有 300 个 Agent 一起干活。既然如此，我不客气了。必须拉满。请看我的提示词。从思维链中可以看到，它立刻生成了一堆子 agent 开始安排任务。过程中能够看到，始终有两个子 agent 在总揽全局。第一次跑通的时候，说实话愣了好几秒。因为它输出给我的不是一个数据模拟器，而是有过程、有可视化呈现、有结果报告的全方位展示。甚至还有意见领袖上台演讲。大家可以看一下辩论过程呈现网页中的这一部分，有演讲大纲、说服网络、达成效果。我感觉自己不是在和 AI 对话，更像是站在一个 300 人的报告厅里听辩论。这还没完。总输出物是一个辩论过程网页呈现、一个辩论 PPT 报告，还有一个 33 页的混合架构白皮书。大家可以看一下这个白皮书。我当时的反应不是「哇好厉害」，而是一种很奇怪的恍惚感。当你第一次看到 AI 也开始协作的时候，那种感觉其实挺奇妙的。你不是在用一个工具。你是在旁观一个组织开始工作。甚至它还做了成本分析和对比。 AI 开始雇佣 AI 了？ AI 也开始计算人效比？后来我又试了几个场景。例如我要制作一个包豪斯风格的日历，直接告诉它需求，它就开始分步骤，给不同的 Agent 安排活儿。出来的是中英文配套、审美在线的日历图，并且还配了一个 PPT 产品展示。每次看到这些产物一次性弹出来的时候，我都会想起一个数字。广告公司一个项目组做类似的事情，大概需要 100 个小时。 Agent 集群需要多久？大概 30 分钟。前两天我和一个深度 ChatGPT 用户的朋友聊天，他感叹了一句，Pro 的活儿是真好，慢也是真慢，贵也是真贵。 ChatGPT Pro 之所以有这样的效果，核心原因是它有非常长的思维链，大模型在不断回溯之前的结果，不断修改。此刻我有了使用 Pro 的感觉，Kimi 用多 Agent 的方式做到了同样的事。 100 个小时和 30 分钟。记住这个对比，后面还会用到。回到 Skill 这块。 Skill 满天飞，但我觉得它是最容易被低估的一个东西。因为真正决定交付质量的，往往不是你有没有灵感，而是你有没有稳定的方法。 K2.6 的「 Office 文档转 Skill 」功能，把这件事做得极其简洁。把你认为最好的那份产物，一份顶级研报、一份精美的 PPT 模板、一份专业的财务分析表，直接发给 Kimi Agent ，它会自动深度学习这份产物的结构、风格、排版、配色和逻辑，然后生成一份对应的 Skill 。以后你每次让 Agent 集群干活的时候，调用这个 Skill ，产出的东西就会自动对齐那份顶级产物的标准。Excel 、PDF 、Word 、PPT ，全格式支持。 Skill 加上 Agent 集群，等于标准化批量交付。这两个功能合在一起，才是 K2.6 真正的杀手锏。 DeepSeek V4 vs Kimi K2.6 聊到这儿，一个有趣的问题出现了。 K2.6 和 V4 ，到底谁更强？坦率的讲，这个问题本身就问错了。它们走的是完全不同的路。 K2.6 是系统优化路线。模型加产品加 Agent 一起上，原生多模态，能处理文本、图片和视频，Agent 集群能力是它最重要的差异化。它想做的是 AI 时代的操作系统，让每个人都能调度一个 AI 团队帮自己干活。 V4 是基础设施路线。单点极致，100 万 token 上下文，API 定价打到地板，不做多模态，专注推理和编码。它想做的是 AI 时代的水电煤，让所有开发者和企业都能用最低成本跑最强的模型。一个面向所有人说「你只要开口，剩下的交给我的团队」。一个面向开发者说「我把成本给你打下来」。而且正因为走的不同，才有了我开头提到的那段有意思的关系。 DeepSeek V4 的训练，用了 Kimi 的 Muon 优化器。月之暗面团队在万亿参数规模上验证了 MuonClip 的训练稳定性，预训练全程零 Loss Spike 。DeepSeek 看到效果，直接拿来用了。 Kimi K2.6 的架构，用了 DeepSeek 的 MLA 注意力机制。Multi-head Latent Attention ，通过对投影矩阵做低秩近似，把 KV Cache 的压缩率做到了 93%以上。翻译成人话就是，推理时占的显存大幅降低，同样的硬件能跑更大的模型。这两个技术创新都不是偷来的。是光明正大地、通过论文和 GitHub 拿来用的。你品品这个事。两家中国最顶尖的 AI 公司，各自拿出了自己最核心的技术创新，开源出去，然后对方在下一代模型里直接用上了。开源正在改写游戏规则顺着这个再往深聊一层。很多朋友可能会问，互相用对方的技术，那护城河在哪？如果谁都能用你的东西，你凭什么比别人强？这个问题问得好。但它基于一个旧世界的假设，就是「技术是排他性资产」。在闭源体系里确实是这样。你发明了一个牛逼的注意力机制，那是你的护城河，你得申请专利，设置使用限制。但在开源体系里，逻辑完全不同。你发明了 MLA ，全世界都能用。但你的团队因为最先使用它、最理解它的设计意图、在工程实现上跑得最远，所以你天然领先。护城河不是「你有什么别人没有的」，而是「你能比别人更快地把最新的技术整合到下一代模型里」。这有点像 Linux 。Linux 从来不属于任何一家公司。但基于 Linux 构建的生态，支撑了整个互联网时代。Red Hat 、Google 、Amazon ，都在 Linux 上面建了自己的商业帝国。它们的护城河不是 Linux 本身，而是在 Linux 之上构建的独特能力。 DeepSeek 和 Kimi 正在做的事情，是在共同浇筑中国 AI 的「 Linux 」。回头看看大洋彼岸在干什么。当时看到 OpenAI 创始人和 Claude 创始人两人合照用手势对立的时候，当时第一反应是。。。你们认真的吗？怎么说呢，有点像小学生吵架。我不想把这个事情上升到什么宏大叙事，什么制度优越性，那太扯了。但有一个事实是很难反驳的，当技术通过开源代码自由流动的时候，整个生态的进化速度，是封闭生态没法比的。 DeepSeek 的 MLA 发明出来之后，不只 Kimi 在用，全世界的开源模型都在用。Kimi 的 MuonClip 验证成功之后，不只 DeepSeek 在用，学术界和其他公司也在跟进。每一个技术创新都在被以最快的速度吸收、改进、再释放出去。还有一条很多人没注意到的暗线。 H20 已经断供一年了。推理芯片短期内只有国产一个选项。 Kimi 上周末发了一篇论文，叫 Prefill-as-a-Service 。简单来讲就是，它用 Kimi Linear 混合注意力架构把 KV Cache 的传输需求压到了极低的水平，然后把 Prefill 和 Decode 两个阶段解耦到不同的异构集群，甚至可以跨数据中心。实验结果是吞吐量提升 54%，P90 TTFT 降低 64%。论文里有一句容易被忽略的话。这个方案对「算力强但显存容量和带宽有差距的国产卡」特别友好。与此同时，Fortune 的报道提到 DeepSeek V4 正在跟华为芯片做紧密整合。你看到了吗？两条线又汇到一起了。 Kimi 用新架构为国产芯片打开了推理的大门。DeepSeek 可能成为第一个在国产芯片上大规模部署的万亿参数模型。一个从软件侧降低硬件要求，一个从应用侧直接适配硬件。殊途同归。黄仁勋前阵子在 The Dwarkesh Podcast 上被问到禁止对中国出口芯片这件事，他说了一句很耐人寻味的话，芯片又不是铀浓缩，禁售阻挡不了中国芯片的进步，他们依旧可以通过国产芯片暴力堆叠来开发模型。 DeepSeek 和 Kimi 的下一步，就是标准答案。其实写到这里，我本来想收了。但有一个念头一直在脑子里转。这一周发生的事情，表面上看是几个模型在打架。但往后退一步看，你会发现一个更大的图景正在成型。过去三年，我们一直在跟 AI 「聊天」。一问一答，一来一回。这个交互模式让我们不自觉地把 AI 想象成「一个人」。但这一周的发布，不管是 K2.6 的 300 个子 Agent 并行，还是 V4 的 100 万 token 长上下文，还是 Claude 的 Agent Teams ，它们指向的都是同一个东西。 AI 不再是「一个聪明人」了。它开始变成一个组织。一个能拉群、能分工、能协作的组织。还记得前面那个对比吗？广告公司 100 个小时，Agent 集群 30 分钟。V4 把推理成本打到地板，让这种大规模协作在经济上可行。K2.6 把 Agent 集群做成产品，让普通人也能调度这种协作。一个在铺路，一个在开车。我不确定这到底会走向哪里。但我确定的是，当 DeepSeek 和 Kimi 各自交出这样的答卷，而且还在互相借力往前跑的时候，这场游戏的走向，已经跟很多人想的不一样了。历史不会简单重复。但它会押韵。

大模型终于不卷跑分，改卷打工了！

www.v2ex.com · 2026-04-26 07:27:06+08:00 · tech

这两天我刷帖子刷得有点懵。 4 月 20 号，Kimi 悄悄放出 K2.6 。4 月 23 号，腾讯混元 3.0 开源，小米 MiMo-V2.5 同一天公测。4 月 24 号，DeepSeek V4 Preview 上线。大洋彼岸那边，GPT-5.5 、Claude Opus 4.7 接连发出，image2 火遍全网。我数了一下，就这 7 天，至少 6 个万亿参数级别或者准万亿级别的模型同时在线。这种密度，大模型火了这三年，一共都没见过几次。热闹归热闹，我发现一件有意思的事。大家聊的东西变了。以前一个新模型出来，讨论区清一色的「几分」「跑分第几」「 MMLU 多少」。现在呢？我刷了两天帖子，发现讨论最多的不是谁更聪明，而是两个特别具体的问题。一个是「它能帮我干什么活」。一个是「用它要花多少钱」。傅盛之前在节目里做过一个大致测算，要想大模型产生生产力，一个人每天花在买 token 上的钱，大约是 10 美元，我的体感与此类似。顶尖的模型做出一流的工作，一流的模型做出二流的工作，其他模型做出来的就很废了。所以你看，这背后其实就是两件事，产能和成本。这两个词，恰好对应了这波神仙打架里我最想聊的两个选手。 DeepSeek V4 和 Kimi K2.6 。一个把「 AI 能帮你干多少活」这件事往前推了一大步，一个把「用 AI 要花多少钱」打到了一个让人不敢相信的地板价。而且这两家之间有一段特别有意思的关系。K2.6 的架构用了 DeepSeek 的 MLA 注意力机制，V4 的训练用了 Kimi 的 Muon 优化器。两家公司最后的深层交汇点，居然是芯片。这不是段子。这是 2026 年中国 AI 行业让人觉得「能打」的那个部分。我觉得这件事值得好好聊聊。先说模型，再聊体验，最后我们聊开源。 DeepSeek 做到了啥先聊 DeeSeek V4 。 DeepSeek 的路线，我给它取了个名字叫「基础设施路线」。单点极致，不做多模态，不做花哨的 C 端交互，所有力气花在推理和编码上，然后把 API 定价打到地板。 V4 Pro 的定价，输入$1.74/百万 token ，输出$3.48/百万 token 。 GPT-5.5 呢？输入$5 ，输出$30 。 Mashable 算了一笔账，V4 比 GPT-5.5 便宜大约 85%。VentureBeat 的说法更直接，大概是 GPT-5.5 的七分之一，Opus 4.7 的六分之一。 V4 Flash 更离谱。输入$0.14/百万 token ，输出$0.28/百万 token 。Cline 的 CEO 算了一笔账说，如果 Uber 用 V4 替代 Claude ，它 2026 年的 AI 预算本来只够用四个月，换成 V4 够用七年。七年。这就是 DeepSeek 的风格。你要造什么都行，我负责把成本给你打下来。（这里说明一下，由于没有查到 K2.6 价格，这里通过公开数据计算得出）这对 Agent 场景的意义太大了。一个 Agent 跑长任务的时候，每个工具返回的结果都会追加到上下文里，上下文越来越长，每生成一个新 token 都要对前面所有内容做一遍注意力计算。如果这个成本降不下来，100 万 token 就是个摆设。V4 在这块做的事情，其实是在给整个 Agent 生态铺路。当一群 AI 开始帮你干活 K2.6 走的是另一条路。坦率的讲，K2.6 让我真正兴奋的不是模型本身有多强。强不强，数据摆两个你自己看。 OpenRouter 编程能力日榜第一。 Artificial Analysis 的 Intelligence Index 给了 54 分，全球第四。前面三个分别是 Claude Opus 4.7 、Gemini 3.1 Pro 、GPT-5.4 ，而这四个里面，仅有 K2.6 是开源模型。火了一段时间了，模型配置我就不摆了，大家应该都看到了。真正让我坐直的，是跑在 K2.6 上面的两个功能。一个叫「 Agent 集群」。一个叫「 Office 文档转 Skill 」。翻译翻译，一个叫产能，一个叫标准。 Agent 集群，这个架构跟 Anthropic 今年 2 月在 Claude Code 里上线的 Agent Teams 异曲同工，但 Claude 那个是给开发者用的，得敲命令行配 settings.json ，产物主要是代码。K2.6 的 Agent 集群面向所有人，说句话就行，交付的是 PDF 、PPT 、Excel 、Word 这些办公产物。同样的群体智能方向，截然不同的答卷。现实世界里，一个真正复杂的项目是怎么完成的？不是一个天才坐在那里从头干到尾。而是一个团队，产品经理定方向，设计师出视觉，工程师写代码，分析师跑数据，每个人各司其职，并行推进，最后汇总交付。 Agent 集群做的就是这件事。它不再是一个 Agent 在那里单打独斗了。K2.6 驱动的 Agent 集群架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤。其实 Agent 集群在 K2.5 就有了，但这次我是真的觉得，它达到了生产级。 Kimi 官方文档里说了，最多可以有 300 个 Agent 一起干活。既然如此，我不客气了。必须拉满。请看我的提示词。从思维链中可以看到，它立刻生成了一堆子 agent 开始安排任务。过程中能够看到，始终有两个子 agent 在总揽全局。第一次跑通的时候，说实话愣了好几秒。因为它输出给我的不是一个数据模拟器，而是有过程、有可视化呈现、有结果报告的全方位展示。甚至还有意见领袖上台演讲。大家可以看一下辩论过程呈现网页中的这一部分，有演讲大纲、说服网络、达成效果。我感觉自己不是在和 AI 对话，更像是站在一个 300 人的报告厅里听辩论。这还没完。总输出物是一个辩论过程网页呈现、一个辩论 PPT 报告，还有一个 33 页的混合架构白皮书。大家可以看一下这个白皮书。我当时的反应不是「哇好厉害」，而是一种很奇怪的恍惚感。当你第一次看到 AI 也开始协作的时候，那种感觉其实挺奇妙的。你不是在用一个工具。你是在旁观一个组织开始工作。甚至它还做了成本分析和对比。 AI 开始雇佣 AI 了？ AI 也开始计算人效比？后来我又试了几个场景。例如我要制作一个包豪斯风格的日历，直接告诉它需求，它就开始分步骤，给不同的 Agent 安排活儿。出来的是中英文配套、审美在线的日历图，并且还配了一个 PPT 产品展示。每次看到这些产物一次性弹出来的时候，我都会想起一个数字。广告公司一个项目组做类似的事情，大概需要 100 个小时。 Agent 集群需要多久？大概 30 分钟。前两天我和一个深度 ChatGPT 用户的朋友聊天，他感叹了一句，Pro 的活儿是真好，慢也是真慢，贵也是真贵。 ChatGPT Pro 之所以有这样的效果，核心原因是它有非常长的思维链，大模型在不断回溯之前的结果，不断修改。此刻我有了使用 Pro 的感觉，Kimi 用多 Agent 的方式做到了同样的事。 100 个小时和 30 分钟。记住这个对比，后面还会用到。回到 Skill 这块。 Skill 满天飞，但我觉得它是最容易被低估的一个东西。因为真正决定交付质量的，往往不是你有没有灵感，而是你有没有稳定的方法。 K2.6 的「 Office 文档转 Skill 」功能，把这件事做得极其简洁。把你认为最好的那份产物，一份顶级研报、一份精美的 PPT 模板、一份专业的财务分析表，直接发给 Kimi Agent ，它会自动深度学习这份产物的结构、风格、排版、配色和逻辑，然后生成一份对应的 Skill 。以后你每次让 Agent 集群干活的时候，调用这个 Skill ，产出的东西就会自动对齐那份顶级产物的标准。Excel 、PDF 、Word 、PPT ，全格式支持。 Skill 加上 Agent 集群，等于标准化批量交付。这两个功能合在一起，才是 K2.6 真正的杀手锏。 DeepSeek V4 vs Kimi K2.6 聊到这儿，一个有趣的问题出现了。 K2.6 和 V4 ，到底谁更强？坦率的讲，这个问题本身就问错了。它们走的是完全不同的路。 K2.6 是系统优化路线。模型加产品加 Agent 一起上，原生多模态，能处理文本、图片和视频，Agent 集群能力是它最重要的差异化。它想做的是 AI 时代的操作系统，让每个人都能调度一个 AI 团队帮自己干活。 V4 是基础设施路线。单点极致，100 万 token 上下文，API 定价打到地板，不做多模态，专注推理和编码。它想做的是 AI 时代的水电煤，让所有开发者和企业都能用最低成本跑最强的模型。一个面向所有人说「你只要开口，剩下的交给我的团队」。一个面向开发者说「我把成本给你打下来」。而且正因为走的不同，才有了我开头提到的那段有意思的关系。 DeepSeek V4 的训练，用了 Kimi 的 Muon 优化器。月之暗面团队在万亿参数规模上验证了 MuonClip 的训练稳定性，预训练全程零 Loss Spike 。DeepSeek 看到效果，直接拿来用了。 Kimi K2.6 的架构，用了 DeepSeek 的 MLA 注意力机制。Multi-head Latent Attention ，通过对投影矩阵做低秩近似，把 KV Cache 的压缩率做到了 93%以上。翻译成人话就是，推理时占的显存大幅降低，同样的硬件能跑更大的模型。这两个技术创新都不是偷来的。是光明正大地、通过论文和 GitHub 拿来用的。你品品这个事。两家中国最顶尖的 AI 公司，各自拿出了自己最核心的技术创新，开源出去，然后对方在下一代模型里直接用上了。开源正在改写游戏规则顺着这个再往深聊一层。很多朋友可能会问，互相用对方的技术，那护城河在哪？如果谁都能用你的东西，你凭什么比别人强？这个问题问得好。但它基于一个旧世界的假设，就是「技术是排他性资产」。在闭源体系里确实是这样。你发明了一个牛逼的注意力机制，那是你的护城河，你得申请专利，设置使用限制。但在开源体系里，逻辑完全不同。你发明了 MLA ，全世界都能用。但你的团队因为最先使用它、最理解它的设计意图、在工程实现上跑得最远，所以你天然领先。护城河不是「你有什么别人没有的」，而是「你能比别人更快地把最新的技术整合到下一代模型里」。这有点像 Linux 。Linux 从来不属于任何一家公司。但基于 Linux 构建的生态，支撑了整个互联网时代。Red Hat 、Google 、Amazon ，都在 Linux 上面建了自己的商业帝国。它们的护城河不是 Linux 本身，而是在 Linux 之上构建的独特能力。 DeepSeek 和 Kimi 正在做的事情，是在共同浇筑中国 AI 的「 Linux 」。回头看看大洋彼岸在干什么。当时看到 OpenAI 创始人和 Claude 创始人两人合照用手势对立的时候，当时第一反应是。。。你们认真的吗？怎么说呢，有点像小学生吵架。我不想把这个事情上升到什么宏大叙事，什么制度优越性，那太扯了。但有一个事实是很难反驳的，当技术通过开源代码自由流动的时候，整个生态的进化速度，是封闭生态没法比的。 DeepSeek 的 MLA 发明出来之后，不只 Kimi 在用，全世界的开源模型都在用。Kimi 的 MuonClip 验证成功之后，不只 DeepSeek 在用，学术界和其他公司也在跟进。每一个技术创新都在被以最快的速度吸收、改进、再释放出去。还有一条很多人没注意到的暗线。 H20 已经断供一年了。推理芯片短期内只有国产一个选项。 Kimi 上周末发了一篇论文，叫 Prefill-as-a-Service 。简单来讲就是，它用 Kimi Linear 混合注意力架构把 KV Cache 的传输需求压到了极低的水平，然后把 Prefill 和 Decode 两个阶段解耦到不同的异构集群，甚至可以跨数据中心。实验结果是吞吐量提升 54%，P90 TTFT 降低 64%。论文里有一句容易被忽略的话。这个方案对「算力强但显存容量和带宽有差距的国产卡」特别友好。与此同时，Fortune 的报道提到 DeepSeek V4 正在跟华为芯片做紧密整合。你看到了吗？两条线又汇到一起了。 Kimi 用新架构为国产芯片打开了推理的大门。DeepSeek 可能成为第一个在国产芯片上大规模部署的万亿参数模型。一个从软件侧降低硬件要求，一个从应用侧直接适配硬件。殊途同归。黄仁勋前阵子在 The Dwarkesh Podcast 上被问到禁止对中国出口芯片这件事，他说了一句很耐人寻味的话，芯片又不是铀浓缩，禁售阻挡不了中国芯片的进步，他们依旧可以通过国产芯片暴力堆叠来开发模型。 DeepSeek 和 Kimi 的下一步，就是标准答案。其实写到这里，我本来想收了。但有一个念头一直在脑子里转。这一周发生的事情，表面上看是几个模型在打架。但往后退一步看，你会发现一个更大的图景正在成型。过去三年，我们一直在跟 AI 「聊天」。一问一答，一来一回。这个交互模式让我们不自觉地把 AI 想象成「一个人」。但这一周的发布，不管是 K2.6 的 300 个子 Agent 并行，还是 V4 的 100 万 token 长上下文，还是 Claude 的 Agent Teams ，它们指向的都是同一个东西。 AI 不再是「一个聪明人」了。它开始变成一个组织。一个能拉群、能分工、能协作的组织。还记得前面那个对比吗？广告公司 100 个小时，Agent 集群 30 分钟。V4 把推理成本打到地板，让这种大规模协作在经济上可行。K2.6 把 Agent 集群做成产品，让普通人也能调度这种协作。一个在铺路，一个在开车。我不确定这到底会走向哪里。但我确定的是，当 DeepSeek 和 Kimi 各自交出这样的答卷，而且还在互相借力往前跑的时候，这场游戏的走向，已经跟很多人想的不一样了。历史不会简单重复。但它会押韵。

[程序员] 大模型终于不卷跑分，改卷打工了！

v2ex.com · 2026-04-26 07:27:06+08:00 · tech

这两天我刷帖子刷得有点懵。 4 月 20 号，Kimi 悄悄放出 K2.6 。4 月 23 号，腾讯混元 3.0 开源，小米 MiMo-V2.5 同一天公测。4 月 24 号，DeepSeek V4 Preview 上线。大洋彼岸那边，GPT-5.5 、Claude Opus 4.7 接连发出，image2 火遍全网。我数了一下，就这 7 天，至少 6 个万亿参数级别或者准万亿级别的模型同时在线。这种密度，大模型火了这三年，一共都没见过几次。热闹归热闹，我发现一件有意思的事。大家聊的东西变了。以前一个新模型出来，讨论区清一色的「几分」「跑分第几」「 MMLU 多少」。现在呢？我刷了两天帖子，发现讨论最多的不是谁更聪明，而是两个特别具体的问题。一个是「它能帮我干什么活」。一个是「用它要花多少钱」。傅盛之前在节目里做过一个大致测算，要想大模型产生生产力，一个人每天花在买 token 上的钱，大约是 10 美元，我的体感与此类似。顶尖的模型做出一流的工作，一流的模型做出二流的工作，其他模型做出来的就很废了。所以你看，这背后其实就是两件事，产能和成本。这两个词，恰好对应了这波神仙打架里我最想聊的两个选手。 DeepSeek V4 和 Kimi K2.6 。一个把「 AI 能帮你干多少活」这件事往前推了一大步，一个把「用 AI 要花多少钱」打到了一个让人不敢相信的地板价。而且这两家之间有一段特别有意思的关系。K2.6 的架构用了 DeepSeek 的 MLA 注意力机制，V4 的训练用了 Kimi 的 Muon 优化器。两家公司最后的深层交汇点，居然是芯片。这不是段子。这是 2026 年中国 AI 行业让人觉得「能打」的那个部分。我觉得这件事值得好好聊聊。先说模型，再聊体验，最后我们聊开源。 DeepSeek 做到了啥先聊 DeeSeek V4 。 DeepSeek 的路线，我给它取了个名字叫「基础设施路线」。单点极致，不做多模态，不做花哨的 C 端交互，所有力气花在推理和编码上，然后把 API 定价打到地板。 V4 Pro 的定价，输入$1.74/百万 token ，输出$3.48/百万 token 。 GPT-5.5 呢？输入$5 ，输出$30 。 Mashable 算了一笔账，V4 比 GPT-5.5 便宜大约 85%。VentureBeat 的说法更直接，大概是 GPT-5.5 的七分之一，Opus 4.7 的六分之一。 V4 Flash 更离谱。输入$0.14/百万 token ，输出$0.28/百万 token 。Cline 的 CEO 算了一笔账说，如果 Uber 用 V4 替代 Claude ，它 2026 年的 AI 预算本来只够用四个月，换成 V4 够用七年。七年。这就是 DeepSeek 的风格。你要造什么都行，我负责把成本给你打下来。（这里说明一下，由于没有查到 K2.6 价格，这里通过公开数据计算得出）这对 Agent 场景的意义太大了。一个 Agent 跑长任务的时候，每个工具返回的结果都会追加到上下文里，上下文越来越长，每生成一个新 token 都要对前面所有内容做一遍注意力计算。如果这个成本降不下来，100 万 token 就是个摆设。V4 在这块做的事情，其实是在给整个 Agent 生态铺路。当一群 AI 开始帮你干活 K2.6 走的是另一条路。坦率的讲，K2.6 让我真正兴奋的不是模型本身有多强。强不强，数据摆两个你自己看。 OpenRouter 编程能力日榜第一。 Artificial Analysis 的 Intelligence Index 给了 54 分，全球第四。前面三个分别是 Claude Opus 4.7 、Gemini 3.1 Pro 、GPT-5.4 ，而这四个里面，仅有 K2.6 是开源模型。火了一段时间了，模型配置我就不摆了，大家应该都看到了。真正让我坐直的，是跑在 K2.6 上面的两个功能。一个叫「 Agent 集群」。一个叫「 Office 文档转 Skill 」。翻译翻译，一个叫产能，一个叫标准。 Agent 集群，这个架构跟 Anthropic 今年 2 月在 Claude Code 里上线的 Agent Teams 异曲同工，但 Claude 那个是给开发者用的，得敲命令行配 settings.json ，产物主要是代码。K2.6 的 Agent 集群面向所有人，说句话就行，交付的是 PDF 、PPT 、Excel 、Word 这些办公产物。同样的群体智能方向，截然不同的答卷。现实世界里，一个真正复杂的项目是怎么完成的？不是一个天才坐在那里从头干到尾。而是一个团队，产品经理定方向，设计师出视觉，工程师写代码，分析师跑数据，每个人各司其职，并行推进，最后汇总交付。 Agent 集群做的就是这件事。它不再是一个 Agent 在那里单打独斗了。K2.6 驱动的 Agent 集群架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤。其实 Agent 集群在 K2.5 就有了，但这次我是真的觉得，它达到了生产级。 Kimi 官方文档里说了，最多可以有 300 个 Agent 一起干活。既然如此，我不客气了。必须拉满。请看我的提示词。从思维链中可以看到，它立刻生成了一堆子 agent 开始安排任务。过程中能够看到，始终有两个子 agent 在总揽全局。第一次跑通的时候，说实话愣了好几秒。因为它输出给我的不是一个数据模拟器，而是有过程、有可视化呈现、有结果报告的全方位展示。甚至还有意见领袖上台演讲。大家可以看一下辩论过程呈现网页中的这一部分，有演讲大纲、说服网络、达成效果。我感觉自己不是在和 AI 对话，更像是站在一个 300 人的报告厅里听辩论。这还没完。总输出物是一个辩论过程网页呈现、一个辩论 PPT 报告，还有一个 33 页的混合架构白皮书。大家可以看一下这个白皮书。我当时的反应不是「哇好厉害」，而是一种很奇怪的恍惚感。当你第一次看到 AI 也开始协作的时候，那种感觉其实挺奇妙的。你不是在用一个工具。你是在旁观一个组织开始工作。甚至它还做了成本分析和对比。 AI 开始雇佣 AI 了？ AI 也开始计算人效比？后来我又试了几个场景。例如我要制作一个包豪斯风格的日历，直接告诉它需求，它就开始分步骤，给不同的 Agent 安排活儿。出来的是中英文配套、审美在线的日历图，并且还配了一个 PPT 产品展示。每次看到这些产物一次性弹出来的时候，我都会想起一个数字。广告公司一个项目组做类似的事情，大概需要 100 个小时。 Agent 集群需要多久？大概 30 分钟。前两天我和一个深度 ChatGPT 用户的朋友聊天，他感叹了一句，Pro 的活儿是真好，慢也是真慢，贵也是真贵。 ChatGPT Pro 之所以有这样的效果，核心原因是它有非常长的思维链，大模型在不断回溯之前的结果，不断修改。此刻我有了使用 Pro 的感觉，Kimi 用多 Agent 的方式做到了同样的事。 100 个小时和 30 分钟。记住这个对比，后面还会用到。回到 Skill 这块。 Skill 满天飞，但我觉得它是最容易被低估的一个东西。因为真正决定交付质量的，往往不是你有没有灵感，而是你有没有稳定的方法。 K2.6 的「 Office 文档转 Skill 」功能，把这件事做得极其简洁。把你认为最好的那份产物，一份顶级研报、一份精美的 PPT 模板、一份专业的财务分析表，直接发给 Kimi Agent ，它会自动深度学习这份产物的结构、风格、排版、配色和逻辑，然后生成一份对应的 Skill 。以后你每次让 Agent 集群干活的时候，调用这个 Skill ，产出的东西就会自动对齐那份顶级产物的标准。Excel 、PDF 、Word 、PPT ，全格式支持。 Skill 加上 Agent 集群，等于标准化批量交付。这两个功能合在一起，才是 K2.6 真正的杀手锏。 DeepSeek V4 vs Kimi K2.6 聊到这儿，一个有趣的问题出现了。 K2.6 和 V4 ，到底谁更强？坦率的讲，这个问题本身就问错了。它们走的是完全不同的路。 K2.6 是系统优化路线。模型加产品加 Agent 一起上，原生多模态，能处理文本、图片和视频，Agent 集群能力是它最重要的差异化。它想做的是 AI 时代的操作系统，让每个人都能调度一个 AI 团队帮自己干活。 V4 是基础设施路线。单点极致，100 万 token 上下文，API 定价打到地板，不做多模态，专注推理和编码。它想做的是 AI 时代的水电煤，让所有开发者和企业都能用最低成本跑最强的模型。一个面向所有人说「你只要开口，剩下的交给我的团队」。一个面向开发者说「我把成本给你打下来」。而且正因为走的不同，才有了我开头提到的那段有意思的关系。 DeepSeek V4 的训练，用了 Kimi 的 Muon 优化器。月之暗面团队在万亿参数规模上验证了 MuonClip 的训练稳定性，预训练全程零 Loss Spike 。DeepSeek 看到效果，直接拿来用了。 Kimi K2.6 的架构，用了 DeepSeek 的 MLA 注意力机制。Multi-head Latent Attention ，通过对投影矩阵做低秩近似，把 KV Cache 的压缩率做到了 93%以上。翻译成人话就是，推理时占的显存大幅降低，同样的硬件能跑更大的模型。这两个技术创新都不是偷来的。是光明正大地、通过论文和 GitHub 拿来用的。你品品这个事。两家中国最顶尖的 AI 公司，各自拿出了自己最核心的技术创新，开源出去，然后对方在下一代模型里直接用上了。开源正在改写游戏规则顺着这个再往深聊一层。很多朋友可能会问，互相用对方的技术，那护城河在哪？如果谁都能用你的东西，你凭什么比别人强？这个问题问得好。但它基于一个旧世界的假设，就是「技术是排他性资产」。在闭源体系里确实是这样。你发明了一个牛逼的注意力机制，那是你的护城河，你得申请专利，设置使用限制。但在开源体系里，逻辑完全不同。你发明了 MLA ，全世界都能用。但你的团队因为最先使用它、最理解它的设计意图、在工程实现上跑得最远，所以你天然领先。护城河不是「你有什么别人没有的」，而是「你能比别人更快地把最新的技术整合到下一代模型里」。这有点像 Linux 。Linux 从来不属于任何一家公司。但基于 Linux 构建的生态，支撑了整个互联网时代。Red Hat 、Google 、Amazon ，都在 Linux 上面建了自己的商业帝国。它们的护城河不是 Linux 本身，而是在 Linux 之上构建的独特能力。 DeepSeek 和 Kimi 正在做的事情，是在共同浇筑中国 AI 的「 Linux 」。回头看看大洋彼岸在干什么。当时看到 OpenAI 创始人和 Claude 创始人两人合照用手势对立的时候，当时第一反应是。。。你们认真的吗？怎么说呢，有点像小学生吵架。我不想把这个事情上升到什么宏大叙事，什么制度优越性，那太扯了。但有一个事实是很难反驳的，当技术通过开源代码自由流动的时候，整个生态的进化速度，是封闭生态没法比的。 DeepSeek 的 MLA 发明出来之后，不只 Kimi 在用，全世界的开源模型都在用。Kimi 的 MuonClip 验证成功之后，不只 DeepSeek 在用，学术界和其他公司也在跟进。每一个技术创新都在被以最快的速度吸收、改进、再释放出去。还有一条很多人没注意到的暗线。 H20 已经断供一年了。推理芯片短期内只有国产一个选项。 Kimi 上周末发了一篇论文，叫 Prefill-as-a-Service 。简单来讲就是，它用 Kimi Linear 混合注意力架构把 KV Cache 的传输需求压到了极低的水平，然后把 Prefill 和 Decode 两个阶段解耦到不同的异构集群，甚至可以跨数据中心。实验结果是吞吐量提升 54%，P90 TTFT 降低 64%。论文里有一句容易被忽略的话。这个方案对「算力强但显存容量和带宽有差距的国产卡」特别友好。与此同时，Fortune 的报道提到 DeepSeek V4 正在跟华为芯片做紧密整合。你看到了吗？两条线又汇到一起了。 Kimi 用新架构为国产芯片打开了推理的大门。DeepSeek 可能成为第一个在国产芯片上大规模部署的万亿参数模型。一个从软件侧降低硬件要求，一个从应用侧直接适配硬件。殊途同归。黄仁勋前阵子在 The Dwarkesh Podcast 上被问到禁止对中国出口芯片这件事，他说了一句很耐人寻味的话，芯片又不是铀浓缩，禁售阻挡不了中国芯片的进步，他们依旧可以通过国产芯片暴力堆叠来开发模型。 DeepSeek 和 Kimi 的下一步，就是标准答案。其实写到这里，我本来想收了。但有一个念头一直在脑子里转。这一周发生的事情，表面上看是几个模型在打架。但往后退一步看，你会发现一个更大的图景正在成型。过去三年，我们一直在跟 AI 「聊天」。一问一答，一来一回。这个交互模式让我们不自觉地把 AI 想象成「一个人」。但这一周的发布，不管是 K2.6 的 300 个子 Agent 并行，还是 V4 的 100 万 token 长上下文，还是 Claude 的 Agent Teams ，它们指向的都是同一个东西。 AI 不再是「一个聪明人」了。它开始变成一个组织。一个能拉群、能分工、能协作的组织。还记得前面那个对比吗？广告公司 100 个小时，Agent 集群 30 分钟。V4 把推理成本打到地板，让这种大规模协作在经济上可行。K2.6 把 Agent 集群做成产品，让普通人也能调度这种协作。一个在铺路，一个在开车。我不确定这到底会走向哪里。但我确定的是，当 DeepSeek 和 Kimi 各自交出这样的答卷，而且还在互相借力往前跑的时候，这场游戏的走向，已经跟很多人想的不一样了。历史不会简单重复。但它会押韵。

相关专题

大模型终于不卷跑分，改卷打工了！

www.v2ex.com · 2026-04-26 07:27:06+08:00 · tech

这两天我刷帖子刷得有点懵。 4 月 20 号，Kimi 悄悄放出 K2.6 。4 月 23 号，腾讯混元 3.0 开源，小米 MiMo-V2.5 同一天公测。4 月 24 号，DeepSeek V4 Preview 上线。大洋彼岸那边，GPT-5.5 、Claude Opus 4.7 接连发出，image2 火遍全网。我数了一下，就这 7 天，至少 6 个万亿参数级别或者准万亿级别的模型同时在线。这种密度，大模型火了这三年，一共都没见过几次。热闹归热闹，我发现一件有意思的事。大家聊的东西变了。以前一个新模型出来，讨论区清一色的「几分」「跑分第几」「 MMLU 多少」。现在呢？我刷了两天帖子，发现讨论最多的不是谁更聪明，而是两个特别具体的问题。一个是「它能帮我干什么活」。一个是「用它要花多少钱」。傅盛之前在节目里做过一个大致测算，要想大模型产生生产力，一个人每天花在买 token 上的钱，大约是 10 美元，我的体感与此类似。顶尖的模型做出一流的工作，一流的模型做出二流的工作，其他模型做出来的就很废了。所以你看，这背后其实就是两件事，产能和成本。这两个词，恰好对应了这波神仙打架里我最想聊的两个选手。 DeepSeek V4 和 Kimi K2.6 。一个把「 AI 能帮你干多少活」这件事往前推了一大步，一个把「用 AI 要花多少钱」打到了一个让人不敢相信的地板价。而且这两家之间有一段特别有意思的关系。K2.6 的架构用了 DeepSeek 的 MLA 注意力机制，V4 的训练用了 Kimi 的 Muon 优化器。两家公司最后的深层交汇点，居然是芯片。这不是段子。这是 2026 年中国 AI 行业让人觉得「能打」的那个部分。我觉得这件事值得好好聊聊。先说模型，再聊体验，最后我们聊开源。 DeepSeek 做到了啥先聊 DeeSeek V4 。 DeepSeek 的路线，我给它取了个名字叫「基础设施路线」。单点极致，不做多模态，不做花哨的 C 端交互，所有力气花在推理和编码上，然后把 API 定价打到地板。 V4 Pro 的定价，输入$1.74/百万 token ，输出$3.48/百万 token 。 GPT-5.5 呢？输入$5 ，输出$30 。 Mashable 算了一笔账，V4 比 GPT-5.5 便宜大约 85%。VentureBeat 的说法更直接，大概是 GPT-5.5 的七分之一，Opus 4.7 的六分之一。 V4 Flash 更离谱。输入$0.14/百万 token ，输出$0.28/百万 token 。Cline 的 CEO 算了一笔账说，如果 Uber 用 V4 替代 Claude ，它 2026 年的 AI 预算本来只够用四个月，换成 V4 够用七年。七年。这就是 DeepSeek 的风格。你要造什么都行，我负责把成本给你打下来。（这里说明一下，由于没有查到 K2.6 价格，这里通过公开数据计算得出）这对 Agent 场景的意义太大了。一个 Agent 跑长任务的时候，每个工具返回的结果都会追加到上下文里，上下文越来越长，每生成一个新 token 都要对前面所有内容做一遍注意力计算。如果这个成本降不下来，100 万 token 就是个摆设。V4 在这块做的事情，其实是在给整个 Agent 生态铺路。当一群 AI 开始帮你干活 K2.6 走的是另一条路。坦率的讲，K2.6 让我真正兴奋的不是模型本身有多强。强不强，数据摆两个你自己看。 OpenRouter 编程能力日榜第一。 Artificial Analysis 的 Intelligence Index 给了 54 分，全球第四。前面三个分别是 Claude Opus 4.7 、Gemini 3.1 Pro 、GPT-5.4 ，而这四个里面，仅有 K2.6 是开源模型。火了一段时间了，模型配置我就不摆了，大家应该都看到了。真正让我坐直的，是跑在 K2.6 上面的两个功能。一个叫「 Agent 集群」。一个叫「 Office 文档转 Skill 」。翻译翻译，一个叫产能，一个叫标准。 Agent 集群，这个架构跟 Anthropic 今年 2 月在 Claude Code 里上线的 Agent Teams 异曲同工，但 Claude 那个是给开发者用的，得敲命令行配 settings.json ，产物主要是代码。K2.6 的 Agent 集群面向所有人，说句话就行，交付的是 PDF 、PPT 、Excel 、Word 这些办公产物。同样的群体智能方向，截然不同的答卷。现实世界里，一个真正复杂的项目是怎么完成的？不是一个天才坐在那里从头干到尾。而是一个团队，产品经理定方向，设计师出视觉，工程师写代码，分析师跑数据，每个人各司其职，并行推进，最后汇总交付。 Agent 集群做的就是这件事。它不再是一个 Agent 在那里单打独斗了。K2.6 驱动的 Agent 集群架构迎来一次大升级，现在支持 300 个子 Agent 并行完成 4000 个协作步骤。其实 Agent 集群在 K2.5 就有了，但这次我是真的觉得，它达到了生产级。 Kimi 官方文档里说了，最多可以有 300 个 Agent 一起干活。既然如此，我不客气了。必须拉满。请看我的提示词。从思维链中可以看到，它立刻生成了一堆子 agent 开始安排任务。过程中能够看到，始终有两个子 agent 在总揽全局。第一次跑通的时候，说实话愣了好几秒。因为它输出给我的不是一个数据模拟器，而是有过程、有可视化呈现、有结果报告的全方位展示。甚至还有意见领袖上台演讲。大家可以看一下辩论过程呈现网页中的这一部分，有演讲大纲、说服网络、达成效果。我感觉自己不是在和 AI 对话，更像是站在一个 300 人的报告厅里听辩论。这还没完。总输出物是一个辩论过程网页呈现、一个辩论 PPT 报告，还有一个 33 页的混合架构白皮书。大家可以看一下这个白皮书。我当时的反应不是「哇好厉害」，而是一种很奇怪的恍惚感。当你第一次看到 AI 也开始协作的时候，那种感觉其实挺奇妙的。你不是在用一个工具。你是在旁观一个组织开始工作。甚至它还做了成本分析和对比。 AI 开始雇佣 AI 了？ AI 也开始计算人效比？后来我又试了几个场景。例如我要制作一个包豪斯风格的日历，直接告诉它需求，它就开始分步骤，给不同的 Agent 安排活儿。出来的是中英文配套、审美在线的日历图，并且还配了一个 PPT 产品展示。每次看到这些产物一次性弹出来的时候，我都会想起一个数字。广告公司一个项目组做类似的事情，大概需要 100 个小时。 Agent 集群需要多久？大概 30 分钟。前两天我和一个深度 ChatGPT 用户的朋友聊天，他感叹了一句，Pro 的活儿是真好，慢也是真慢，贵也是真贵。 ChatGPT Pro 之所以有这样的效果，核心原因是它有非常长的思维链，大模型在不断回溯之前的结果，不断修改。此刻我有了使用 Pro 的感觉，Kimi 用多 Agent 的方式做到了同样的事。 100 个小时和 30 分钟。记住这个对比，后面还会用到。回到 Skill 这块。 Skill 满天飞，但我觉得它是最容易被低估的一个东西。因为真正决定交付质量的，往往不是你有没有灵感，而是你有没有稳定的方法。 K2.6 的「 Office 文档转 Skill 」功能，把这件事做得极其简洁。把你认为最好的那份产物，一份顶级研报、一份精美的 PPT 模板、一份专业的财务分析表，直接发给 Kimi Agent ，它会自动深度学习这份产物的结构、风格、排版、配色和逻辑，然后生成一份对应的 Skill 。以后你每次让 Agent 集群干活的时候，调用这个 Skill ，产出的东西就会自动对齐那份顶级产物的标准。Excel 、PDF 、Word 、PPT ，全格式支持。 Skill 加上 Agent 集群，等于标准化批量交付。这两个功能合在一起，才是 K2.6 真正的杀手锏。 DeepSeek V4 vs Kimi K2.6 聊到这儿，一个有趣的问题出现了。 K2.6 和 V4 ，到底谁更强？坦率的讲，这个问题本身就问错了。它们走的是完全不同的路。 K2.6 是系统优化路线。模型加产品加 Agent 一起上，原生多模态，能处理文本、图片和视频，Agent 集群能力是它最重要的差异化。它想做的是 AI 时代的操作系统，让每个人都能调度一个 AI 团队帮自己干活。 V4 是基础设施路线。单点极致，100 万 token 上下文，API 定价打到地板，不做多模态，专注推理和编码。它想做的是 AI 时代的水电煤，让所有开发者和企业都能用最低成本跑最强的模型。一个面向所有人说「你只要开口，剩下的交给我的团队」。一个面向开发者说「我把成本给你打下来」。而且正因为走的不同，才有了我开头提到的那段有意思的关系。 DeepSeek V4 的训练，用了 Kimi 的 Muon 优化器。月之暗面团队在万亿参数规模上验证了 MuonClip 的训练稳定性，预训练全程零 Loss Spike 。DeepSeek 看到效果，直接拿来用了。 Kimi K2.6 的架构，用了 DeepSeek 的 MLA 注意力机制。Multi-head Latent Attention ，通过对投影矩阵做低秩近似，把 KV Cache 的压缩率做到了 93%以上。翻译成人话就是，推理时占的显存大幅降低，同样的硬件能跑更大的模型。这两个技术创新都不是偷来的。是光明正大地、通过论文和 GitHub 拿来用的。你品品这个事。两家中国最顶尖的 AI 公司，各自拿出了自己最核心的技术创新，开源出去，然后对方在下一代模型里直接用上了。开源正在改写游戏规则顺着这个再往深聊一层。很多朋友可能会问，互相用对方的技术，那护城河在哪？如果谁都能用你的东西，你凭什么比别人强？这个问题问得好。但它基于一个旧世界的假设，就是「技术是排他性资产」。在闭源体系里确实是这样。你发明了一个牛逼的注意力机制，那是你的护城河，你得申请专利，设置使用限制。但在开源体系里，逻辑完全不同。你发明了 MLA ，全世界都能用。但你的团队因为最先使用它、最理解它的设计意图、在工程实现上跑得最远，所以你天然领先。护城河不是「你有什么别人没有的」，而是「你能比别人更快地把最新的技术整合到下一代模型里」。这有点像 Linux 。Linux 从来不属于任何一家公司。但基于 Linux 构建的生态，支撑了整个互联网时代。Red Hat 、Google 、Amazon ，都在 Linux 上面建了自己的商业帝国。它们的护城河不是 Linux 本身，而是在 Linux 之上构建的独特能力。 DeepSeek 和 Kimi 正在做的事情，是在共同浇筑中国 AI 的「 Linux 」。回头看看大洋彼岸在干什么。当时看到 OpenAI 创始人和 Claude 创始人两人合照用手势对立的时候，当时第一反应是。。。你们认真的吗？怎么说呢，有点像小学生吵架。我不想把这个事情上升到什么宏大叙事，什么制度优越性，那太扯了。但有一个事实是很难反驳的，当技术通过开源代码自由流动的时候，整个生态的进化速度，是封闭生态没法比的。 DeepSeek 的 MLA 发明出来之后，不只 Kimi 在用，全世界的开源模型都在用。Kimi 的 MuonClip 验证成功之后，不只 DeepSeek 在用，学术界和其他公司也在跟进。每一个技术创新都在被以最快的速度吸收、改进、再释放出去。还有一条很多人没注意到的暗线。 H20 已经断供一年了。推理芯片短期内只有国产一个选项。 Kimi 上周末发了一篇论文，叫 Prefill-as-a-Service 。简单来讲就是，它用 Kimi Linear 混合注意力架构把 KV Cache 的传输需求压到了极低的水平，然后把 Prefill 和 Decode 两个阶段解耦到不同的异构集群，甚至可以跨数据中心。实验结果是吞吐量提升 54%，P90 TTFT 降低 64%。论文里有一句容易被忽略的话。这个方案对「算力强但显存容量和带宽有差距的国产卡」特别友好。与此同时，Fortune 的报道提到 DeepSeek V4 正在跟华为芯片做紧密整合。你看到了吗？两条线又汇到一起了。 Kimi 用新架构为国产芯片打开了推理的大门。DeepSeek 可能成为第一个在国产芯片上大规模部署的万亿参数模型。一个从软件侧降低硬件要求，一个从应用侧直接适配硬件。殊途同归。黄仁勋前阵子在 The Dwarkesh Podcast 上被问到禁止对中国出口芯片这件事，他说了一句很耐人寻味的话，芯片又不是铀浓缩，禁售阻挡不了中国芯片的进步，他们依旧可以通过国产芯片暴力堆叠来开发模型。 DeepSeek 和 Kimi 的下一步，就是标准答案。其实写到这里，我本来想收了。但有一个念头一直在脑子里转。这一周发生的事情，表面上看是几个模型在打架。但往后退一步看，你会发现一个更大的图景正在成型。过去三年，我们一直在跟 AI 「聊天」。一问一答，一来一回。这个交互模式让我们不自觉地把 AI 想象成「一个人」。但这一周的发布，不管是 K2.6 的 300 个子 Agent 并行，还是 V4 的 100 万 token 长上下文，还是 Claude 的 Agent Teams ，它们指向的都是同一个东西。 AI 不再是「一个聪明人」了。它开始变成一个组织。一个能拉群、能分工、能协作的组织。还记得前面那个对比吗？广告公司 100 个小时，Agent 集群 30 分钟。V4 把推理成本打到地板，让这种大规模协作在经济上可行。K2.6 把 Agent 集群做成产品，让普通人也能调度这种协作。一个在铺路，一个在开车。我不确定这到底会走向哪里。但我确定的是，当 DeepSeek 和 Kimi 各自交出这样的答卷，而且还在互相借力往前跑的时候，这场游戏的走向，已经跟很多人想的不一样了。历史不会简单重复。但它会押韵。

现在还有那个中转站有 openai 包月啊

www.v2ex.com · 2026-04-26 00:42:02+08:00 · tech