WWW.YOUINFO.SITE
标签聚合 杨轩

/tag/杨轩

36氪 · None · tech

文|周鑫雨 编辑|张雨忻 杨轩 《智能涌现》从多个信源处独家获悉,2026 年,字节 AI 有四个重要的命题: 加大对世界模型训练的投入,年底前,模型 性能达到现阶段世界模型全球 SOTA(最佳)Google Genie 3 的水平。 视频模型继续保持领先地位, 探索“动态生成”等新方向。 进一步打好 Coding 的地基, 做好 Coding 的 Dogfooding(数据回流、评测,形成飞轮),提升 Agent 能力。 豆包强化商业化能力, 重点场景是“办公”。 字节的未竟之地:世界模型 如今,字节的 AI 矩阵中,有让字节终于得以进入中国大模型第一梯队的 Seed 2.0,还有做到世界 SOTA 水平的 Seedance 2.0,另外在应用侧,豆包也形成了断层式领先—— 我们从多方了解到,2026 年春节过后,豆包 DAU 达到 2 亿 。 “没有明显短板。”一名大厂 AI 战略如此评价字节的 AI 业务矩阵。 但在一众模型中,唯独少了大模型研究下一阶段的关键:世界模型。 几名接近 Seed 团队人士告诉我们,字节是入场世界模型赛道较晚的玩家。 2024 年,刚从阿里加入字节的周畅,扛起了世界模型研究的大旗 。 但当时内部的判断是,世界模型路线和商业化场景还不明确,更重要的是打好视频模型的仗。 直到 2025 年,字节才在小范围内成立研究组,开始对世界模型中的 VLA(视觉-语言-动作模型)路线进行探索。带队人有两位: 一是字节 AI Lab 负责人李航——2025 年 4 月,AI Lab 整体(包含 Robotics 团队)并入了 Seed,目的之一是提升模型和应用(具身智能)之间的沟通效率——主要基于仿真数据进行世界模型训练。 另一位是 Seed 多模态研究员王文千,主要基于自然数据做训练。 来到 2026 年,吴永辉终于在 Seed 全员会上为世界模型设立了一个明确的目标: 2026 年底之前至少发布一版世界模型���性能对标目前的世界 SOTA(最佳)—— Google 在 2025 年 8 月发布的 Genie 3 。 但从目前的进度来看,追赶的速度不够。一位接近 Seed 人士告诉我们,吴永辉多次在 Seed 内部会直言字节世界模型和具身智能的效果不及预期。 另有 Seed 成员透露,根据内部评测,截至2026年初,字节世界模型的综合性能距离全球 SOTA 还存在 10% 的差距。 但这场仗代表未来。 一方面,世界模型的下游,便是至少千亿美金体量的具身智能市场,以及想象空间极大的游戏和娱乐场景。 一名前 Seed 研究员曾对我们表示,字节机器人此前的落地场景主要为物品运输、工业搬运,但内部判断天花板较低,“市场前景更广阔的人形机器人是字节一定会入局的方向。” 另一方面,世界模型的路线仍然存在诸多非共识,包括视频生成派、VLA(视觉-语言-动作模型)派、JEPA(像素预测)派等。 “赌,以字节的人才密度和资金投入,大概率能赢。”一名AI投资人对我们分析,“不赌,则一定会输。” 围绕跻身世界第一梯队的目标,2026年以来,字节针对世界模型训练,也已经做了不少调整。 《智能涌现》得知,2026年春节后, Seed 新设立了一支世界模型研究组,负责人为前Meta FAIR Lab研究员范浩奇,汇报给 Seed 多模态和世界模型负责人周畅; 与此同时,原来李航和王文千带领的两个 VLA 研究组合并,统一向周畅汇报。 多名知情人士告诉《智能涌现》,原来李航和王文千的研究组所探索的路线,主要是 VLA,追求“即兴”、“真实”,目标应用场景是具身智能;而范浩奇带领的新队伍走的则是 3D 仿真路线,主打娱乐和游戏这类应用场景。 除了人力和探索路线的扩张,世界模型在资金投入上也是文本、Coding、视频等多个模型方向中最高的一个。 很显著的是数据预算。一名字节数据平台的员工告诉我们,训练数据“走量”的策略,此前在 LLM(大语言模型)和 Seedance 2.0 上取得了显著收益,团队计划将同样的“数海战术”应用在世界模型的训练上。 这也对应着更高昂的数据投入——我们从多方了解到,2026 年,字节批给世界模型的训练数据(包括VLA、长视频、3D 等模态)的预算,在各个模态中是最高的,金额达到数千万元。 一名数据供应商提到,字节在世界模型上的数据投入,能达到其它厂商的 3-4 倍。 Coding :追求更极致的数据工程 Coding 能力是基础,是决定 Agent 效果上限的关键——这已成为业界的共识。 多名知情者曾对我们提及字节对 Coding 的重视。“字节对 Coding 的投入一直很高,仅次于今年的世界模型。”有接近 Seed 的人士告诉《智能涌现》。 比如,内部会定向采购数据,或是研究 Claude Code、CodeX 等海外顶尖 Coding 模型的训练数据 demo。 在 2025 年的火山引擎 Force 大会上,字节跳动技术副总裁洪定坤也表示,Coding 作为一种高度结构化、逻辑严密的任务,对模型理解复杂的语义结构、逻辑推理、算法设计和精确表达都有很高的要求,能助力模型智能上限的探索。 但在外界,字节 Coding 业务的存在感一直不强。无论是 2025 年 11 月发布的模型 Doubao-Seed-Code,还是 2025 年初发布的 AI 编程工具 Trae,效果和声量都不及智谱的 GLM 5 和月之暗面的 K2。 “字节 Coding 效果难以取得突破的原因在于缺少数据回流。” 一名知情者评价。由于模型能力有限,字节相关业务都不愿意使用 Seed-Code。 就连 AI Coding 应用 Trae,最早接入的也是 DeepSeek 和 Claude Code,以及产品内部自己训练的 Coding 模型。 这就导致,字节 Coding 模型缺少来自真实应用场景的反馈。 2026 年以来,不少字节员工感受到,各个业务方正在加大对 Seed 模型的支持力度。一名 Seed 员工告诉《智能涌现》,原来字节并不限制业务侧使用第三方 Coding 模型做开发,但 2026 年以来,多个应用部门被强制要求使用 Seed 模型。 不过,在更极致的数据投入下,Seed 在人才招聘上的速度倒是稍有放缓。 有AI 圈猎头告诉《智能涌现》,字节 HR 现在对外释放的信号是:粗放高薪招聘的时代已经结束了,接下来的命题是内部培养、提拔年轻人才,提高算法待遇。 如今,Seed 为数不多的招聘口子,主要开放给了来自DeepSeek,以及OpenAI、DeepMind、Meta 等海外大厂的 AI 人才,比如前 DeepSeek 核心成员郭达雅、前英伟达研究员董鑫。 Seedance 如何保持 SOTA 地位 2026 年字节在 AI 模型上的另一个重点,则是维持 Seedance 在全球视频生成领域的 SOTA 地位。 “Seedance 2.0 的胜利,是数据的胜利。”某视频生成初创企业的创始人曾对《智能涌现》这样评价 Seedance 2.0。我们得知, 庞大的训练数据量和超过 2000 人的评测团队,造就了 Seedance 2.0 的亮眼效果。 但持续靠“走量”的训练方式也存在隐忧。一些研究表明,视频生成领域存在“Anti-Scaling Law”现象,简单而言,训练数据越多,模型越容易“偷懒”,只学习某些关键帧,而忽视完整叙事——因此,越到训练后期,数据“走量”的收益往往越低。 两名数据侧的知情人士告诉我们, Seedance在预训练上已经做到了天花板,接下来想要提升性能,就必须清洗训练数据,进行更精细的后训练。 与此同时, “动态生成”能力是 2026 年 Seedance 团队关注的新方向。 所谓的“动态生成”,也就是互动视频,指的是用户可以输入指令,随时调整视频生成的内容和剧情。在这一赛道上,已经跑出了估值高达 13.2 亿美金的Vivix AI(前商汤高级研究总监刘宇创立)。 多名知情者告诉《智能涌现》,周畅一直十分看好动态生成的落地前景。 “互动视频可以做成小游戏,也可以做互动剧集,同时也能和世界模型的探索接轨(视频生成也是世界模型的一条探索路径)。”一名接近 Seed 人士表示。 加速豆包的商业化和出海 36氪曾独家报道 ,豆包预计将在 6 月下旬正式上线付费内容;与此同时,豆包也在计划与抖音电商打通,完善付费场景。 2026 年 5 月初,豆包曾在 App Store 中更新过付费订阅方案,月订阅价格在免费到500元不等。 6 月 3 日,豆包官方也宣布,即将针对专业人群的生产力需求推出“豆包专业版”,包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。 多名知情者透露,春节后, 豆包 DAU 已经突破 2 亿 。“今年豆包的投流预算很低。”在一名知情者看来,高 DAU 带来的是高昂的推理成本和运维压力,豆包在这个时间点推进商业化,带有降一降增长的增速,以及自我造血的双重目的。 而 PPT 生成,是豆包建立用户付费心智的核心切入点 。“豆包希望加强 PPT 生成功能,是为了面向金融、法律等高净值行业的白领收费。”一名接近豆包人士告诉《智能涌现》, 下一阶段,豆包还计划推出企业版,与企业内部的系统打通,但内部仍在讨论具体的结合方式 。 他表示,这一想法,是受到了海外模型商业模式的启发。目前,面向办公场景收费这条商业化路径,在海外已经得到了验证。据 Anthropic 披露的数据,Claude Code 上线仅 6 个月,ARR 就达到了 10 亿美元;上线一年后,2026 年 2 月的 ARR 已经达到了 25 亿美元。 面向企业开发场景的 Claude Code 带来的可观现金流,也让成立比 OpenAI 晚了 6 年的 Anthropic,在今年年初一跃反超 OpenAI 的 ARR。 那么现在,豆包要解决的问题就是把自己的用户心智从一个可以免费问一切的“通用入口”转变为一个虽然要花钱但能帮你提高效率的“办公助手”。 不过,豆包想进入的这个市场已经开始拥挤。有豆包人士对智能涌现提到,在调研企业客户的过程中,字节发现企业 AI 工具市场已经被不少行业 AI 解决方案供应商占领,迟来的豆包必然要面对更高的获客成本。 《智能涌现》了解到,出海也是豆包今年的重要命题之一。 此前,据《界面新闻》报道,豆包海外版应用 Dola 在 2025 年底的 DAU 已经突破千万。《智能涌现》了解到, Dola 2026 年的增长目标为:年底达到 3000万 DAU。 一名知情人士表示,小语种国家是 Dola 面向的主要市场。目前,海外 AI Chatbot 市场,已经基本被 ChatGPT、Claude、Gemini 占据。不在欧美市场与“AI 御三家”正面对抗,差异化切入小语种市场,是 Dola 的增长策略。 第三方数据显示,2025 年下半年以来,Dola 频频登上印尼、马来西亚、墨西哥等国家的应用商店下载榜。 —— 加入字节一年来,吴永辉的命题就是带领 Seed 一边修 Bug,一边做 SOTA 模型。而 2026 年,在AI 的每一个战场中,字节的目标都是做赢家。 如今,Seed 2.0、Seedance 2.0 成果初显,Seed 积累的工程、数据经验、人才,也将会以更高效的方式,复用到新一轮战争中。 (《智能涌现》作者邓咏仪对本文亦有贡献。) 封面来源|AI生成、视觉中国 欢迎交流! 欢迎交流!

36氪 · None · tech

文|肖思佳 编辑|乔芊 杨轩 5月初旬,豆包将推出付费订阅服务的消息,引发市场广泛讨论。其在苹果App Store中更新的付费订阅方案显示,豆包将推出四档收费标准:基础版、标准版、加强版、专业版。对应的月收费价格为:免费、68元、200元、500元;年收费价格为:免费、688元、2048元、5088元。 随后官方回应:“豆包始终提供免费服务。在免费服务的基础上,我们也在探索推出更多增值内容,以满足不同用户的差异化需求。” 据36氪独家了解,以上只是豆包商业化的预热动作。在接下来的季度中,豆包将持续推进商业化的落地。知情人士透露, 豆包预计将在6月下旬正式上线付费内容,并于同期举行的Force大会上更新相关功能。 之所以选择这一时间节点,是因为PC端与移动端仍需约一个月时间,完成基础功能与收费体系的适配改造。 据36氪了解,若进展顺利,豆包将于三季度进一步结合电商功能更新完善付费场景,并通过补贴为抖音商城进行引流,四季度进入运行期。 这些动作,皆是为了面向2027年及更长期的商业化回报做准备。因此,2026年豆包将不会把付费用户的渗透率作为考察指标。 2025年10月,豆包初步和抖音电商打通。用户可以通过和豆包的对话,获取商品信息和购物链接推荐。据前述知情人士透露,当时,字节曾在小范围测试豆包硬广能力,但由于用户体验问题,后续暂停了放量。目前,豆包采取的是优先响应用户问题,再在答案中穿插横条商品推荐的互动模式。 前述知情人士表示, 自2026年4月以来,用户对AI购物推荐的接受度较去年下半年有所提升,点击商品卡并看完详情页的转化率达3%以上。 另一方面,豆包目前的用户增长已有所放缓。据36氪了解,增速放缓一部分也是字节有意为之的结果——昂贵的算力推理成本,使得字节在新一年减少了对豆包的推广投流。 移动互联网产品的常规节奏是先烧钱圈用户,再做商户化,但AI产品的商业化显然更紧迫了。字节也不例外。 01 订阅是个好选择吗? 据《彭博社》5月27日报道,字节跳动正在考虑投入最高700亿美元的资本支出,用于推进AI发展。而就在不到一个月前,《南华早报》5月9日援引知情人士报道称,字节已将其AI基础设施预算从去年的1600亿元人民币,上调至2000亿元人民币(约300亿美元)。持续加码的投入,也显示出字节正以前所未有的力度押注AI。 全球AI军备竞赛仍在不断升温,但如何赚钱已成为摆在所有公司面前的现实问题。 此前,36氪曾报道:尽管字节跳动2025年海外营收增长近50%,但由于对AI业务的巨大投入,整体净利润出现了超过70%的降幅(官方后澄清该降幅主要是国际会计准则的原因)。随着巨额资金的不断投入,迫使全球的科技公司,都很难继续停留在只谈技术理想、而不谈商业回报的阶段。 当前市场上, AI商业化落地最常被提及的三种路径,分别是订阅制、广告变现以及To B模型服务。其中,订阅制是最先被切入的商业化场景。 回看海外市场,头部AI产品实际上很早便开始探索付费模式。2022年11月上线后,ChatGPT仅用了约两个月时间,便在2023年2月推出每月20美元的ChatGPT Plus订阅服务。随后,Anthropic也在2023年9月推出Claude Pro,同样定价20美元/月。相比之下,国内Chatbot产品过去较长时间仍停留在免费阶段,依旧延用“烧补贴抢占用户量”的竞争思路。 作为国内首个计划转向订阅的Chatbot产品,豆包的确拥有更深厚的用户基础。据AICPB产品榜全球总榜显示,豆包App端2026年4月的月活跃用户数约为3.36亿,环比增长1.51%,仅次于ChatGPT,排名全球第二。 问题在于:豆包能在Chatbot产品中迅速跻身头部,靠的并非模型本身的智能程度,更多是产品层面的易用性。加上抖音流量池强大的输送能力,让豆包率先在下沉市场中抢占了用户心智。 事实上,国内用户对单一AI产品并没有太强的忠诚度。据《晚点LatePost》报道,目前豆包的单用户日均使用时长为10分钟。在没有显著的技术壁垒、竞争对手又依旧免费的情况下,开放订阅可能会造成用户的流失。 不过,抛开产品本身不谈,订阅制本身也并非AI商业化的最佳路径。 即便是在付费意愿更强的西方市场,订阅所能带来的收益转化也依然有限。为了增加付费用户,ChatGPT在2026年推出了更便宜的ChatGPT Go,每月只需8美元。这使得它的付费用户人数从去年年底的4700万,增加至第一季度的5500 万。但据《The Information》报道,ChatGPT第一季度的周活跃用户平均约为9.05亿。 换言之,即便是全球MAU规模最大的Chatbot产品,在推行订阅制三年后,付费转化率也仅为6.1%。 付费人数难以提升,在于AI订阅模式自身的两难。 一方面,在竞争激烈、产品高度同质化的情况下,没有任何一家模型公司敢于彻底取消免费服务。对大多数轻度用户而言,免费版足以满足他们日常问答、资料查询的基础需求。另一方面,在Token依旧昂贵的当下,若需要AI来完成更复杂的任务,目前需要支付的最高价格则达到200美元/月(约1400元人民币)。而愿意为此长期买单的,本就是少数人。 更关键的是,即便定价如此之高,AI公司也未必赚钱。2025年6月,Sam Altman曾公开在社交平台X上表示,OpenAI在200美元/月的ChatGPT Pro的订阅上亏钱了。 这导致了一个悖论——定价太高,用户不愿付费;定价太低,又难以覆盖算力成本。 因此,C端订阅在当下更多只是“赔本赚吆喝”。想要真正实现商业回报,各大科技公司仍需探索更多商业化场景。比如,OpenAI就在今年2月,开始在ChatGPT中逐步上线并推广广告业务。 02 AI商业化如何落地 在经历长时间碰壁后,眼下,科技巨头们似乎终于找到了通往商业化的最佳路径——面向企业出售模型能力。企业无需自己训练模型,只要通过API接入,就能直接调用科技公司研发出来的AI模型能力,并按Token用量付费。 比起付费意愿有限的个人用户,企业完全有能力、也有意愿使用这些AI工具,来试图推动组织内部的经营提效。 更重要的是,To B模式下,企业通常按照Token调用量持续付费,而非包月订阅 (如前所述,面向普通用户的包月订阅价���常无法覆盖算力成本)。对模型厂商来说,这显然是笔稳赚不赔的好买卖。 Anthropic的利润增长已经充分说明了这一点。据《华尔街日报》5月21日报道,Anthropic第二季度的收入预计将增长逾一倍,达到109亿美元,并可能实现5.59亿美元的营业利润。 在行业内仍在大规模烧钱补贴的阶段,Anthropic是第一家接近盈利的大模型公司。 其主要收入来源是企业和初创公司的API调用。截至2025年10月,Anthropic拥有超过30万家企业客户,约占总收入的80%。 国内的互联网大厂也已相继在ToB市场布局和发力。和Anthropic等AI初创公司不同,互联网大厂坐拥云计算能力:一方面靠模型API变现,这类将模型封装为云服务对外输出的形态,就是MaaS(模型即服务);另一方面模型调用带来的算力消耗,又可能拉动自家云业务增长。 在这场新的AI云竞争中,字节旗下的火山引擎增长最快。5月7日,国际数据公司IDC公布的数据显示,2025年,中国企业在公有云上的大模型调用量相比去年暴增16倍。其中,接近一半的调用量都发生在火山引擎平台上,其市场份额达到49.5%,位居行业第一。 阿里也在2025年11月末启动了“百炼战役”,试图追赶AI云上的市场份额。据阿里2026年Q4财年的财报数据显示,阿里的“百炼平台”(阿里云的MaaS平台)客户数同比增长8倍。这也说明,阿里正在快速补强其AI To B市场能力。 除了To B市场带来的显性收益外,字节也在积极利用AI能力,来为自家的主营业务赋能。 以字节旗下的王牌AI模型seedance 2.0为例,其生视频能力进一步推动了短剧市场的创作热潮。有短剧行业人士告诉36氪,随着视频创作门槛的不断降低,行业内涌入了大量新玩家。他们背景各异,来自游戏、潮玩,甚至传统制造业。此外,单部短剧制作成本的降低,也让制作公司能够在总预算不变的情况下,生产更多剧集。 创作者数量的激增,和制作成本的降低,双双推高了AI短剧的供给量。而在当下,短剧获取播放量最核心的方式,依旧是抖音侧的投流。 一位短剧投流人士透露,目前AI短剧在字节巨量引擎体系内的日耗峰值约为1.2亿元。 负责短剧发行的嘉书科技创始人王小书告诉36氪,其所在公司去年每天的投流消耗仍只有几十万元,而今年已达数百万元,增长约10倍。与此同时,短剧出品方在巨量引擎上的ROI通常仅为1.03至1.07。这意味着,每投入100万元广告费用,能获得约3万至7万元利润。 AI+电商购物或将成为字节下一个发力场景。 2026年3月30日,据《界面新闻》报道,豆包的购物支付功能正在进行灰度测试。该功能支持用户在豆包APP内直接下单商品并完成支付,无需跳转至抖音商城。 豆包不是第一个试图打通AI购物闭环的AI产品。今年5月11日,阿里千问就已正式接入淘宝,打通了AI购物功能。去年9月,ChatGPT也曾推出过“即时结账”(Instant Checkout)功能,试图引导用户直接在AI对话框中完成下单与支付。但今年3月,OpenAI已经取消了这一功能。原因在于,打通技术路径容易,但想打通背后完整的电商生态体系却很难。 豆包与千问的优势在于,它们背后分别站着抖音商城与淘宝这两大成熟电商体系。无论是商品库、商家生态、支付还是履约能力,都早已存在。这也让AI购物这件事,在理论上看起来更加成立。 但即便如此,AI购物仍需面对两大核心拷问。 一是,AI购物本身是否是真需求? 春节期间,千问曾投入30亿元红包,请用户用AI点奶茶,试图培养消费者通过AI完成消费决策的习惯,36氪也曾对此进行报道。但从结果来看,大多数用户并未形成长期留存。而相比点外卖,购物本身又是一个更复杂、更依赖比较与决策的场景。 二是,消费者是否真的会信任AI的商品推荐? 随着AI搜索与推荐能力的重要性提升,部分商家已经开始通过GEO(生成式引擎优化)等方式,影响大模型对信息的抓取与排序。今年315晚会上被曝光的GEO产业链,也曾引发广泛讨论。当AI推荐开始受到商业投放与利益关系的影响后,消费者究竟会将其视为客观建议,还是新的广告入口,仍有待观察。 (周鑫雨对本文亦有贡献)

36氪 · None · tech

文|周鑫雨 邓咏仪 编辑|杨轩 林俊旸以创业者的身份,重新加入AI模型的战场。 《智能涌现》独家获悉,前阿里千问大模型技术负责人林俊旸近期已经开启创业,考虑方向包括世界模型和具身大脑。 目前, 林俊旸已经招募数名字节、腾讯和海外背景的成员,并以约20亿美金的估值开启融资,接触基金包括红杉中国、高榕创投等 。 截至发稿前,有关上述信息,林俊旸尚未回复。 时间距离3月初的那场“闪电”诀别,已经过去了两个月。 2026年3月4日凌晨,林俊旸在X上宣布离开千问:“me stepping down. bye my beloved qwen(我卸任了。再见了,我深爱的千问)。”更早前,3月3日下午,他在Qwen成员的钉钉群中发出消息:“无颜再带领大家。” 在从百模大战,快速收束至巨头争锋(字节、阿里、DeepSeek)的三年里,林俊旸是阿里Qwen留在大模型一线梯队的灵魂人物。 自2022年起,林俊旸就接手阿里Qwen团队,负责整体工作。三年以来,他主导了Qwen系列模型的研发和开源——最全尺寸、开源策略的推进,也让Qwen成为在全球开发者社区中颇具影响力的国产模型。 林俊旸掌舵的几年中,Qwen被“保护”为一个相对独立发展的组织。 《智能涌现》曾独家报道 ,为了追求模型训练的效率,此前Qwen拥有自己的预训练、后训练、Infra团队,多个模态方向的员工也在一起工作。 但站在集团的视角中,独立,会造成业务合作的阻力。 比如,《智能涌现》曾了解到,集团重点推进的ToC超级应用“千问App”,并没有得到Qwen团队的积极支持。 2026年3月3日,一场围绕Qwen团队拆分重组的沟通会,成了林俊旸离职的导火索。 当天下午,阿里云CTO周靖人向林俊旸传达了Qwen调整的计划:将原来的Qwen,拆分成预训练、后训练、文本、图像、语音等相对独立的水平团队。一天后,林俊旸官宣了自己的离开。 具身智能,成了林俊旸重回AI战场的切入赛道。 这一方向,也是他在阿里的未竟之业。2025年10月,林俊旸就在Qwen组建了一支专注于机器人与具身智能的小团队。 在X上,他提出了自己的判断:“多模态基础模型正在转化为基础代理,通过强化学习利用工具和记忆进行长时序推理。它们应该从虚拟走向物理世界!” 在硅谷,已经有数名AI大牛,投身于世界模型和具身大脑。 前谷歌副总裁、AI“教母”李飞飞创立的空间智能公司World Labs,在2026年2月官宣了10亿美金的融资,估值高达50亿美金; 3月,杨立昆(Yann LeCun,图灵奖得主)和谢赛宁(DiT架构提出者)成立的世界模型公司AMI Labs,在没有任何产品的情况下,完成了10.3亿美元的种子轮融资,投前估值就达到了35亿美元。 同样入局具身大脑的华人研究员周衔,其成立的Genesis AI在2025年7月,宣布完成1.05亿美元的种子轮融资。 在LLM技术路线收敛的情况下,路线存在诸多争议和可能性的具身智能、世界模型,恰恰成了VC和AI大牛愿意押注的非共识。 曾有AI行业人士对《智能涌现》评价:“林俊旸至少是1亿美金以上级别的人才。”但如今,也有投资人表达了对技术人才创业的担忧:“大厂没有那么自由,但也提供了相对安全、可控的环境。技术高管创业,往往容易在商业化上水土不服。” 抛除阿里时代的技术光环,创业者林俊旸接下来直面的,将是商业世界的考验。 封面来源|相关活动主办方 欢迎交流! 欢迎交流!

36氪 · None · tech

作者 | 肖思佳 编辑 | 乔芊 杨轩 所有互联网大中厂都渴望在AI时代博得位置,在这场比赛中,小红书曾是克制的那个。 在一个搜索属性与社区属性并存,以真实经验分享为核心的产品中,活人感与AI、温情和算法,始终像天平的两端。 很长一段时间里,小红书既没有完全缺席技术探索,也没有像许多同行那样高调推进AI产品化。相反,这家公司始终在两股力量的拉锯和平衡中前行:一边持续投入模型能力,一边谨慎控制AI对社区生态的介入。 但2026年,随着Agent叙事的升温,小红书开始显露出某种急迫。 4月30日,小红书发送全员内部信,宣布成立AI一级部门Dots,“建立从模型研发、基础设施、工程到产品的完整技术体系,整合顶尖AI人才和资源。”Dots向小红书新任总裁柯南汇报。 据36氪了解,Dots部门由原人文智能实验室Hi Lab升级而来,下设模型研发、基础设施、工程、产品四个部门。目前小红书内部最重要的AI应用产品“点点”也被纳入该体系之下。 将AI置于更高优先级的背后,是小红书长期未解的一道命题。多年来,小红书始终握有业内艳羡的社区资产和广告基本盘,也想通过电商、直播等业务,去撬动新的增长,却始终未能真正打开局面,让生意规模再上一个台阶。 “社区”就像一个装满可能性的宝箱,AI被视作新的变量和机会。但它能否成为答案,仍未可知。至少现在看来,小红书的AI故事,仍在起笔阶段。 01 一条没有走通的产品化路径 2022年末ChatGPT问世之际,针对小红书的未来,创始人毛文超曾借用员工的手机,向GPT提出过一个问题:小红书是否会被颠覆?AI会给小红书带来怎样的危险? 据知情人士向36氪透露,那段时间,毛文超开始密集地关注与人工智能相关的动态信息,并要求团队每两周进行一次进展汇报。 2023年8月,在一封内部信中,毛文超重申了小红书的核心优势。他提到,与外国朋友交流时,发现人们会在ChatGPT上询问大量与生活经验相关的问题,这与小红书的定位有所重叠。但他同时判断,这一现象源于海外缺乏类似的经验内容沉淀,而小红书上则拥有海量真实生活的内容分享。言下之意是:小红书长期沉积下来的内容护城河,一时还难以被AI动摇。 不过从另一个角度来看,毛文超的确把AI视作一个小红书的潜在威胁。 ChatGPT的出现,迅速对谷歌、百度这类传统搜索公司形成冲击。而这对当时仍以“你的生活指南”为Slogan、强调社区搜索属性的小红书来说,同样制造了一种难以回避的不安。 不安引发行动。在ChatGPT的催化下,2023年,国内互联网大厂加速了大模型基座的布局与投入,并在此基础上逐步推进产品化落地,形成了今天以豆包、千问、元宝为代表的AI应用形态。目的是抢占下一个时代的入口权。 小红书也考虑了这个路径。2023年,小红书初步开始在内部推动技术能力的建设,于3月筹备了独立的大模型团队,由AI创新负责人张德兵(薯名“宇尘”)牵头自研通用大模型基座。该团队最初以基座模型研发为主,随后逐步向产品侧延伸,于2024年8月推出了独立的AI应用点点。 但和那些多少带着技术基因的公司不同,对小红书来说,这是条崭新而陌生的道路。 点点的产品定位是生活搜索助手,起初接入的是小红书自研的珠玑大模型。然而到了2025年2月26日,点点却公开宣布接入DeepSeek。根据前述人士的回忆,这是因为其基础模型的实际使用体验并不理想。 据另一知情人士透露,点点团队早期由宇尘负责推进,并直接向毛文超汇报。但在 2025 年初,小红书对团队进行了重新拆分:技术侧仍由宇尘负责,产品侧则交由毛文超的斯坦福校友、新加入小红书的天圣主导。不过,点点团队后来经历多轮变动,目前天圣担任小红书基础模型后训练负责人。 某种程度上,这也宣告了小红书自研模型的路径,暂时还未跑通。“大模型部门没有被废除,但它和各个产品也都没有接触。”前述知情人士表示。一个佐证是,目前小红书社区内的另一款AI搜索产品“问一问”,接入的是开源的通义千问模型。 伴随模型选择的调整,点点在产品路径上也出现了更为明显的转向。 据36氪了解,点点的探索大致经历了四个阶段: 第一阶段:基模探索。 早期团队以自研基础模型为核心推进,但效果未达预期,最终转向接入DeepSeek等外部模型。不过,内部对基模路径的探索并未完全停止。 第二阶段:人文化转向。 毛文超提出要为点点打造更具人文气质的人设,并提出如“45度角仰望生活”“柏拉图式的旅行家”等人设画像。与此同时,2025年初,小红书将原有的大模型技术与应用产品团队整合为Hi Lab(人文智能实验室),并大规模招聘具有人文学科背景的“人文训练师”为模型进行后训练。 第三阶段:产品迭代。 2025年7月,点点推出2.0版本,升级UI并加入语音、图像等多模态交互。但改版也引发用户争议,例如深色背景和气泡式回答结构,被认为降低了阅读体验。 第四阶段:回归社区。 2025年11月28日,点点官方连发两条动态,宣布完成关键调整:不仅重整了App的形态,还首次进入小红书主站左上角入口,从独立应用转向站内内置能力,成为日常浏览与搜索的辅助工具。 但这个产品的进展却不及预期。“没有和市面上的其他AI类对话产品形成差异化,缺乏竞争力。”多名接近小红书的人士,对点点发表了上述看法。 在用户端,点点的存在感始终不强,几乎没有激起水花。截止2026年4月底,在App store的下载排行榜中,点点仅位列186名;评分及评论一栏中,只有45名用户为其留下评分,而“豆包”的数据则高达192万个。 融入社区,既是点点的退一步,也是进一步。自推向市场以来,点点曾多次尝试与社区生态结合,通过“问点点”或“评论区互动”等形式,增加在用户面前的存在感。小红书优质的社区流量,无疑是可以灌溉其的肥沃土壤。 只不过,在点点之外,小红书社区中本身已经存在另一款名为“问一问”的AI搜索助手,二者在功能上并无明显差别,同样是基于社区数据,对用户提问生成答案。该产品由小红书社区部门下的搜索小组孵化,向算法负责人夏侯汇报。 产品层的重复建设,本质上是不同部门对AI路径的各自下注。这种“赛马”机制在互联网公司内部并不罕见。36氪据悉,目前小红书内部正在考虑将两个产品进行整合。而与整合一样“待定”的关键问题,还有AI在小红书内部,究竟处于何种位置。 02 一个真人社区的克制与犹豫 在新技术浪潮面前,FOMO情绪并不曾在小红书内部缺席。但与业内争先恐后拥抱AI的节奏相比,小红书对AI的态度在相当长一段时间里仍显得格外克制——甚至是警惕。 在一场2024年的社区搜索小组内部会议上,有算法同学抛出过一个问题:AI搜索是否会取代传统搜索,或者两者之间究竟是什么关系?社区搜索算法负责人小灰当时的回应是:“这件事情值得尝试,但它不会是我的O1或O2。” 将视线放到更大的层面,这一逻辑同样成立。相比AI,小红书始终有更紧迫的事情要做——2026年以前,商业化和电商一直是小红书内部的重头戏,占据着OKR的前两项,AI只能屈居第三。 而在优先级之外,更深层的顾虑在于:对于一个依赖社区氛围与“活人感”运转的平台来说,AI及其生成的内容缺乏温度,用户是否会天然产生排斥?在当时,这个问题并没有明确答案。 “小红书首页双列图文不对齐的设计,是为了营造一种城市的街道感。用户就像在街区里来回逛,能看到参差错落的招牌,点进一个帖子,就像敲开一扇门。”一位前小红书社区线员工告诉36氪,“因此AI的入口究竟放在哪,小红书一直会有些犹豫。” 这种犹豫,也体现在点点在社区中的位置变化上。前小红书搜索员工李舒回忆,点点最早进入社区时,入口被安放在搜索页的sug第四列。“他们一直想进社区首页,但始终没开这个口子。当时内部的判断是,社区里不应该出现AI。” 在推进另一个AI产品“问一问”的过程中,李舒小组也面临着类似取舍。当用户发起搜索时,哪些问题适合弹出AI总结、覆盖到什么范围,这些都存在争议。李舒表示,最初“问一问”只能覆盖1%~2%的query(用户搜索请求),“当时我们希望扩展到10%,但老板不同意,理由是影响面太大,最后只放宽到了3%~4%。” 2024年,整个AI市场并没有跑出什么颠覆性的创新产品。在最初的焦虑逐渐被冲淡后,毛文超一度失去了对AI的兴致,相关的汇报回也从两周一次,变为一个月甚至两个月一次。“后来慢慢他也不怎么听了。”前述知情人士透露道。当时,毛文超认为小红书的重心还是应该回归自身业务。内部的AI项目虽然还在推进,但并不受到额外关注。 直到2025年初,Deepseek横空出世,中国迎来了自己的GPT时刻。这意味着,国内用户使用AI成了一件没有门槛的事情。 小红书内部展开了激烈的讨论,甚至专门做了数据对比:如果用户的手机上同时安装了Deepseek和小红书,用户使用小红书的搜索量会不会降低?“在GPT那会,他们没有觉得AI会代替传统搜索,但Deepseek出来后,他们开始真正担忧这件事了。” 李舒回忆道。 围绕“是否要像腾讯元宝一样,接入Deepseek R1模型”,“问一问”团队进行了大量争论。后端的技术人员也在反复测试接入R1后的效果,不断分析模型输出的回答质量、等待时长、以及隐私敏感性,来判断是否要执行这一方案。 但这一决策最终没有被采纳。理由仍然是用户体验——虽然接入Deepseek能输出更优质的回答,但由于当时R1的思维链路更长,使得生成答案的时间增加了。小红书内部认为,这会影响用户在社区中的感受。 如今回头看,李舒认为这是一个非常正确的决策:“对于AI搜索来说快是最关键的。因为用户不会在那等,他会认为这是个bug。” 也有质疑的声音。一些员工认为,接入Deepseek明显能增加答案的丰富度和活人感,为什么不用呢?他们想了许多方法来试图解决等待时长的问题,比如离线生产——提前生成好答案,等用户搜索时直接跳出。 但这些想法都没有真正落地。除了决策层的顾虑外,还存在另外的原因。“当时还有非常多其他任务要忙,导致我们没有人去推进这件事情。”李舒说。时值2025年春节,小红书内部向来有CNY(春节营销)的传统,不仅要赞助春晚,还要策划各种活动。目的是传播品牌年轻化、社交化的形象,与用户产生情感共鸣。这些工作占据了绝大多数人力资源和员工的注意力,此时的AI仍然不具备优先级。 谨慎本身就是一种信号。2022年,直到成立的第九年,小红书才首次将社区的流量开放给电商业务。面对AI的狂潮,小红书保持了一以贯之的态度:宁可慢,也不要出错。因此,小红书内部一直在探索如何让AI生成的回答更有“人味”,更能与社区的氛围相融。 除了用户的体验感外,另一个重要的问题是:在一个社区产品中,植入AI搜索总结工具,这是否会降低用户的APP使用时长?当用户能以更高效的方式,直接获取答案和攻略,他们是否还有必要花时间浏览小红书? 但事实证明,管理层们的最初对AI破坏社区的种种担忧,并没有发生。AI搜索反而为小红书社区带来了增量。 据36氪了解,2025年,“问一问”功能使社区用户留存率提升约2%–3%——在成熟产品中,这是显著的增长。目前,“问一问”的最新日活用户量达千万规模。用户查询规模也新增数百万级。 “他单个(问题)的浏览时长可能变短了,但他整体的使用频率会增加。”李舒总结道,“比如有人原先一周只问一个问题,但他现在天天都会问题,那小红书的用户留存就会增加。” “数据”是语言模型的核心资产之一。小红书沉淀的真实内容,构成了天然的优质语料。在此基础上,AI搜索的生成与总结能力,能让用户更快抵达答案。这也使“点点”在2025年末进入社区主页,成为顺理成章的选择。 不过,与商业化的冲突也随之浮现。由于AI搜索会根据社区内用户的真实讨论生成产品推荐,这类“原生结果”容易与品牌方利益发生冲突。 比如当用户提问“什么吹风机好用”时,AI搜索会自动生成A、B、C三个品牌,及每个品牌在社区内被推荐的百分比。“如果一个大客户在小红书投了商业化广告,但在AI搜索里只被排到第三位,对方肯定不乐意。”李舒说。商业化团队曾一度希望AI搜团队不主动生成购物推荐列表。但目前,这一功能仍在小红书内展示。 “真实感”和“商业化”的矛盾,一直是小红书发展过程中此消彼长的难题——过度商业化侵蚀社区,缺乏商业化又难以为继。随着AI的到来,这种矛盾可能被进一步加剧和放大。 03 突然加速,是FOMO还是想明白了? 2025年秋季,结束了对美国硅谷的考察之后,毛文超在一场闭门会上做出如下指示:AI技术路线已经收敛,可以做更多投入了。 所谓的技术路线收敛,指业内在AI的落地上,逐渐形成的一套通用模式:一个大模型打底,支持语音、图片等多模态输入方式,配上垂直数据的知识库和RAG(检索增强生成),最后形成Agent式交互。“翻译一下就是:搜索很重要,同时用户可能会用语音、图片等多模态的方式去做搜索。”一名知情人士总结。 而搜索,恰恰是小红书在“种草社区”之外,最强烈的用户心智。 在经历过去一年围绕AI搜索的探索后,毛文超似乎逐渐意识到:AI并不会损害社区的价值,并拥有能与小红书“搜索心智”结合的应用场景。因此,小红书对AI的态度,也从最初的警惕与克制,逐渐转向更积极的拥抱。 随着2026年到来,AI的行业叙事也翻开了新的一页。以对话为核心的Chat类产品已退居其后。OpenClaw(“龙虾”)的出现,将一类以coding能力为基础、具备任务执行能力的Agent推向台前,成为新的注意力中心。整个互联网行业的FOMO情绪也急剧升温。 即便是最为保守的组织,也难以否认AI在当下的重要性。几乎所有互联网公司,都在试图证明自己具备掌握这一新技术的能力,是一家真正意义上的科技公司。 小红书也不可避免地变得着急。“全员转型AI产品经理。”一名小红书员工透露。 自3月以来,所有人都能感觉到:AI在小红书内部的战略地位迅速上升。 不仅技术团队频繁组织分享会,传授Skill的使用心得。非AI岗位也被卷入其中。一些员工被要求学习用vibe coding搭建AI工具嵌入工作流,甚至需要通过问卷,对直属上级的AI使用能力进行评价。 招聘业务也开始向AI倾斜。2026年校招,小红书几乎只开放AI相关岗位,其中工程师一职占据绝大多数。而此前,内部从事AI工作的员工总共不过百人规模。相比之下,字节仅“豆包”团队就超过千人。 据了解,小红书在对外招聘AI人才时,通常要求候选人要同时满足“年轻、高潜、大厂高绩效”三条标准。与之相对应的,是小红书在待遇上的大方出手,“薪资是业内独一份的,top中的top。” 这里追求极致的人效比,和扁平的汇报结构。工程师以一抵三,产品经理的权责范围非常大,“可能一个人可能就要干一个团队的活”。其背后的判断和理念是:臃肿的组织结构只会叠加冗余与分歧,“一群平庸的产品经理,只会造出一个复杂的产品。”上述员工复述道。 2025年下半年,小红书一度传出要于今年4月上市的风声。靴子没有落地。“因为没有上市,所以小红书更需要AI的故事。”一名前小红书AI员工表示。 内部对模型底座的探索还在继续。 2025年中后,小红书Hi Lab团队陆续发布了一系列自研的开源大模型,包括:dots.llm1(文本大模型)、dots.vlm1(视觉语言模型)、dots.ocr(文档解析模型)。此外,还有一系列覆盖多模态推理、图像编辑、深度搜索及代理的开源模型与工具链。但如点点一般,dots系列模型也并未在行业或技术社区中引发太多关注。 作为一家体量相对有限的公司,小红书的短板显而易见:技术积累与算力资源都不占优势。 尽管诸多内部员工在小红书上对外发帖招聘时,常会附上“卡管够”的说辞。但相比头部大厂动辄千亿的投入,小红书难免有些捉襟见肘。“做个简单点的任务还是不缺卡的。但如果想搞基模,可能就会差一点。”一名内部技术人员向36氪表示。 另一方面,虽然小红书在招聘方面不吝投入。但内部始终缺乏如吴永辉、姚顺雨这样在技术层面的领军人物。事实上,自前任CTO郄小虎(薯名“山丘”)于2020年前后离职后,小红书至今未再设置CTO职位,其技术架构主要由副总裁风笛和凯奇两名技术VP负责。 尽管在外界看来,这是一场性价比并不清晰的投入——除少数头部公司外,大多数玩家继续重金押注模型底座,似乎难以获得对等回报。 但在小红书内部,这更像一道不得不做的必选题。“没这个能力,上不了牌桌。”多名技术人员给出了如上回答。一名接近小红书的人士表示, 小红书自研模型的意义未必在做得有多好,而在于用技术驱动业务,保有参与下一轮竞争的资格:没有底层能力,就无法真正理解技术的边界,也难以在关键节点做出判断。 迄今为止,AI产品的推陈出新,更多仍靠技术先行驱动——大模型每次能力跃升,都会在原有边界之外“溢出”一些新的可能性。新的产品机会可能藏在这些溢出点里。 比如,2024年Claude Sonnet 3.5的代码生成能力大幅提升后,外溢出了自主执行任务的Agent能力。Cursor团队率先抓住了机会,根据市场需求挖掘出来优化了自身的产品,迅速获得了开发者市场的认可。 “谁能最快地挖掘 AI 潜能、挖掘出 AI 最厉害的玩法,谁就成功了。这需要人在模型和产品上都有较大的感知。” 前述接近小红书的人士表示。 因此,即便短期回报不明,这仍是一张小红书需要买下的入场券。 4月30日,小红书发送全员内部信,宣布新一轮组织升级,成立AI一级部门Dots和企业智能部,从产品技术、组织两方面加大对AI的投入。此外,任命柯南(丁玲)出任总裁,全面整合社区、电商、商业化三大核心业务及公司技术体系,向CEO星矢(毛文超)汇报。 柯南本科毕业于新加坡南洋理工大学计算机工程专业,后于2011年进入美国斯坦福大学商学院攻读MBA。在加入小红书前,她曾任职于波士顿咨询集团、花旗等机构,主要从事咨询与金融相关工作。其职业路径与创始人毛文超相似,后者同样于2011年进入斯坦福商学院。而小红书三号位员工,现任首席产品官、社区业务负责人的樱木(邓超),则出身建筑专业。 从管理层背景来看,小红书的核心决策层并不以技术见长。此次由柯南整合公司技术体系的任命,也被外界视为小红书在 AI 战略上,更偏向从产品层面寻求创新,而非强调技术上的突破。 据 36 氪了解,除了社区内置的 AI 助手,和主攻底层研发的 Dots 外,小红书内部还分布着一些更隐秘的 AI 创新项目组,负责产品层面的探索。这些团队属于保密项目,不在公开架构中,彼此之间也互不知情。其中有项目已孵化出产品,但对外宣传时,刻意隐去了“小红书”的身份。 据前述已经离职的小红书AI员工透露,小红书未必期望自己能在AI时代构建多么宏大的叙事,而是更务实地指向具体场景——比如在旅游、时尚等垂直领域,打造出能解决用户需求、能够占领细分心智的产品。 小红书的确拥有难以复制的资产——一个高度活跃的社区,和一群贴近真实生活的用户。这里曾孕育出露营、飞盘等席卷年轻人的生活方式。相较技术上的追赶,这些源自一线的洞察,或许有望成为它在新一轮AI竞赛中找到差异化竞争的机会。 在既有的社区叙事之外,AI时代,小红书还需要一个新的故事来证明自己。 (应采访对象要求,李舒为化名)

36氪 · None · tech

作者|黄楠 周鑫雨 编辑|袁斯来 杨轩 硬氪独家获悉,AI卡片录音笔公司Plaud已于2025年年中拿下腾讯的融资,估值达10亿美元; 目前,Plaud公司估值已涨至约20亿美元。同时,硬氪从相关人士处了解到,Plaud正在推进与腾讯会议之间的硬件合作。 有关上述信息,硬氪向Plaud及腾讯方面求证,双方均表示消息不实。 一名接近Plaud人士告诉硬氪,Plaud在2024年的总营收约5600万美金,利润率接近20%,“2025年营收差不多涨了3倍”。另有知情者透露,2025年Plaud全年收入达到了历年最高,大陆全线产品的出货量符合内部预期。 但Plaud出货量谈不上高, 有一位行业人士告诉硬氪,其销量在国内市场或未超过十万台。 显然,Plaud很难复刻过去几年在海外顺风顺水的爆涨。 Plaud的崛起,踩中了ChatGPT引爆的AI录音硬件风口。2023年,苹果手机海外市场无法提供通话录音的痛点,让AI卡片录音笔Plaud Note迅速出圈。这款厚度仅2.9毫米、支持磁吸充电的设备,集成多麦克风阵列,接入大模型后可实现数十种语言实时转写、会议纪要生成、多语言翻译等功能,解决海外用户通话与会议记录刚需。 随后,Plaud海外市场迎来爆发式增长,迅速跻身独角兽行列。官方数据显示,2025年7月,Plaud全球销量已突破百万台规模,其首创AI录音产品此前两年均实现十倍级的增长。Plaud联合创始人许高在同年11月的《福布斯》访谈中也透露,2025年Plaud总营收预计能达到2.5亿美元。 高速增长背后,是海外市场的天然红利与先发优势。 “Plaud早期能起来,核心是抓住了单一形态的先发窗口。当时没人做这么轻薄、能磁吸手机、还集成大模型的录音设备,海外用户没有替代选择。”某头部AI硬件公司负责人告诉硬氪。 靠着海外品牌势能,Plaud开启中国市场布局。 知情人士对硬氪透露,早在2025年初,Plaud便启动内地业务筹备,初期选择从医疗、金融两大行业切入,以ToB专业服务作为落地突破口。 2025年9月,Plaud面向中国内地消费级用户,发布Plaud Note、NotePin S、Note Pro三款产品,定价分别为1149元、1249元和1299元。 从左到右依次为:Plaud Note Pro、Plaud NotePin S、Plaud Note(图源/企业) 可以看到,Plaud整体定价高于国内同类竞品,但核心功能并无实质性差异化。进入中国内地后,Plaud海外积累的品牌与供应链优势几近失效,发展瓶颈逐渐凸显。“成熟的供应链体系意味着,在国内复制产品的成本会很低。中国市场会更卷。”曾有一名Plaud员工对硬氪表示。 从硬件结构来看,Plaud护城河稀薄,形态极易被复制,其核心的磁吸卡片设计并无太高工程壁垒。依托国内完善的音频硬件供应链,同行厂商可以快速复刻外观形态,且在小型化工艺、降噪收音、硬件调校上实现赶超。 即便后续Plaud推出Pin等新形态产品,也仅停留在外观、佩戴方式的微调,没有实现场景体验的颠覆性创新,也未能延伸到生活、娱乐等多元记录场景,难以撬动用户复购和换机需求。 其次是软件方面,Plaud的AI功能无独占性,工具属性同质化。实时转写、会议摘要、多语言翻译等核心能力,均基于通用大模型开放能力实现,难以形成独家底层技术。有业内人士向硬氪评价称: “AI给了Plaud起飞的红利,但它没能沉淀出专属技术壁垒。单纯的记录、转写、总结功能,以国内App和大模型的迭代速度,同类功能很快就能被平权复刻。目前来看也确实是如此。” 更关键的是办公生态巨头的降维入局后,直接包抄Plaud这样的创业公司。2025年8月,钉钉发布AI录音卡片DingTalk A1;2026年1月,安克联合字节推出“AI录音豆”,赛道竞争进一步加剧。 正如一名Plaud员工的评价:“国内巨头下场的速度远超想象,2026年的战略必须要更卷。” Plaud长期局限于办公、通话记录单一场景,而这恰恰是钉钉、飞书的生态主场。企业用户本就深度使用钉钉、飞书办公协作,平台原生自带会议录音、智能纪要、文档联动能力,无需额外再单独购置硬件,直接分流大量Plaud核心客群。 如今,AI录音硬件赛道正变得愈发拥挤。追觅、出门问问等头部科技厂商快速推出同形态竞品。Plaud必须依托某个大厂,构筑自己的模型能力,才有可能在国内市场存活。 恰巧, 腾讯也需要一个硬件触手,快速加入智能硬件的战争。 一名知情人士告诉硬氪,此前,腾讯会议和企业微信就有成立硬件项目小组,探索与手机、手表等硬件的结合。“腾讯不会放弃硬件入口。” 腾讯快速入局硬件战场的另一重原因,则在于办公软件的增长逐渐触及天花板。 一名业内人士提到,即便近两年腾讯会议收入增长了数倍,但内部对市场的整体判断是,“ AI驱动的软件增长红利很快会消失,硬件会是新的增长曲线 ”。 “腾讯会议很早就想过,既然腾讯会议的定位是会议工具,那么,终极形态应该不仅覆盖线上,还要覆盖线下。”上述人士表示,“目前覆盖线下最好的触手就是硬件,尤其是符合用户纪要习惯的录音笔。” 对上述信息,腾讯方面表示消息不实。 若随着腾讯投资Plaud落定,三大AI大厂均已布局AI录音硬件赛道。而它们的触手显然不止于录音场景,而是会围绕自己的办公软件,推出覆盖多场景的硬件,最终形成更宽更深的护城河。办公场景已经迎来巨头们软件 +硬件的全面战争。

36氪 · None · tech

文|王毓婵 周鑫雨 编辑|杨轩 “看流水(即营收),AI视频类这些项目的表现确实很不错,可以说是AI最赚钱的细分赛道之一。”投资行业人士对36氪说。 中国 AI 视频生成赛道,正在经历大厂模型能力疯狂增长的巨大红利。来自字节跳动的Seedance和来自快手的可灵这两款“超级底座”正在进行一周一小版、两月一大版的高频迭代。阿里巴巴也在4月底,对视频生成模型HappyHorse 1.0开启灰测,720P视频生成刊例价为0.9元/秒。 愿意为此花钱的内容创作者太多了,太急迫了。众多短剧、内容公司排队等待使用Seedance2.0已经成为2026年AI世界的一个奇观。由此,在AI视频模型外“套一层壳”,使其更简单易上手的AI视频Agent产品,也迎来了增长奇迹。 一位业内人士对智能涌现透露,头部公司一个月的算力消耗成本应该在百万元以上。 “一部短剧的算力消耗成本约为3万元,工具平台如果一个月能接100部这样的工程,那么消耗量就能达到300万。这没什么难度,只是时间问题。” 在必应上搜索“AI视频生成工具”这样的关键词,能看到不少此类产品的广告。“据我了解,某头部工具平台一天在这个广告上的消耗就有两三万元,那么一年光这一个渠道的广告投放就至少需要七八百万元。由此可以反推它的收入水平是多么高。”业内人士称。 AI视频创作平台Creati对智能涌现透露,上线一年,该平台的全球用户量就突破了千万级别。产品ARR(年度经常性收入),一度达到了2000万美金。 但令这些AI视频Agent产品担忧的是,如果大厂也从模型层走到产品层,跟自己抢饭碗呢?今年1月,抖音还推出了AI视频应用“随变”,将工具+社区两块业务一并做了起来。以及,产品公司设计的应用层功能又可能随着大模型的一次升级被覆盖。 “短期来说,这类工具型公司与大模型厂商之间还是合作关系。创业公司的利润很大程度上由它们能接入哪些模型、能拿到多大API价格折扣来决定。”蔚来资本投资经理冯绘霓表示,“但同时,据我所知,大厂对这些‘合作伙伴’也看得很紧。在这些比较重要的赛道方向上面,大厂内可能有不止一个团队在做。” 这是一个“等待被大厂吞没”的行业,还是真的有可能长出像Adobe那样的工具型公司? 产品公司在生态位上的弱势,体现在利润里。“如果看利润,其实大家的毛利率都挺低。”某投资人表示,很多项目在牺牲UE(单位经济效益)换规模,因为“目前这个行业没什么壁垒,所以都在烧钱补贴获客,还做不到盈亏平衡。” 但依然有不少投资人愿意对其下注。这个赛道最明星的中国公司——LibTV 的母公司LiblibAI,在去年10月完成了由红杉中国、CMC资本等机构投资的1.3亿美元B轮融资。更早之前,它还曾创下 “一年内连续四轮融资”的行业纪录。 工具类公司融资规模排名 “ 今年AI视频工具是为数不多可以投的赛道 ,因为视频的迭代速度比语言、coding慢很多,所以在语言工具、coding应用大批被基模颠覆的情况下,视频生成项目反而相对更‘可看’。”一位投资人对智能涌现表示。 这些AI视频Agent产品依然有时间做出自己的护城河。 在这场“不对等的竞争”中,谁能活下来? 大厂之剑,与商业化护城河 目前来看,主流的工具类产品有三种形态: 要么做好“idea”,通过AI Agent将创作流程极度简化为“自然语言指令”,比如ZeroCut、Ribbi;要么做好“editing”,把无限画布、细节调整做到非常精细,比如LibTV、Buzzy;要么“离钱更近”,直接把视频生成与电商交易/社媒运营挂钩,比如TapNow。 本文包括创业者和投资人在内的所有受访人都认同,等大模型厂商卷完了基建层面的事,势必就要做应用层面的事,这只是一个时间早晚的问题。关键是,这个时间窗口有多久,以及窗口关闭了之后,自己还能否存活。 曾在大厂工作,并经历了古典互联网时代竞争的张云剑,打造了AI视频创作平台ZeroCut。他认为,“ 至少在五年内,大厂很难一口气完美覆盖掉整个AI视频制作的全流程。” 他的判断主要基于以下两个认知: 第一, 视频制作是一条极长的创意服务链条 。外界或投资人往往只关注“工程工具”和“生成”这一层面,但视频生成实际上只占整个制作环节的一小部分。在真正生成视频之前和之后,有着非常复杂的创意和链条过程,因此,AI对流程的替代将是一个逐步的过程,五年内很难达到直接面向消费者,且完全不需要人工干预的终极形态。 第二, 基于市场竞争与细分逻辑,单一厂商很难在所有环节都做到极致 。一个完整的AI视频工作流需要调用语言模型、图片模型和视频模型。大厂虽然有能力做全流程覆盖,但这并不意味着它能在每一个细分领域都保持最强,例如有的模型在图片生成上做到了极致,但视频能力未必最强。这种能力的差异化最终会促成市场细分,而非一家独大。 同样离开大厂、投身AI创作工具创业的Ribbi创始人兼CEO Robin,在这一点上与张云剑观点接近。“ 大厂中,业务、模型和顶层之间的对齐是最困难的事,除非已经有业内共识。 ”Robin说,“在看到Taste的确切价值之前,为审美、品味构建模型,是大厂不愿意做的。只有当视觉创意生成从非共识,变成共识,才能激发更多大厂和顶尖人才参与进来。” 然而,投资经理冯绘霓觉得这个为期五年的这个预估有点“过于乐观”。 “大厂在接触这类工具型的初创公司时,其实 最想挖的不是产品或算法人才,而是运营。 ”冯绘霓说,“这揭示了一件事情—— 在技术层面,大厂自认为完全有这个能力把产品做出来 ,而目前的短板在于用户渗透。” 冯绘霓的判断是,Seedance、可灵等大模型的野心非常大,“它们不会只想做一个基建或者工具,他们更想做的是‘定义下一个内容平台、社交平台’,而工具只是‘顺带被做了’的部分。” 一句话来说,大厂会做,但不会明天就做。在这个窗口期,创业公司能做什么呢? 从腾讯、字节跳动等大厂离职创业的Anijam CEO方晨认为,创业公司与大厂竞争的关键,是“ 要更早跑起来,形成用户留存与数据沉淀。 ” 换句话来说,时间就是资源,跑起来的速度决定了达摩克利斯之剑落下之后的生死。“要尽快进入市场、获取用户,并在真实使用中积累数据与认知。”方晨说。 张云剑对ZeroCut的规划是, 公司的护城河在于“AI落地服务”与“社会分工” 。 “即使底层模型变得非常强大,市场上依然会有大量不会使用工具的用户,或者出于‘性价比’和‘比较优势’考虑而不愿亲自下场制作的企业客户。”张云剑说。因此,ZeroCut将避开工具层面的硬碰硬, 直接帮客户解决最终的“交付和落地”问题 。 这就涉及到了商业化路线的问题——是在大模型的算力成本与自己的用户定价之间赚差价,还是找一条新的商业化道路?前者虽然简单,但大模型厂商一旦降价,就会吸走用户,大模型厂商一旦涨价,自己的利润就会变薄。说白了终究是把命脉交在他人手中。因此,创业公司大多选择了后一条路。 ZeroCut的思路,就是"技术+服务"模式——如果客户有能力,可以直接使用工具;如果客户需要代工,平台会将订单对接给熟练掌握该工具的创作者,提供稳定的视频定制交付服务。至于 计费标准,则从传统内容承制公司的“人力计费”转为AI时代的“Token计费”。 客户不需要关心固定的人力报价,而是以视频生成过程中消耗的算力为基准来计价。 只是让用户“花钱买积分”根本不够。 许多AI视频生成工具,都在将手越来越深地伸向客户的业务深处,变得越来越像一个能包揽一切的乙方。 主打“电商+AI自动生成”商业模式的TapNow,就被外界评价为“离钱最近的项目” 。 传统 4A 公司高管在《BusinessFocus》的匿名访谈中提到:“TapNow 这种‘预测+自动生成’的逻辑,抢走了原本属于中小代理商的短视频代运营订单。” Ribbi不仅能用来创作音视图,还能帮用户监测内容发布到社交媒体之后的数据。感知阶跃也一样,致力于覆盖内容生成、发布、投放、A/B Test、效果分析、二创等的全流程。 “ 人一定是懒的动物。 没有用户希望做一个产品、完成一个环节,就换一个模型、换一套工具。”Robin说。 社交媒体,是Agent在线进化落地的核心训练场,将作品发布到社交媒体,是Agent与真实世界的交互。监测数据表现后,Ribbi能够自主迭代和优化创作路径,交付更好的结果。最终,平台就能够形成一个自主进化的创作闭环。 Ribbi目前的模式还没完全确定,但Robin确定未来一定不会是积分制,因为它“不够诚实清晰”。 但积分制仍然是目前行业的主流商业化模式,毕竟它足够简单,并且已经完成了用户教育。但随着工具能提供的服务越来越深化,以及“Token未来会越来越廉价”的美好愿景,也许未来的服务也会有未来的新商业模式。 “感知阶跃”创始人兼CEO张诗莹与方晨有一个共识,他们认为,未来时代的商业模式应该是 “为效果付费,而不应该为成本付费。” 方晨认为理想的情况是,当AI生成的准确率足够高,而Token成本足够低时,那么用户就可以仅在愿意下载内容时,才为最终产出买单,而非为生成过程中的Token消耗付费。 张诗莹则认为,Agent的商业模式,应该与人类Agency越来越相似,“收费模式不会是订阅,而更多会采用分佣的形式。” 工具型公司的时间窗口,是新时代诞生一个新的Adobe那么大的机会,还是在大厂包揽一切之前的昙花一现?对于已经入局的人来说,他们相信底层大模型归属大厂,但应用层也有创业公司能做的事。 “我立志成为硅基生命的垫脚石。”Robin说。“假设某一天,某家模型厂商实现了AI的自主进化,即便功不在我,我也愿意贡献我们对Context Layer自主进化的Know-How、开源我们的技术架构,帮助模型厂商训练更好的自主进化模型。” 技术路线之争:提供idea,还是提供editing? 创业公司之间,目前也有显著的思路分歧。 同样是AI视频生成工具,产品的形态却千差万别——有的一打开首页就像进了抖音(会自动播放AI视频)或得物(满屏AI广告片示范),有的却只有简简单单一个对话框,像进了任意一个chatbot。这背后是行业的技术路线之争。 到底要画布,还是要一个包揽一切的Agent,是目前最大的技术分歧之一。 “无限画布”的UI交互方式改变了传统的线性时间轴,允许创作者像在Figma或Miro中一样,通过节点连接素材和工作流。坚持这一路线的明星产品有LibTV、SkyReels、TapNow等。 在这些产品上,用户有了一个可以无限缩放、拖拽的画布空间。你可以将一个“图片节点”连向“视频节点”,再连向“音频节点”,形成一个自动化的 Pipeline。 LibTV画布界面 画布的好处,在于人的意志的“强控制” ——用户可以在任意环节手动介入调整,确保AI生成内容的画风、角色、镜头细节等等都在自己的规划之内。 有创作者将LibTV的无限画布比喻为“乐高积木 ” ,因为它能自由搭建分镜,彻底改变了线性剪辑逻辑。 但也有旗帜鲜明地反对画布形态的产品,比如ZeroCut和一周收到了全球4万多用户使用申请的Ribbi。 这两款产品的特征,是没有醒目的画布,所有的创作、编辑交互,都集中在一个小小的对话框中。用户用自然语言与Agent对话,然后由agent去指导模型生成内容。 张云剑致力于推动从“人为主导”向“Agent为主导”的范式转移。他对智能涌现表示,ZeroCut认为传统的画布或工作流模式只是过渡形态,这些模式本质上是“重人工”的,是将AI能力作为节点,让用户去手动串联,属于自动化工业方案。 ZeroCut网页端产品界面 “ 当你在创作时,大部分的活是人在干,还是AI在干? ”张云剑说,“这个是我们判断的一个标准”。ZeroCut致力于让人退居幕后,进行决策和提供灵感,而让AI去承担长流程的视频制作。 Ribbi在这一点上也有这样的共识——不做“画布类”的产品,而是用Chat作为UI,给Agent更多的自由度。 Ribbi界面 “画布类的产品,把模型的可能性锁死了。”Robin说,“我们没有把Ribbi做成画布类的产品。画布类的AI产品看起来交互很酷炫,能让投资人眼前一亮,专业用户使用起来也很顺手。但它们有一个致命伤:把模型的可能性提前锁死了。因为画布的本质,是将工作流拆成一个个节点,模型只能沿着这条路径走。” Robin认为,AI时代的UI应该是容器化的,而不是功能化的。产品应该给AI创造一个容器,让它可以自由决定调用什么样的工具、怎么组合工具,甚至按照什么样的顺序执行任务。 在这种初衷之下,这类产品的界面就浓缩为了一个Chatbot。Robin表示,他认为 Chat是一个“足够简单,并且灵活兼容一切的容器。” 他举了豆包作为例子——豆包的移动端App设计得很轻量,用户不需要打开新的对话框,只要在一个session中Chat,就能生图、生视频。它将用户的交互和AI的行为,统一在一个非常简单的框架中。 两类技术路线之争其实归根结底是在争一个问题—— 工具到底应该提供idea(为没那么专业的用户提供思路),还是提供editing(为相对专业一些的用户提供编辑工具)? 在路线之争尚未定胜负之时,也出现了“融合态”的产品。 由腾讯杰出科学家创业打造的AI视频工具产品Anijam,融合了画布和Agent两种形态—— 用户既可以用自然语言在Chat中指导Agent干活,也可以在画布上自己上手调整。 既有Agent又有画布的Anijam界面 Anijam CEO方晨向智能涌现展示,在创作过程中,系统会自动识别故事中的关键元素,包括角色、场景、道具及风格,并基于此生成完整的分镜镜头。每一个镜头都会包含场景描述、角色状态、镜头语言等信息。 对于画面中的问题,创作者可以通过自然语言指导Agent进行修改,也可以亲自使用工具,在画布上“局部编辑”,例如只修改角色表情,而不影响动作或背景。这也是Anijam的关键能力之一,即从抽卡式生成视频走向“可控编辑”。 在大模型厂商做出真正好用的应用层产品之前,两类产品都已经积累了可观的用户基础。现在的问题是,大厂给大家留了多少时间窗口?窗口关闭之后呢? “应用层不应该去做模型层的事,因为模型一定会变得足够好。”张诗莹说。她是“感知阶跃”创始人兼CEO,该公司的产品之一,是AI视频创作平台Creati。 “当下有很多‘套壳’视频模型能力的产品,无论是画布,还是工作流,解决的都是模型能力不够强的问题,比如抽卡、视频生成长度有限。但未来,模型层一定会解决生成质量和长度的问题。应用层的机会,就在于解决生成环节之外的问题。”张诗莹说。

36氪 · None · tech

作者 | 李小霞 访谈| 李小霞、杨轩 编辑 | 乔芊 林清轩创始人孙来春有一段广为人知的惊险故事。 那是2020年春节疫情初起,林清轩大面积闭店,业绩断崖式下滑90%,公司账户里的现金最多支撑67天。 在那一刻,孙来春突然发现自己过去十几年引以为傲的线下基因,变成了最不堪一击的包袱。 后来的故事很多人也都知道。孙来春走进直播间,从一个害怕镜头、会紧张到呕吐的中年男人,变成了能和屏幕那头的陌生用户聊护肤、聊品牌的网红CEO。 随之变化的,还有林清轩的命运。公司在去年末完成了上市,成为港股“国货高端护肤第一股”。 这些光鲜放到以前不敢想象:入驻商场被赶来赶去,融资屡屡碰壁。如今,这一切都翻篇了。 最近,林清轩发布了上市来的首份财报: 林清轩2025年营收24.5亿元,同比增长103%;净利润为3.6亿元,同比增长93%,毛利率维持在82%,核心旗舰品山茶花精华油累计销量突破5500万瓶。 线上收入占比首次超过线下,升至70.4%,创始人IP与品牌IP矩阵,成为区别于传统美妆品牌的独特标签。 质疑也纷至沓来。诸如“产品单一”“国货做不起高端”……孙来春自己也说,“品牌冲高端的一路上,嘲讽、质疑、不理解从未间断,只能坦然接纳。” 在他的规划中,做大山茶花精华油只是林清轩的第一步,他想要的是,参考欧莱雅,做多品牌以及国际化。 这并不是说林清轩要「成为中国的欧莱雅」——一个无数中国美妆品牌都曾喊过的口号。 “我们只想成为林清轩。” 近日,36氪与林清轩创始人进行了一次访谈,以下为对话内容(经编辑): 「距离真正的高端还有差距。」 36氪:林清轩最早从平价手工皂起家,从大众走到高端,中间经历了怎样的转变?国内能做成高端美妆的国货并不多,为什么是林清轩? 孙来春: 林清轩起点确实低,但不能因此认为我们做不了高端护肤品。没有人有权利来定义一个品牌“他出生在哪里就应该在哪里”。 当年我们虽然是做手工皂,但选择了一条差异化路径,就是开线下百货和购物中心店。这真正决定了林清轩未来的战略选择。 还有一点,我们主做直营店,后来又做了研发和全产业链布局,全部是重资产投入,慢慢具备了打造高端品牌的可能性。 从2012年至今,我们用了14年时间准备、运作、突围,九死一生才走出来,到现在距离真正的高端还有差距。 36氪:这段距离体现在哪里? 孙来春: 比如高端精华、面霜,还没有成功打造出来。其次品牌影响力,消费者认知都要有过程。换个角度看,这恰恰是我们未来的成长空间。 36氪:品牌刚起步没什么声量的时候,你们当初是怎么说服商场引进入驻的?这个过程是不是特别难? 孙来春: 不是难,是太难了。2008年3月,林清轩产品已经全部准备就绪,部分都已经生产入库。从3月到12月,整整九个月,我跑了两百多家商场、百货和购物中心,90%都是直接拒绝。 现在回想起来,特别感谢上海中山公园龙之梦。当时商场刚开业,比较愿意接纳我们这样的新国货品牌。 十几年后我偶遇凯德当时的总经理,当面表达感谢。他说商场每年都会预留名额,引进3—5家有创新潜力的本土品牌做扶持。过往引进过很多,但林清轩是为数不多,从一家店起步、走向全国,未来还有机会走向全球的品牌。 我们开到某知名百货时,已经有四五十家门店规模了。起初商场给了不错的位置,经营半年后,商场引进日本大牌,就以“国货不配和国际品牌同区”为由,把我们赶到了冷门的国产品牌专区;又过半年引进韩系品牌,再一次把我们排挤到地下楼层。 我们干了一年下来,装修两次一分钱不挣。又过了六个月,说地下改造,不要化妆品了,就把我们赶出去了。 不过后来换了一个CEO,比较认同中国文化,他认为中国品牌在崛起,就把我们重新招进来了。我当时也跟对方说,不用有顾虑,让挪位置就挪,让搬走就搬走,我们都能接受。 一路走来,林清轩经历过无数次被排挤、被挪位,一点点熬到现在快六百家门店。所以我说要有个过程,忍得了寂寞,接受不断的蹂躏,才有未来。 品类单一,只是阶段性状态 36氪:大众对以油护肤的认知度并不高,你们是怎么去突破市场教育的? 孙来春: 说实话,林清轩做以油养肤、开辟精华油新品类,难度比品牌高端转型、布局线下门店还要大。 首先是用户认知空白:大众习惯用水乳、普通精华,根本没有用油护肤的意识;而且大众固有印象里,油就等于油腻,大家反而都在买控油产品,天然存在负面认知。 其次是山茶花原料认知弱:大家只知道山茶花好看,但不清楚它的护肤功效,需要花大量精力做市场教育。 唯一的优势是,山茶油护肤有千百年古籍、宫廷沿用和文史记载背书,自古就被用来润肤抗皱。除此之外,一切都要靠我们自己投入科研,把产品做得轻薄好吸收,再持续做市场推广。 36氪:依靠山茶花 + 以油养肤,能否撑起林清轩的长期大盘?外界也一直有声音质疑品牌单品过于单一。 孙来春: 这就像早年的可口可乐开创了一个新品类,质疑它的人,觉得产品线太单一,只有一款可乐,没有矿泉水、酒水、零食等多元品类。而今天可口可乐也早已拓展出雪碧、天然水等多条产品线。 像现在SK-II你会觉得他家就卖神仙水吗、雅诗兰黛只卖精华吗。我们是先聚焦成为一个品类王,后续再逐步延伸,打造「1+4+N」多旗舰的高端护肤。 外界觉得现在林清轩靠单品支撑,这话没错,但只是阶段性状态,我们的第二成长曲线已经出来、新品牌布局也已经在路上了。 36氪:新品牌布局是什么? 孙来春: 我们分为三个阶段布局。第一个阶段就是单品牌的高端化,目前正在推进中,初见成果。第二个多品牌矩阵。针对不同的人群,甚至不同的地区,不同的皮肤性质,形成一个差异化的多品牌。第三个是全球化。 36氪:会选择什么样的多品牌,或者做哪些品类的多品牌? 孙来春: 目前林清轩定位中高端,还有不少布局空白需要补齐:缺少顶奢线,也没有香氛、彩妆、男士护肤及大众平价品牌。参考欧莱雅,如果把林清轩比作兰蔻,我们还缺赫莲娜、巴黎欧莱雅、美宝莲等。 就算同属中高端赛道,我们主打以油养肤精华,还缺少主打面霜、化妆水、功效精华等细分定位的品牌。 学习欧莱雅做多品牌布局 36氪:你们会想成为中国的欧莱雅吗? 孙来春: 我们不是要成为中国的欧莱雅。我们是学习欧莱雅集团多品牌布局,我们只想成为林清轩。 36氪:不过这么多年想成为欧莱雅的公司很多,但至今没有出现。 孙来春: 我相信中国企业中一定会出现欧莱雅、雅诗兰黛一样的国际集团。是哪家不确定,大家都在努力,而且努力都有成果。 36氪:你应该也有听到很多杂音,说中国品牌做高端化就是割韭菜,你们会怎么消解大众这种固有偏见? 孙来春: 小时候,我住在煤矿矿区,当时环境风气不好,不少小孩随地吐痰、砸玻璃、扔石头捣乱。大家都跟着一起做坏事时,你若坚持不跟风、不参与,不仅不被认同,还会被嘲笑、排挤,甚至被同伴欺负。这就像一篓螃蟹,有一只想要爬出去,其余的都会把它拖下来。 做品牌也是一样,不能因为当下缺少本土高端品牌,就断定国货不适合走高端化。这是错误的归纳思维,应该用长远的演绎思维看趋势。二十年前我就笃定,中国一定能诞生比肩国际大牌的高端护肤品牌,也抱着这个梦想做起了林清轩。 36氪:所以这种声音不会成为你们的障碍。 孙来春: 我奶奶是个山东老太太。她常说的一句话是“光听拉拉蛄叫,就别种地了”,大意就是不要因外界的声音而失去动力。 36氪:2024 年高端护肤排名里,林清轩是前15名里唯一的国货。过去的成绩已经证明,我们现在有实力和国际大牌掰手腕了。接下来,要怎么继续跟他们比拼? 孙来春: 过去三年,国产美妆整体市场占比从不到50% ,今年已经涨到 57%,份额还在持续扩大。原因一是中国品牌的科技实力上来了。第二消费者的文化自信上来了。所以说怎么去竞争?还是踏踏实实做好科研,老老实实做好品牌,做好零售,做好服务,一步一步的迭代。 高毛利,不是在抖音盈利的核心点 36氪:目前国内高端美妆里,真正走到上市阶段的,差不多就毛戈平和林清轩两家。为什么偏偏是这两家? 孙来春: 我们走的路完全不一样,但有共同基因,比方说愿意开线下门店,踏踏实实做好零售和顾客体验,再就是敢于去开创新品类,敢于做中高端品牌的投入。 36氪:做电商直播,你为什么非要亲自下场? 孙来春: 在巨大的困难面前,作为一个领头的,你是说兄弟们跟我冲,还是兄弟们跟(着)我冲?我选择了后者,那时候大家都居家隔离,没人愿意主动做直播。 我不光自己上,还号召公司所有管理层都去尝试直播、摸索这个新事物。只有亲自下场试过,才能找到手感,知道这件事到底难不难,知道茶是苦、药是苦的。 我觉得任何一个老板,如果对业务一点手感没有,在那瞎指挥肯定不行。公司转型关键时候,作为领导干部肯定要冲锋陷阵。当业务已经成型时,领导干部要从前线下来打造组织、团队,培养复制更多优秀的将军,而不是一直在一线。 36氪:你有推崇的企业家或企业吗? 孙来春: 现阶段对我们帮助最大的是华为,它从战略到执行非常厉害。另外我最近对丹纳赫的体系非常着迷。接下来林清轩布局多品牌、国际化和并购战略,也会计划将丹纳赫这套体系吸纳过来。 36氪:林清轩的毛利很高,这是否也是支撑你们能持续做好抖音的关键,毕竟抖音的成本要高一些。 孙来春: 我们的产品复购率平均达到34.2%,但有些品牌的护肤品只有4.5%的复购率,就算天天拼命拉新,用户来过一次就再也不回头,根本赚不到钱。 所以不是高毛利,而是高复购率决定了林清轩的抖音能够有利润。再一个就是二十多年线下门店沉淀下来的品牌力,带来了高转化。 36氪:当初生死存亡之际,你做了两个重要决定,一个是入局电商,另一个是开放融资,找投资人这个过程艰难吗? 孙来春: 2020年之前,林清轩一直坚持“防火防盗防投资人”,压根不想融资。那时候公司经营状况很好,很多投资人找上门,反复劝我们接受投资,都被我拒绝了。 结果2020年一下来了疫情,突然发现我们的现金流,只能支撑67天。我就有一种巨大的危机感。 然后我就开始大量找投资人,在上海隔离的一个礼拜,过年初一到初七,联系了五六十个所能联系上的投资人。有的就说等疫情过去之后,过来看一下,但我心想等疫情过去了,估计公司也没有了。 我想起马云说的:天晴时就要修房子,特别后悔,天晴的时候没修房子。现在下雨屋也漏。所以说那时候就下决心自己做业绩,转型电商,转型短视频直播带货,先把企业救过来。 后来企业转型活过来了,我们又开始主动找投资人。但大部分人表示:“我们现在都投电商网红品牌,你这个品牌太不性感,你开这家店怎么估值?”2020年我们已经卖到5亿的销售额。有一个投资人说你没做互联网,只能给你一个亿的估值。这样的故事数不胜数。 36氪:现在对林清轩来说,其实已经度过了最艰难的时期了,应该没有比2020年那会让你面临如此巨大压力的事情了吧。 孙来春: 我觉得每个阶段压力不同,以前是生存压力,现在是发展压力。上市才是万里长征第一步,未来还要去翻越一座又一座山,去实现品牌高端化、多品牌矩阵、全球化。革命的道路刚刚开始。

36kr.com · None · tech

文|周鑫雨 编辑|杨轩 规模化落地,今年的具身公司都在谈这个。 数字竞速,不约而同出现在具身公司的产线、招股书、出货量上——2026年4月以来,智元机器人宣布第1万台机器人量产下线,5000到10000,只用了三个多月;宇树科技的IPO招股书也摊开了激进商业化的一角:2025年营收17.07亿元,出货量超过5500台。 激进的数字背后,是“低价、高性能”的中国机器人在全球的扩张。宇树科技创始人王兴兴曾在2025年世界机器人大会上提到,过去几年,宇树的海外营收一直占总营收的50%以上。 在这些具身玩家中,魔法原子MagicLab近期提出了一个相当激进的营收目标: 2036年,要实现140亿美元的营收规模。 在全球范围内打响品牌,也让这家公司,将发布会开进了硅谷。美西时间2026年4月28日,在云集Adobe、TikTok、IBM等公司的圣何塞,魔法原子发起了全球具身智能创新大会(GEIS)。 魔法原子机器人MagicBot Z1现场给张艺兴表演。作者拍摄 在会上,魔法原子发布了从底层模型本体的一系列新产品: 世界模型Magic-Mix :魔法原子自研的“自主进化模型”。Magix-Mix由两个引擎构成:让机器人学会理解真实世界的Magic-WAM,以及可以离线生成大批量许年数据的Magic-Creator——这意味着,Mix可以在“数据生成-模型训练-真实世界反馈-数据在生成”的闭环中持续自主迭代。 Magic-Mix架构。图源:魔法原子 灵巧手MagicHand H01 :搭载了20 DOF(自由度,人手约24-27 DOF)和44个高分辨率三维触觉传感器,主打工业制造、服务护理等场景的精细操作。 MagicHand H01。图源:魔法原子 人形机器人MagicBot X1 :一款身高180cm、体重70kg、全身搭载31个主动DOF、极限关节扭矩达450N·m的机器人。基于无限续航双电系统,X1可以7*24连续作业。产品分为标准版和科研版,前者商业部署效率高、开箱即用,后者则面向高校、实验室、开发者和产业伙伴,支持底层二次开发和外形定制。 MagicBot X1。图源:魔法原子 在会上,Openmind、PrismaX、Chestnut Roborics等来自硅谷的具身大脑和本体公司,也出现在现场。有关大脑、本体、数据的解决方案,这些公司给出了不同的解决思路。 以下是《智能涌现》关于现场讨论的整理: 用机器合成数据训练,效果会比真实世界数据更好吗? 高质量数据的稀缺,一直是掣肘具身模型训练的瓶颈。当前真机数据采集一直存在成本高、周期长、场景覆盖等问题。 机器合成数据,就是解决方案之一。然而,合成数据的局限性在于真实信息的缺失,比如摩擦系数、延迟、触觉反馈等。这也造成业界对“sim-to-real-gap”的担忧。 混合数据训练,是当下中美具身智能企业提出的主流解决方案。比如,魔法原子总裁顾诗韬介绍,魔法原子日均采集约16000条数据,再通过数据合成实现1万倍的体量扩展。她提到,由于产品迭代快、60%-70%的工序依赖人工, 新能源汽车制造业,是数据采集的富矿 。 判断使用真实数据,还是机器合成数据,行业的共识是:基于具体训练目的和应用场景。 亚马逊前沿AI与机器人研究院科学家Haozhi Qi提到,合成数据适用于让机器学习单一的反应基本技能,但 难以让机器获得类似于做早餐之类的长程技能 。此时,引入真实数据训练是有必要的,因为构建一个足够丰富的模拟环境,成本很高。 英伟达GEAR Lab高级研究科学家Zhengyi Luo则透露,团队目前采用50%的模拟数据,用于基础训练;15%的动捕数据、25%的互联网视频数据,用于理解人类的动作;同时,训练还会添加10%的高质量真实世界数据。他还提到,有些公司甚至会使用社交媒体上的数据,来指导机器人的本体设计。 VLA(视觉-语言-行动)是具身“大脑”最好的解决方案吗? 由于强大的任务泛化能力,当下VLA已经成为具身模型最主流的架构范式。 但事实上,当人类用手指旋转一个篮球时,只用依靠触觉和本体感知,并不需要视觉——这意味着,VLA在这两个感知系统上,存在短板。 在GEIS大会上,亚马逊前沿AI与机器人研究院科学家Haozhi Qi认为, VLA的流行,与硬件传感器的发展程度有关 :当下,视觉传感器趋于成熟,但触觉传感器还在初级开发阶段。 因此,在他看来,具身系统需要通过其他感觉的输入,来补足不太成熟的传感系统,从而维持本体的操作。因此, 通过视觉和语言补足触觉缺陷的VLA,成了当下最好的解决方案之一 。不过,未来随着传感器和硬件层面的发展,算法也会随之迭代。 灵巧手的三大路线之争:连杆、腱绳与直驱 当下,有关灵巧手设计的核心迷思是:要不要像人手?围绕这一命题,诞生了连杆、腱绳、直驱三种设计方案。 其中,“连杆”最不像人手,但胜在成本低、易于控制;“腱绳”最像人手,可以做精细化操作,但成本高、控制难。“直驱”则是一种折中方案,将驱动单元直接集成在每个关节上,但成本不低,同时力传导效率和热管理上仍然面临工程层面的挑战。 混合架构路线,则是近期兴起的灵巧手技术解决方案。 Chestnut Robotics创始人、前Tesla Optimus灵巧手核心成员Evan Tao介绍,当下团队已经选择了混合架构路线,以可以完成精细化操作的腱绳结构为主,辅以AI控制和自主学习系统。未来的方案,“都会在灵活度和工程可靠性之间寻求平衡。”他提到。 机器人如何真正规模化落地? 在数据层,引入真实世界数据,依然被认为是让机器人真正理解应用场景、学习复杂任务操作的关键。 比如,XGSynBot CEO Zizheng Li提到,他们采取的混合数据策略,依然引入了少量高质真实世界数据,控制成本的同时,也能提升模型能力和泛化水平。 在系统层,XGSynBot CEO Zizheng Li认为,机器人需要从“单一功能设备”向“多任务通用平台”演进,比如XGSynBot的机械臂,带有6个Quick-chage的模块化系统,这样做的好处是,一台机器人可以在不同工序间灵活切换,提高落地场景的广泛性。 最后,OpenMind创始人、斯坦福大学生物工程副教授Jan Liphardt总结: 机器人进入真实世界,越早越好 。 他发现,实验室环境无法模拟所有复杂的现实场景,比如过亮的光线、泥泞潮湿的地面、生锈的门铰链、多个系统同时运行的负载——这些复杂的真实场景,往往导致机器人在离开实验室后,出现系统故障。 因此,机器人落地前,不应该仅仅待在实验室��。Jan Liphardt建议,尽早让机器人在家庭、学校、机场、幼儿园和其他公共场景的实际部署中,收集交互数据,持续迭代。

36kr.com · None · tech

作者 | 邓咏仪 编辑 | 杨轩 如果你在4月27日这一周走进美国旧金山艺术宫,也许你会感到惊讶——这不像一个艺术圣地,更像一场包罗万象的博览会。 来自50多个国家的媒体、KOL、客户挤在展区里。映入眼帘的产品,小至智能吊坠、吹风机、LED 美容面罩、扫地机,大至洗地机、空调、冰箱、手机,甚至还有一辆“火箭车”的概念超跑。 Nebula NEXT 01 在舞台台上,图灵奖得主 David Patterson、7-Eleven 前 CEO James Keyes、Meta 前 VP来谈论AI如何重塑物理世界;而苹果联合创始人沃兹尼亚克(Steve Wozniak)以及NBA传奇球星德怀恩·韦德施然从会场走出,和扫地机互相PK。 韦德与扫地机互动 这是2026年4月27日,追觅“DREAME NEXT”的发布会的现场。追觅也由此成为世界第一家在硅谷拥有一整个发布会周的科技企业。 这家公司仍处于高速扩张之中。2025年,追觅营收突破400亿元,连续六年增速超过100%。如今,追觅的主力市场也已经转向海外,营收占比近80%,产品覆盖120多个国家和地区,线下门店超过6500家。 追觅的野心还不仅如此。仅在半年之内,这家公司在 CES、春晚、超级碗、AWE 展开了声势浩大的宣传和产品展示。追觅创始人兼 CEO 俞浩也不止一次公开表示,要把追觅做到百万亿美金的营收规模——这约等于25个苹果公司的市值。 追觅全宇宙 概括整场发布会的主题,也许只有一点:一家公司的版图到底能扩到多大? 至少目前,追觅几乎把触角伸向几乎所有你能想到的消费电子品类——它的版图中既包含最复杂的民用消费品,比如追觅“星空计划”的概念旗舰 Nebula NEXT 01 JET Edition。 尽管这辆车目前更接近一份雄心勃勃的技术宣言:官宣的参数是150毫秒响应,100千牛推力,0.9秒破百。这相当于世界顶级超跑的参数,直接把目标拉到了超跑甚至航天器的维度。而量产车型也会在明年发布。 甚至,在2025年,追觅正式官宣入局手机,这又是一个早已饱和的市场。 追觅AURORA 手机负责人刘扬对36氪表示,追觅AURORA首笔将投入100亿元押注手机创新研发。同时,追觅计划2026年将团队保底扩容至2000人、2027年扩大至5000人。 处在这次发布产品矩阵中的另一极,则是一批处在不同成熟度阶段的庞大产品矩阵。 除了扫地机、洗地机、吸尘器、吹风机、空调、冰箱、洗衣机这些成熟品类之外——还有早至一些尚处原型阶段的产品,如近期大热的AI智能录音卡片、AI吊坠等等。品类之多,让人眼花缭乱。 追觅智能戒指 事实上,这更像是将互联网的逻辑放到了硬件行业——穷举、配列组合、试错、快速迭代。“字节做 APP 工厂,我就在机器人时代做1000个产品。”俞浩曾在访谈中表示。 边界,是习惯的复制 问题是,支撑着一家公司能够扩张到如此规模的能力,到底是什么? 尽管品类繁多,但追觅的扩展逻辑几乎没有发生太大变化,围绕“N+1”来进行——早期做吹风机时,追觅将马达转速提高,加上 AI 算法,把一个品类在一个功能点上做到最好,从而实现规模化的扩张。 “追觅的延展是‘习惯的复制’,”2022年,俞浩曾在采访中表示,“只要大方向不错,过程中的微调很多是没问题的。” 而当转向海外市场和高端化战略后,这个产品创新飞轮转动的速度甚至更快了。 界面新闻曾报道,追觅如今已经形成一个庞大的“创新矩阵”,以单个产品单位,将250个产品一号位和250个销售一号位交叉组合,形成6万多个矩阵格子。追觅并不追求每个格子都成功,但只要有一个跑通,就迅速压上资源,极致执行,达到商业化胜利。 这套逻辑的技术基础,是大量可复用的底层能力。 一个例子是机械臂。在发布会现场,多个产品都接上了“机械臂”——扫地机、割草机有仿生双机械臂;洗护机器人Z1搭载的多关节机械臂,以及多模态感知系统,则可以自主打开洗衣机门,精准识别和拾取衣物。 带机械臂的割草机器人 履带也是同样的原理。追觅不仅把履带放在割草机器人这样的产品上,也放到了扫地机上——因为发现了用户对让扫地机器人进房间、上下楼的痛点确定是刚需之后,再将履带放在扫地机之上。 爬楼扫地机 用这套打法来看,追觅现场的数十款产品更像是一组庞大的测试用例:扫地机是已经跑通的成功模型,手机和智能戒指是正在验证的新品类,而火箭车这样的新品类,则是用来测试技术天花板的极端实验。 在开发周期中,硬件通常被认为比软件行业漫长,耗费更多的开模、生产成本,但追觅并不看待这件事——在进军每一个新品类时,追觅都用极少的资金来进行早期验证,从数万到更多不等。俞浩曾经回应,“造车不像大家想的那么费钱,是造错车了才费钱;手机也是,不是造手机费钱,是造错手机才费钱。” 2026年春天的硅谷,或许也提供了一个理解追觅的角度。 就在发布会举办的同一周,硅谷在2026年前四个月裁员超7.3万人。Anthropic CEO 预言“软件工程将被AI终结”。事实上,这是关于技术范式转移时,对既有商业模式彻底失效的恐惧。 没有人知道18个月后的行业会变成什么样。追觅的激进与硅谷的焦虑,某种程度上也是互为镜像:都在试图用一种极端,去对冲另一种极端。或许,在一个增长总体停滞的年代,先把自己推向极限的风险,可能比原地停滞还要小一些。

36kr.com · None · tech

文|周鑫雨 王毓婵 编辑|杨轩 解读DeepSeek V4的技术报告,是这几天AI行业最狂热的集体活动。 V4很强吗?在工程优化的维度中,答案是毋庸置疑的。过去,大家信奉“Scaling Law的暴力美学”——也就是靠堆更多优质算力、更大参数规模来提升模型性能。而V4走的是一条完全不同的路,它定义了一种“模型训练的克制美学”: 它不靠疯狂堆算力和参数,而是通过一系列组合优化和重构: 注意力机制 (让模型学会“抓重点”,像人读长文章时会自动关注关键句子一样) MoE架构(混合专家模型,可以理解为“让不同的专家负责不同类型的问题,每次只激活少数专家,省时又省力”) 后训练 (模型初步练成后再针对性地补课强化) 推理系统工程 (优化实际运行时各个环节的效率) 这样做的成果是把V4-Pro在处理百万Token(大约几十万字)长上下文时需要的算力,压低到了上一代V3.2的27%,同时用来临时存储对话上下文的 KV缓存 (可以理解为模型在跟你聊天时“记笔记”的草稿纸)被压缩到了原来的10%。 不过,工程只是工程,榜单只是榜单。 评价一个模型,我们不希望只停留在纸面参数上,而是放到部署、开发、投资的真实场景中去讨论V4的价值。为此,我们邀请了近10名开发者、应用创业者和投资人,进行了三天左右的体验和测试。 先说一个反直觉的结论:DeepSeek对应用层带来的影响,或许比模型层更大。 在惊叹极致的工程优化之余,正如DeepSeek自己在V4技术报告中坦言的那样:发展轨迹大约滞后前沿闭源模型3至6个月——V4如今的成果,就好比 与魔鬼做交易: 拉长了推理和Agent(智能体)能力的长板,代价是牺牲了部分准确性。 闭源模型厂商们,暂时可以松一口气。对于注重稳定、精确的商业世界而言,V4显然不是一款能够直接落地的模型。 Pine AI首席科学家李博杰,以及某头部Coding Agent创业者Chillin都对我们直言,工具调用稳定性+幻觉率,这两点必须在harness(给智能体套上的“缰绳”和“安全带”,用来规范它的行为、降低出错风险)层面补足,V4落地离不开“脚手架”。 但智力大脑的迭代方向,往往牵动着下游应用的生态。AI应用创业,将会面对技术和资本更严厉的双重考验。 “基模的性能还在快速迭代”——这句业内的共识,也意味着应用随时可能成为被模型颠覆的沙砾。一名双币基金的投资人举了不少“昨日黄花”的案例:“Workflow、Coding……” AI应用公司“涌跃智能”创始人兼CEO陈炜鹏总结:未来,AI应用的壁垒,是把模型、Agent、产品场景和数据反馈组织成一个可靠、低成本、可规模化的生产系统。 亮点:不只有长文本和编程能力,而是高能力还成本低 写在前面:核心优势——代码与智能体能力 在几个关键的代码和软件工程评测中,V4-Pro展现出了当前开源模型的最高水平,与顶尖闭源模型几乎不相上下。我们把核心数据整理如下: AI制图 🧑‍🏫PingCAP联合创始人兼CTO 黄东旭 我正在把自己的Hermes工作流迁移到DeepSeek V4上。原来我用得比较浪费,是用Claude Opus和GPT5.4来做Agent,但后来我发现,大多数日常工作其实并不需要特别高的coding能力。 日常办公任务,主要包括:(a)日常邮件整理;(b)文章撰写;(c)日历管理;(d)内容总结;(e)网络浏览。 现在我已经完全切换到DeepSeek V4了。它的效果比我想象中要好,可能是针对中文做了一些优化,整体语言能力比Opus和GPT更符合中文母语者的使用习惯。 所以我第一个结论是:如果你现在正在用一些更贵的模型来作为日常工作助理的Agent,其实可以比较放心地切换到DeepSeek V4 Pro上。 它的能力大概在Claude Sonnet 4.5到4.6的水平,但价格只有头部模型的四分之一还不到。现在我基本上已经不用再关注Agent的成本开销了。 DeepSeek V4的论文里一直在强调1M的上下文,但这点我其实感觉不是太强,因为现在主流的SOTA模型基本上至少也都是1M的上下文了,这只是追赶上了。 它真正的点在于: 1.成本真的非常低; 2.它是一个开放开源的模型。 我不用太担心Anthropic或者OpenAI如果断供,我之前的一些工作流就不能用了,这种事情之前其实发生过。在这一点上,切到DeepSeek V4,安全感是更高的。 其次,看编程能力。因为测试时间还比较短,我还没有用它来开发非常复杂的大型系统应用。 但在大概几千行代码的规模,或者做一些小型应用,以及处理充满各种外部第三方系统调用的场景(比如去Supabase或者TiDB Cloud上,通过阅读文档去接入一个它不太熟悉的工具),目前我的体感是基本上没有出现太大的问题。 在几千到一万行的规模里,V4 one-shot(一次性给足例子和指令,不额外调试)的成功率还是比较高的。 所以如果你只是做一些简单的小网站或者小型应用,我觉得DeepSeek的编程能力肯定比前一代要强非常多。 因为现在我的Harness框架其实并没有太复杂的人为编排,更多是依靠模型自身的协同能力(使用Slock.ai)。 简单来说,有以下两点: 1.它能够跟使用其他模型的Agent进行协同; 2.它完成一些简单的/具体的任务。 所以,如果前面有一些比较强的模型(例如像GPT5.5这种级别的)去给DeepSeek V4 Pro指方向,然后让它负责执行,这种模式我觉得能让整个Harness Engineering的成本大幅下降。 🧑‍🏫零一万物技术与产品中心副总裁 赵斌强 DeepSeek V4不是“最全能的”,但它是“最值得信赖的”——坚定的开源承诺、完整的技术报告、极低的推理成本、全技术栈国产化,让它成为ToB(面向企业)场景下性价比最优的基础模型选择。 DeepSeek V4最让我惊艳的是两件事。 第一,模型架构的底层创新。在100万Token上下文窗口下依然保持高质量推理能力,背后是 混合注意力机制 的底层创新。这种机制可以通俗地理解成:“粗读”着眼大局整体含义,“精读”精确理解细节。 尤其是在Context压缩方面的探索非常先进,而且DeepSeek在技术报告中毫无保留地公开了细节。这种坦诚和开源精神,在竞争激烈的大模型行业中极为宝贵。 第二,国产算力全栈适配。DeepSeek完成了华为昇腾910B/950的适配,在量化、稀疏化机制、领域expert优化等方面的工作做得非常细致。 这意味着从芯片到底层软件到模型训练、推理,国产全栈解决方案已在正确的方向上迈出了实质性一步。虽不能说完全摆脱对英伟达生态的依赖,但已经找到了正确的发展方向。这件事的难度和意义,怎么强调都不为过。 🧑‍🏫 Pine AI首席科学家 李博杰 最惊艳的是DeepSeek把MoE、CSA+HCA混合注意力、mHC、Muon、FP4QAT这一长串架构创新真正在1.6T(1.6万亿参数)这个目前最大开源规模上跑通了。 这就像把一堆理论上很先进、但在小规模实验里经常失效的技术,成功组合到一台巨型引擎上并稳定运转起来。我们自己试过20多种架构创新,结论几乎都是“在70亿参数规模上可行,一上规模就掉链子甚至反作用”。 其他家的模型架构创新大多也卡在这一步。能在最大规模上让多项创新协同工作,说明DeepSeek底层训练的技术积累极深,仅其中一项“mHC”技术,就把原来在27B实验里近3000倍的信号放大,压到了约1.6倍,让训练变得稳定可控。 🧑‍🏫联想集团副总裁,联想创投首席投资官、高级合伙人 宋春雨 DeepSeek证明了“AI性价比”可以成为一种主动设计出的结构性优势。 27%、显存占用仅10%。同时,其1.6T总参数量大,但每次仅激活49B参数,效率极高。 这种结构性降本,再加上V4-Flash版本API 1元/百万Token的低价策略,使得“平民化超长上下文”成为了AI应用的新基准。 🧑‍🏫 涌跃智能创始人兼CEO 陈炜鹏 DeepSeek V4最让我振奋的,不只是某个单点能力的提升,而是它说明国内大模型已经从“追赶基座能力”,进入到“参与Agent时代系统竞争”的阶段。 过去大家更关心模型会不会回答、推理、写代码;但到了今天,真正重要的是模型能不能在复杂任务中稳定完成目标,能不能以足够低的成本、足够高的效率接入真实产品系统。 遗憾:真正落地,V4还缺一些“脚手架” 写在前面:相对劣势——事实性知识与极端复杂推理 DeepSeek官方和各评估平台指出了V4-Pro的几个明显弱点。为了更直观,我们将关键弱项数据整理成下表: AI制图。 🧑‍🏫Pine AI首席科学家 李博杰 我主要使用的是代码类和Agentic任务。这一类工作里: V4-Pro的工具调用能力和通用世界知识,基本追平了前沿模型的次一档版本(大致相当于Claude 4.6 Sonnet水平); 但工具调用稳定性+幻觉率仍然是硬伤——这两点必须在Agent Harness层面补足(比如加强校验、失败后自动重试、用外部知识库让模型“接地气”、把工具使用规范定得严格清晰),否则在长链条任务里,任务链路一拉长,错误就会被不断放大; 一旦Harness层补好了这两个缺陷,整体推理成本能比前沿模型低好几倍。这才是真正的杠杆。 另一条线是:V4-Flash作为垂直微调的“甜点”是非常好的。什么叫垂直微调?就是在通用模型基础上,用特定领域的专业数据再“补课”,让它成为某个行业的专家。 1.6万亿参数的超大模型做后训练(SFT/RL)成本太高,一般公司根本负担不起,而2000亿到3000亿参数的模型才是市场做后训练的主力尺寸。我们之前在千问235B(2350亿参数)上做后训练,效果明显弱于同尺寸的V4-Flash。 Flash的性能已经追上前一代万亿级开源模型,超过600B多的DeepSeek V3.2和老版Kimi。Flash会成为做业务微调的首选基座。 🧑‍🏫Coding Agent创业者 Chillin 我们内部测评后得出的结论是:在Coding Agent场景下,DeepSeek V4是Claude一年多前的水平。 问题可能出现在两方面,一是参数规模,二是数据。DeepSeek和Anthropic还有比较显著的差距。 如果要真正落地,DeepSeek V4还需要一些特殊的脚手架,比如SWE-Agent(软件工程智能体)、OpenHands(一个开源Coding智能体)、Claude Code、OpenClaw。这都需要开发者额外配置。 🧑‍🏫涌跃智能创始人兼CEO 陈炜鹏 以Loopit(涌跃智能旗下的AI互动内容产品)的实际使用(主要是Coding场景)来看,要客观看到,DeepSeek V4在执行复杂长程任务的稳定性和任务完成率上,距离海外最强闭源模型仍有差距。 国内头部模型之间的能力差异在变小。这说明模型竞争正在进入一个新阶段:在Agent时代,模型能否理解长上下文、适应复杂框架、稳定完成长程任务,并以可接受的成本和速度运行,会变得同样重要。 真正拉开差距的,不只是模型本身,而是模型、后训练、Agent框架、评估体系和工程效率形成的整体系统。 🧑‍🏫联想集团副总裁,联想创投首席投资官、高级合伙人 宋春雨 V4的发布没有包含原生多模态版本(即同时能处理文字、图像、声音等的模型),这在当前市场环境下稍显遗憾。 但结合其全面拥抱国产算力的战略,这很可能是为了集中资源攻克最核心的算力底座问题而做出的阶段性取舍。 🧑‍🏫零一万物技术与产品中心副总裁 赵斌强 说“不及预期”有点鸡蛋里挑骨头。 但如果从ToC(面向个人用户)角度来看,产品化打磨还不够——Flash版本涉及创作、编程等复杂任务,能力略显不足;Pro版本虽然接近顶级闭源模型水准,但起步算力要求较高,存在入门门槛。 影响:AI并不是简单地越来越便宜 🧑‍🏫涌跃智能创始人兼CEO 陈炜鹏 一个重要趋势是,AI并不是简单地越来越便宜。 全球最旗舰模型的调用成本其实在上升,因为它们承载的是更高复杂度、更长上下文、更高价值的任务。真正快速变便宜的,是中层模型、开源模型和可自部署模型。 所以未来应用公司不会只问“哪个模型最强”,而是要建立一套模型调度系统:哪些任务必须用最强模型,哪些任务可以用高性价比模型,哪些能力可以通过Agent框架和工程系统补足。 DeepSeek V4的意义在于,它进一步丰富了模型供给层。 对企业来说,它不是简单替代某一个海外模型,而是让应用可以更灵活地做多模型编排、自部署和成本优化。 未来AI应用的壁垒,也不会是简单调用一个模型,而是把模型、Agent、产品场景和数据反馈组织成一个可靠、低成本、可规模化的生产系统。 对Loopit来说,这个趋势非常关键。我们做的是AI互动内容,模型能力决定创作上限,成本和速度决定创作能否规模化。 只有当不同层级的模型都足够可用,并且能够被有效编排,普通用户的大量创意才有可能被实时生成、互动和传播。DeepSeek V4的进展,会加速这个过程。 🧑‍🏫Pine AI首席科学家 李博杰 在垂直微调市场,千问、Llama等200-300B档基座被V4-Flash系统性替换。 所有做该尺寸后训练的团队都会重新评测;Flash同尺寸效果反超、推理框架Day-0适配齐全(SGLang/vLLM/TileLang),6个月内会成为国内开源垂直模型的默认起点。 华为昇腾950 SuperNode推理生态正式起步,并冲击英伟达芯片溢价。 这是第一个完整跑通的“国产芯+国产顶级开源模型”方案(NVIDIA/AMD都没拿到V4的早期适配),下半年950大规模出货后,Agent长上下文场景里会出现一波纯本土推理替换; 这间接影响是英伟达在中国市场的估值与溢价被重新定价——不是销量崩,是议价能力被压。 能完成复杂长程任务的Agent整体使用成本大幅下降。 V4-Pro输入(缓存未命中)1.74美元/输出3.48美元+1M上下文高效KV+MegaMoE已经把单Token成本压到前沿模型的1/6-1/7; 只要业界在Agent Harness层把V4的工具调用稳定性和幻觉率补齐(验证器、外部接地、严格Schema、自一致性投票),那些过去因为成本无法实用化的多步研究、长程代码Agent、深度搜索类应用会在今年下半年走出demo进入真实业务,Agent经济性的拐点就在这一波。 以及,闭源前沿厂商不会因此降价——它们的产品仍然显著领先,V4不构成定价压力。 🧑‍🏫零一万物技术与产品中心副总裁 赵斌强 ToB AI应用的核心命题是:在保证效果的前提下实现全周期的成本控制。DeepSeek V4的出现为这一命题提供了极具竞争力的解法。 Flash覆盖简单任务,Pro覆盖高复杂度场景,整体成本相比主流闭源方案会大幅降低,让零一万物在交付时能够显著提升方案性价比。 更重要的是,DeepSeek的开源是坚定的、不摇摆的,不会突然宣布闭源让应用的投入打水漂。这种坚定的开源姿态为企业级技术选型提供了宝贵的确定性。 零一万物内部已经全面启动基于DeepSeek V4的产品评测与能力验证,重点评估其在生产调度、智能办公、投资管理等企业核心场景中的表现,验证达标后会考虑替换原有模型,让更多行业客户用上顶级国产大模型。 V4发布后,我认为行业会主要产生三个变化: 1.国产全技术栈解决方案进入发展轨道,国产化替代从“梦想”变“现实” DeepSeek成功适配华为昇腾,意味着国内AI产业在“芯片+框架+模型+应用”全技术栈国产化的方向上迈出了实质性一步。 对于有合规要求的政企客户,这是刚需。ToB市场的国产化替代进程将明显加速。 2.开源大模型倒逼闭源降价,AI应用业务减少被闭源模型吸血 DeepSeek用远远低于顶级闭源模型的价格实现了接近顶级闭源模型的效果,它的示范效应会进一步拉高开源模型的整体性能。 这也会迫使Anthropic、OpenAI等闭源模型厂商的高价策略面对压力。行业利润中心将从基座模型向深度行业应用迁移,对AI长期的发展极有益处。 3.开源模型≠企业应用,Harness能力成为新分水岭 开源降低了基座门槛,Harness决定了落地高度。从优质开源模型到稳定可靠的企业级产品,中间还隔着Harness这一层,包括幻觉消除、指令遵循、错误校验、专业性注入等工程能力。 每个行业的需求不同,没有一套Harness是通用的。这恰恰是零一万物的核心优势所在:基于自动评测、自动反馈、自动改进、专业性注入,为不同行业快速构建专属的Harness体系,让大模型真正在业务中用起来。 🧑‍🏫联想集团副总裁,联想创投首席投资官、高级合伙人 宋春雨 第一,百万级上下文成为应用层的“标配”,催生Agent爆发:V4将超长上下文能力下沉为普惠基础设施。 第二,行业竞争从“卷模型”转向“卷应用与数据”:当顶级开源模型性能逼近闭源、成本大幅下降后,模型本身将不再是稀缺壁垒。未来的投资与竞争焦点,将更明确地转向谁能利用这些基础模型,在医疗、金融、法律等高价值垂直场景中建立数据与应用闭环,形成商业护城河。 第三,国产算力产业链迎来巨大投资机遇:V4的成功,向业界证明了大模型在国产算力上也能摘取“皇冠上的明珠”。这必然催生对国产算力的确定性需求,带动从芯片设计、服务器到云服务的全产业链投资热潮。 我们判断,“今年的国产算力,就是去年的海外算力”,其产业趋势和资本市场的映射效应将尤为强劲。 我们会把资源向“能快速商业化、能落地行业、能形成产品壁垒”的项目集中,同时保持对底层架构与算力基础设施的长期投资。 🧑‍🏫某双币基金投资人 我今年的愿望是:基模Portfio(被投资方)顺利上市。 DeepSeek启动融资后,一定会吸收一级市场(尤其是国资)的大量资金。对剩下几家还没IPO的基模公司来说,继续滚动融资是不可持续的。 我还有个比较悲观的观点:今年应用层融资会比较困难。 基模能力还在快速迭代,意味着一大批应用会被颠覆。就像去年非常火热的Coding、Workflow,今年一级市场已经没什么人提了。 🧑‍🏫Coding Agent创业者 Chillin 开源是一个好事,DeepSeek V4能进一步推动交流和优化。但是这个时间距离拉的很大,让人感觉比较难受; DeepSeek V4会迫使模型厂更加正面地面对规模和数据的��题,然而这两个问题极难解决,这是资本量的问题; 它也进一步地证明了Scaling Law的极限。工程化带来的性能跃升是有限的,这迫使所有人去找更底层的解。路漫漫其修远兮。 Bonus:一份DeepSeek V4实用指南 适合干什么? 编程与代码学习: 如果你是编程初学者或需要编写个人脚本,DeepSeek V4是目前最顶级的选择之一。它能非常可靠地理解上下文、生成高质量代码,并且极擅长代码调试。 中文及中日韩(CJK)内容创作: 无论是写文章、润色文案还是进行翻译,V4在中文、日文和韩文环境下的表现极其优异。 超长文本阅读与分析: V4原生支持高达100万Token的上下文窗口。你可以一次性将整本书、数万字的长篇报告或完整的代码库直接喂给它,让它帮你总结或提取关键信息。 不适合干什么? 搜索与查证客观事实: V4是一款“推理模型”而非“百科全书”,它在事实性知识(如历史细节、特定实体信息)的回忆测试中表现较弱,且极容易产生幻觉。特别是V4-Flash版本,在事实问答测试中得分仅有34.1%。建议:不要用它来当搜索引擎,查证事实请使用带搜索功能的其他AI或自己核实。 处理图片或文档排版: DeepSeek V4是一个纯文本模型,不支持任何图像输入或输出(No Vision)。如果你需要分析图表或图片,请使用其他多模态模型(如GPT-5.4 Mini)。 纯英文的高级创意写作: 虽然它能写英文,但它的英文输出有时会显得行文生硬(stilted phrasing),如果你需要创作高度自然、地道或富有创意的纯英文内容,建议使用其他西方主流模型。 其他须知: 给予充分的思考空间: 如果你使用的是具备显式 思维链 (CoT,即模型在给出答案前会先一步步推理,类似于“先打草稿再誊写”)的Pro版本,遇到难题时,不妨在提示词中鼓励它“多想几步”或开启“Think Max”模式,它推导得越深入,给出的答案往往越准确。 容忍偶尔的啰嗦: 评估显示V4是一款相对“啰嗦”的模型,输出速度也偏慢。如果你只想要简短的答案,可以在提示词中明确要求“请用一句话回答”或“请尽量简短”。 欢迎交流! 欢迎交流!

36kr.com · None · tech

文|周鑫雨 资料整理|钟楚笛 编辑|苏建勋 杨轩 靴子终于落地。 被调侃“Next Week”近3个月的DeepSeek V4,终于显露真身。 1.6T的最大参数量、1M的上下文窗口、针对Agent的性能优化,以及基于MoE(混合专家模型)和稀疏注意力机制DSA,降低计算和显存需求——这些曾被外界纷纷猜测的参数和性能,随着V4的官宣,一锤定音。 DeepSeek V4性能测评结果。 姗姗来迟的原由,与V4将训练框架从英伟达迁移到华为昇腾上有关,也与DeepSeek内部的决策变动有关。我们得知,2025年年中,DeepSeek曾面临一次较为严重的训练失败。 “当时,DeepSeek面临重新适配芯片的问题。”一名知情者提到,“内部有关训练方向的意见也不完全统一。梁文锋提出了一些自己的要求,但在执行层面很难折中。” 不过,与外界关于“新模型支持多模态生成和理解”的猜测不同,V4依然是个语言模型。暂缓多模态生成的训练策略,主要源于算力和现金的掣肘。 多名知情者告诉《智能涌现》,DeepSeek的对外融资窗口,是2026年4月中旬打开的。内部的导火索,是DeepSeek需要更多资金支持,训练参数规模更大的模型,同时,留住和招纳更多的顶级人才。 “1.6T的参数量与OpenAI、Anthropic等顶级厂商的模型相比,并不具有绝对的竞争力。”一名从业者对我们提到,很快,国内也有模型厂商,将发布 3T 参数规模的模型。 在人才侧,随着郭达雅(DeepSeek R1核心作者)、王炳宣(DeepSeek LLM核心作者)等人才被字节、腾讯等大厂挖走,DeepSeek需要一笔大额融资稳定军心、招兵买马。 而转向开放融资的外部导火索,几名业内人士猜测,与腾讯的投资态度有关。在开发融资前,梁文锋和马化腾曾有关注独家注资有过几次商谈。但两名相关人士透露,给腾讯20%股份的条件,没有得到梁文锋的同意。 R1发布以来,一个明显的转变是: DeepSeek从一个偏非营利的、理想主义的技术乌托邦,被迫快速转向一家重视产品、商业化的务实公司。 2026年4月8日,DeepSeek App改版,上线支持复杂推理的“ 专家模式 ”,和处理简单任务的“ 快速模式 ”——随着V4的发布,我们也从而得知,负责“专家模式”的,是1.6T参数量的V4-pro,支持“快速模式”的,则是284B的V4-flash。 DeepSeek App的两种模式。 曾有知情人士表示,2025年下半年以来,梁文锋开始重视产品的打磨。有多名大厂AI产品经理向《智能涌现》提到,2025年年末,DeepSeek对产品策略/经理进行了“开闸式招聘”,他们也多次收到DeepSeek HR的联络。 一名业内人士也对《智能涌现》透露, DeepSeek内部已经搭建了数个创新产品团队,对Agent和其他C端产品形态进行探索。 从更新后的版本看,DeepSeek的文本能力提升明显。在过去一年,我们也听到多位AI行业HR、猎头提起过, 不止一次在北大中文系的宿舍,遇见加学生微信的DeepSeek HR 。 招中文系学生的目的,是做人文领域的数据标注和测评标准搭建。这被视为DeepSeek重视模型的人文性的信号。 虽然“普惠”“开放”,产品简单到只有一个Chat界面,是DeepSeek对外呈现出的形象。但我们了解到,2025年,DeepSeek对产品和商业化的探索一直没有停过—— 目前,内部已经组建了一支数十人的产品团队,对Agent等产品形态进行探索 。 甚至更早前,在2024年,爆火前的DeepSeek,也考虑过投流推广,但很快被梁文锋否决。 DeepSeek终于放出年度更新,有如终于掉落的达摩克利斯之剑,让中国乃至全球模型厂商悬着的心稍稍放下。 迈入2026年后,DeepSeek的年度迭代,已成为AI世界“狼来了”的故事。避开DeepSeek,成了近几个月模型厂商的标准动作。 两家刚刚上市的大模型厂商,智谱和MiniMax,在春节前,就错峰发布了新的模型GLM 5和M 2.5。 一名智谱员工告诉《智能涌现》,“DeepSeek将在春节发模型”的传言一放出,算法团队立马拉了会,要求“尽早”发布GLM 5。 MiniMax的一名员工也表示,1月中旬,港股IPO庆功酒的宿醉还没褪去,算法团队就自觉早早回到了工位上。 “错峰”,对这两家已经IPO的模型创业公司尤为重要。 “如果比DeepSeek晚发,性能不如它们,会影响股价;但不发,也会影响股价。”上述员工表示,“影响最小的办法,是早发。” 模型公司的融资动作,也要抢在DeepSeek更新前面。 1月末宣布了B+轮融资的阶跃星辰,也迫切地想在春节前Close这轮融资。一名知情人士告诉我们,一旦DeepSeek再次掀桌,和投资人的沟通成本将会非常高。 在从业者眼中,牌桌上一直有“两个DeepSeek”——一个带来被倾轧的恐惧,另一个则作为范式的引领。在模型厂商们温吞缠绵的两年里,行业需要这样一个“不确定性因素”,让厂商们反思、继而冲刺起来。 MiniMax一名员工记得,在年后的内部信和全员会上,创始人兼CEO闫俊杰提到: “DeepSeek帮我们走出了一条我想走的路。” 即使中国AI从业者对DeepSeek情绪复杂,但人们依然承认,DeepSeek改变了中国AI行业的诸多规则。 改变,往往意味着推倒和重建,这必不会是个舒适的体验,但正如一名六小虎投资人对我们评价的那样:DeepSeek奠定了近一年来中国大模型的组织文化、冲研发重点,而在这以后,“ 它是中国AI跻身全球一流的起点,但不会是终点 ”。 DeepSeek让中国AI行业的竞争格局,进入相对稳定的中场。但在模型技术的早期,DeepSeek为行业留下的不尽是共识。随着商业化和竞争压力加剧,围绕开源、商业化、增长等命题,各个厂商正在走向不同的分叉口。 在DeepSeek V4发布前,我们与十余位AI行业人士,围绕“DeepSeek改变了中国AI行业什么?”展开对话。 以下,是我们从中总结出的5条“后DeepSeek时代”的新命题。 命题一:重新审视开源的性价比 一年前,DeepSeek R1公开技术报告后,一名AI投资人的判断是:回归基模研究、靠开源开放打响技术品牌,对模型厂商而言是最重要的事。 但如今,他告诉我们,当时的判断有待商榷。 跟随DeepSeek一年后,厂商们大力托举开源和研究生态的时代是否要终结?这一关键问题,随着近期阿里千问大模型技术负责人林俊旸的离职,被摆到了明面上。 某种意义上,林俊旸领导的Qwen,代表着开源生态的利益。但如今,这与阿里作为商业公司的营利性,产生了尖锐的矛盾。 “ 非盈利的黄金时代结束了。 ”针对这一事件,一名Qwen员工对我们这样评价。 让厂商们动摇的事实是, 如今营收最高的2家模型厂商,走的是闭源路线 ——OpenAI,年化收入超过250亿美元;Anthropic,年化收入超过190亿美元(据The Information报道,数据截至2026年2月底)。 至于国内厂商的模型收入,近期披露的2025年财报显示,MiniMax全年总收入为7903.8万美元,智谱为7.24亿元(约1.05亿美元),与OpenAI和Anthropic相比,还有多个数量级的差距。 △2023年以来,OpenAI和Anthropic的年化收入情况。图源:The Information 2026年1月的AGI Next大会上,智谱创始人唐杰也发出警告,“我们可能只是在‘开源游乐场’里玩得开心,而美国的闭源模型早已进入下一个纪元”。 毫无疑问,DeepSeek带动的开源开放生态,让中国模型在2025年内,快速在全球建立知名度和技术口碑。 但一个残酷的事实是,靠开源快速“冷启动”、建立技术口碑的阶段已经过去了。在基模研发仍然“吞金”的当下,如何将口碑转化成真金白银,是更重要的存活命题。 开源的价值,到了被重新审视的时间点。 命题二:投流大战暂停,精细化投放开打 如何解读DeepSeek “0投流,App上线7天用户破亿”的成绩? 放置一年前,行业的目光会不由自主地聚焦在“0投流”之上——这套破圈叙事,推翻了不少厂商深信不疑的增长路径,也戳破了彼时模型产品烧出的虚假繁荣。 警醒,应激。2025年初,不少公司都做出了和大举投流同样激进的反思。 其中的典型,是拉开投流大战序幕的月之暗面。 《智能涌现》曾报道 ,2025年2月一场持续了五六个小时的战略会上,月之暗面联合创始人张予彤宣布,立刻暂停Kimi在安卓渠道的投流,同时将iOS渠道上的投流预算,从原来的千万元/天,削减到数万元/天。 一名六小虎中层曾对我们假设:以Kimi和豆包为主角, AI应用激进的投流大战,大概率会持续到2025年Q2 ,按照平均每个季度2亿美金的投流支出,月暗会因资金压力率先败下阵。 当应激的情绪逐渐回归理性,多数厂商的增长成员都告诉我们:投流,仍要继续,但要做聪明的、有的放矢的增长。 事实上,激进的投流、补贴大战,没有因DeepSeek的非典型成功而停止。只是, 参战的主要对象,剩下了财力雄厚、手握流量入口的几家大厂 。 增长大战最白热化的一幕,发生在刚过去不久的2026年春节。阿里千问豪掷30亿元请用户喝奶茶,腾讯元宝狂撒10亿元红包,字节则用同样的10亿元,将豆包送上春晚的舞台。 六小虎的一名增长团队成员,将如今的投流,称作“巧妇要为无米之炊”:“ 流量入口被大厂们把握,意味着剩余的模型厂商,要用更精细化的增长方式,放弃建立大盘认知,聚焦目标用户。 ” 他举了个例子,如果AI产品的主要场景是金融、法律办公,那就将产品推到一些金融App上,流量还更便宜。 命题三:回归基模,选实用,还是选研究? R1出圈后,聚焦基模研发,一夕之间成为AI模型厂商的共识。 “我们对自己的研究方向,都更坚定了。”一名亲历R1发布的前月之暗面研究员对我们表示,“R1并不是石破天惊的创新,但它证明, 只要大方向判断不出错,厂商坚持自己的路线,就能获得性能上的正反馈 ,就像DeepSeek一直坚持纯语言和推理。” 此前,为了打榜或是追逐热点,不少厂商会将聚焦在推理、对话等不同性能的模型,分开单独训练。 “这样做可以针对某项能力调优,但模型的实用性会打折扣,客户也不一定买单。”一名智谱员工告诉我们。他提到,一个令智谱警铃大作的现象是,R1发布后,不少行业头部客户,转向了部署DeepSeek。 彼时的智谱在冲击中,做出了一个在上述员工看来“难而正确”的决定:训练一个同时聚集推理、Coding和Agentic能力的模型,GLM 4.5。 “ 这是智谱第一个‘反榜单’的模型,性能调优方向都从真实的客户需求中来, ”他表示,“某种意义上,这也是智谱的背水一战。” 同样的反思,也席卷了大厂。2025年1月,前谷歌DeepMind研究副总裁吴永辉,挂帅字节模型团队Seed后,“不刷榜单,聚焦模型能力本身”的方针就被多次提起。 类似的,多名知情人告诉《智能涌现》,前OpenAI研究员姚顺雨加盟腾讯后,花了大力气把模型和AI产品的测评体系重新搭一遍,直接对接人员具体到每个场景的负责人,甚至他们的-1、-2。 “原来混元(腾讯大模型团队)的风格是‘刷榜’,让模型性能有些虚假繁荣。”一名混元成员告诉我们,“顺雨很Sharp,他希望团队认识到模型的真实水平,回归到研发本身。” 但共识之下必有裂隙。技术研发,向来有“实用派”和“研究派”之分,前者注重赢得竞争、商业落地,后者注重学术价值——具体到一家商业公司的体系中,在手头宽裕的时代,承担AI“研究派”角色的,往往是AI Lab、研究院。 然而,随着AI投入的压力逐步加大, 基础模型研究该倾向“研究”还是“实用”,业界并没有统一的答案。 可见的是,在商业化目标的趋势下,目前“实用派”占了大多数。一个显著的信号是,AI Lab正在后退和消亡,研发资源被聚集至“实用派”。 2025年以来,字节AI Lab被并入Seed团队,阿里达摩院多个研发团队被重组至通义实验室;2026年3月20日,腾讯也撤销了成立近10年的AI Lab,团队成员并入混元大模型团队。 但DeepSeek在某种意义上依旧验证了, 伟大是无法被计划的 ,不少突破性的技术,源自非功利性的研究。 依然有厂商,选择给“研究派”自由探索的空间——比如,字节Seed内部,还设置了注重研究的虚拟组织“Seed Edge”,鼓励骨干突破更基础、更长期的AGI课题,考核周期延长至3年。 命题四:大模型组织,顶层扁平高效,基层人海战术 命运的齿轮在梁文锋决定脱离幻方量化,单独成立DeepSeek那一天起就开始转动了。 一名接触过DeepSeek早期成员的知情人士告诉《智能涌现》,2023年初,DeepSeek早期团队到位后,梁文锋就坚持将DeepSeek脱离于幻方,理由是“ 幻方不是AI时代的组织形式,想要实现AGI,必须脱离原有的组织惯性做事。 ” R1的成功,让不少模型厂商开始重新审视适配AI时代的人才组织形式。 “ 本质每一代(巨头)企业,都是那个阶段最先进的组织,去适配那个时候的技术和商业 ,自然而然脱颖而出。”在近期一次播客访谈中,阶跃星辰董事长印奇也提到,如今每一家企业的AI顶尖人才都不少,关键在于组织形态。 《智能涌现》曾报道 , DeepSeek采取的是相当扁平和“学院派”的管理方式 :成员根据具体的目标,分成不同的研究小组;组内没有固定分工和上下级关系——这一组织形式的好处在于,可以充分发挥人的想象力,适配创新业务。 对于规模尚且不大的创业公司而言,寻找适配AI时代的组织形式,尚且有较高的试错空间。不少六小虎的员工都对我们表示,2025年以来,扩张规模成为一件“很谨慎”的事。不少企业甚至选择自行断尾,目的是“更高效、更聚焦”。 但对于动辄万人规模的互联网大厂而言,打破原有组织惯性并非易事。正如印奇所言: 创新者的窘境,往往是组织问题;领域内越是优秀的公司,越是将组织模式固化的更好,但往往也更难改变 。 只是,对于大厂而言,在AI时代延续辉煌辉煌,是必须要做的事。 2025年以来, 大厂玩家都试图将模型研发和AI创新业务,规整为一个相对独立于互联网业务的组织,用更为扁平的方式管理 。 比如虽晚但到的腾讯。《智能涌现》曾独家报道,原来分散在各个BG中的模型核心研发资源,在数次调整中,被集中在姚顺雨管理的AI Infra部,以及大语言模型部。 在近期的答疑会上,姚顺雨针对AI Lab与混元的整并,也做出了回应:要打破部门墙,让AI基础模型的开发和研究架构 更年轻、更直接 。 但精简研发团队的另一面,是数据、评测等支持团队的激进扩张。 “模型底层算法的迭代,到了一个平台期。在算法架构没有突破的情况下,训练数据的质量在模型性能迭代中起到了关键作用。”一名大语言模型研究员告诉我们,“尤其是视频、3D等涉及主观审美的多模态数据,各个厂商之间的质量差距就会显现出来。” 用高薪、高职级组建数据、评测,在不少厂商中已经屡见不鲜。 一名知情者告诉我们,, 近期字节Seed总规模相较于年初,已经翻了约2倍 。 豆包某一个尺寸的模型,光负责智商评测的就有5人,负责策略产品的有五六十人 ,“豆包、Seedance目前的性能优势,都是靠人力堆出来的。” 在数据供应的上游,盘踞在成都、武汉等城市的数据标注公司,已经跑出了不少年营收过亿的“隐形巨头”,招聘的普遍门槛,从中专、大专,抬高到了211硕士。 “ 金字塔结构 ”,一名Seed研究员如此形容目前模型组织的标准范式:研发顶端,是少数顶尖大脑,而为顶层输送燃料的数据、评测,依然需要人海战术。 命题五:年轻人和“一把手工程” 组织最重要的毛细血管,则是人。很难说, 是DeepSeek统一了行业“重视年轻天才”的人才审美 ,但各个厂商对AI年轻人才的渴求,被拉到了一个史无前例的高度。 △腾讯“CEO/总裁办公室”首席AI科学家 姚顺雨,1998年生。图源:姚顺雨个人博客 “很多大厂的HR团队,前几年招人的姿态都比较‘甲方’。”一名在AI行业从事了7、8年高端人才招聘的猎头告诉我们,“他们只负责给钱,但与人才在业务上的沟通都比较浅。” 明显的转变发生在R1发布之后—— 抢人,成了各大公司的“一把手工程”。 比如,2025年以来,隐退近4年的张一鸣的身影,频繁出现在新加坡,目的是引进全球各地的AI人才。也有不少人看到,腾讯总裁刘炽平亲自带HR团队,现身多个国内外计算机顶会现场,给参会者发名片、加微信。 一名混元成员也告诉我们, 姚顺雨进入腾讯后的一个重要任务,是招人 。自2025年9月,他加入腾讯以来,已经替混元面试了近百人,“每个校招生他都会亲自面,也常找突出的实习生吃饭”。 “DeepSeek终于让厂商们 自上而下 对齐了一件事: AI就是top mission 。”一名AI投资人总结。 结语:一直仰望,就无法超越 DeepSeek不能一直待在神坛上。正如一名混元研究员所言: 一直仰望,就无法超越 。 2025年下半年以来,模型玩家们对DeepSeek的态度,不再只有景仰,而是暗自卯足了超越的野心。 这一点,在去年借助DeepSeek流量,快速托举元宝的腾讯身上,尤为明显。一名元宝员工告诉我们, 截至2025年底,仍有约7成用户将DeepSeek选为元宝的默认模型 ,而非腾讯自己的模型混元。 “2026年,元宝的一个重要目标就是摆脱DeepSeek依赖,让腾讯自己的搜索品牌形成一定的用户心智。”她告诉我们。 当然,这也势必伴随更激进的模型研发目标。一名混元研究员告诉我们,2026年4月23日发布的新模型Hy3 preview,腾讯设定的目标是跟上第一梯队。 第一梯队的名单,则是DeepSeek和阿里。 对于牌桌上更早进场的其他玩家而言,经过一年的调整、加速,几乎所有厂商都在模型赛道,找到了差异化的身位: 字节和阶跃星辰聚焦全模态;月之暗面和智谱打磨Coding和Agentic能力;MiniMax保持语言模型不掉队的同时,突出视频生成模型的优势。 “每个厂商都沿自己的路线走。”Jason告诉我们,“这条路的终点可以是AGI、是泼天财富,但绝对不会是包括DeepSeek在内的任何一家公司。” 2016年,埃隆·马斯克和OpenAI CEO山姆·奥特曼有过一段公开对话。他提到:“人们有时会认为技术每年都会自动进步,但其实并非如此。 只有聪明的人们拼命努力去改进它,技术才会进步。 ” △埃隆·马斯克(右)与山姆·阿尔特曼(左)的对谈。图源:YouTube@Y Combinator 2025年初,DeepSeek恰好成了那个吹哨的聪明人。2026年,努力的聪明人会更多。 (文中受访者均为化名) 欢迎交流!

36kr.com · None · tech

文|周鑫雨 编辑|杨轩 一句话介绍 Buzzy(https://www.buzzy.now/)是AI内容创作公司“感知阶跃”旗下的视频编辑Agent平台,主要面向C端内容创作者和中小型商家。 好比“视频版的PhotoShop”,用户只需下达自然语言指令,就能驱动Agent对视频进行背景去除、光线修正、产品替换、背景/视角更改等编辑操作。 团队介绍 “感知阶跃”创始人兼CEO Ella Zhang(张诗莹),曾在苹果、Oculus VR、Google负责核心产品。 在苹果期间,她曾为AirPods产品线创始团队核心成员,负责产品的系统集成和全周期设计落地,包括音频产品的架构设计、元器件选型、原理图绘制、版图设计、验证以及大规模生产。 此后,张诗莹又在Google担任AR产品的系统架构师,负责Glass、Reflector等产品的算法和架构研发。 “感知阶跃”其余核心成员,来自Adobe、小米、商汤等公司。 融资进展 近期,“感知阶跃”完成了新一轮融资, 金额超过2000万美元,领投方为Redpoint(红点创投)。 深渡资本担任本轮独家财务顾问。 产品及业务 在张诗莹看来,随着视频生成模型性能的发展,生成类的工具赛道,已经逐渐“红海”。她将市面上的视频创作工具,大致分成了两类: 一类是“画布型”产品,优点在于可以通过手动控制,保证生成结果的质量,但缺点是对大多数用户而言,使用门槛高;另一类则是向用户提供预制的workflow和模板,劣势在于不够灵活,同时,idea不够创新。 “用户更倾向于一次性生成整段视频,并通过不断迭代修改的方法来修到完美方案。所以一个指哪打哪的视频编辑器就变成了刚需。” 当下,由于视频的连贯性以及模型理解能力的局限性,用户很难通过Chat的方式,对视频进行换背景、换人物、消除某元素的“局部精修”。大多AI编辑器会改变整个画面,接近于重新生成。 近期, “感知阶跃”上线的新产品Buzzy, 就是一款AI视频编辑器,让用户可以 像P图一样便捷地“P视频”。 只需要通过Chat,Buzzy就可以对视频完成去除背景路人、修正光线、替换产品、合拍、更改背景与视角等操作,真正实现局部精修。 △背景路人去除。左:去除后;右:去除前。图源:受访者供图 △改变光线。上:改变前;下:改变后。图源:受访者供图 △拍摄角度改变。左:改变后;右:改变前。图源:受访者供图 做到对视频的局部编辑、维持其余部分,技术门槛并不低。张诗莹告诉我们,局部编辑要求视频模型有更高的视频和语言理解能力,“首先它要识别修改的部分到底是什么、在哪里出现,其次它还要准确理解用户的意图,比如prompt中的梗。” 为此,“感知阶跃”基于RLHF(人类反馈强化学习),训练了一个小模型,来增强Buzzy对视频编辑的理解。 与此同时,Buzzy也被设计为一个能够 自主学习用户审美和品味 的Agent。 Buzzy上线了一个“类OpenClaw”的Bot。用户可以通过扫码,直接将Bot接入Telegram和WhatsApp中。 通过向Bot分享TikTok、YouTube上的视频链接,Bot会自动分析用户的视频偏好和品味,基于该视频风格24*7自动全网搜索灵感素材,并将该风格沉淀为Skill。 风格沉淀。图源:受访者供图 此前,自2021年成立以来,“感知阶跃”经历了两次内容创作产品迭代: 在Midjourney、Stable Diffusion等文生图产品爆发之前,“感知阶跃”就基于GAN(生成对抗网络),开发出了第一款面向国内B端电商客户的AI模特图生成平台ZMO.ai,并在后续将落地场景扩展到商品图设计、编辑等场景。 ZMO.图源:受访者供图 占据先发优势的ZMO.ai,MAU一度达到了700万。 2024年起,视频生成赛道随着Sora的发布,迎来了一个小爆发。在风口中,“感知阶跃”叫停了ZMO.ai,并在2024年4月上线了涵盖图片、视频的内容创作平台Creati。 相较于聚焦电商、广告图片生成和编辑的ZMO.ai,Creati将内容创作扩展到了视频领域,包括文生视频、基于视频模板二创等功能。 与此同时,它为用户提供了移动端产品。不少非专业内容生产者,就可以直接用手机拍摄素材后,直接在App端完成内容的创作、编辑和发布,而非辗转导入电脑。 “用户对AI生视频的需求,比图片更刚一些。”张诗莹提到,“在传播效果上,无论在社媒端,还是广告端, 视频都比图片更能吸引注意力。 与此同时,用户拍视频的难度,比做图片高很多。” Creati。图源:受访者供图 同样转变的还有目标用户。ZMO.ai的主要客户,是国内B端的电商、广告商。但很快,张诗莹发现,即便ZMO.ai用户增长很快,但流量并没有转化为实际的付费。 核心原因在于,其一,“大B”客户的结款周期过长;其二,图片的创作成本比视频更低,因此 用户对图片的付费意愿不够高。 Creati则是一款面向“大C小B”的产品:C端内容创作者,以及中小商户。张诗莹告诉《智能涌现》, “大C小B”是付费意愿最高的人群, “更大的B端企业倾向于自研工作流”。 上线一年,Creati的全球用户量就突破了千万级别。 产品ARR(年度经常性收入),一度达到了2000万美金。 商业模式 靠用户订阅,覆盖Token消耗成本,是目前AI软件的主流商业模式。但张诗莹认为,订阅是SaaS时代的商业模式, Agent时代的商业模式应该为效果付费,而不应该为成本付费。 她告诉《智能涌现》,现阶段,用户依然将Agent视作工具,而非创造价值的人。 当Agent可以覆盖内容生成、发布、投放、A/B Test、效果分析、二创等创作全流程,Agent的商业模式,应该与人类Agency越来越相似,“收费模式不会是订阅,而更多会采用分佣的形式。” Founder思考 大多数非专业用户的内容创作场景,主要在Mobile端,而非PC端。 不少商家、非专业内容创作者,习惯用手机拍摄获取商品图、短视频等素材。但矛盾的是,创作工具往往集中在PC端。这就会导致内容创作链路的断裂。 因此,无论Creati,还是Buzzy,我们都向用户提供了MobileApp产品,让素材的获取、内容创作和编辑、发布,都可以在手机上完成。 当AI生成视频技术足够成熟,应用层能做的事只有两块:内容生成之前,以及内容生成之后。 内容生成之前,应用层解决的是产生创意的问题;内容生成之后,需要解决的是“怎么改”的问题。 应用层不应该去做模型层的事,因为模型一定会变得足够好。 当下有很多“套壳”视频模型能力的产品,无论是“画布”,还是workflow,解决的都是模型能力不够强的问题,比如“抽卡”、视频生成长度有限。 但未来,模型层一定会解决生成质量和长度的问题。应用层的机会,就在于解决生成环节之外的问题。 未来,Skill会成为可以交易的资产。 Skill本质上是用户沉淀下的品味、认知,以及工作流。就创作领域而言,人的审美和品味,以及掌握找素材的技能,都是有价值的。 因此未来,卖Skill可能会成为一种商业模式。 新的时代,应该独立开发新的产品,而不是在旧产品上加上一个新入口。 Buzzy和Creati是两代完全不同的产品。Creati聚焦生成,Buzzy聚焦生成后的编辑。不同代的产品,会形成不同的用户心智。 所有的Go Viral(走红)都很偶然,产品不应该过分追求Go Viral。 很多用户刚需,其实不具备在社媒上Go Viral的潜质,比如PDF Editor,但它们的用户量非常大。 根据我们的经验,能够Go Viral的产品有几个特点:第一,产品形态、设计比较创新;第二,实用,只有解决了用户的痛点,他们才愿意自发传播;第三,降低用户生产有趣内容的门槛。 欢迎交流!

36kr.com · None · tech

访谈|邓咏仪 周鑫雨 文|周鑫雨 编辑|杨轩 乍一使用,你很难给Ribbi一个准确的定义。 若说这是一个多模态内容创作工具,Ribbi能做得不止于此。比起一个“死”的工具,Ribbi更像一个可以自动管理创作全链路的“人”。 它能将用户的创作流程,自动沉淀为Skill;也能监测社交媒体的数据表现,总结复盘,并 自动对后续的创作进行优化。 Ribbi官网首页。 对绝大多数创作者而言,这又是一个使用体验极度“陌生”的产品。区别于Figma、Lovart等设计产品,Ribbi没有醒目的画布,所有的创作、编辑交互,都集中在一个小小的对话框中。 而与你对话的Ribbi,被设定为一只个性十足的“青蛙”:爱吐槽,偶尔还能爆点粗口。 与Ribbi的对话。 这款有些“怪”的产品,却在 上线封测一周内,收到了全球4万多用户的使用申请。 用户群从上线第一天的20人,快速扩张成了20个几乎满员的大群。闲鱼上,Ribbi的内测码,一度被炒到了200元。 “我们上线Ribbi,本来是为了找100多个种子用户做封闭测试,验证PMF(产品-市场适配率),都没正式开始做营销和投放。”Ribbi创始人兼CEO Robin告诉我们,用户通过口碑传播的裂变速度,远超他的预期。 在4月初和《智能涌现》的交流中,Robin的嗓子已经哑了。半个月内,他见了多家投资机构,官方Linkedin的私信箱,也堆满了合作邀约。 毕业于工业设计专业,Robin做过4A和品牌企划,后续还在几家头部大厂,主导多款明星AI产品的创作功能设计、创意Agent落地等工作。 创业前,Robin就一直在探索:如何让创意实现的过程更简单。他发现, 市面上的创作工具,都彼此独立,用户创作的上下文互不相通。 这就导致,当用户要创作内容,每涉及一个环节,就要切换一款工具,还需要重新和工具对齐创作的需求。 “市面上不少AI设计工具,仍然把内容创作视作单点环节的拼接。但事实上, 创作应该是涵盖创意生成、内容生成、发布、数据监测、复盘、优化的完整链路 。”Robin告诉《智能涌现》。 基于这一认知,2025年末决定创业时,Robin做了不少“非共识”的决定: 不做Multi-Agent(多Agent架构)的产品 ,因为不同专家Agent在传递过程中,会造成Context的损耗; 不做单点的内容生成, 而是用一个Agent,打通创作、发布、效果监测、复盘优化等创作中所有的链路; 不做“画布类”的产品, 而是用Chat作为UI,给Agent更多的自由度; 自训VLM(视觉-语言模型)、自研名为Contxt Layer的Agent架构, 沉淀创作经验和反馈,让AI自主进化。 这一切设计的最终目标,Robin告诉我们,是让Ribbi不仅仅局限于一个“工具”,而是成为理解完整创作闭环的“人”。 以下,是Ribbi创始人兼CEO Robin关于Agent创业的20条“暴论”: 🐸 大厂中,业务、模型和顶层之间的对齐是最困难的事,除非已经有业内共识。 比如,当Coding成为业内共识,不管是大厂,还是“AI六小虎”,都不约而同朝这个方向冲。 但在看到Taste的确切价值之前,为审美、品味构建模型,是大厂不愿意做的。只有当视觉创意生成从非共识,变成共识,才能激发更多大厂和顶尖人才参与进来。 🐸 一旦团队变大,对Context的折损就会增加。 大厂的基模能力很强,但模型团队对业务的认知有偏差。一旦团队变大,每个团队之间信息传递的过程,会折损大量的Context。 这也是Ribbi团队只有6个人的原因。我们只有3个程序员,他们现在是全栈设计师、全栈工程师,什么都能开发,并且可以做得很好。 这就是Claude Code带来的代码生产力的进化。 我相信,Ribbi会带来内容生产力的进化。 🐸 很多AI产品都在虚假宣传。 我们在宣发的过程中搞了很多“抽象”,比如“72小时ARR破亿”“一夜百万用户”,本质上是为了讽刺很多AI产品的虚假宣传。 只是我们讽刺做得不够好,很多用户信以为真了(无奈笑)。 我们在X上的CEO账号也是虚假的,根本没有“Robin Bisset”这个人。账号上的很多内容,包括Robin的外国人形象,都是Ribbi生成的。 △Ribbi的虚拟老外CEO。图源:X 🐸 AI行业正在逐渐“币圈化”。 我花了很长时间才研究明白Harness。圈内很喜欢造概念,又是“马鞍”,又是“驾驭”,搞得很玄乎。 其实Harness很简单,就是一个脚本,或者一个workflow,让模型不偏离目标,更好地发挥价值。 在Harness这个概念出现之前,依靠框架或者Agent去优化AI执行任务的上下文,本身就是一个共识。如今行业只是把这件事抽象了出来,给了一个核心定义。 🐸 画布类的产品,把模型的可能性“锁死”了。 我们没有把Ribbi做成画布类的产品。画布类的AI产品看起来交互很酷炫,能让投资人眼前一亮,专业用户使用起来也很顺手。 但它们有一个“致命伤”:把模型的可能性提前“锁死”了。因为画布的本质,是将工作流拆成一个个节点,模型只能沿着这条路径走。 我们一直以来的判断是, AI时代的UI应该是容器化的,而不是功能化的。 产品应该给AI创造一个容器,让它可以自由决定调用什么样的工具、怎么组合工具,甚至按照什么样的顺序执行任务。 🐸 具身智能成熟之前,Chat是AI最好的UI。 在互联网时代,我们就习惯通过Chat完成信息的传递,比如微信上可以拍图片、拍视频,也可以发链接、小程序。 在我看来, Chat是一个足够简单,并且灵活兼容一切的容器。 比如豆包DAU跑得很快,其中一个原因在于,它的移动端App设计得很轻量。用户不需要打开新的对话框,只要在一个session中疯狂Chat就能生图、生视频。 它将用户的交互和AI的行为,统一在一个非常简单的框架中。 用户认为Ribbi好用的点,就在于他们可以随时把X、Instagram、Pinterest等平台上的素材,采集、保存在Ribbi中,底层的AI再自主学习其中的审美。这其实就是人与AI Chat的过程。 作为AI产品经理,我非常讨厌用复杂的交互去操作AI。AI应该很聪明,不用我时时刻刻盯着,就把活干了。当你产品的交互门槛、使用门槛足够低的时候,自然而然就能吸引更多人。 🐸 真实的创作需求从来不是单一维度的。 很多人会疑惑:为什么要往Ribbi里塞这么多功能(图片/视频/音乐创作、社交媒体监测、编辑器)?这样会不会导致定位模糊,或者每个功能都做不深? 我们一直认为,真正的创作需求从来不只有单一维度。比如一条抖音视频的制作,就涵盖了想选题、写文案、写脚本、生成分镜、配音、剪辑、编辑封面、发布、数据监测、复盘等流程。 这是一个完整的链路。没有All in one的工具意味着,用户需要切换不同的工具,重新对齐创作的上下文。 人一定是懒的动物。 没有用户希望做一个产品、完成一个环节,就换一个模型、换一套工具。比如做一个视频,要先用ChatGPT生成文案,再用Gemini生成分镜,最后还要用剪映拼接视频,是很麻烦的。 我们设计Ribbi功能的出发点,不是为了把功能做全面,而是为了 让创作链路的Context完整连通。 🐸 Ribbi构建Agent的核心在于自主进化。 互联网平台的核心是UGC, Ribbi的核心是AGC,Agent Generated Content。 创业前,我就在寻找可以让“Agent自主进化”落地的场景,创作就是一个很好的答案。 首先,Taste会自主进化,这就是我们设计Pond和训练VLM的原因。 其次,Skills也会随着用户的使用自主进化。用户在使用Skill地过程中,会产生新的场景、需求和Context,这些Context就会凝练成专属用户个人的Skill。 这些个人Skill,都会经过Context Layer中的Skill Agent的评估、去重、去隐私化,再贡献给平台全端。因此,平台的Skill也会循环进化,用户使用越多,Skill就越多,能力也越强。 最后,用户的创作也会自主进化。我们建立完整创作工具的原因,就在于用户的创作是连续的过程,涵盖搜索、发现素材、生成内容、编辑优化、发布到社媒、数据监测等流程。 社交媒体,是Agent在线进化落地的核心训练场, 将作品发布到社交媒体,是Agent与真实世界的一种交互。监测数据表现后,Ribbi能够自主迭代和优化创作路径,交付更好的结果。最终,平台就能够形成一个自主进化的创作闭环。 🐸 Multi-Agent本质上是对模型能力的低估,产品要让Agent更自由。 Multi-Agent架构中,大部分专家Agent的底层能力,都来源于Claude。既然底层模型一样,为什么还要通过提示词工程,把模型拆分成不同的Agent? 提示词工程,本质上是对模型能力的约束。 与此同时, 任务在多层Agent架构中的传递,都会造成Context的损耗。 我们做Ribbi的时候,核心观点是:让Agent足够自由。 Agent要在一个非常丰满、质量足够高的Context中,发挥自己的能力。因此, 我们的核心架构其实是一条Single-Agent链路。 除此之外,我们构建了一个中间层, Context Layer。 它由Memory、Taste 、Skills等不同层级构成,每一层都有对应的Agent。它们的作用不是执行任务,而是辅助Single-Agent收集Context。 这样做的好处是 Single-Agent对上下文的感知不会折损,Token的损耗也会降低,这是我们的核心优势。 与此同时,其他Agent又能补足一些上下文信息。 🐸 Ribbi不是OpenClaw的“套壳”,大家只是对Agent有相同的想象。 2025年11月,那时还没有OpenClaw,我就在公众号上写了一篇文章,构想了Agent发展的路径:第一,Agent会从被动,发展为更主动;第二,Agent的Context会不断自我进化。 这两点在OpenClaw上得到了具体的体现。但我们的产品定义和OpenClaw非常不一样: 首先我们提出了Context Layer,为Agent提供了很干净的Context;其次我们不希望为用户提供一个部署门槛很高的产品;最后我们整体的功能链路都是为内容创作服务,所以Ribbi提供了100多个可以自由组合、循环进化的Skills。 我相信世界上很多人对Agent的想象是一致的。OpenClaw很多的底层思考来源于Claude Code,我们的核心想象也出自Claude Code。 Claude Code为Agent创造了一个非常简洁的系统: Coding是Agent的环境,Function Call是Agent的手。 Claude Code的出现让任何人可以成为全栈工程师,Ribbi的出现是让任何人能成为全栈的创作者。 🐸 我们不把Ribbi定义为“工具”,而是理解完整创作闭环的“人”。 首先,Ribbi是一个可以自我进化的内容引擎。其中,“Pond”是它的审美输入端,Skills是流程的沉淀,主动发布和数据监控是内容创作的最后一公里。 其次,我们希望Ribbi有活人感。如果你和Ribbi对话,就会发现ta是一只嘴上嘟囔、但会认真干活的青蛙。 🐸 Taste is all you need。 创作过程中最难用语言表达的,就是审美和品味。 为了解决审美建立的问题,我们为Ribbi设计了一个叫做“Pond”的板块。 用户在浏览Behance、Pinterest等设计平台时,可以通过Ribbi插件,将喜欢的设计采集并保存到Pond中。通过对Pond中资产的学习,Ribbi可以建立对用户审美的认知,未来创作的设计也会更符合用户的偏好。 除了学习用户个体的审美,Ribbi也会凝练平台所有用户的审美,成为平台共识。这么做的意义在于,让用户在不输入Prompt的情况下,也能获得高质量的设计。 支撑Ribbi学习、积累、迭代用户审美的核心,是我们基于开源的千问8B小模型训练的VLM(视觉-语言模型)模型。 它可以将图片、视频转化为文本Context,并将Context压缩进用于构建审美的Taste层,再基于Taste层生成新的设计。 对审美的不断沉淀,也是Ribbi产生用户粘性的核心。平台上,用户不断贡献新的审美Context,这些Context都会沉淀为Ribbi对你审美的认知。 在Pond中可以上传个人资产。 🐸 不能让模型,不知道你的操作。 目前,我对Ribbi主要有两个不满意的地方,一方面,稳定性还不够,包括性能和服务器、API负载; 另一方面,创作流程还不够灵活。因为没有编辑器,所以诸如“把字幕往上挪一点点”等简单调整,都需要用户去Chat。因此我们需要上线一些后编辑的功能。 但迭代的卡点在于,我们必须让底层模型知道用户的所有操作,对齐用户所有的上下文。只有这样,在后续创作过程中,Agent才能记住用户的偏好。 让模型感知到用户的后编辑,目前来看还有很高的开发门槛。 🐸 Ribbi的壁垒在于对技术的想象。 我们自主训练的VLM模型,目前多多少少算壁垒。当然,技术壁垒很容易被超越,Claude发布一个新模型可能就可以做到。 Ribbi的核心价值在于,我们不仅希望只做一家应用层的公司,而是在未做模型层的探索。训练VLM是现阶段探索的开始,包括中间层Context Layer的设计,都是基于我们对行业的Know-How和共识去完成的, 这些事说出来其实不难,难的是把它想象出来。所有的事最重要的就是想象,而 我们是第一个把技术领域的AI自主进化想象、并且落地的团队。 而且我们对Agent的认知一直在往前走,这是我们的想象保持领先性、建立壁垒的前提。 🐸 把Token消耗转化为扣积分的商业模式,不够诚实清晰。 我们的商业化会做得比较诚实。虽然模式还没完全确定,但一定不会是积分制。 △Ribbi会显示每个环节消耗的Token量。图源:作者试用 不少AI产品会采用积分发放的方式。个人觉得挺绕,用户还得把积分转化为Token消耗量,不够清晰。 也有平台会告诉你,“充值一次,无限Token”,但实际上用户天天在排队。这样的商业模式不诚实,而且平台还会亏本。 🐸 好的内容平台应该有广告。 我最近也在研究一些好的内容平台的商业模式。YouTube几乎是免费的,因为有足够多的广告商在视频中分发贴片广告。 广告的好处在于,让平台把用户的成本转嫁给广告商,同时也让创作者通过广告,有直接的收入,从而激励他们在平台上的创作。 🐸 Ribbi的北极星指标,是Skill的增长。 目前,网站上有20多个Skill,其实我们内部已经有100多个Skill,比如一键消除、做PPT等技能。没有放出来的核心原因在于,我们的设计师对审美的要求很高。 所以我们的北极星指标是不断裂变出更多高质量、高审美的Skill。 并且我们不希望Ribbi成为一个工具集。 工具聚合网站,更像是一个个的小程序,它们之间是相互独立、互不连通的状态。 但我们的Skill会在同一个Single-Agent中连通。这样的好处是Agent可以在接管创作全流程中,灵活串联不同的Skill。 另一点,我也希望Ribbi上的工具数量能不断增长。目前我们的100多个Skill,靠的是100多个工具的不同组合。一旦我们的工具数量扩大到1000多个,Skill会进化产生我们想象不到的价值。 △Ribbi上沉淀的Skills。图源:Ribbi官网 🐸 应用公司探索模型层是有必要的。 只有自己亲身训练和使用,才能知道当下模型的限制,以及实现AI自主进化的逻辑路径。我们现在实现AI自主进化的路径,是基于Context实现的。 但未来, 自主进化一定会在模型层上实现 ,并且会有非常多的人探索。自己训练模型,是为了提前积累经验。 🐸 我们不把自己定义为创业团队,而是独立开发者的组织。 我们不会像某些友商那样,不断花钱买量、烧各种补贴。我们不想做一家为估值而奋不顾身的公司。 融资当然也很重要。你要确保账上有足够的资金,去支撑研发-获得用户反馈-迭代的循环。 我们现在正在推进下一轮融资,并非是有意的,而是如今Ribbi获得的用户声量,远超我们的预期。现在的状态,有点像时代推着你往前走。 我们收到了很多投资意向书,但我希望愿意投资我们的机构,是真正对AI有价值判断的、长期看好AI的自主进化,而不是出于FOMO(错失恐慌)。 🐸 我立志成为硅基生命的垫脚石。 我们一直在找一个符号表达“自主进化”的理念。Ribbi LOGO是一只青蛙的原因,是因为蝌蚪进化为青蛙是一种非线性的变态发育,“Ribbi”就是呱呱叫(ribbit)的拟声词。 我相信AGI一定会到来。无论是训练模型,还是做Context Layer,这些看起来“很重”的事,目的都是为了加快AGI到来的进程,哪怕只留下一点点痕迹。 假设某一天,某家模型厂商实现了AI的自主进化,即便功不在我,我愿意贡献我们对Context Layer自主进化的Know-How、开源我们的技术架构,帮助模型厂商训练更好的自主进化模型。 欢迎交流!

36kr.com · None · tech

文|周鑫雨 编辑|杨轩 一句话介绍 成立于2025年6月的“涌跃智能”,是《智能涌现》曾报道过的AI创业公司 。 其旗下产品Loopit,好比“可以玩的抖音”,是一个面向C端的AI互动内容平台,覆盖可交互内容的创作、分发和消费。 基于自研的“AI Coding+多模态生成”的互动引擎,用户既可以与社区中的内容互动,也可以创作、发表支持图像、语音、视频、3D等全模态可交互互动内容。 团队介绍 “涌跃智能”创始团队,主要出身于“AI六小虎”百川智能的核心团队。 “涌跃智能”联合创始人兼CEO陈炜鹏,前百川智能的联合创始人兼大模型负责人,主导了BaiChuan 1-4等大模型的训练。 此前,他的职业路径横跨搜索、推荐与社区产品——从搜狗的搜索与信息流,到Soul的内容社区,一直围绕分发与内容形态演进展开。 融资进展 近期,“涌跃智能”完成了新一轮融资,金额为5000万美元。 该轮融资由全球头部游戏厂商Garena领投。 本轮投资阵容还包括 经纬创投、蓝驰创投、渶策资本、柏睿资本等 机构,高鹄资本担任独家财务顾问。其中天使股东经纬创投为第4次加码。 2026年以来,“涌跃智能”已经连续完成了3轮融资,累计金额近1亿美元。此前,投资方还包括天使股东耀途资本、钟鼎资本等机构。 产品及业务 2026年才过了1/3,“涌跃智能”就连续完成了三轮融资。资本市场火热,背后是Loopit所代表的AI应用赛道的兴起: AI互动式内容平台 。 在Loopit创作端,用户可以通过文字输入创意,生成可互动的mini-App,也可以基于其余用户创作的内容进行remix(魔改); △Loopit支持复杂互动内容的创作。图源:受访者供图 在消费端,产品采用单列Feed流进行分发,将互动体验封装进统一内容卡片中,降低用户参与体验的门槛。 △左:Loopit创作后台;中:Loopit首页Feed流;右:Loopit内容分区。图源:产品界面 在众多互动内容产品中,Loopit是增长最为迅猛的产品之一:正式上线(2026年2月10日)不到24小时,用户制作互动内容就在X上被马斯克评论转发; 《智能涌现》独家获悉,上线两个月以来, Loopit的全球注册用户规模达到了近200万 ,其中北美用户超过半数; 产品次日留存从早期的30%,上升到超过50% ,用户创作率达到30%。 实现用户新增、留存和消费时长的同时增长,陈炜鹏告诉《智能涌现》, Loopit核心做对了两件事 : 一方面,不断拓展互动内容的体验边界;另一方面,持续降低互动内容创作的门槛。 围绕增强“体验”,近期Loopit拓展了 “联机内容”的创作 ,支持多人互动内容的生成和发布。 陈炜鹏观察到,近几年来,用户对“体验”有个更深的需求:“人与内容的关系,从人观看内容,发展为人与内容互动,现在又扩展到人和人之间通过内容产生联系。” 比如,在Loopit平台上,有用户生成了一个全网聊天室,支持多人视频连线;也有网友制作了多人可以参与的闯关游戏。 △用户生成的联机闯关游戏。图源:作者体验 增强内容体验的同时,在陈炜鹏看来, 底层技术足够通用、内容生成的门槛足够低 ,是激发用户创作欲、���足用户探索欲的前提。 陈炜鹏认为,支持 “许愿式创作”,是驱动用户创作的核心之一 。即便用户尚未形成成熟的创意、没有创作目的,也能通过描述大致的创作需求,生成互动内容。 比如,用户只需要输入“90年代TV”,Loopit的创作引擎也能在几分钟内完善创意,生成一个可以调频道的互动内容。 △许愿式创作。图源:作者体验 Loopit背后的互动内容创作引擎,是团队自研的Coding驱动多模态生成架构,支持涵盖语言、图片、语音、视频、3D等全模态的互动内容生成。平均经过3轮对话,用户就能创作出模态、交互形式较为复杂的内容。 据陈炜鹏介绍,这一套架构,本质上是一个通用的Coding Agent与一个通用的多模态Agent的组合,“这套技术实现的门槛非常高,Coding和多模态的生成都在互相约束”。 可以看见,互动内容平台,已经成为当下最火热的AI赛道之一。陈炜鹏认为, Loopit的差异化在于,产品更为通用。 “不少产品或聚焦在小游戏、社交等具体场景,吸引的也是某一圈层的用户。”他不希望在早期就将Loopit的定位限定“死”,“我们把底层能力做得足够通用、创作的门槛降到足够低,是为了让每个普通人的创意涌现出来。” 商业模式 陈炜鹏对我们坦言,现阶段对Loopit而言,谈商业化还为时尚早:“ 过早讨论一个社区型产品的商业化,是不专业的、不懂社区的行为。 ” 在陈炜鹏看来,产品仍在快速演进阶段,未来的商业模式很大程度上会与用户结构深度绑定,而当下的任何设计,都未必能完全匹配未来。 团队更关注的是另一件事:用户是否愿意在Loopit上持续停留,以及是否在这里产生足够深的体验。“只要用户的时间和体验深度成立,商业化的答案是可以被自然推导出来的。” Founder思考 过去分发的是信息,未来分发的是体验。 过去用户和内容的关系是观看,今天的关系变成了体验和参与。用户参与内容的形式又可以分成两种:一种是人参与内容,另一种是人与人通过内容产生连接。 AI时代,做70分但通用的产品,别做90分但垂直的产品。 做90分的产品是有代价的,你会过早收敛产品的形态。在技术不完全ready的情况下,做一个90分的垂类产品会错失未来智能增长红利。 大部分Agent看起来相似,真正拉开差距的是底层抽象能力。 底层抽象能力不仅决定了系统当前能完成多复杂的任务,也决定了未来是否具备持续扩展和演化的空间。 过早把产品边界定义得过于狭窄,往往会与未来技术的发展脱节。 在互动内容赛道中,如何定义边界、从哪些人群切入,本身仍然没有共识。 不少产品选择聚焦单一场景,例如小游戏或小发明。这种路径对技术能力的要求更集中,但也意味着对内容深度和完成度的预期更高,边界更容易被锁死。 Loopit则选择另一条路径——以“Make everything playable”为核心,构建一个通用的UGC表达平台。我们更看重底层能力的通用性,以及尽可能放大创作的可能性。 对于内容平台而言,真正重要的不是某一个具体场景,而是能否持续激发创意的涌现,从而不断产生让用户产生“Aha Moment”的内容。 产品内容越复杂,内容入口就要越简单。 很多早期用户规模不小的产品最终做不大,除了市场空间限制,一个重要原因是入口过于复杂。 好的内容平台往往遵循同一原则:把复杂性封装在内容里,而不是暴露在入口上。 每一代优秀的产品设计,本质上都是技术驱动下的抽象升级。例如Feed流的出现,让用户始终在同一个认知框架内完成消费与切换,从而降低使用成本、提升分发效率,并放大平台的整体规模。 在大模型时代,这一逻辑进一步成立:产品不再由功能定义,而是成为承接能力涌现的载体。 欢迎交流!

36kr.com · None · tech

文|王毓婵 编辑|杨轩 当一家机器人公司决定做AI大模型平台和开放生态,它会给行业带来什么? 上个月,智元刚刚跨过“机器人量产下线一万台”的门槛。4月17日,这家由前华为“天才少年”彭志辉与前华为副总裁邓泰华共同创立的机器人公司在合作伙伴大会上,花了大量的时间和篇幅介绍软件上的新产品。相较之下,硬件的篇幅反倒很少。 智元推出了六大AI模型、七大生产力解决方案,并首次公开AIMA(AI Machine Architecture)全栈生态技术体系。这些软件产品将与硬件机器人一起,组成智元“一体三智”的架构。 所谓“一体三智”,“一体”指的是机器人本体;"三智"则包括:运动智能(基础智能,承担物理载体的执行器功能);交互智能(高阶智能,为情绪价值入口);作业智能(高阶智能,提供劳动生产力)。 “智元并不仅仅只是一家机器人公司,更是一家具身智能公司。如果没有跟本体深度耦合的智能,机器人只是一个工具,并不是真正的具身智能。”彭志辉说。 如何让机器人不止会按照写好的程序跳舞、翻跟头,而是在工业、商业和家庭环境里自主承担工作,关键的变量就在于机器人大脑。现在,智元希望做这个“孵化机器人大脑”的平台。 智元联合创始人、总裁兼CTO彭志辉 一口气推出六款AI模型,智元要做“开放生态” 智元创始人、董事长兼CEO邓泰华宣布,智元将于今年推出的六款AI模型,覆盖“一体三智”中的运动智能、交互智能和作业智能。 运动智能方面, 将推出两大基座模型:支持感控融合的全身运控基座模型(通过环境感知实现自适应运动控制),以及生成式运控基座模型(以多模态交互实时生成任意动作,无需预编排)。 交互智能方面, 在已规模应用的WITA大模型基础上,三季度将发布行业首个端到端具身多模态交互大模型WITA Omni 1.0。该模型保留对话情感、语境、音调、环境等信息,实现自然拟人的情感交互表达,支持中途插话、打断、纠正。 作业智能投入最大、算法人才密度最高。 智元近期已发布融合大小脑的GO-2模型、动作世界模型GE-2、开源数据集AGIBOT WORLD 2026、仿真平台Genie Sim 3.0及Genie Studio 2.0。第三季度,还将推出GO-3模型,融合ViLLA架构和世界模型架构,具备了规划推演能力,也具备复杂任务的推理执行能力,数据规模达GO-2的数十至百倍。 邓泰华向台下的产业界合作伙伴们展示了一张图——具身智能发展的XYZ曲线。 具身智能发展的XYZ曲线 X曲线(2022年至2025年)为开发尝鲜期,完成从原型到规模量产的跨越。2023年首款人形机器人发布,完成技术可行性验证;2025年实现5000台量产,机器人从"展品"变成"商品",机器人能“动"起来了。 Y曲线(2026年至2030年)为部署成长期。2026年3月智元机器人万台下线,交互智能与作业智能规模化落地,机器人生产力持续逼近人类水平。 Z曲线(2030年及以后)为部署普及期,具身智能涌现时刻到来——机器人在制造、物流、服务等重点领域的生产力全面超越人类,学习效率和进化速度极度领先,群体智能开始涌现。 按照智元的规划,公司三年走过 X 曲线,实现首个十亿营收;五年走过 Y 曲线,完成万台部署,实现百亿营收;八年迎来 Z 曲线,与全球生态伙伴共创,实现规模化从 1 到 N 推广。这个规划被称为“358宏图计划”,而2026年作为Y曲线的开端,被称为"部署态元年"。 总裁兼CTO彭志辉说,智元判断2026年为突破点,是因为“有三个要素在今年同时成立”——大模型的突破;机器人的本体和数据飞轮。 首先,在大模型方面,模型已经让机器人开始能够看懂世界、理解世界。更重要的是这些模型不再是孤立的算法,而是形成了开源的生态,整个加速了机器人技术的迭代。 其次,在机器人本体方面,机器人已经实现了大规模量产,并可以实现7×24小时的稳定运行。 最后,在数据飞轮方面,彭志辉说:“数据飞轮部署的机器人越多,飞轮转得越快,采集的数据也越多,模型的训练能力也就越强。这个飞轮一旦转起来,就将产生指数级的网络效应,智元的判断是2026年飞轮也会开始加速转动。” 基于这样的判断,智元接下来的思路是——本体量产、模型迭代、开源数据,开放生态平台。彭志辉称之为“一条最难,但是也最有复利的路径”。 缺少数据的行业,和重复造轮子的竞争对手 机器人公司在2026年尝试与竞争对手一起走向开放,某种程度上也是资源缺失导致的必然。 2026年,大语言模型和视频生成大模型都在疯狂烧Token,而具身机器人行业却正在经历“无Token可烧”的局面。大模型能像人一样读书,而具身智能要去真实的世界里摸爬滚打才能获取数据——数据的匮乏成为了卡住全行业的瓶颈。 在合作伙伴大会举办的前一天,智元机器人旗下觅蜂科技先发布了一个“一站式物理 AI 数据服务平台”,它的定位是面向其他机器人公司的To B数据服务平台。 “谁是AI时代最大的Token消费者?不是聊天软件,不是代码助手,也不是图片视频生成器——而是具身智能体。”彭志辉说,“具身智能体的任务空间横跨数字世界与整个物理世界,一个在物理世界中持续运行的机器人,每时每刻都在消耗Token。” 机器人已经量产了,大模型也已经造出来了,现在还差“数据飞轮”。 “GPT5用了100万亿tokens的训练语料。1token约等于0.75个英语单词,如果一个正常人一分钟能说150个词,这个语料级就等于一个人要说100亿个小时才能说完。”觅蜂科技董事长兼 CEO 姚卯青说,“但具身智能不一样。今天,全世界的高质量数据汇聚在一起,可能也只有50万小时的规模。” 在大会后的采访环节,彭志辉再次对包括智能涌现在内的媒体谈起“数据荒”的问题。 “具身智能的数据缺口还是比较大,现在对行业来说是很大的瓶颈。而且它采集要求高,因为你要在物理世界产生真实的接触,统计摩擦力、重力等等各种数据。”彭志辉说,“所以我们一直在推出数据采集的产品和商业方案,同时积极建设各种开放的数据生态。” 而且,行业至今仍然没有形成标准化,这导致了重复造轮子的问题。 彭志辉的另一个身份,是工信部人形机器人与具身智能标准化技术委员会副主任委员。“国内有上层引导,我也参与标准建设,(希望)大家能合心齐力推动发展。”彭志辉说,智元一方面会继续扩大本体部署,让更多机器人进入真实的工作流去采集这个数据,另外也希望能吸引更多的第三方开发者去共建。 开放生态,是为了共同解决数据荒,也是为了形成“标准”,避免行业内的公司各自闷头重复造轮子。 “开源的东西多了,才容易形成生态。参与生态的人多了,才能形成一个‘事实标准’,这也是我们推进标准化的一条路径。”彭志辉说。 根据海外权威机构及国务院发展研究中心的数据,到2050年左右,具身智能产业将达到5万亿美元的规模。10年之后的2035年,仅中国具身智能产业就将到1万亿人民币的规模。 类比汽车产业,目前全球汽车保有量约为16亿辆,对应的市场规模接近5万亿美元。也就是说,具身智能将在25年之间“再造一个汽车产业”。 面对如此庞大而又遥远的一个蛋糕,这个正在数据瓶颈上挣扎的行业还远未到谈论竞争的时候。 “我们所有伙伴合作都不要求排他,不独占,不要求二选一,全部面向整个产业开放。如果在智元体系能力基础上,别家跑出来了,推动了产业发展,我们也是欢迎的。产业成功了,生产力进步了,我们每个人都是受益者。”邓泰华说。