WWW.YOUINFO.SITE
标签聚合 苏建

/tag/苏建

36kr.com · None · tech

文|邱晓芬 编辑|苏建勋 2026年,全球的具身智能机器人创业者不约而同将目光方向调转向深水区:家庭。 点燃这份热情的,是近期行业里闪烁着的一丝丝Scaling Law苗头—— 先是硅谷具身智能公司Generalist AI在GEN-1模型上验证了确定性,当他们给机器人喂进海量数据后,精细操作任务成功率竟从64%提升到了惊人的99%; 随后,硅谷当红的具身智能独角兽公司Sunday Robotics也试图解决家庭场景数据难关,不仅推出Umi手套数据采集方案,还直接将机器人Memo送进家庭做家务(收拾餐做、冲咖啡、叠衣服),因此吸引了大量的资本押注。 在大洋彼岸的中国,近期闯入家庭机器人领域的创业者中,还有一个熟悉的身影——许华哲。 “两年内,中国将会出现可用的家庭机器人”,他对于行业的判断,同样乐观且激进。 作为“伯克利归国四子之一”、清华大学交叉信息研究院助理教授,2023年,许华哲曾加入「星海图」任前首席科学家兼联合创始人,一起将这家公司打造成中国具身智能领域的明星公司。 不过,在这家公司估值冲破200亿、融资近30亿的巅峰时刻,许华哲又选择“单飞”并创办了全新的具身智能公司「破壳机器人」。 此次重新出发,他想做的是能在家庭场景干活的、真正有泛化性的具身智能机器人。 △ 许华哲 其实,想做一个家庭机器人公司并不是近期偶然的想法。初高中时的他读完《乔布斯传》后,内心便萌生创办一家伟大To C公司的种子。此后,在清华、伯克利、斯坦福的一路升学中,他一直深耕机器人强化学习方向,梦想便是把机器人送入千万家庭。 他理想中的家庭机器人,虽然不是无所不能,却能完成上一代机器人(比如扫地机、洗地机)无法完成的复杂任务,比如能进行更精细的清洁工作、有条理的完成诸如洗衣收纳的长序列、多步骤任务串联。 在他看来,这种创业方向的选择,也带有强烈的审美洁癖。许华哲直言,泛化性的本质是一种“美与影响力”——用最简洁优雅的模型,解决人类复杂的生活问题,并真正将AI转化为生产力,而非仅仅替代低端劳动力。 从更理性的层面,切入To C家庭场景也包含着许华哲的商业判断。在他看来,当前大量机器人厂商将人形机器人送进工厂,完成传统机械臂就能完成的上下料、搬运箱的工作,本质上只是在用新的人性在做旧时代的事情,机器人没有发挥出真正的通用性。 他认为,真正的AGI应该在家庭场景中诞生、运用,因为家庭场景任务比工厂场景更混乱随机,且数据丰富,恰恰是训练通用模型的最佳土壤。 因此,为了追赶时机,在创业的短短一个月内,新公司「破壳机器人」已经完成了融资、核心团队组建、具身模型的训练、以及硬件迭代工作。 《智能涌现》独家获悉,破壳机器人近期完成数千万美元天使轮融资,由云启资本领投,并获得顺为资本、弘晖基金等一线美元基金,小米战投、星海图等知名产业方,以及BV百度风投、英诺天使基金、水木清华校友种子基金、东方嘉富等一线市场化基金的支持。 快速得到资本押注,也因为许华哲在关键技术路线上有一些不同的选择。 为了实现泛化,在关键技术路线方面,他的选择也略显反常识。他完全放弃了行业主流的VLA(视觉-语言-动作)基座模型方案,转而构建一种能直接输入和输出“视频-动作”的 世界模型 。 在模型结构上,他也提出了独特的“ UAG架构 ”,用并联式预训练替代过去的瀑布式级联,并将强化学习贯穿预训练与部署全过程,实现了训练效率的五倍提升。 打好模型基础之余,在数据与硬件层面,他也通过UMI、外骨骼和第一人称视角三层方案采集高质量数据,形成从任务定义到数据、模型、本体的闭环迭代。 据许华哲透露,「破壳机器人」第一代 32B参数规模的具身世界模型 已完成首轮训练,正处于数据迭代的关键爬坡期。在硬件层面,「破壳机器人」为数据采集量身定制的手套硬件已迭代了五六个版本。 近期,《智能涌现》与许华哲聊了聊,以下是交流实录(略经摘编) 为何出走「星海图」? 《智能涌现》:为什么选择离开星海图,创立一家新的机器人公司? 许华哲:这个想法其实酝酿了很久。在2023年8、9月份,我就开始和高继扬聊,加入星海图。但经过了两年,到去年11、12月份,我已经基本决定要离开了,真正办完手续是在今年,创立「破壳机器人」是最近一个月的事情。 离开的原因主要是因为我内心一直想做一些To C的、真正泛化的通用机器人。 《智能涌现》:既然一直想做To C,为什么一开始不直接做To C方向机器人的创业呢? 许华哲:原因是多方面的。2023年我加入星海图时,也考虑过要不要自己创业,但那时我刚从美国读完书回来,在叉院工作才一年左右,要自己开公司lead一摊事,还要兼顾教职,挑战很大。 那时星海图和其他一些具身智能公司也邀请我加入,我觉得先加入一个优秀的团队做联创,是一个更稳妥的选择,而且当时星海图的宣传里也提到大概是“让机器人服务千万人类”的话语,这和我的一部分想法是吻合的。 《智能涌现》:您现在新公司虽然只成立一个月,都有哪些进展? 许华哲:团队方面,目前有20人左右,AI侧有一些天才少年,硬件侧有很多做过To C量产交付的工程师。我们还在火热招聘中。 在技术上,我们的AI模型在“动得快”、“泛化强”、“成功率高”三个维度都有较好的前期积累,能让机器人完成某些复杂任务时达到接近100%的成功率。 我们第一代32B的模型已经完成了第一次训练,但还需要数据量的迭代才能展现出更好能力。我们的硬件手套也已经迭代了五六个版本。 第一个月要处理公司注册、选址、装修等各种事务。能跑出这个速度,我觉得还是比较快的。 《智能涌现》:您这次创业,和第一次创业时心态有什么不同? 许华哲:最大的不同是心态上更踏实、也更敢了。第一次创业前,我会担心,我没上过班怎么给别人“班”上?我没做过生意怎么办,没跟投资人、政府打过交道怎么办? 在星海图的两年,我接触过这些事,“没打过就硬打,没上过就硬来”,其实最终结果也挺顺利的,太多的顾虑没必要,出来混最重要是先出来。这次心理上更从容。 《智能涌现》:在2023年和2026年两个节点创业做家庭机器人这件事,区别大吗? 许华哲:区别挺大的。首先是硬件本体,这三年中国的硬件供应链打磨得更好了,有了更多能用的机器人,2023年时可能只能用工业臂; 第二是数据,2023年时机器人的数据几乎是0,现在网上开源数据就有几十万小时,还出现了大量的数据供应商,虽然数据质量和跨本体适配还是问题,但丰富度已经不可同日而语。 第三是融资和市场认知,2023年要做To C机器人可能很难融资,大家给的时间缓冲也更少。今天起步比2023年更好。 AGI应用于家庭,工厂是上一代技术的领地 《智能涌现》:一直想做To C的机器人,背后的触发点是什么? 许华哲:首先,一个核心思考是,我们做机器人到底在做什么?机器人是人类自古以来的追求,我们在海底捞、酒店、工厂都见过机器人,但如果我们只是用人形的外壳去工厂拧螺丝、搬箱子,那本质上还是在做旧时代的事情。 这一代机器人最核心的不同在于它的通用性。 通用性该用在越混乱、越需要通用能力的地方。那答案就是家庭,或者广义的服务场景。我认为,通用的AGI(通用人工智能)应该用在家里。 第二,从个人偏好来说,做有品牌的事情是可以做得足够大、有梦想的。伟大的公司很多是To C的,比如苹果、小米。 第三,从数据角度看,通用性需要有丰富的数据,混乱的家庭场景恰恰能提供丰富的数据。如果你的数据源头错了,就得不到正确的模型。 基于这三点,我觉得做To C机器人是一件正确的事,我自己也特别感兴趣。 《智能涌现》:您认为AI模型什么时候可以支撑做家庭To C机器人? 许华哲:我的预测比较乐观激进,我认为 两年内 会出现可以用起来的机器人。它不是万能的,但会是一个有完善产品定义、能做相当多通用事情的机器人,但它会有一些明确不做的事,比如抱婴儿、烧热水。 《智能涌现》:机器人进家庭能做的事情都包括哪些?能否举一些例子? 许华哲:分两类。 一类是本身很难的任务, 比如更精细的清洁,比如清洁墙角霉点、擦掉干涸的饭汤、剥橘子、剥虾等等。 另一类是 长序列、多步骤任务的串联。 举个例子,一个完整的洗衣流程是——把脏衣服放进洗衣机、倒洗衣液、启动,然后机器人可以去做别的事,它会在监听到“洗完了”的声音后,把衣服拿出来放进烘干机,启动烘干,最后再把衣服拿出来叠好放进衣柜。 现在的机器人能做任何一个单一步骤,但没有机器人能像人一样,从头到尾,带着这些“任务间的缝隙”把它完成,我认为两年后的机器人能有这个能力。 《智能涌现》:家庭和工厂场景,最大的区别是什么? 许华哲:家庭和工厂某种程度上都是“混乱”的,但是本质上不同。工厂的混乱更多是“管理混乱”,比如东西乱扔、人走来走去,但它具体干的活,比如上下料、装配是高度确定性的。 家里的混乱是任务本身的混乱, 比如衣服是团成一团的,杯盘狼藉需要收拾,这种混乱是需要通过工作去恢复秩序的。工厂的很多混乱并不需要去恢复。所以,这是两种完全不同性质的“混乱”。 《智能涌现》:您认为当前做家庭To C机器人,最大挑战是什么? 许华哲: 机器人进家庭的逻辑和落地To B不同。 To B的账很难算,因为工厂给人形机器人干的活价值很低,一台二三十万的机器人可能相当于一个人三四年的工资,还要考虑可靠性、维护,很难回本。再加上工厂里采集的数据可能过于专化。 To C的账不是简单的“替代人力”计算。它更像 科技潮品+家庭助手+管家 的复合体。用户买它,是购买一种先锋的生活方式、极致的便利,就像二十年前大家买车一样。我们考虑的是,当用户有一笔预算时,是买辆车还是买个能改变生活的机器人。 所以,关键是产品体验要足够好,价值感知要足够强。价格区间我们内部还在讨论,但肯定会是五位数起步。 追求泛化,也是追求美和影响力 《智能涌现》:所以To C并不是您离开星海图后才有的想法,而是一贯的想法? 许华哲:是的。我从小就想做To C,想创业。初高中的时候读《乔布斯传》、《迪士尼传》,读完了就很想创业,做一个像谷歌一样的公司,后来选电子系也是想要做IT,大学还修了管理学双学位,就是为了创业做铺垫。 后面去了伯克利、斯坦福,也是一直在做强化学习和机器人,后来还做了一些触觉相关的研究,也是在机器人大类里。 我博士毕业时(2021年),主要就是找教职还有找投资人聊,看看有没有创业机会,当时普遍观感是,下一代技术还远,这一代技术就是做扫地机、餐馆机器人,但是和AI关系不大,没看到特别匹配我专业技能的创业机会。 《智能涌现》:你判断一件事情做与不做,或者谈论你对某件事是否感兴趣时,你的标准是什么? 许华哲:一个是美,这件事要能给我带来好的审美体验。另一个是影响力,我们学术圈有一个词叫impact追问。 美,更多是个人体验,我做这件事创造出来的东西是优雅、简洁的,就像简单的公式能描述复杂的现象,泛化性的本质也是美;影响力意味着,我做的这件事要能对世界产生足够大的影响,改变人们的生活方式。 现在我们被迫用巨大的参数量来描述世界,是因为我们还没找到AI领域的牛顿定律, 我相信大模型只是一个中间状态。 我的博士生涯是带着“AI一定存在一个优美理论”的心理开始的,但后来发现理论越来越解释不了AI,这是一个痛苦但必须接受的过程。 所以现在我的使命是追求简洁和影响力,如果有另一个公式(而不是AI模型)能描述机器人与世界的所有交互,我会觉得它更好。 《智能涌现》:这次创业你希望找到什么样的合作伙伴?你会更欣赏什么样的公司文化? 许华哲:我对合作伙伴和团队文化有三个核心要求—— 极致: 我很喜欢戴密斯·哈萨比斯那本传记里的描述,里面说,一个人做事要做到什么程度,就像跑马拉松撞线后,有个救护车把你拉走了,但是你最后没死。虽然有点夸张,但是我觉得做事极致投入,永远想更进一步,是很重要的。 坦诚: 对自己、对同事、对事情绝对坦诚。不会因为不会而装会,搞砸了就承认,不要为了面子影响效率。 利他: 公司里有很多“缝隙”,如果每个人都只盯着自己的KPI,这些缝就没人填。对于初创公司,需要每个人在有余力时主动填缝,这种利他性长期看对个人和团队成长都有益。 (作者注:戴密斯·哈萨比斯(Demis Hassabis)是英国著名人工智能科学家、Google DeepMind 联合创始人兼CEO、神经科学家,被誉为“AlphaGo之父”。) 我很欣赏段永平的“本分文化”,也欣赏前段时间一篇报道中提到的,Kimi“没有部门墙”的协作模式,我倾向于弹性、扁平的组织,很赞同黄仁勋、亚马逊那种鼓励一线员工直接向老板直接发邮件反馈问题的文化。 做全新物种的家庭机器人 《智能涌现》:很多To C的机器人是曲线救国,先从陪伴场景切入,但是感觉你们的您的产品路径和其他家很不一样。 许华哲:完全不一样。他们做的是陪伴,核心能力是大模型提供的对话能力和娱乐。我们追求的 核心是物理世界的通用交互和干活能力。 我们的机器人是“家庭助理”,要能实际处理家务,所以在技术上,我们需要非常强的模型能力来保证通用性,但是很多家庭陪伴机器人是没做基础模型的。本质上,我们和他们是两个不同的品类。 《智能涌现》:你们最主要的技术的差异点是在模型侧吗? 许华哲:我们的一大亮点我们的模型能 用好强化学习 。过去机器人对强化学习的使用一般停留在单机的后训练上,但是其实强化学习上有很多自己独特的东西。 第一个就是价值函数(value function)。 价值函数 可以对数据质量进行评估,让模型知道哪些数据好、哪些次优、哪些失败。数据带着权重,去让模型学习。 它带来的好处有两个,一是可以让模型学得更精准,二是可以理解失败的边界,这样模型就能够知道紧邻着成功的失败长什么样,让强化学习去把这些失败因素排除掉; 第二是,强化学习能同时在多个任务上保持高成功率高速度,而不过度拟合到单一任务。 第三是,强化学习也可以突破人类数据上限。以前我们用人采集的数据去做某件事,数据是什么样的,机器人就能做到怎么样的,甚至会更差,因为机器人是跟着数据学习的。 但是强化学习就是根据数据以及后续的自我改进,持续突破自己的上限,最终可能做出比人类示范数据更好的表现,上限更高。 《智能涌现》:你们的强化学习只用在后训练上吗? 许华哲:我们的预训练也会用离线的强化学习。预训练现在还是有一些卡点的,比如说模型的选择上有很多种,市面上有用VLA+VLM的,��有世界模型的,还有VLWAM,就是VLM后面再内嵌一个世界模型。 《智能涌现》:那你们还是用VLA的路线吗? 许华哲:现在模型的路线还远远没有收敛,我们的选择是 世界模型结合原生的机器人模型,不是用VLA的路线。 《智能涌现》:现在的世界模型有很多派别,有的人用的是偏3D视频的方向,有的又是偏向于世界仿真,你们对世界模型的理解方式是什么? 许华哲:我们输入的是视频和动作,在训练和推理的时候,输出的也是视频和动作。这些视频和动作里面是遵循物理规律的真实世界的数据。 《智能涌现》:你们做这些事情的过程中,遇到的最大的挑战是什么? 许华哲:要训练大模型所需的Infra (基础设施)是一个挺大的卡点,因为我们想做一个32B的大模型,要支撑比较大的数据量,GPU 集群的并行效率、数据吞吐都是一个很大的挑战和壁垒。 《智能涌现》:在模型侧你们提到了一项“UAG”架构,这个怎么理解? 许华哲:UAG(Unconditioned Action Guidance)是我们的一种模型训练架构。 相对于传统的瀑布式级联的模型训练方式,我们采用的是一种并联的方式,核心思想是 先对动作进行预训练,然后再对所有的动作做整体联合的训练,做一个动作预测器,然后再将动作预测器和视觉模型一起进行联合训练。 背后的原理是,一个小时的图片、视频是巨大的,但是一个小时的动作很少,可能就是一系列关节的运动,也就是一堆小的浮点数。 这种方式可以最大程度保留基础模型的泛化能力,同时大幅提升训练效率, 估计至少5倍以上。 《智能涌现》:数据也是你们新公司的亮点,你们大概有哪些方案? 许华哲:我们的数据方案主要分三层—— ①外骨骼数据采集: 提着机器人手臂直接操作,精度高,反馈更直接; ②UMI方案: 让人戴一个和机器人手部构型完全一样的“硬手套”进行操作,好处是没有机械臂的负担,采集效率高,数据量大。手套做硬是为了保持和机器人手的一致性,确保人能做的动作机器人都能做; ③第一人称视角人类数据: 在头上戴一个摄像头,记录人日常干活的视频。这是从人的视角(Ego-centric)采集海量自然行为数据。 《智能涌现》:这些采集方式其他家也在探索,你们最大的不同点在哪? 许华哲:采集的数据,表层方法可能相似,但内核有本质不同。比如umi手套是否打磨得足够好,足够通用?采集的数据质量如何保证?以及如何清洗和处理这些数据,提升数据质量? 我们一个很大的不同是,我们会大量使用评估数据,就是机器人自己做测试和探索的时候,自己在动的数据。这样的数据某种意义上是更“差”的数据,因为里面会有失败、会有次优。但是这种“差”其实也是“好”,会让模型更知道任务的目标是什么。 另外,手套的设计细节,比如摄像头位置、佩戴舒适度、是否适应不同手型等等,都需要针对家庭任务精心打磨,我们手套的构型设计是面向家庭任务,追求通用性的。我们会在8月末左右给大家看到我们和现在所有的形态都不一样的数采系统。 《智能涌现》:但是现在出来创业会不会太晚了?现在具身智能行业的融资环境怎么样? 许华哲:市场热度还可以,投资人还是比较有热情的。和之前比,投资人更懂了,大家被市场教育过一轮,所以会问得更细。 关于创业出来是否太晚,我认为——在技术没有收敛的今天,仍然有巨大的机会。同时,因为我们更晚,所以我们的时间压力更小、负担更小,但是各种基础设施比如本体等也更加成熟了。另一方面,走向通用家庭机器人,其实才刚上半场。虽然后发,但是谁能先至,也未可知。 封面来源|企业官方 end

36kr.com · None · tech

文|周鑫雨 资料整理|钟楚笛 编辑|苏建勋 杨轩 靴子终于落地。 被调侃“Next Week”近3个月的DeepSeek V4,终于显露真身。 1.6T的最大参数量、1M的上下文窗口、针对Agent的性能优化,以及基于MoE(混合专家模型)和稀疏注意力机制DSA,降低计算和显存需求——这些曾被外界纷纷猜测的参数和性能,随着V4的官宣,一锤定音。 DeepSeek V4性能测评结果。 姗姗来迟的原由,与V4将训练框架从英伟达迁移到华为昇腾上有关,也与DeepSeek内部的决策变动有关。我们得知,2025年年中,DeepSeek曾面临一次较为严重的训练失败。 “当时,DeepSeek面临重新适配芯片的问题。”一名知情者提到,“内部有关训练方向的意见也不完全统一。梁文锋提出了一些自己的要求,但在执行层面很难折中。” 不过,与外界关于“新模型支持多模态生成和理解”的猜测不同,V4依然是个语言模型。暂缓多模态生成的训练策略,主要源于算力和现金的掣肘。 多名知情者告诉《智能涌现》,DeepSeek的对外融资窗口,是2026年4月中旬打开的。内部的导火索,是DeepSeek需要更多资金支持,训练参数规模更大的模型,同时,留住和招纳更多的顶级人才。 “1.6T的参数量与OpenAI、Anthropic等顶级厂商的模型相比,并不具有绝对的竞争力。”一名从业者对我们提到,很快,国内也有模型厂商,将发布 3T 参数规模的模型。 在人才侧,随着郭达雅(DeepSeek R1核心作者)、王炳宣(DeepSeek LLM核心作者)等人才被字节、腾讯等大厂挖走,DeepSeek需要一笔大额融资稳定军心、招兵买马。 而转向开放融资的外部导火索,几名业内人士猜测,与腾讯的投资态度有关。在开发融资前,梁文锋和马化腾曾有关注独家注资有过几次商谈。但两名相关人士透露,给腾讯20%股份的条件,没有得到梁文锋的同意。 R1发布以来,一个明显的转变是: DeepSeek从一个偏非营利的、理想主义的技术乌托邦,被迫快速转向一家重视产品、商业化的务实公司。 2026年4月8日,DeepSeek App改版,上线支持复杂推理的“ 专家模式 ”,和处理简单任务的“ 快速模式 ”——随着V4的发布,我们也从而得知,负责“专家模式”的,是1.6T参数量的V4-pro,支持“快速模式”的,则是284B的V4-flash。 DeepSeek App的两种模式。 曾有知情人士表示,2025年下半年以来,梁文锋开始重视产品的打磨。有多名大厂AI产品经理向《智能涌现》提到,2025年年末,DeepSeek对产品策略/经理进行了“开闸式招聘”,他们也多次收到DeepSeek HR的联络。 一名业内人士也对《智能涌现》透露, DeepSeek内部已经搭建了数个创新产品团队,对Agent和其他C端产品形态进行探索。 从更新后的版本看,DeepSeek的文本能力提升明显。在过去一年,我们也听到多位AI行业HR、猎头提起过, 不止一次在北大中文系的宿舍,遇见加学生微信的DeepSeek HR 。 招中文系学生的目的,是做人文领域的数据标注和测评标准搭建。这被视为DeepSeek重视模型的人文性的信号。 虽然“普惠”“开放”,产品简单到只有一个Chat界面,是DeepSeek对外呈现出的形象。但我们了解到,2025年,DeepSeek对产品和商业化的探索一直没有停过—— 目前,内部已经组建了一支数十人的产品团队,对Agent等产品形态进行探索 。 甚至更早前,在2024年,爆火前的DeepSeek,也考虑过投流推广,但很快被梁文锋否决。 DeepSeek终于放出年度更新,有如终于掉落的达摩克利斯之剑,让中国乃至全球模型厂商悬着的心稍稍放下。 迈入2026年后,DeepSeek的年度迭代,已成为AI世界“狼来了”的故事。避开DeepSeek,成了近几个月模型厂商的标准动作。 两家刚刚上市的大模型厂商,智谱和MiniMax,在春节前,就错峰发布了新的模型GLM 5和M 2.5。 一名智谱员工告诉《智能涌现》,“DeepSeek将在春节发模型”的传言一放出,算法团队立马拉了会,要求“尽早”发布GLM 5。 MiniMax的一名员工也表示,1月中旬,港股IPO庆功酒的宿醉还没褪去,算法团队就自觉早早回到了工位上。 “错峰”,对这两家已经IPO的模型创业公司尤为重要。 “如果比DeepSeek晚发,性能不如它们,会影响股价;但不发,也会影响股价。”上述员工表示,“影响最小的办法,是早发。” 模型公司的融资动作,也要抢在DeepSeek更新前面。 1月末宣布了B+轮融资的阶跃星辰,也迫切地想在春节前Close这轮融资。一名知情人士告诉我们,一旦DeepSeek再次掀桌,和投资人的沟通成本将会非常高。 在从业者眼中,牌桌上一直有“两个DeepSeek”——一个带来被倾轧的恐惧,另一个则作为范式的引领。在模型厂商们温吞缠绵的两年里,行业需要这样一个“不确定性因素”,让厂商们反思、继而冲刺起来。 MiniMax一名员工记得,在年后的内部信和全员会上,创始人兼CEO闫俊杰提到: “DeepSeek帮我们走出了一条我想走的路。” 即使中国AI从业者对DeepSeek情绪复杂,但人们依然承认,DeepSeek改变了中国AI行业的诸多规则。 改变,往往意味着推倒和重建,这必不会是个舒适的体验,但正如一名六小虎投资人对我们评价的那样:DeepSeek奠定了近一年来中国大模型的组织文化、冲研发重点,而在这以后,“ 它是中国AI跻身全球一流的起点,但不会是终点 ”。 DeepSeek让中国AI行业的竞争格局,进入相对稳定的中场。但在模型技术的早期,DeepSeek为行业留下的不尽是共识。随着商业化和竞争压力加剧,围绕开源、商业化、增长等命题,各个厂商正在走向不同的分叉口。 在DeepSeek V4发布前,我们与十余位AI行业人士,围绕“DeepSeek改变了中国AI行业什么?”展开对话。 以下,是我们从中总结出的5条“后DeepSeek时代”的新命题。 命题一:重新审视开源的性价比 一年前,DeepSeek R1公开技术报告后,一名AI投资人的判断是:回归基模研究、靠开源开放打响技术品牌,对模型厂商而言是最重要的事。 但如今,他告诉我们,当时的判断有待商榷。 跟随DeepSeek一年后,厂商们大力托举开源和研究生态的时代是否要终结?这一关键问题,随着近期阿里千问大模型技术负责人林俊旸的离职,被摆到了明面上。 某种意义上,林俊旸领导的Qwen,代表着开源生态的利益。但如今,这与阿里作为商业公司的营利性,产生了尖锐的矛盾。 “ 非盈利的黄金时代结束了。 ”针对这一事件,一名Qwen员工对我们这样评价。 让厂商们动摇的事实是, 如今营收最高的2家模型厂商,走的是闭源路线 ——OpenAI,年化收入超过250亿美元;Anthropic,年化收入超过190亿美元(据The Information报道,数据截至2026年2月底)。 至于国内厂商的模型收入,近期披露的2025年财报显示,MiniMax全年总收入为7903.8万美元,智谱为7.24亿元(约1.05亿美元),与OpenAI和Anthropic相比,还有多个数量级的差距。 △2023年以来,OpenAI和Anthropic的年化收入情况。图源:The Information 2026年1月的AGI Next大会上,智谱创始人唐杰也发出警告,“我们可能只是在‘开源游乐场’里玩得开心,而美国的闭源模型早已进入下一个纪元”。 毫无疑问,DeepSeek带动的开源开放生态,让中国模型在2025年内,快速在全球建立知名度和技术口碑。 但一个残酷的事实是,靠开源快速“冷启动”、建立技术口碑的阶段已经过去了。在基模研发仍然“吞金”的当下,如何将口碑转化成真金白银,是更重要的存活命题。 开源的价值,到了被重新审视的时间点。 命题二:投流大战暂停,精细化投放开打 如何解读DeepSeek “0投流,App上线7天用户破亿”的成绩? 放置一年前,行业的目光会不由自主地聚焦在“0投流”之上——这套破圈叙事,推翻了不少厂商深信不疑的增长路径,也戳破了彼时模型产品烧出的虚假繁荣。 警醒,应激。2025年初,不少公司都做出了和大举投流同样激进的反思。 其中的典型,是拉开投流大战序幕的月之暗面。 《智能涌现》曾报道 ,2025年2月一场持续了五六个小时的战略会上,月之暗面联合创始人张予彤宣布,立刻暂停Kimi在安卓渠道的投流,同时将iOS渠道上的投流预算,从原来的千万元/天,削减到数万元/天。 一名六小虎中层曾对我们假设:以Kimi和豆包为主角, AI应用激进的投流大战,大概率会持续到2025年Q2 ,按照平均每个季度2亿美金的投流支出,月暗会因资金压力率先败下阵。 当应激的情绪逐渐回归理性,多数厂商的增长成员都告诉我们:投流,仍要继续,但要做聪明的、有的放矢的增长。 事实上,激进的投流、补贴大战,没有因DeepSeek的非典型成功而停止。只是, 参战的主要对象,剩下了财力雄厚、手握流量入口的几家大厂 。 增长大战最白热化的一幕,发生在刚过去不久的2026年春节。阿里千问豪掷30亿元请用户喝奶茶,腾讯元宝狂撒10亿元红包,字节则用同样的10亿元,将豆包送上春晚的舞台。 六小虎的一名增长团队成员,将如今的投流,称作“巧妇要为无米之炊”:“ 流量入口被大厂们把握,意味着剩余的模型厂商,要用更精细化的增长方式,放弃建立大盘认知,聚焦目标用户。 ” 他举了个例子,如果AI产品的主要场景是金融、法律办公,那就将产品推到一些金融App上,流量还更便宜。 命题三:回归基模,选实用,还是选研究? R1出圈后,聚焦基模研发,一夕之间成为AI模型厂商的共识。 “我们对自己的研究方向,都更坚定了。”一名亲历R1发布的前月之暗面研究员对我们表示,“R1并不是石破天惊的创新,但它证明, 只要大方向判断不出错,厂商坚持自己的路线,就能获得性能上的正反馈 ,就像DeepSeek一直坚持纯语言和推理。” 此前,为了打榜或是追逐热点,不少厂商会将聚焦在推理、对话等不同性能的模型,分开单独训练。 “这样做可以针对某项能力调优,但模型的实用性会打折扣,客户也不一定买单。”一名智谱员工告诉我们。他提到,一个令智谱警铃大作的现象是,R1发布后,不少行业头部客户,转向了部署DeepSeek。 彼时的智谱在冲击中,做出了一个在上述员工看来“难而正确”的决定:训练一个同时聚集推理、Coding和Agentic能力的模型,GLM 4.5。 “ 这是智谱第一个‘反榜单’的模型,性能调优方向都从真实的客户需求中来, ”他表示,“某种意义上,这也是智谱的背水一战。” 同样的反思,也席卷了大厂。2025年1月,前谷歌DeepMind研究副总裁吴永辉,挂帅字节模型团队Seed后,“不刷榜单,聚焦模型能力本身”的方针就被多次提起。 类似的,多名知情人告诉《智能涌现》,前OpenAI研究员姚顺雨加盟腾讯后,花了大力气把模型和AI产品的测评体系重新搭一遍,直接对接人员具体到每个场景的负责人,甚至他们的-1、-2。 “原来混元(腾讯大模型团队)的风格是‘刷榜’,让模型性能有些虚假繁荣。”一名混元成员告诉我们,“顺雨很Sharp,他希望团队认识到模型的真实水平,回归到研发本身。” 但共识之下必有裂隙。技术研发,向来有“实用派”和“研究派”之分,前者注重赢得竞争、商业落地,后者注重学术价值——具体到一家商业公司的体系中,在手头宽裕的时代,承担AI“研究派”角色的,往往是AI Lab、研究院。 然而,随着AI投入的压力逐步加大, 基础模型研究该倾向“研究”还是“实用”,业界并没有统一的答案。 可见的是,在商业化目标的趋势下,目前“实用派”占了大多数。一个显著的信号是,AI Lab正在后退和消亡,研发资源被聚集至“实用派”。 2025年以来,字节AI Lab被并入Seed团队,阿里达摩院多个研发团队被重组至通义实验室;2026年3月20日,腾讯也撤销了成立近10年的AI Lab,团队成员并入混元大模型团队。 但DeepSeek在某种意义上依旧验证了, 伟大是无法被计划的 ,不少突破性的技术,源自非功利性的研究。 依然有厂商,选择给“研究派”自由探索的空间——比如,字节Seed内部,还设置了注重研究的虚拟组织“Seed Edge”,鼓励骨干突破更基础、更长期的AGI课题,考核周期延长至3年。 命题四:大模型组织,顶层扁平高效,基层人海战术 命运的齿轮在梁文锋决定脱离幻方量化,单独成立DeepSeek那一天起就开始转动了。 一名接触过DeepSeek早期成员的知情人士告诉《智能涌现》,2023年初,DeepSeek早期团队到位后,梁文锋就坚持将DeepSeek脱离于幻方,理由是“ 幻方不是AI时代的组织形式,想要实现AGI,必须脱离原有的组织惯性做事。 ” R1的成功,让不少模型厂商开始重新审视适配AI时代的人才组织形式。 “ 本质每一代(巨头)企业,都是那个阶段最先进的组织,去适配那个时候的技术和商业 ,自然而然脱颖而出。”在近期一次播客访谈中,阶跃星辰董事长印奇也提到,如今每一家企业的AI顶尖人才都不少,关键在于组织形态。 《智能涌现》曾报道 , DeepSeek采取的是相当扁平和“学院派”的管理方式 :成员根据具体的目标,分成不同的研究小组;组内没有固定分工和上下级关系——这一组织形式的好处在于,可以充分发挥人的想象力,适配创新业务。 对于规模尚且不大的创业公司而言,寻找适配AI时代的组织形式,尚且有较高的试错空间。不少六小虎的员工都对我们表示,2025年以来,扩张规模成为一件“很谨慎”的事。不少企业甚至选择自行断尾,目的是“更高效、更聚焦”。 但对于动辄万人规模的互联网大厂而言,打破原有组织惯性并非易事。正如印奇所言: 创新者的窘境,往往是组织问题;领域内越是优秀的公司,越是将组织模式固化的更好,但往往也更难改变 。 只是,对于大厂而言,在AI时代延续辉煌辉煌,是必须要做的事。 2025年以来, 大厂玩家都试图将模型研发和AI创新业务,规整为一个相对独立于互联网业务的组织,用更为扁平的方式管理 。 比如虽晚但到的腾讯。《智能涌现》曾独家报道,原来分散在各个BG中的模型核心研发资源,在数次调整中,被集中在姚顺雨管理的AI Infra部,以及大语言模型部。 在近期的答疑会上,姚顺雨针对AI Lab与混元的整并,也做出了回应:要打破部门墙,让AI基础模型的开发和研究架构 更年轻、更直接 。 但精简研发团队的另一面,是数据、评测等支持团队的激进扩张。 “模型底层算法的迭代,到了一个平台期。在算法架构没有突破的情况下,训练数据的质量在模型性能迭代中起到了关键作用。”一名大语言模型研究员告诉我们,“尤其是视频、3D等涉及主观审美的多模态数据,各个厂商之间的质量差距就会显现出来。” 用高薪、高职级组建数据、评测,在不少厂商中已经屡见不鲜。 一名知情者告诉我们,, 近期字节Seed总规模相较于年初,已经翻了约2倍 。 豆包某一个尺寸的模型,光负责智商评测的就有5人,负责策略产品的有五六十人 ,“豆包、Seedance目前的性能优势,都是靠人力堆出来的。” 在数据供应的上游,盘踞在成都、武汉等城市的数据标注公司,已经跑出了不少年营收过亿的“隐形巨头”,招聘的普遍门槛,从中专、大专,抬高到了211硕士。 “ 金字塔结构 ”,一名Seed研究员如此形容目前模型组织的标准范式:研发顶端,是少数顶尖大脑,而为顶层输送燃料的数据、评测,依然需要人海战术。 命题五:年轻人和“一把手工程” 组织最重要的毛细血管,则是人。很难说, 是DeepSeek统一了行业“重视年轻天才”的人才审美 ,但各个厂商对AI年轻人才的渴求,被拉到了一个史无前例的高度。 △腾讯“CEO/总裁办公室”首席AI科学家 姚顺雨,1998年生。图源:姚顺雨个人博客 “很多大厂的HR团队,前几年招人的姿态都比较‘甲方’。”一名在AI行业从事了7、8年高端人才招聘的猎头告诉我们,“他们只负责给钱,但与人才在业务上的沟通都比较浅。” 明显的转变发生在R1发布之后—— 抢人,成了各大公司的“一把手工程”。 比如,2025年以来,隐退近4年的张一鸣的身影,频繁出现在新加坡,目的是引进全球各地的AI人才。也有不少人看到,腾讯总裁刘炽平亲自带HR团队,现身多个国内外计算机顶会现场,给参会者发名片、加微信。 一名混元成员也告诉我们, 姚顺雨进入腾讯后的一个重要任务,是招人 。自2025年9月,他加入腾讯以来,已经替混元面试了近百人,“每个校招生他都会亲自面,也常找突出的实习生吃饭”。 “DeepSeek终于让厂商们 自上而下 对齐了一件事: AI就是top mission 。”一名AI投资人总结。 结语:一直仰望,就无法超越 DeepSeek不能一直待在神坛上。正如一名混元研究员所言: 一直仰望,就无法超越 。 2025年下半年以来,模型玩家们对DeepSeek的态度,不再只有景仰,而是暗自卯足了超越的野心。 这一点,在去年借助DeepSeek流量,快速托举元宝的腾讯身上,尤为明显。一名元宝员工告诉我们, 截至2025年底,仍有约7成用户将DeepSeek选为元宝的默认模型 ,而非腾讯自己的模型混元。 “2026年,元宝的一个重要目标就是摆脱DeepSeek依赖,让腾讯自己的搜索品牌形成一定的用户心智。”她告诉我们。 当然,这也势必伴随更激进的模型研发目标。一名混元研究员告诉我们,2026年4月23日发布的新模型Hy3 preview,腾讯设定的目标是跟上第一梯队。 第一梯队的名单,则是DeepSeek和阿里。 对于牌桌上更早进场的其他玩家而言,经过一年的调整、加速,几乎所有厂商都在模型赛道,找到了差异化的身位: 字节和阶跃星辰聚焦全模态;月之暗面和智谱打磨Coding和Agentic能力;MiniMax保持语言模型不掉队的同时,突出视频生成模型的优势。 “每个厂商都沿自己的路线走。”Jason告诉我们,“这条路的终点可以是AGI、是泼天财富,但绝对不会是包括DeepSeek在内的任何一家公司。” 2016年,埃隆·马斯克和OpenAI CEO山姆·奥特曼有过一段公开对话。他提到:“人们有时会认为技术每年都会自动进步,但其实并非如此。 只有聪明的人们拼命努力去改进它,技术才会进步。 ” △埃隆·马斯克(右)与山姆·阿尔特曼(左)的对谈。图源:YouTube@Y Combinator 2025年初,DeepSeek恰好成了那个吹哨的聪明人。2026年,努力的聪明人会更多。 (文中受访者均为化名) 欢迎交流!

36kr.com · None · tech

文|邱晓芬 编辑|苏建勋 2026年,AI正在加速从云端落地到端侧。近期,模型厂商和手机厂商都在背后开始发力—— 3月下旬,国内几大手机厂商几乎同时推送了端侧AI的大规模更新,把原本仅限于旗舰机的AI能力下放到中端和千元机市场。自此,端侧AI终于成为大部分智能手机的标配。 到了4月初,谷歌发布开源模型Gemma 4系列,通过架构创新显著降低了端侧AI部署门槛,让AI能力首次真正下沉至手机、IoT等边缘场景中。 尽管当前行业里对端侧AI落地方向的探索五花八门,但众多非共识中唯一的共识是,AI手机依旧是短期内端侧AI最佳的落地形式。 而此前在2025年,在全球AI浪潮下,荣耀已发起了一场转型,从一家智能手机制造商向AI终端生态公司转型,并且计划用五年时间在AI领域投资百亿美金。 荣耀AHI战略 在过去的探索中,荣耀一步步构建起了自己的AI打法——在操作系统侧,荣耀发布了原生、自进化的AI智能体操作系统MagicOS。在AI Agent产品侧,荣耀推出了核心载体YOYO智能体。“YOYO建议”、“一句话打车”,“一句话购物比价”等都是荣耀手机上特色的AI功能。 转型的迫切,也体现在组织管理层面。2025年,荣耀在研发侧重构了组织架构,设立了AI&软件部门,整合操作系统、AI产品、互联网产品等团队,进一步构建荣耀AI核心竞争力。 如果体验荣耀最新的旗舰机Magic V6,可以发现AI手机的体验已经有了本质区别。 在过去,AI在手机上更多是不痛不痒的“问答”功能,而在荣耀Magic V6上,手机逐渐有了向生产力演进的趋势——比如, “AI会议参谋” 功能,能够在会前提醒用户、会中实现AI托管、会后一键生成结构化会议纪要和待办事项等等;在“AI文档智能体”上,用户还可以实现“拍照转文档”,“拍照即编辑”。 AI会议参谋 荣耀MagicOS AI产品专家李向东向《智能涌现》分析,背后反映了未来的AI手机的三个迭代方向。 首先,AI手机将支持Agent自动执行,相当于长出了“手”和“脚”。与此同时,手机是用户最高频使用的硬件终端,AI手机也会有专属的知识库和记忆系统,实现“越用越懂你”。在未来,AI手机大概率是千人千面的。另外,未来AI手机也将支持多模态交互,从过去的语音文字,向视频、照片甚至是具身智能延伸。 在李向东看来,未来AI手机的迭代,也会带来用一场颠覆性的改变,比如人机交互模式、甚至是重构过去手机上的流量分配逻辑。 近期,《智能涌现》与李向东聊了聊他对于AI手机和端侧AI的理解、以及荣耀在AI上的思路,以下是交流实录(略经摘编) AI手机将重构一切 《智能涌现》: 如果概括来讲,你认为未来的AI手机相比目前的手机,最大的不同会是什么? 李向东: 主要有三点根本性变化。首先是 越用越懂你, 手机将会给用户提供高度个性化的服务,AI手机将会是千人千面的。 其次, 人机交互范式从“人适应GUI”转变为“系统主动服务于人”。举个例子, 我们现在的“YOYO建议”,会对你的航班飞行旅程做全流程主动提醒,这就是主动服务的雏形。 最后,未来的AI手机将具备强大的自动执行能力。 AI能像秘书一样,理解用户复杂、级联的需求并拆解任务工作流、自动完成任务,用户只需做选择题或反馈意见。 《智能涌现》: 今年也有很多厂商在水下布局AI手机,你认为2026年这个行业有哪些值得关注的重点趋势? 李向东: 首先是 智能体与自动执行, Agent能力将会与手机场景的深度结合; 其次,AI手机上也会开始强调全局记忆 ,手机将 基于全局的长上下文记忆,落地“越用越懂你”的个性化服务。 最后是多模态交互,AI手机上将 结合视觉、语音、文字的融合交互与服务,比如前段时间荣耀发布了HONOR Robot Phone,它能“看你所看,听你所听”,进行陪伴式讲解并生成总结,这也代表了多模态的未来方向。 《智能涌现》: 在自动执行这个方向,手机厂商在推进中会有难点吗,因为现在大量的用户数据都存在于各大APP里。 李向东: 这确实是个生态问题,不过从客观上讲,这是 终端厂商相比APP厂商和大模型厂商更有优势的地方。 因为APP厂商只知道用户在自家应用内的习惯,而大模型厂商只在用户使用时才能了解需求,但是终端厂商却能全天候、跨应用地理解用户。 我们也在和大型APP厂商推进战略合作,大家的目标都是在保护用户隐私基础上,为用户提供更好体验,实现商业共赢。 《智能涌现》: 但是未来的AI手机可能会重塑手机里现有的流量分配逻辑吗? 李向东: 这是 毋庸置疑的 。当前的商业模式是应用厂商、大模型厂商和终端厂商等,各展所长、共同竞争,相对稳定。 但随着AI的发展,尤其是以用户意图为中心的AI自动执行与主动服务趋势推进,必然会 重塑原有的商业模式和流量分配,各方终将达成新的平衡,重塑过程需要各方探索与磨合。 《智能涌现》: 智能体出现之后有很多厂商在探索AI手机,比如模型厂商、互联网厂商还有手机厂商。不同背景的厂商做这个方向,你认为各自的优劣势是什么? 李向东: 模型厂商的优势在于大模型基座能力、算力和推理技术,对硬件的理解和投入、以及对终端消费行业的积累可能不足。 终端厂商的优势在于对终端消费者的深刻理解、以及积累的海量用户、软硬件一体化的能力,还具备了成熟的消费品操盘经验,但无法像大模型厂商那样去All in基座模型研发。 各方所长、投入焦点不同,大家也会基于自身优势去做融合与合作,共同服务好用户。 一家手机厂商的AI决心 《智能涌现》: 荣耀在AI上一直持续投入,如果要梳理的话,大概可以分为几个阶段? 李向东: 荣耀对AI的深耕可追溯至2016年第一代Magic系列智能手机、Magic Live智慧引擎的诞生。到2020年,荣耀进入AI核心探索阶段。 2020年到2023年,我们是在进行整体的平台级AI部署与AI战略布局阶段,当时我们基于MagicOS 7.0发布了平台级AI,基于Magic Live智慧引擎提供了 基于意图识别的人机交互体验; 2024年上半年,我们发布了MagicOS 8.0及端侧AI能力 “任意门”功能。任意门基于业界首个端侧意图识别框架,允许用户通过简单的拖拽,跨应用快速调取所需服务。也是在这一年,荣耀对意图识别框架和端侧AI四层架构做了清晰定义,用AI重构了 操作系统和端云协同 ; 到2024年下半年,我们已经洞察到了整个行业开始有迈向AI智能体的技术趋势,开始探索智能体帮用户自动执行任务的功能; 到2025年,我们 全面迈向智能体和AI自进化 ,不仅发布了我们基于端侧的AI智能体三层架构,还发布了最新的魔法家族大模型。 从2020年到2025年,荣耀完成了整个AI技术底层架构、核心战略的奠定,近期OpenClaw和Hermes智能体的热度,也印证了荣耀在技术路径上投入的价值与前瞻性。 《智能涌现》: 从产品的层面,我们发现在新发布的荣耀Magic V6上,AI的体验上好像比以前更丰富了,比如会有很明显的AI个性化服务,和用户也有了更深的情感链接,好像更《HER》了。 李向东: 是的。在荣耀Magic V6上,我们精准瞄准了 目标人群。 我们经过调研发现, 他们的核心痛点是高频会议与文档处理,所以我们打造了完整的AI会议参谋体验,包括会前提醒、会中分人转写与实时总结、还有会后自动生成精准纪要和待办。 另外,我们还针对目标人群推出了文档智能体,让纸质文档可以一键转成可编辑文件。 还有,我们针对投资人群做了“AI情报官”,用户可以在手机上定制信息主动推送,这些都基于真实场景解决了用户痛点。这背后本质的理念是, 让AI从玩具变成了生产力工具。 《智能涌现》: 荣耀也完成了从手机厂商向“AI终端生态公司”的转型,体现在架构上,荣耀去年也成立了专门的AI一级部门,把AI提到很高的战略高度。在这个部门出现的前后,荣耀在做AI上有哪些主要区别? 李向东: 区别还是很显著。在成立前,AI是操作系统部门下的二级板块,主要聚焦OS内的智慧引擎和AI平台。 成立后 ,打通OS、AI、互联网、生态等关键模块,在AI上的投入更聚焦、更系统化。 《智能涌现》: 为不同硬件匹配不同的AI功能,有没有一些例子? 李向东: 以我们的 旗舰机荣耀 Magic V6为例,其算力强、配置高,是打造AI核心竞争力的重点。我们会将行业前沿方向,如智能体(Agent)自动执行、全局记忆、多模态交互等,集中在旗舰机上使能和发力。 对于 中低端机型 ,用户核心诉求是流畅、不卡顿、长续航。我们也提供了一套 系统级的轻量化AI Native解决方案。 这套方案重构了OS,通过AI技术让系统更轻量化,从而在芯片和存储相对有限的中低端手机上,也能实现接近旗舰机的流畅丝滑体验。这项能力也提升了大量中低端机型用户的体验和用户黏性。 《智能涌现》: 荣耀如何决定某一个AI功能做与不做,背后的决策逻辑是什么? 李向东:我们的核心逻辑从“AI能做什么”转向“AI应该做什么”, 根本目标是让AI“越用越懂你”,更好地服务用户。所以我们具体围绕三个方向布局: 首先是针对不同硬件产品的目标用户需求,规划功能。比如,我们为荣耀Magic V6的商务人群打造了 “AI会议参谋”和“文档智能体” 的功能; 其次,我们也围绕核心AI产品“YOYO”作产品拓展, 目标是让用户实现“万事找YOYO”; 最后,我们也将AI Agent深度融入MagicOS,实现主动服务和自动执行,如 YOYO建议、任意门。 我们会舍弃那些 用户使用复杂、频率不高、学习成本高 ,或当前AI准确率不足、需要大量三方适配的功能,追求AI与产品、用户需求的紧密结合,提供闭环、好用的体验。 《智能涌现》: 你们做了不少有特色的AI功能,比如任意门等等。你们内部会如何评估某一项AI功能是否真正为用户提供了真实价值,也就是现在大家常说的PMF(产品市场适配度)? 李向东: 这是我们擅长的领域。我们拥有成熟的To C消费品评估体系,具体会分三个层面操作: 首先,针对不同硬件,我们前期会针对目标人群的核心场景去规划功能,并通过用户共创、以及后调(如用户满意度)来做验证。 其次,针对核心AI产品“ YOYO”,我们采用的是互联网产品快速迭代模式,比如A/B测试、用户反馈、日活等维度,来评估AI功能的表现; 最后,针对MagicOS的原生AI体验,我们在系统级应用中注入AI后,比如闹钟、任意门等功能,我们也会持续观察用户使用率、满意度和留存率。通过分层分级的验证体系,我们会确保AI功能能真正解决目标用户痛点。 手机厂没做“豆包手机”,不是能力不够 《智能涌现》: 我很好奇你怎么看待“豆包手机”? 李向东: 豆包手机是一次 重要的行业探索, 它的亮点在于打通系统底层能力,实现了泛化的跨应用的Agent自动执行和后台任务处理。 同时,它的成功也有特定背景,包括基于手机厂商的合作,获取系统级权限,并以不计成本的大模型及算力投入打造标杆场景。 《智能涌现》: 手机厂商一直在讲AI手机的故事,但是也有很多人提出疑问,为什么类豆包手机不是手机厂商最先做出来? 李向东: 其实类似于豆包手机的想法我们很早就考虑过,目前还没有商用落地。主要是 终端厂商考虑问题的逻辑不同。 手机厂商的立场首先是 保证用户体验, 我们面向海量用户,必须确保功能的稳定、闭环和普适性,任何体验上的瑕疵都可能引发大规模用户不满。 其次是成本考量。 当海量用户高频调用AI服务,Token的成本是终端厂商必须考虑的可持续性问题。对于大模型厂商而言,AI产品走向规模化时,也必然面临成本压力,未来可能转向限次使用或付费模式,进而影响用户体验。 所以,类豆包手机最早不是由手机厂商做出来,这不是能力问题,而是 商业逻辑和对用户体验的标准及要求不同。 尽管豆包手机的探索具有启发性、小龙虾全球爆火,但AI发展刚刚开始,远未到终局。 《智能涌现》: 系统级的GUI Agent路线,会是AI手机未来的雏形吗? 李向东: 它是一次很重要的探索,但它不一定是最终形态,因为它目前仍是基于APP来执行,但未来AI Native的系统和手机, 可能会打破当前APP的格局 ,转向用户所需即服务的模式。 举个例子,未来用户订机票可能不再需要打开特定APP,只需说出需求,AI在理解用户意图及偏好后,直接呈现机票信息卡片,让用户决策付款,对于用户来说,无需关心服务来自哪个应用。我认为这可能是一种更长远的形态。 《智能涌现》: 你认为OpenClaw的出现对AI手机产生了什么影响? 李向东: OpenClaw的火爆验证了智能体Agent与自动执行的价值,其实,荣耀也一直在布局这个方向,比如我们打造了荣耀龙虾宇宙“YOYO Claw”,它可以支持手机控制荣耀PC、Pad等跨设备部署,或三方云、三方设备部署的小龙虾进行任务执行,实现生态养虾,并注重安全性。 OpenClaw的出现说明行业正从“AI问答”阶段进入“AI自动执行”阶段, 这正是我们关注的核心方向。 《智能涌现》: 现在也有很多厂商在探索手机之外的全新品类,你认为未来的核心入口硬件可能会具备什么重要的特点?以及你更相信什么品类最终能胜出? 李向东: 目前确实是 百花齐放、共同探索 的阶段,我认为一个成功的AI Native终端品类,必须具备的特点是能高效且低成本解决用户核心痛点,具体而言可能具备三个特征—— 首先它是能够做到物理世界与数字世界感知的融合, 具备摄像头、麦克风等传感器后,实现多模态感知,并可以做到拟人化交互。比如,HONOR Robot Phone可以在用户逛博物馆的时候,摄像头看到文物,就可以给用户进行拟人化的讲解。 其次是具备 长上下文记忆与个性化预判,会 基于用户历史习惯提供个性化服务; 最后,是具备 自动执行与主动服务能力, 能跨设备、跨生态执行用户的要求。 现在手机仍然是AI的核心载体,其他设备多为手机的辅助,端侧AI探索的方向还没收敛。 但最终哪个形态能胜出, 取决于其提供的AI智慧化体验能否在价值层面实现跨代领先。 《智能涌现》: 到现在感觉各家手机厂商在AI上的做法都不太一样,但也慢慢形成自己的特色和打法了。你会怎么评价荣耀在AI手机浪潮中的身位和战略? 李向东: 其实本质上具体的AI功能只是“相”,是一个外在呈现,如果比喻成一颗大树,这些只是差异化竞争的一个“枝干”,但本质大家还是要考虑 AI与终端结合将给用户带来什么核心价值。 荣耀的主航道非常清晰,沿着 主动服务、Agent自动执行、个人知识库、多模态交互 这几个方向持续发力,迭代沉淀,我认为只要坚持沿着创造用户价值的主航道前进,就能笑到最后。 《智能涌现》: 我们两年前和手机厂商的高管聊,大家会说AI还没有真正撬动用户购机,到现在这个情况有变化吗? 李向东: 出现了积极变化。前几年,AI更多是卖点而非买点,但从2025年开始,经过我们的新机用户调研, AI已能进入购机考量因素的TOP 4,在部分机型中,比如荣耀Magic V5、Magic V6,甚至已经进入TOP 3。 这得益于我们将AI特性聚焦在目标用户的核心痛点和场景,并做到了体验闭环。当然,目前在一些机型中,排名第一的购机因素可能仍是硬件特性,如折叠屏的轻薄、长续航,但AI已成为越来越重要的决策因素。 封面来源|企业官方 end end

36kr.com · None · tech

文|王欣逸 编辑|苏建勋 龙虾热还在继续。 4月16日,荣耀进行了一场史上最短的发布会,正式发布此前预热的“养虾本”——荣耀MagicBook系列轻薄本。 即便OpenClaw已经刷屏了两个多月,但对于普通用户而言,要养一只原装龙虾,并没有想象中的容易。 不少软件和云服务厂商赶上热度,推出一键部署的龙虾。但对终端厂商而言,下场做龙虾和“养虾本”,荣耀是第一家。 据悉,荣耀MagicBook数字系列是荣耀首款“养虾本”,出厂即配置荣耀自研龙虾YOYO CLAW,荣耀MagicBook 14 | 16 2026款售价5949.15元起。 作为一家终端厂商,荣耀一直在AI PC有所布局。 2026年初,OpenClaw横空出世。3月10日,荣耀紧随小米Claw、华为鸿蒙小艺Claw其后,宣布要推出“龙虾宇宙”,支持PC一键养虾、平板养虾、手机养虾等功能。3月27日,荣耀Agent助手YOYO Claw开启封测。 4月13日,在荣耀PC技术交流分享会上,荣耀再次提及了龙虾宇宙的构想,首次提出“龙虾PC”的硬件品类,并展示了PC端YOYO Claw的功能。 “养虾本”里的龙虾,并非是此前推出的YOYO Claw在电脑端的复用,而是完全重写的、针对PC端的一个AI助手。 开箱即用,意味着用户拿到“养虾本”后无需任何操作,就拥有了自己的龙虾助手。 扫描二维码登陆后,用户就可以用微信、飞书等工具直接调用Agent工具。YOYO Claw内预设了5大主虾、23个子虾,并具备自主进化能力,能通过理解用户的记忆,实现“越用越顺手”。 除了“上手难”的问题,烧Token,是另一个让用户们对龙虾望而却步的原因。 值得一提的是,YOYO Claw采用了端云协同方案,能智能判断任务该在哪里执行,实现Token的高质量消耗。根据荣耀公布的信息,在执行任务的过程中,相比OpenClaw,YOYO Claw能节省平均50%的Token消耗。 此外,为了实现安全养虾,荣耀还做了一个“独立安全虾”,专门在用户设备上做安全防护,能全程盯着Agent的操作,阻挡格式化硬盘、重装系统等高危动作。 在分享会上,荣耀PC产品总经理朱臣才提到,在Agent时代,PC,不仅是Personal Computer(个人电脑),也是Partner Creator(创作伙伴)。 △荣耀PC技术交流分享会现场,图源:智能涌现拍摄 看见Claw在普通人中应用的最后一公里 “龙虾热”的背后,是普通人养虾难的现实。 未来的大模型能力一定会越来越强,但是模型操控电脑、执行展示等一些基本的工作仍然存在。普通用户不需要一个所有功能配置拉满的应用,而是更看重高效、经济、稳定性几个指标。 荣耀的核心用户群体是基础办公人群和大学生,办公场景和论文相关需求是高频应用。因此,在YOYO CLAW的预设Skill上,荣耀瞄准了教��、办公、学术、内容创作、智能辅助五大场景,并延伸出23个Skills。 落到具体的功能上,YOYO Claw可以化身为办公虾、教育虾、学习虾、健康关怀虾,可以是大学生论文助手,也可以是金融炒股高手。 以大学生写毕业论文这个具体的场景为例,用户只需要输入提示词,龙虾就可以完成从文献下载、解析,到论文撰写、图表生成,最后到论文排版、PPT生成上,实现一站式应用。 从垂直虾做起,是为了打通基础工具链。 除了五大垂直场景的Skills预设,YOYO Claw也支持用户安装OpenClaw生态里的其他Skills,以补充其他没有覆盖到的场景。 回到YOYO Claw的开发策略来看,它既有OpenClaw的开放Skills兼容,又有Hermes Agent的安全严格和自研系统机制。 其采用了“端云模型协同,端侧优先”的方案,在使用过程中,本地端侧模型可处理语义搜索,减少云端推理轮次。 简单、高频且涉及本地操作的任务,YOYO Claw会主动选择100%在端侧完成,只有在需要用到云端算力的情况下才会调用云端模型。它还会通过对上下文的优化、记忆匹配等方式,来放大云端调用的效率。 相比OpenClaw,平均情况下,YOYO Claw可以实现Token消耗节省50%,在极致情况下可省90%以上。 △荣耀YOYO Claw和OpenClaw对比,图源:官方 此外,安全养虾,也是荣耀龙虾宇宙里一个重要的部分。 YOYO Claw设置了独立的三层记忆系统, 能支持对本地数据的理解,不会主动抓取第三方应用的数据。这些记忆和理解能力都需要用户授权,且都保留在端侧。 不仅如此,YOYO Claw还内设了一个无法被篡改的“安全虾”,在用户自行安装Skills时,系统会扫描Skill包里是否含恶意代码,在运行时,“安全虾”也会拦截异常的脚本操作。 易用性、省Token、安全性,支撑起用户长期、高频使用YOYO Claw的需求。 终端厂商做Claw的价值:没有注定被AI淘汰的人 在2026年GTC大会上,黄仁勋将OpenClaw比作Agent计算机的操作系统。 不过,AI的普及,关联到用户、设备、Skills/生态、模型四个维度。要实现黄仁勋这一判断,单靠一家互联网厂商、模型厂商或者终端厂商远远不够。 例如,垂直场景的应用需要依赖专业的数据源,这关联到的是垂直应用厂商,并且数据的质量可以直接影响到效果的好坏。 对于荣耀这样的终端厂商而言,他们擅长的是打通用户链路、降低成本并提升设备的耐用性。 荣耀中国区CMO雷铮斯提到,“未来的3至5年,PC、手机和平板仍然是人和数字世界进行交互的核心媒介。”荣耀要做的是,看见Claw落地的最后一公里:基于数亿用户的数据,把大模型的能力落地到真实生活场景,实现AI工具的易用性。 这也正是终端厂商的价值。假设把OpenClaw安装到一个算力不高的设备上,在执行任务时,它会疯狂地烧本地的算力,电脑界面甚至会完全卡住。 从硬件来看,终端厂商做“养虾本”有天然的优势——可以对系统进行资源的调度。因此,在响应速度上,PC端的YOYO Claw比搭载OpenClaw的笔记本响应速度更快。 不仅如此,荣耀近日推出的Magic视界桌面界面也让AI助手的调用更加便捷,用户在桌面和菜单栏上可以随时调用出AI工具,实现“服务找人”。 跨设备生态,是另一件荣耀正在做的事。 在过去一段很长时间,荣耀在全场景终端设备上一直在做数据上的互联互通。Agent时代,这一能力正在更进一步,并升级为记忆和Skill的互联互通。 例如,用PC后台跑项目的同时,用户可以通过手机端的YOYO Claw,基于云端记忆下发指令。 这种生态不只存在于个人多端的设备上,荣耀要做的是一个服务全家的AI助手。 据介绍,在家庭联动的模式下,全家多人可以共有一台PC,所有家庭成员都可以通过手机、平板等设备与PC端的龙虾互动,同时做到一人一虾的专属独立。家庭相关的记忆数据都存储在这台PC中。 △“养虾本”能实现多端共享Skills、记忆等功能,图源:智能涌现拍摄 目前,PC端的YOYO Claw已经率先在新品笔记本上推出,在功能稳定之后,旧机型随后也会进行功能的更新适配。 现有MagicBook Pro 16/14可运行约30B参数模型,能解决的场景还比较少。未来,PC端侧可能会逐渐发展到100B以上模型,并在端云模型中不断做平衡,逐步减少云端的依赖。

36kr.com · None · tech

文|富充 编辑|苏建勋 2026年春天,“龙虾”火热异常,也直接带火了另一个概念:OPC(One Person Company,一人公司)。 一人公司的概念最早源于2013年英国公司法,原指法律意义上的“一人有限责任公司”。在AI浪潮下,它被重新定义,演变为一种个人或极小型团队,借助AI工具,即可实现全链路闭环的新型创业模式。 越来越多的商业领袖为OPC概念站台。周鸿祎说,一人公司是 AI 时代“超级个体”的极端形态。本质是 1个人指挥N个AI智能体 ,人做决策、AI 做执行。美图创始人吴欣鸿则在内部设立专项基金,鼓励10人以下的小团队申请,同时美图也推出新产品Meitu CLI,明确喊出要让“一人公司和初创团队”也能像专业团队一样调用影像能力。 从创业圈到成熟企业,AI工具正在重塑产品开发的最小单元,其带来的效率杠杆,在OPC群体中尤为凸显。 一人创业加速社区鸿鹄汇Honghub近日发布《2026一人公司洞察报告·重力、杠杆与进化》,首次提出面向一人公司OPC的AI效能评估指标HACR(Human-AI Cost Ratio,人机成本比),并发布中国市场2026年基准值: 一人公司每投入1元AI成本,等效替代约72元开发人力支出 。 △图片来自 《2026一人公司洞察报告·重力、杠杆与进化》 2025年下半年以来,一人公司逐渐从创业圈的自发现象,演变为被政策体系正式接纳的新型经济单元。杭州、深圳、上海、苏州、北京纷纷出台专项扶持政策,据公开信息,目前全国已有23个城市发布OPC相关政策。 《智能涌现》对谈了这波浪潮中,两位颇具代表性的“超级个体”创业者: “遇见森林”创始人郑国俊已有多年创业经历,过去三年里,他把团队从30人压缩到3人,在AI工具辅助下效率不减;“龙虾”赛道爆火后,他们又在14天内搭出了可上线的Agent协作新产品。 “00后”创始人Arvin体现的则是AI降低创业门槛的典型样本,两人团队、十几万启动资金,在AI帮助下把原本资源有限的个人创业跑了起来;“龙虾”出现后,他在语音硬件新项目EinClaw中,补齐对供应链和创业判断力的认知。 这些极小团队积极撬动AI杠杆,迅速补足执行层和知识空白,跑完从想法到产品的全过程。 但看得越深,我们越确认一个判断: AI降低的是“入场”的门槛,而至少在现阶段,“成功”的天花板却并未降低。 Demo可以速成,但产品定位、审美品位、痛点挖掘——这些决定生死的判断力,AI无法代劳。即便跑通了业务闭环,能否把它复制成可持续的收入、扩大客群,考验的依然是人的商务能力。 Honghub鸿鹄汇发起人邹凌曾经对《智能涌现》表示,称职的极小团队Founder,要会找机会、有执行力、能自我营销能把一人公司或者这种极小组织公司良好经营起来的Founder,身上通常具备以下三种核心能力: 一,找机会的能力。他们往往在某个行业深耕多年,可以从自身行业经验中提炼真实痛点、找到可以用AI改进的低效环节。 二,快速执行力,能借助AI独立完成短时间内做出初版甚至多个Demo,然后迅速获得反馈,聚焦最有潜力的方向迭代。 三,AI时代,很多早期项目并不依赖ToB销售或获客团队,个人创业者还要擅长用社交媒体为自己“代言”。得有找到早期用户、验证需求,甚至带来现金流的能力。 这篇文章记录了两位OPC创业者的真实经历。我们想呈现的,不仅是一套小团队创业的方法论,更是他们在这一轮变革中,那些值得被记住的收获与反思。 郑国俊:AI代替了员工、客户、CEO,但商业化的关还得自己过 “龙虾”火了不到两个月,“遇见森林”联合创始人兼CEO郑国俊就决定关掉运营两年多的AI写真业务“45AI”,彻底转向“龙虾”相关的新项目。 关停旧业务并非因为“不赚钱”,今年2月,45AI还在稳定产生现金流,之前最火的时候零市场预算情况下,上线7天超10万付费用户。 但郑国俊判断:既然已经看到Agent是AI创业的未来方向,存量业务增长有限,要做就把有限的资源All In在新赛道。 郑国俊毕业自哥伦比亚大学数学系,做过投资;创业前在"出门问问"担任AI产品经理的经历,让他对用户需求和产品形态的变化更为敏感。 △郑国俊(左二)在一人公司社区HongHub的对谈活动现场,图片:采访对象提供 新项目名为Clawroom,让不同主人的Agent能在同一套协议下接活、协作、交付,这可以解决目前“龙虾”难以跨组织沟通协作的问题。 具体而言,现在的初步产品像个“龙虾”协作“聊天室”:甲方给自家“龙虾”下任务,它直接在这里对接乙方“龙虾”执行,人只负责验收和兜底。 比如,甲方说“下周发5篇小红书笔记”,自家“龙虾”就在Clawroom里指派给乙方“龙虾”,甲方等结果即可。 最初,郑国俊其实还没想清楚产品具体长什么样,只是看到B端客户有想让企业Agent之间更高效协作的诉求。产品思路是他和Claude一轮轮聊出来的,然后Claude Code完成多款Demo。从立项到第一版上线,3个人,14天。 郑国俊估计,放在前AI时代,这至少需要一个10人的团队,花费2个月;更大的可能是,团队会因为周期太长和不确定性直接放弃这个新业务。 这也是AI时代产品开发的明显变化:不再憋大招,而是可以先做出最小原型,放进真实场景里快速迭代。 过去三年,郑国俊的团队从近30人缩减到3人,AI几乎参与了公司事务的每一个环节。 最初的替代从实习生开始。问卷调研、用户需求挖掘——这些重复性高、创造空间小的工作,交给GPT-3.5后,一个实习生能完成过去几个人的活。 后来是程序员。GitHub Copilot让一天的工作量压缩到四小时,擅长AI编程的人能把三周的工作量四天干完。 替代不止于执行岗。郑国俊甚至让AI扮演CEO:拆解竞品功能、分配开发任务、制定迭代计划——AI完成得有条不紊。 最近,在“龙虾”承担起运营等工作的情况下,原本只负责写代码的CTO,也开始独立运营一个新的小红书账号,发布商品推广图文。最初有客人来询价时,CTO并不清楚该怎么报价,还是“龙虾”客服向对方提出了价格方案。 但效率的提升,并没有让创业变得更容易。 郑国俊越来越清楚:AI改变的是效率,不是商业的底层逻辑。团队可以更小,开发可以更快,Demo可以更容易做出来——但客户不会因此自动出现,获客这些市场行为,仍然离不开人。 而且,极小团队的项目,往往不是资本青睐的类型,就更要把商业化闭环跑通。 2022年之后,融资环境变差,郑国俊想明白一个道理:融资和做生意是两套逻辑。融资青睐的是可规模化、可上市退出的故事,但一人AI创业项目通常基于某个细分需求和创意,很难符合这个预期。 更重要的是,股东多了,转身就会慢。比如关停“45AI”这件事——郑国俊清楚,存量业务的增长已经到头,继续维持只会分散精力。在这个三个月就变一次的行业里,决策速度比钱值钱。但如果公司有多位股东,就难以执行:会有更多人劝他不要关掉一个赚钱的业务。 所以郑国俊反复强调:如果选择做生意,Day 1就要想好怎么赚钱。不要被热钱冲昏头脑。 从30人到3人,不只是一个“AI提效”的故事。它真正说明的是:AI让团队更轻了,让转身更快了,但商业这道关,最后还是得创始人自己过。 Arvin:一个不想做“牛马”的00后,在AI“一人创业”里迭代判断力 正是AI工具的出现,让EinClaw项目联合创始人Arvin意识到“我也能先把公司开起来”。 2025年10月,Arvin从上家公司离开,扎进AI创业,做截图管理App。他的基本盘并不“华丽”:“双非”大学延毕两年,国际商务专业,在区块链公司做过三年产品经理。十几万的启动资金,行业资源有限,团队只有他和合伙人Affe两人。 这样的起点,在过去很难撑起一个产品团队。但在AI时代,它变得可行了。开发、法务、财务、隐私政策——没经验的事,先问AI;有了产品想法,就让Vibe Coding工具执行开发,人不需要在大量沟通和会议中浪费精力。 这也是Arvin最初对“一人公司”的理解:不想在大厂做低效运转的“牛马“,而是尽可能无损地把自己的能力直接转化进业务。 但AI是帮手的同时,也是竞争者。 12月30日,Arvin留意到了当时还名为ClawdBot的“龙虾”,但判断这是一款有安全风险的Claude Code,没有过多关注。1月10日,他初次试用后,失眠到凌晨四点。那一晚他做出的判断不是“来了个新工具”,而是“之前的App功能会被“龙虾”覆盖,项目必须转向”。 后来的故事一路加速。 2月,Arvin开始考虑做一款能接入“龙虾”的语音硬件——像Plaud一样挂在身上,不用解锁手机,就能语音输入想法并传给“龙虾”执行任务。他和合伙人在3月初的上海DIIS 硬件黑客松上,把“语音+Agent+硬件”的想法完整串起来,获奖,项目开始启动预售。 △DIIS 硬件黑客松上,Arvin(左)和合伙人Affe的“龙虾”语音硬件创意获奖,图片:采访人提供 接下来才是真正的难点。因为他和合伙人都没做过硬件,供应链磨合一开始就走了弯路。熟人报来的硬件方案价格要20万元,对一个刚起步的小团队来说,这不是个小数目。 项目一度陷入停滞,直到Arvin的另一位朋友指出,其实上述方案在5万元以内就可以做下来并推荐了相应供应链,项目才得以继续。 在Arvin看来,创业至今,业务具体内容变了,但底层逻辑其实没变。无论是最早的截图App,还是后来的语音硬件,本质上都在解决同一个问题:帮用户沉淀日常产生的大量 context,并真正把它调用起来。 真正变化的,是Arvin对创业的理解。 他会反思自己对业务的研判有些“滞后“:为什么12月30日看到那个产品时,没有更早一点认真试用?为什么被供应链报出20万元后,没有再继续找其他供应链验证信息是否属实,导致项目陷入了短暂的停滞? 他慢慢意识到,有了AI作为执行层之后,极小团队中真正稀缺的,是创始人的判断力。 如果说,Arvin眼中大公司的“苦”在于消耗,那么小团队创业的“苦”,就在于没有缓冲层。判断的后果,要自己承担;一个成员状态差,团队产能就会立刻打折;方向判断慢一步,窗口可能就没了。 AI的杠杆,让Arvin这样的年轻人有机会低门槛开启创业,也逼着他们更早面对创业里最硬的一层:能力不只是做得快,还包括想得对。 Arvin在过去8个月摸出了一套现实经验: 团队再小,也要有个“J”人能排优先级、搭框架; 合伙人最好先在黑客松这类高压协作里验一遍——能不能一起扛压力,比履历更重要; AI工具要多用,但也要知道它做不了什么——设计、审美、营销判断这些事,自己不够强就得尽快找专业人士帮忙; 办公环境不是小事,对极简团队来说,一个能迅速进入心流的空间,本身就是生产力。 △Arvin最近离开工作多年的深圳,入驻杭州HongHub办公室,他选择在办公室里搭帐篷住,图为和好朋友一起参观他的帐篷 ,图片:采访人提供 Arvin说起,自己创业的动力,也包括极强的、对运转效率低下的旧公司体系的厌恶,因此即使退回到起点,仍然会选择“极小公司创业”这条路。 “因为别的路也要吃苦,只是那些苦不是他想吃的,自己做创业,最差最差,也不过是一场白日焰火。”Arvin说。 封面来源|AI生成 欢迎交流~ 👇🏻 扫码加入「智涌AI交流群」👇🏻