作者 | 邱晓芬 编辑 | 袁斯来 6月9日,位于加州库比蒂诺的苹果总部被Swift标志性的暖色系渐变背景填满,熟悉的倒计时欢呼声依旧,但WWDC 2026选了一条更克制的路线—— 这次,苹果没有如往常一般发布新硬件,也不预热万众瞩目的折叠屏,而是把一个多小时演讲的最大篇幅,留给了软件与AI。 显然,苹果正试图把过去两年的"AI迟到者"的标签,编译成另一套叙事。 在发布会上,苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)先是纠偏了多数AI的产品思路——他认为,大部分公司都在急着往前跑,"为了AI而AI",却始终没考虑真正要服务的用户。 或许是在隐晦为苹果过去缺席AI做出解释,在他看来,苹果在AI上的定调是,AI必须以人为中心,要个性化、且有用。具体体现在,AI不仅要懂用户的个人环境、常用的应用、读懂用户当前的屏幕,且每一步的设计都要以尊重隐私为前提。 在关注AI之余,大众的另一个关注点是,这也是蒂姆·库克最后一次以CEO身份站上 WWDC 舞台主持。 不过,他选择把这段落幕的分量压得很轻——没有渲染煽情,在演讲结尾,他表示,“与这群团队同行,是一生的荣幸”,"我坚信苹果的最佳时刻仍在前方"。 (图源/企业) 真正的苹果AI,来了 在发布会上,克雷格·费德里吉回应了外界最为关切的苹果AI基础模型构成—— 其称,苹果今年开拓了与谷歌的深度合作,与Gemini共同打造了苹果的基础模型。这一模型同时能在设备端和云端服务器上运行。 (图源/企业) 落实到功能上,苹果AI具备四大核心升级—— 个人场景理解能力: 不仅仅是搜索文件,系统能读懂你散落在各处的碎片化信息——无论是相册里多年前的一张老照片,还是备忘录中随手记下的一段文字。 具备丰富的世界知识: 它充当了一个全能的研究助理,既能针对学术问题进行资料梳理,也能在你筹备派对时从网页中筛选出最实用的建议。 可以调用app工具箱: AI从“动嘴”升级为“动手”,它可以直接操作App内的功能,比如帮你把一组照片修图、排版并分享出去,或是根据你的口述从头撰写一封邮件,把想法转化为行动。 屏幕感知能力: 它能敏锐地感知你当前正在使用的App和操作界面,并据此提供辅助。无论是针对当前页面的内容提问,还是根据屏幕上的信息执行下一步操作。 (图源/企业) 遗憾的是,此次新升级的苹果AI无法在中国大陆提供,原因是“需要配合监管要求”。 在欧盟,苹果AI也无法在iOS、iPadOS上提供,但苹果方面称,正在寻找兼顾隐私与安全的可行路径。 Siri AI新叙事:跨终端、视觉是重头戏 基于底层苹果AI,苹果大刀阔斧重构了Siri,让语音小助理变得更神通广大。 举个例子,当你问“某明星演唱会在什么时候、怎么订票”时,SiriAI可以调用当下的世界知识,并且以此为依据来回答问题,并给你打开这个歌手的音乐; 在你看到屏幕上某个地方,也可以问SiriAI这是在哪里,并且让它导航。 (图源/企业) 不过,更重要的是,苹果此次把Siri AI装进了不同的硬件里,还为不同硬件量身定制了独特的打开方式。 比如,在手机上,用户向下扫动 灵动岛 就可以文字搜索、或者是用侧边按钮、用“Hey Siri”唤起;在Mac里,Siri AI被整合进了 Spotlight(聚焦)中 ; (图源/企业) (图源/企业) 在手表上,Siri AI可以通过抬手腕来访问。在 Apple Vision Pro上的体验更有趣,Siri AI能被空间化呈现——不用借助语音唤醒词,只要把按钮放在空间中任意位置,用眼睛看着它,Siri AI就被直接唤醒,就像一个随时待命的管家。 (图源/企业) 在手机、平板、电脑等不同硬件里,通过iCloud同步,Siri AI能够保持一致的对话历史,也支持断点续聊。 值得注意的是,在此次苹果AI的更新中,“视觉”成为了一条全新的故事线。 苹果先是���AI引进了拍照里——当你把镜头对准实物时,Siri将会自动帮你识别与触发动作。例如,当你拍下和朋友聚餐的账单,并且选中自己点的东西,SiriAI就能自动通过Apple Cash帮忙自动AA。 (图源/企业) 在macOS、iPad上,用户还可以通过专属的键盘快捷键,选中屏幕上的内容,就可以对选区内进行持续提问。 而在Apple Vision Pro上,用户甚至可以“对着实物问”。比如,你可以对着背包问SiriAI,“这能当9月航班随身行李吗”,它将会结合物品物理尺寸常识进行作答。 (图源/企业) 本质上,Siri AI正在将用户眼前的像素,变成了一些可查询、可执行的命令参数,而不只是和过去一样,手机识图仅仅为了好玩。 苹果AI,融入一切原生APP 这次,苹果没有简单把AI封装在Siri的小气泡里,而是试图把它塞进用户最常用的六大原生APP中。 (图源/企业) 在Safari里,苹果借助AI提供了一项更简单、更智能的标签页管理方式。当用户打开一堆网页时,苹果AI将会分析各个页面的相似之处,并且“合并同类项”。 另外,新Safari还上线了“通知我”功能。当用户在报名或者抢票的场景下,Safari会帮你盯着某个网页,当检测到更新时,系统将跳出弹窗自动提醒你。 (图源/企业) 在信息、邮件APP中,信息和邮件里面的信息则不再是冷冰冰的文字——经过苹果AI的理解,系统将根据上下文,匹配相应的动作。 比如,帮你自动创建提醒事项或备忘录、帮忙匹配邮件或信息里提到的要发送的图片、或者是快速调出常用APP等等。 (图源/企业) 在电话APP,苹果则设想了一个常用场景——当你拨打航空公司等服务号码时,系统会依据你通话对象的诉求,帮你自动把邮件里的验证码帮你翻出来,钉在通话屏幕上。 (图源/企业) 在Home APP中,苹果AI也将发挥作用,比如,将识别相同类型的推送,合成成一个,在原有基础上连续更新; 在用户连接摄像头时,苹果AI还将识别摄像头片段,支持用户文字内容检索,并且帮助提取出用户想要的、相同的片段。 (图源/企业) 在快捷指令APP内,苹果AI引入自然语言创建功能。当你说一句需求时,系统将帮忙调用背后上百个APP,把步骤组装出来。 在相册APP里,最有趣的功能其实是空间重构(Reframe)。用户可以在照片上模拟"重新构图",基于苹果的空间模型和图像生成模型,可以让构图过的图片与原始拍摄场景基本一致,仿佛你穿越回拍摄时的那一瞬间。 (图源/企业) 其实,苹果这套AI刀法的有趣之处在于,不止是宣布了技术更强的多模态模型,而是直接把AI嵌进用户日常的路径里, 让 相册、短信、日历、浏览器、家居摄像头、快捷指令这些以前被动响应的模块,长出了主动性。 只是,这套体验的另一面也很苦涩——苹果AI的体验越私人、越强调跨应用、跨硬件,隐私与监管也更会成为其阻碍落地的潜在瓶颈。 正是在这种矛盾中,苹果在发布会尾声亮出了真正的底牌: 打破黑盒 。 通过全新的 Core AI 框架,苹果把运行在自家芯片上的本地模型能力,打包成了一种通用的系统级服务。开发者只需熟悉的 Swift 语言,就能直接调用这套能力。 这不仅意味着,第三方 App 也能拥有媲美原生的本地 AI 体验,更关键的是,苹果并未打算独占这一优势——它预留了标准化接口,允许不同的 AI 模型接入同一套开发管线。 这一步,看似是降低开发门槛,实则是在“布道”:苹果 AI 正试图从单点功能,蜕变为支撑整个生态运转的底层基础设施。 在AI狂潮中缺席太久的苹果,如今正迈出试探性的一步。坐拥全球最庞大的硬件入口,苹果的入场显然会加快整个AI普及的进程。但疑问仍然挥之不去:苹果到底打算走多快? 首页图源|企业 排版|范馨雅 欢迎交流
作者 | 邱晓芬 编辑 | 袁斯来 「格物科技」的创始人范典,是当下智能硬件赛道的一个“异类”。 作为喝过小米粥的小米创始员工,范典曾任曾小米物联网平台部总经理、AIoT战略委员会主席。以大厂高管履历拿笔钱,以最短时间做出款硬件上众筹,依托媒体造势,再滚动更多融资是这两年硬件赛道创业很常见的打法。 但范典做第一款产品用了三年。 2024年,智能硬件还是很冷僻的赛道,范典的选择更是小众中的小众。 他没做当时已被市场验证过的AI可穿戴设备、AI床垫,转而做起一个 全新的品类—— AI睡眠床头灯(Sleepal AI Lamp)。 很少人清楚这三年发生了什么。范典几乎不接受采访,也鲜少见投资人。低调也体现在他新公司「格物科技」的融资上。创业三年,他们仅公布了一轮天使轮融资,资方为小米、天际资本等。 直到今年5月19日,Sleepal AI Lamp在海外平台Kickstarter开启众筹,定价为449美金。产品刚上市就被好奇和疑问包围:“一个床头灯这么贵,是不是疯了?”“创业三年了,就做了个灯?”、“有手表了,谁还需要这个?” 产品众筹之际,范典接受了硬氪的采访,这是他从小米离开后首次接受媒体采访。我们能看到他清晰的产品思路以及厚重的技术积累。 (图源/企业) 用毫米波雷达测量睡眠 范典的创业初衷源于自身的痛苦经历。他患有睡眠呼吸暂停症(OSA),也就是说,睡着后因为气道堵塞而导致全身缺氧。这让他即使睡满8小时,醒来依然头痛欲裂。其实,这类问题并不罕见,成年人的发病率约为15%,40岁以上的比例甚至高达约30%。 为此,范典尝试过大量助眠方法,戴上CPAP呼吸机、使用AI床垫、睡眠带等等,但真正能长期坚持的方案,往往带有一定的“摩擦”。 范典告诉硬氪,AI床垫的问题在于单品成本过高,且安装成本门槛高;他们也曾经考虑过做AI睡眠吸顶灯,其优势在于可以感知全屋,但可能受吊顶结构遮挡限制。 具备睡眠检测作用的可穿戴设备(手环、戒指、前段时间大火的whoop)虽已经被市场验证,但市场调研数据表明,可穿戴设备拥有者的夜间佩戴率仅60%,且主要适用人群是年轻人,高龄人群渗透率并不高。 范典分析,这背后的原因是多方面的,比如可穿戴设备需要持续充电、佩戴有压迫感等等。 于是,他们把产品核心逻辑定为, 不产生摩擦成本的AI睡眠床头灯 。 只是,这种思路虽然解放用户体验,却也产生了更高的技术门槛。 在过去,可穿戴设备检测睡眠的原理是,依靠光电信号(PPG)检测毛细血管心率,再叠加手腕加速度测算体动,最终用两项数据拟合睡眠情况。 不过,这种测量方法容易 受到手部体毛、佩戴松紧度、肤色、纹身等因素的干扰。 在范典看来,这些设备也无法完整理解真实的睡眠环境——它无法理解温度、噪声、光线是不是正在影响你的睡眠,更无法理解用户的睡姿变化。 Sleepal的AI睡眠床头灯的原理则完全不同。 范典告诉硬氪,睡眠分期的转换,受中枢神经系统与自主神经功能的协同调控。在这个过程中,呼吸、心率等生理信号会产生联动性变化,与睡眠分期高度耦合,从而指示不同的睡眠阶段。其中,呼吸信号不仅与睡眠分期高度相关,也是判断呼吸暂停的核心依据。 为了收集这些信息,他们在Sleepal床头灯上装了一系列传感器矩阵,包括一个 60GHz的毫米波雷达、热阵列传感器、麦克风阵列、一个环境传感器。 不同的传感器各司其职—— 毫米波雷达用于感知睡眠期间的体动信号,从中提取睡眠呼吸频率、心跳特征、胸腔起伏,精度可以达到0.1毫米,用户推测人体处于哪个睡眠分期; 另外,为了更全面了解睡眠情况,其上的麦克风阵列还用于收集鼾声和环境噪音,环境传感器用于检测室内光照,记录睡眠的干扰信息,测温阵列用于感知人体轮廓,判断用户睡姿。 (图源/企业) 范典向「硬氪」介绍,Sleepal虽然通过非接触的监测方式,但连续高频地对呼吸、心跳和全身体动等直接体征进行监测,所得的睡眠分期结果,比可穿戴设备靠体动检测睡眠的误差更小。 近期,「格物科技」与世界睡眠学会主席 Thomas Penzel 教授共同署名的论文中,Sleepal基于1022晚的医院PSG数据进行了验证,最终取得κ=0.695的结果,比Apple Watch(0.68)、 Oura Ring(0.65)更高。(点击查看论文:https://arxiv.org/pdf/2604.16442) 七个垂直模型、百万数据投入 解决了数据收集问题,下一步重点是如何给数据搭建一个标尺。 在睡眠医学领域,PSG(临床多导睡眠监测)是公认的精标准。具体而言,在收集睡眠数据后,将由专业技师人工标注睡眠分期(比如清醒/浅睡/深睡/REM)、呼���暂停事件。 在模型训练中,这些数据充当了 标准答案的作用 ,用于监督和对齐雷达采集的原始信号。 范典向硬氪介绍, 创业三年,「格物科技」联合多家医院睡眠中心采集了超过 2000晚的PSG数据,每年公司在数据上的投入成本高达数百万。 基于这些精标准数据和用户睡眠数据,「格物科技」训练了 七个细分垂类AI模型, 包括生命体征检测算法、多模态睡眠分期模型、呼吸暂停检测模型、多模态人体状态识别模型、多模态睡姿识别模型、端侧鼾声识别模型、雷达信号ECG生成模型。 依靠这七个参数数亿的垂直模型矩阵,Sleepal床头灯不再单纯是睡眠信息收集工具,而是一个能提供个性化改善建议的 AI睡眠管家 。 比如,Sleepal可以剥离出呼吸率、HRV(心率变异性)、睡眠阶段等高阶生理特征,帮用户做出睡眠改善建议——告诉你:昨晚没睡好是因为仰睡导致打鼾加剧,或者产生微觉醒是因环境噪光和睡前大量运动等等。 除了睡眠数据检测之外,他们围绕睡眠这一核心场景做了一些用户体验提升,比如增加了昼夜节律灯、白噪音、智能闹钟等功能。 比如,当即在约定的闹钟时间前,Sleepal会在用户浅睡或微觉醒期才渐亮灯光和发声唤醒,避免深睡被惊吓产生起床气。而在用户起夜时,Sleepal会自动微微亮起,在回床躺下时自动熄灭。 (图源/企业) Sleepal 在Kickstarter上线的前48小时,募资金额已经超过20万美金。虽然是全新的品类、全新的技术,全新的品牌,但在Kickstarter这个科技潮玩更受欢迎的众筹平台已经超过了90%的产品。 范典告诉硬氪,在商业模式方面,短期内,Sleepal计划采用硬件销售搭配软件订阅的形式。 Sleepal的每一步,都能看到老硬件产品人的风格,低调且扎实。 从长期来看,「格物科技」更希望从卧室睡眠检测切入,扩展到全屋家庭健康AI的方向。未来,在卧室里验证的多模态感知技术可复制到卫生间(毫米波雷达跌倒监测)、餐厅(检测饮食)等空间。 最终,基于连续的生命体征数据,范典希望可为用户提供慢病风险筛查与预防,成为真正“治未病”的家庭健康入口。 一盏床头灯只是微小的第一步。 首页图源|企业供图 排版|范馨雅 end
作者 | 邱晓芬 编辑 | 袁斯来 硬氪独家获悉,具身智能企业「原力灵机」近期完成新一轮融资,资方主要为数家大模型公司,包括 智谱、阶跃星辰、商汤科技。 此外, 华勤、上汽恒旭 等产业投资方持续加注 。 「原力灵机」 是一家通用具身大模型公司,2025年3月由旷视科技联合创始人兼CTO 唐文斌 创立,团队核心创始成员为旷视科技原班人马。 有意思的是,此次融资也是商汤、旷视这两家曾经的对手,在具身智能的热潮中罕见“会师”; 另外,算上A+轮独家领投的 阿里 ,这也是具身智能赛道罕见同时聚齐国内四家大模型厂商——此前,智谱仅通过Z基金小范围投资具身智能领域,阶跃星辰则几乎未出手具身智能。 而这一集体动作也释放出一个信号,当 大模型竞争的主战从Token向Action转移 ,拥有物理世界交互能力的具身模型,已成为模型公司们锚定的下一片高地。 伴随着此次融资,唐文斌也在兵合一处,着手整合机器人资产。 硬氪独家获悉,「原力灵机」近期通过股权并购方式,完成了与「Atomix」(原力聚合)物流机器人的合并, 剑指具身智能的大规模落地与全球化扩张。 「 Atomix 」的业务基因最早可以追溯到2016年——彼时,唐文斌在旷视科技内部主导智慧物流与机器人调度业务(河图系统),主推多形态物流机器人解决方案。 直到2024年7月,随着旷视业务变化,唐文斌将物流机器人业务从旷视体系剥离独立,并成立「 Atomix 」。 经过几年的探索,「 Atomix 」的托盘四向车销量已达全球第二,累计服务项目超过500个,客户包括优衣库、蜜雪冰城、宁德时代等, 公司年营收近十亿 。 随着具身智能硬件供应链趋近成熟,行业已经逼近那堵必须逾越高墙:具身大脑。相比语言模型进化路径的清晰,具身智能模型当下甚至找不到低成本、海量且高质量的数据,遑论找到收敛的训练范式。可以说,整个行业都在混沌之中摸索。 这种情况下, 本体、大脑、数据的整合,或许成为具身赛道的新常态 。 一直以来,具身智能行业的理想状态是打造真正的数据飞轮。而实际情况是,行业正处于“数据死结”状态——模型需要真实场景里的错误数据来推进进化,而若没有好模型的武装,机器人无法进场景,也就无法采集真实的数据。 因此,有消息人士称,两家公司的合并,本质上是闭环模型与场景,打开数据死结。 正如唐文斌此前在采访中提到,Picking(抓取)正是具身智能时代的“原子任务”——Picking之于具身智能,正如Coding之于大模型,而「 Atomix 」正像是一台连续运转的Picking数据发动机。 「原力灵机」机器人 做早餐 (图源/企业) 据了解,在未来, 「Atomix」在超20个国家、500多个项目里跑出来的真实数据,将直接成为「原力灵机」模型训练的燃料;而「原力灵机」所训练的具身智能模型,也将快速实现跟「Atomix」现有机器人进行协同作业。 这一构想或许并非空中楼阁,而是建立在一定的技术底座之上。在此之前,「原力灵机」已经推出了通用具身大模型“DM0”。 唐文斌此前接受采访时提到,在数据层面,「原力灵机」已完成了业内首次“三类数据大融合”——将互联网语义、智能驾驶物理规则、机器人实操数据进行混合训练,提升数据的规模与质量。 而这种跨域混合训练的方式,使得“DM0”跳出了对特定硬件参数的依赖,像一位经验丰富的“老司机”,在海量异构数据中抽象出了通用的物理规律,并且能够无视硬件差异,在多种不同构型的机器人本体间迁移,实现通用的操作逻辑。 「原力灵机」机器人 在调酒 (图源/企业) 更关键的是,「原力灵机」也试图将大模型的“思维链推理”延伸至物理空间——这也使得,“DM0”仅用2.4B的小参数规模,就实现了突破亚毫米级的精细操作,在长程连续任务中的成功率大幅提升。 通过一系列组合拳,“DM0”正试图打破传统具身模型数据单一、换机即瘫、参数臃肿的痛点。 此次合并、融资后,中国的具身智能行业正迎来一位强劲玩家。更重要的是,这也提示行业正进入下一个阶段——寻找到具身模型的scaling law。 这绝非仅靠堆砌机器人本体就能逾越的险隘。 就在本周,媒体披露字节跳动正重金招募具身智能技术负责人,目标直指头部创业公司的核心技术骨干;与此同时,海外具身智能明星企业Skild AI也刚完成了对Zebra(斑马技术)机器人自动化业务的并购。 海内外巨头的动向如出一辙——随着本体制造商、数据资产方、模型研发者、场景运营方开始加速聚拢,行业正式进入深水区。 首页图源|网络 排版|范馨雅 欢迎交流
作者 | 邱晓芬 编辑 | 袁斯来 在龙旗位于南昌的智能制造工厂中,两台智元精灵G2人形机器人已融入平板产线,承担起多媒体集成测试(MMIT)工站的上下料作业。 其工作节拍已接近熟练产线员工——依托腰部的三个运动自由度与全向移动底盘,机器人精准从传送带抓取生产完成的平板,送入检测机箱;待测试完毕,又能迅速取出合格产品、利落放回传送带分流。 据现场实测数据,单台机器人每小时可稳定处理约310台平板设备,峰值达316台,8小时连续作业整体成功率超99.5% 这并非一次单纯的展示。 2026年,中国的具身智能机器人热潮中,一大波市值百亿、千亿手机供应链巨头躬身入局,成为机器人行业里无法忽视的关键玩家。除了龙旗,动作激进的还有富士康、华勤、蓝思、立讯精密等等,它们的名字都出现在头部具身智能的投资人名单上。 机器人上产线只是个开端。它能最直接地帮助工厂降本增效。 (图源/企业) 但显然,手机供应链巨头不可能只满足于当个买家。硬氪了解到,今年中国头部手机代工厂商(包括华勤、立讯、龙旗等)都在积极接触下游机器人公司。一家机器人公司CEO告诉硬氪, 代工厂们不惜拿出“有诚意的报价”、搬出“有深度合作机器人客大客户”为话术来打单。 它们受够了挣辛苦钱。过去十多年,在全球智能手机分工体系中,中国供应链公司,总在利润相对低的那一端徘徊。 中国手机代工巨头如何布局人形机器人 硬氪基于公开信息整理 他们呼唤这样一个行业,它将生于中国,定义于中国,制造于中国。当具身智能这个故事的轮廓一步步变得清晰,手机供应链错过它,将是不可原谅的战略级错误。 具身智能也等待手机供应链太久。为全球造了百亿部手机,中国手机供应链积累了厚重的消费电子技术和生产经验,只有它们能把机器人产业从过去的“手搓”带往真正的量产。 一场隐秘的供应链迁移,开始了。 机器人进厂造3C 中国手机供应链正站在一个微妙的转折点。过去三十年,凭借极致的成本控制与庞大的劳动力红利,中国手机供应链创造了高效且低价的奇迹。 然而,“世界工厂”的光鲜表象之下,一些隐忧浮现——人口红利和劳动力结构变化,倒逼人海战术著称的产业链玩家寻找新的解法。 人形机器人毫无疑问成为了供应链巨头们眼中解决结构性矛盾的必选项。 一名与手机供应链代工厂商合作的机器人工程师告诉硬氪,以3C的检测环节为例,在两班倒的情况下,工人日均工作时长十小时,且需要在多个机柜间来回穿梭送检。方寸的移动距离里,工人们的日步数高达三万步。 管理与风控的矛盾也逐渐暴露。由于工人们经手的零部件单价高昂,而基层工人薪资相对微薄,工厂不得不采取严苛的“军事化管理”模式。 硬氪曾参观不少手机代工工厂,发现封闭式管理是工人们的日常——工人进出产线前后需过严格接受安检,产线内还设有严密监控。在工作时,工人们也无法自如移动。 一位手机代工厂资深管理者向我们坦言:“ 我们必须假定人性本恶来做管理。 ” 高压工作环境也与新兴劳动力的择业观念背离。前述工程师称,中国手机供应链代工厂里的工人月离职率高达15%,产线几乎处于“三个月一换血”的恶性循环中。 而频繁的人员流动所产生的新人培训、良率波动、熟练工流失,都正在吞噬原本就微薄的代工利润。 过去十年,中国的手机供应链尽管已经意识到这一点,并已大规模引入机械臂提高自动化,但这种方案在疾速变化的消费电子行业里,未免捉襟见肘。 一名行业人士告诉硬氪,消费电子产品迭代极快,产线变动频繁,且存在明显的淡旺季波峰波谷。 而传统的专用机械臂非标程度高,一旦产品改型,意味着昂贵的夹具可能作废。而人形机器人的好处是操作更灵活,当工序变化时,只需要重新适配和模型微调,且人形更有利于主动适应原本本就为人设计的工厂环境。 “人形机器人进工厂,是替代掉原来的人,不是替代掉原来的自动化机械臂,二者将实现互补,让产线实现有更高程度的柔性生产”,前述行业人士表示。 面向未来的生存之战 不过,引入人形机器人,不仅仅是基于劳动力情况和行业特征所做出的权宜之计,更是供应链巨头们一场面向未来的生存之战。 对他们而言,老业务的前景暗淡。 尽管华勤、立讯等巨头近两年营收仍在增长,但营收并未转化成利润,各家的代工业务毛利率依旧徘徊在10%–13%,部分低附加值产品甚至低至5%-8%。对比来看,被称为国产机器人减速器“一哥”的绿的谐波,2025年销售毛利率为37%。 手机代工的本质是一场规模游戏,而在全球智能手机出货量承压、叠加上游存储涨价的情况下,过去薄利多销、用价换量的思路已举步维艰。人形机器人这一新的生产力,被视为下一个增长机会点。 “我们舍得投入,愿意投入,坚信机器人一定是工业的下一个机会。这不是量变是质变”,一家手机代工厂机器人事务部总经理告诉硬氪。 人形机器人成了手机代工巨头拯救利润的稻草。同时,中国机器人产业的规模化落地也极度渴求成熟的手机供应链介入——过去几年,由于核心产业链未真正成熟,中国人形机器人行业长期处于“手搓”状态。 一名人形机器人厂商高管告诉硬氪,近两年来,人形机器人的研发与生产过程相当“痛苦”。 比如,由于供应链标准缺失、工艺不成熟,一些人形机器人运行一段时间后经常出现关节异响,或是脚底材质仅几十小时就磨损报废。这意味着,机器人后续的设计都需要修改,而产线上已制造出的机器人也需要全部召回返工。 对于人形机器人厂商来说,不仅要免费维修,还要支付高昂的零部件与人工维护成本,而这种“手搓”的作坊式生产也严重拖累商业化节奏。 但今年以来,这一局面正在被打破。顶级的代工厂都在放下身段,接下过去根本不屑一顾的人形机器人订单。 “华勤、立讯这类公司向来对成本和数量极其敏感,如果他们愿意主动接单,说明他们认为机器人这个品类真的能上量,这是非常积极的信号”,前述CEO表示。 Interact Analysis数据显示,2025年全球人形机器人产量总计超过2万台,是2024年的约10倍。其中,宇树科技和智元机器人各自产量超过5000台大关,占全球产量50%以上,另外,至少还有10家中国人形机器人公司处于数百到上千台跨越的关键节点,包括优必选、乐聚机器人、加速进化、银河通用等等。 一名行业人士向硬氪分析,1000台是2026年人形机器人厂商的“坎”,是行业从 炫技迈向工业化量产 关键分水岭。而中国手机供应链的介入,毫无疑问为行业送来了关键的工程化能力。 从供应链的角度,人形机器人与手机其实高度同源—— 手机上的摄像头模组和麦克风阵列,可复用作机器人的感知“五官”;手机上的微型电机和线性马达,则可支持机器人的精细操作; 手机上的高密度电池、液冷,则可转化为机器人高密度的供电和散热方案;另外,手机上积累钛合金、碳纤维、以及折叠屏手机的精密铰链,则可能成为机器人的骨骼与外壳。 机器人供应链与手机、汽车供应链的异同 硬氪基于公开信息整理 一个有力的证明便是,不久前,跨界进入机器人仅一年的荣耀,便依靠复用、整合手机技术,力克宇树和上届冠军北京人形,包圆亦庄马拉松第六名。 当人形机器人正从研发演示走向千台的量产拐点,市场紧缺的正是大规模、低成本、高品质交付的工程底座。而这正是中国手机代工巨头们最擅长的本领。 目前人形机器人还远未到爆发的时刻,但能够确定的是,代工厂们将写出和上个时代全然不同的情节。 首页图源|企业供图 排版|范馨雅 end
作者 | 邱晓芬 编辑 | 袁斯来 余轶南似乎是那种总能提前踩中风口的冒险家。 他总在追逐更新、更刺激,早期甚至带着些浪漫想象。博士毕业后,他没有如很多同侪一般,进入学术圈,过上平稳安定的一生,而是冲入互联网浪潮,2015年,他又因为余凯一句“我们一起去做 AI 芯片吧?” ,便追随余凯加入地平线创始团队,成为001号员工。此后几年,地平线逐渐成长为国际上自动驾驶领域最受关注的科技公司之一,并于2024年在港交所上市,成为当年港股最大的IPO。 2024年底,他离开地平线,创立「维他动力」,希望把过去十年在自动驾驶领域积累的能力,迁移到消费级机器人上。 (图源/企业) 余轶南有种知识分子身上并不多见的江湖气。在地平线后期,他管供应链、销售、财务等等,自己创业后更是要纵观全局,果断、坚定成为他必然的底色。 他正带领维他动力跨过了一段段里程碑。 硬氪独家获悉,「维他动力」近期完成Pre-A轮融资,金额达到5亿元,由东方嘉富,华泰紫金,复星锐正联合领投,上汽集团旗下尚颀资本,明荟致远共同参与投资, 凯辉基金、今日资本、高瓴创投、渶策资本、BV百度风投、柏睿资本等老股东继续投资。这也是消费级具身智能领域最大单笔融资。 在融资之余,「维他动力」也开启了量产交付,其首款产品“ Vbot超能机器狗”已于5月8日正式启动交付,首批500台产品已下线 。除了将四足狗送进家庭场景外,「维他动力」也正在开启 人形机器人的产品研发 。 「维他动力」联合创始人赵哲伦向硬氪介绍,5月将完成超过1500名用户的产品交付,到6月,产能将提升到2500台以上,进一步加速预订用户的产品交付。 伴随着量产交付推进,线下渠道也在同步搭建中。据硬氪了解,「维他动力」已完成线下体验网络的首批布局,包括上海长宁来福士体验店、北京蓝色港湾体验店都已开业,未来,还将 继续入驻全国知名大型零售空间,包括 京东 Mall 、 山姆会员店 、 Z·Pilot 黑科技体验空间 等。 余轶南对行业有很清晰的判断。他告诉硬氪,预计在2027年,国内将会出现具备初步实用价值的家庭机器人。但他绝不会盲目乐观。“我们认为 具身智能的万里长征才走了第一步 ,产业远未到收敛的时候,无论是产品形态、技术路线还是应用场景,都还在快速演化。” 在这个过程中,「维他动力」选择小步快跑,“不会一上来就追求100分的完美产品,而是先做出60分的产品,快速迭代。他们接下来的核心工作将围绕三项方向推进:兼具运动能力与任务能力的全尺寸人形机器人的 本体研发;覆盖通用操作和移动能力的世界模型研发;搭建 Agentic OS架构的 具身智能操作系统, 让机器人具备丰富的应用生态,服务家庭、商业、办公等各大生活空间。 在此次融资前,《硬氪》与「维他动力」创始人兼CEO余轶南、联合创始人赵哲伦聊了聊,以下是采访实录(略经摘编) 家庭机器人用户,与新能源车高度重合 硬氪:你们首款产品超能机器狗目前的订单和交付情况如何? 赵哲伦: 自发布以来,Vbot超能机器狗 的 订单总量已超过8000台。我们与华勤合作共建了专属产线,还处于产能爬坡阶段,目前已下线约500台,预计5月将交付1500台,6月产能将爬升至2500台/月,在产线满产状态下的月产能可达4000台以上。 硬氪:目前这些订单的客户画像是什么样的?大家大概的购买诉求是什么? 赵哲伦:我们发现我们的用户画像与上一代的新能源车主高度重合,年龄大概是30-45岁,以拥有理想、蔚来、特斯拉、BBA、保时捷车型的中产有娃家庭为主。 大家的核心购买动机是家庭陪伴,其次是作为AI创新产品让孩子接触前沿科技,也看中了它可带出门的尝鲜属性,机器狗是目前唯一能方便地带到户外进行互动的具身智能产品。我们当前订单全部来自国内市场。 硬氪:今年行业里集体转向C端商业化,但是你们是一开始就锚定家庭场景的,你认为C端的量产交付相比于B端有哪些新的挑战,你们具体是怎么解决的? 赵哲伦: 最大挑战在于,C端用户对产品质量、可靠性和体验的要求远高于B端,而整个机器人产业链却极不成熟。我们以汽车工业的标准来要求我们的消费级机器狗,也做了一些措施应对了三大系统挑战。 首先,在机械系统方面,我们大幅提升了关节电机和本体的耐久性标准,目标是机器狗在使用500-1000公里后仍能保持安静、连贯,无齿轮松动异响,这需要我们去重新定义零部件精度和寿命; 第二是能源系统,为满足家庭长续航需求,我们彻底重构了电子电气架构,取消了工业场景的换电结构,采用高度集成的计算平台,从而释放空间容纳了更大的电池,实现了5小时的续航; 第三是智能系统,我们为机器狗集成了完整的自动驾驶级计算平台和传感器,使其成为不依赖遥控器的自主智能体。 硬氪: 你们可能是目前最早一批真正把具身智能产品带入真实家庭生活空间、并开始形成规模化用户反馈闭环的公司。相比传统“先做Demo、再验证场景”的路径,你们的数据飞轮会怎么运转? 余轶南: 我们将其分为两步。第一步是“冷启动”,先做出一个具备基本作业能力的、且可销售的产品。第二步是构建“在实践中学习”的自学习系统。 当大量机器人在真实场景中运行时,它们会在能力边界进行探索,那些处于成败边缘的“边界数据”最有价值,我们会在端侧对这些数据进行筛选,上传到云端进行二次加工,用于训练出更好的新模型,再通过OTA推送给所有机器人,如此循环,推动能力持续进化。 硬氪: 今年行业都在突破数据大关,你们具体会如何定义和筛选对模型进化有用的数据?大概要有多少数据才有scaling law的可能性? 余轶南: 我们追求的是“高质量”和“高散度”的数据。高质量指的是能反映成功或失败的关键数据,高散度指数据需来自多样化的场景。我认为,简单的重复性数据或完全无法处理的数据价值都很低,现在行业有一个粗略的共识, 可能需要百万小时级别、有散度的数据,才能实现良好的泛化能力,只是单纯堆砌数据量是没意义的。 硬氪: 我理解机器狗只是一一个过渡期的产品形态,后面终局还是会往人形去拓展,你对于形态的判断如何? 余轶南: 我们认为一个完备的具身智能体需要 通用交互、移动和操作能力 ,但具体形态应由场景决定。工业场景里,很多时候一个固定机械臂就够了;商业服务场景会更强调与人的交互能力;而家庭场景最复杂,机器人不仅要移动,还要适应楼梯、地毯、桌椅等各种真实环境。我们现在先从四足形态切入,是因为它更容易率先进入家庭,但长期来看,要完成更复杂的家庭任务仍需要向人形结构演进 当下,我们正在做的其实是一个平台化的机器人操作系统和核心组件生态,然后根据不同场景需求去搭载不同的形态。家庭只是我们的第一个切口,未来我们会把机器人扩展到所有服务于人的空间。 硬氪:最近机器人行业大家也在尝试用消费电子和汽车供应链的成熟技术去赋能全新的机器人产业,你近期一直在盯量产交付,有关注到这个趋势吗,比如会尝试用仿真测试吗? 赵哲伦: 我们用了很多的仿真测试,比如在硬件设计前就在模拟环境中验证算法和步态。但我认为,仿真无法完全替代物理世界,比如我们曾有一个铝制结构件,在仿真中其强度可达1000公斤,但实际压铸件因工艺产生内部气泡,强度仅达100公斤,这也揭示了材料工艺等工程细节是仿真的盲区,必须通过反复的试制和测试来发现和解决问题。 2027年将出现有实际价值的家庭机器人 硬氪: 今年硅谷和国内大家都在谈“机器人进家庭”的故事,但是去年以前,大家普遍会觉得这个场景没那么快能实现。背后的转变是怎么发生的?你判断的进家庭会在什么时候发生? 余轶南: 家庭本身就是市场规模最大的场景,这也是技术进步到一定阶段的必然结果,因为全球在 世界模型、全身运动控制、灵巧操作 等多项技术上的突破,让大家看到了可能性。我认为2027年前后,会开始出现真正具备实际价值的家庭机器人,它们不再只是展示能力,而是能够在部分家庭场景中持续提供高质量的服务。未来,家庭机器人的 市场规模将随着机器人处理任务的复杂度和链条长度而呈指数级扩大。 硬氪:现在家庭陪伴机器人也有不少公司,但感觉大家的产品有一点同质化的趋势,你觉得背后的核心赛点是什么,大家在拼什么? 余轶南:我认为竞争壁垒是分阶段的。短期的核心是拼 速度 ,看谁能更快地完成研发、量产并获取首批用户。长期来看,则是拼 技术深度(比如 专利积累)、 品牌声誉 、 产品质量 以及由此建立的 用户粘性,也就是 用户的切换成本。 硬氪: 你们正在研发全尺寸人形机器人,在技术上,大人形和现有的四足机器狗有哪些协同和差异化的部分? 余轶南:人形机器人和机器狗在技术上的协同度非常高。硬件方面,超过一半的关节、计算平台、电池、传感器、结构材料、供应商可以完全复用。 软件上,操作系统、电子电气架构、通信协议等几乎是100%复用。算法上,越高层的部分复用度越高,比如世界模型、视觉语言模型等,差异化的部分,只有最底层的、与具体身体形态强相关的运动控制部分需要重新适配。这就像一个“大脑”可以适配不同的“身体”。 硬氪:你们接下来会有哪些重点的研发工作? 余轶南: 首先,是全尺寸人形机器人的 本体研发,兼具运动能力与任务能力;其次,是研发手足一体的世界模型研发,覆盖通用操作和移动能力; 最后,是研发Agentic OS架构的 具身智能操作系统, 让机器人具备丰富的应用生态,服务家庭、商业、办公等各大生活空间。 硬氪:今年行业里一个大事件是特斯拉第三代人形机器人量产,你判断这会对行业产生什么影响?这会不会对行业产生一些冲击? 余轶南:我认为这将是定义行业风向标的超级事件,就像当年的特斯拉Model 3进入中国一样,它会极大地教育市场,统一行业认知,告诉大家什么是“正确的玩法”。但我认为它不会颠覆我们,反而会像曾经特斯拉带动“蔚小理”等中国电动车品牌一样, 带动整个产业链和生态加速发展 ,吸引更多资金和人才进入这个赛道。 硬氪:这几年行业里一直有泡沫和行业即将遇冷的论断,你们怎么看? 余轶南:所谓“行业遇冷”的说法其实这几年一直都存在, 但我们认为 具身智能的万里长征才走了第一步 ,产业远未到收敛的时候。今年有机器人公司上市,这对行业反而会是一项重大利好,就像今年大模型公司上市一样,刺激更多资本关注并投入这个赛道,繁荣整个生态,而不是形成所谓的“资金虹吸”。 首页图源|企业供图 排版|范馨雅 end
文|邱晓芬 编辑|苏建勋 2026年,全球的具身智能机器人创业者不约而同将目光方向调转向深水区:家庭。 点燃这份热情的,是近期行业里闪烁着的一丝丝Scaling Law苗头—— 先是硅谷具身智能公司Generalist AI在GEN-1模型上验证了确定性,当他们给机器人喂进海量数据后,精细操作任务成功率竟从64%提升到了惊人的99%; 随后,硅谷当红的具身智能独角兽公司Sunday Robotics也试图解决家庭场景数据难关,不仅推出Umi手套数据采集方案,还直接将机器人Memo送进家庭做家务(收拾餐做、冲咖啡、叠衣服),因此吸引了大量的资本押注。 在大洋彼岸的中国,近期闯入家庭机器人领域的创业者中,还有一个熟悉的身影——许华哲。 “两年内,中国将会出现可用的家庭机器人”,他对于行业的判断,同样乐观且激进。 作为“伯克利归国四子之一”、清华大学交叉信息研究院助理教授,2023年,许华哲曾加入「星海图」任前首席科学家兼联合创始人,一起将这家公司打造成中国具身智能领域的明星公司。 不过,在这家公司估值冲破200亿、融资近30亿的巅峰时刻,许华哲又选择“单飞”并创办了全新的具身智能公司「破壳机器人」。 此次重新出发,他想做的是能在家庭场景干活的、真正有泛化性的具身智能机器人。 △ 许华哲 其实,想做一个家庭机器人公司并不是近期偶然的想法。初高中时的他读完《乔布斯传》后,内心便萌生创办一家伟大To C公司的种子。此后,在清华、伯克利、斯坦福的一路升学中,他一直深耕机器人强化学习方向,梦想便是把机器人送入千万家庭。 他理想中的家庭机器人,虽然不是无所不能,却能完成上一代机器人(比如扫地机、洗地机)无法完成的复杂任务,比如能进行更精细的清洁工作、有条理的完成诸如洗衣收纳的长序列、多步骤任务串联。 在他看来,这种创业方向的选择,也带有强烈的审美洁癖。许华哲直言,泛化性的本质是一种“美与影响力”——用最简洁优雅的模型,解决人类复杂的生活问题,并真正将AI转化为生产力,而非仅仅替代低端劳动力。 从更理性的层面,切入To C家庭场景也包含着许华哲的商业判断。在他看来,当前大量机器人厂商将人形机器人送进工厂,完成传统机械臂就能完成的上下料、搬运箱的工作,本质上只是在用新的人性在做旧时代的事情,机器人没有发挥出真正的通用性。 他认为,真正的AGI应该在家庭场景中诞生、运用,因为家庭场景任务比工厂场景更混乱随机,且数据丰富,恰恰是训练通用模型的最佳土壤。 因此,为了追赶时机,在创业的短短一个月内,新公司「破壳机器人」已经完成了融资、核心团队组建、具身模型的训练、以及硬件迭代工作。 《智能涌现》独家获悉,破壳机器人近期完成数千万美元天使轮融资,由云启资本领投,并获得顺为资本、弘晖基金等一线美元基金,小米战投、星海图等知名产业方,以及BV百度风投、英诺天使基金、水木清华校友种子基金、东方嘉富等一线市场化基金的支持。 快速得到资本押注,也因为许华哲在关键技术路线上有一些不同的选择。 为了实现泛化,在关键技术路线方面,他的选择也略显反常识。他完全放弃了行业主流的VLA(视觉-语言-动作)基座模型方案,转而构建一种能直接输入和输出“视频-动作”的 世界模型 。 在模型结构上,他也提出了独特的“ UAG架构 ”,用并联式预训练替代过去的瀑布式级联,并将强化学习贯穿预训练与部署全过程,实现了训练效率的五倍提升。 打好模型基础之余,在数据与硬件层面,他也通过UMI、外骨骼和第一人称视角三层方案采集高质量数据,形成从任务定义到数据、模型、本体的闭环迭代。 据许华哲透露,「破壳机器人」第一代 32B参数规模的具身世界模型 已完成首轮训练,正处于数据迭代的关键爬坡期。在硬件层面,「破壳机器人」为数据采集量身定制的手套硬件已迭代了五六个版本。 近期,《智能涌现》与许华哲聊了聊,以下是交流实录(略经摘编) 为何出走「星海图」? 《智能涌现》:为什么选择离开星海图,创立一家新的机器人公司? 许华哲:这个想法其实酝酿了很久。在2023年8、9月份,我就开始和高继扬聊,加入星海图。但经过了两年,到去年11、12月份,我已经基本决定要离开了,真正办完手续是在今年,创立「破壳机器人」是最近一个月的事情。 离开的原因主要是因为我内心一直想做一些To C的、真正泛化的通用机器人。 《智能涌现》:既然一直想做To C,为什么一开始不直接做To C方向机器人的创业呢? 许华哲:原因是多方面的。2023年我加入星海图时,也考虑过要不要自己创业,但那时我刚从美国读完书回来,在叉院工作才一年左右,要自己开公司lead一摊事,还要兼顾教职,挑战很大。 那时星海图和其他一些具身智能公司也邀请我加入,我觉得先加入一个优秀的团队做联创,是一个更稳妥的选择,而且当时星海图的宣传里也提到大概是“让机器人服务千万人类”的话语,这和我的一部分想法是吻合的。 《智能涌现》:您现在新公司虽然只成立一个月,都有哪些进展? 许华哲:团队方面,目前有20人左右,AI侧有一些天才少年,硬件侧有很多做过To C量产交付的工程师。我们还在火热招聘中。 在技术上,我们的AI模型在“动得快”、“泛化强”、“成功率高”三个维度都有较好的前期积累,能让机器人完成某些复杂任务时达到接近100%的成功率。 我们第一代32B的模型已经完成了第一次训练,但还需要数据量的迭代才能展现出更好能力。我们的硬件手套也已经迭代了五六个版本。 第一个月要处理公司注册、选址、装修等各种事务。能跑出这个速度,我觉得还是比较快的。 《智能涌现》:您这次创业,和第一次创业时心态有什么不同? 许华哲:最大的不同是心态上更踏实、也更敢了。第一次创业前,我会担心,我没上过班怎么给别人“班”上?我没做过生意怎么办,没跟投资人、政府打过交道怎么办? 在星海图的两年,我接触过这些事,“没打过就硬打,没上过就硬来”,其实最终结果也挺顺利的,太多的顾虑没必要,出来混最重要是先出来。这次心理上更从容。 《智能涌现》:在2023年和2026年两个节点创业做家庭机器人这件事,区别大吗? 许华哲:区别挺大的。首先是硬件本体,这三年中国的硬件供应链打磨得更好了,有了更多能用的机器人,2023年时可能只能用工业臂; 第二是数据,2023年时机器人的数据几乎是0,现在网上开源数据就有几十万小时,还出现了大量的数据供应商,虽然数据质量和跨本体适配还是问题,但丰富度已经不可同日而语。 第三是融资和市场认知,2023年要做To C机器人可能很难融资,大家给的时间缓冲也更少。今天起步比2023年更好。 AGI应用于家庭,工厂是上一代技术的领地 《智能涌现》:一直想做To C的机器人,背后的触发点是什么? 许华哲:首先,一个核心思考是,我们做机器人到底在做什么?机器人是人类自古以来的追求,我们在海底捞、酒店、工厂都见过机器人,但如果我们只是用人形的外壳去工厂拧螺丝、搬箱子,那本质上还是在做旧时代的事情。 这一代机器人最核心的不同在于它的通用性。 通用性该用在越混乱、越需要通用能力的地方。那答案就是家庭,或者广义的服务场景。我认为,通用的AGI(通用人工智能)应该用在家里。 第二,从个人偏好来说,做有品牌的事情是可以做得足够大、有梦想的。伟大的公司很多是To C的,比如苹果、小米。 第三,从数据角度看,通用性需要有丰富的数据,混乱的家庭场景恰恰能提供丰富的数据。如果你的数据源头错了,就得不到正确的模型。 基于这三点,我觉得做To C机器人是一件正确的事,我自己也特别感兴趣。 《智能涌现》:您认为AI模型什么时候可以支撑做家庭To C机器人? 许华哲:我的预测比较乐观激进,我认为 两年内 会出现可以用起来的机器人。它不是万能的,但会是一个有完善产品定义、能做相当多通用事情的机器人,但它会有一些明确不做的事,比如抱婴儿、烧热水。 《智能涌现》:机器人进家庭能做的事情都包括哪些?能否举一些例子? 许华哲:分两类。 一类是本身很难的任务, 比如更精细的清洁,比如清洁墙角霉点、擦掉干涸的饭汤、剥橘子、剥虾等等。 另一类是 长序列、多步骤任务的串联。 举个例子,一个完整的洗衣流程是——把脏衣服放进洗衣机、倒洗衣液、启动,然后机器人可以去做别的事,它会在监听到“洗完了”的声音后,把衣服拿出来放进烘干机,启动烘干,最后再把衣服拿出来叠好放进衣柜。 现在的机器人能做任何一个单一步骤,但没有机器人能像人一样,从头到尾,带着这些“任务间的缝隙”把它完成,我认为两年后的机器人能有这个能力。 《智能涌现》:家庭和工厂场景,最大的区别是什么? 许华哲:家庭和工厂某种程度上都是“混乱”的,但是本质上不同。工厂的混乱更多是“管理混乱”,比如东西乱扔、人走来走去,但它具体干的活,比如上下料、装配是高度确定性的。 家里的混乱是任务本身的混乱, 比如衣服是团成一团的,杯盘狼藉需要收拾,这种混乱是需要通过工作去恢复秩序的。工厂的很多混乱并不需要去恢复。所以,这是两种完全不同性质的“混乱”。 《智能涌现》:您认为当前做家庭To C机器人,最大挑战是什么? 许华哲: 机器人进家庭的逻辑和落地To B不同。 To B的账很难算,因为工厂给人形机器人干的活价值很低,一台二三十万的机器人可能相当于一个人三四年的工资,还要考虑可靠性、维护,很难回本。再加上工厂里采集的数据可能过于专化。 To C的账不是简单的“替代人力”计算。它更像 科技潮品+家庭助手+管家 的复合体。用户买它,是购买一种先锋的生活方式、极致的便利,就像二十年前大家买车一样。我们考虑的是,当用户有一笔预算时,是买辆车还是买个能改变生活的机器人。 所以,关键是产品体验要足够好,价值感知要足够强。价格区间我们内部还在讨论,但肯定会是五位数起步。 追求泛化,也是追求美和影响力 《智能涌现》:所以To C并不是您离开星海图后才有的想法,而是一贯的想法? 许华哲:是的。我从小就想做To C,想创业。初高中的时候读《乔布斯传》、《迪士尼传》,读完了就很想创业,做一个像谷歌一样的公司,后来选电子系也是想要做IT,大学还修了管理学双学位,就是为了创业做铺垫。 后面去了伯克利、斯坦福,也是一直在做强化学习和机器人,后来还做了一些触觉相关的研究,也是在机器人大类里。 我博士毕业时(2021年),主要就是找教职还有找投资人聊,看看有没有创业机会,当时普遍观感是,下一代技术还远,这一代技术就是做扫地机、餐馆机器人,但是和AI关系不大,没看到特别匹配我专业技能的创业机会。 《智能涌现》:你判断一件事情做与不做,或者谈论你对某件事是否感兴趣时,你的标准是什么? 许华哲:一个是美,这件事要能给我带来好的审美体验。另一个是影响力,我们学术圈有一个词叫impact追问。 美,更多是个人体验,我做这件事创造出来的东西是优雅、简洁的,就像简单的公式能描述复杂的现象,泛化性的本质也是美;影响力意味着,我做的这件事要能对世界产生足够大的影响,改变人们的生活方式。 现在我们被迫用巨大的参数量来描述世界,是因为我们还没找到AI领域的牛顿定律, 我相信大模型只是一个中间状态。 我的博士生涯是带着“AI一定存在一个优美理论”的心理开始的,但后来发现理论越来越解释不了AI,这是一个痛苦但必须接受的过程。 所以现在我的使命是追求简洁和影响力,如果有另一个公式(而不是AI模型)能描述机器人与世界的所有交互,我会觉得它更好。 《智能涌现》:这次创业你希望找到什么样的合作伙伴?你会更欣赏什么样的公司文化? 许华哲:我对合作伙伴和团队文化有三个核心要求—— 极致: 我很喜欢戴密斯·哈萨比斯那本传记里的描述,里面说,一个人做事要做到什么程度,就像跑马拉松撞线后,有个救护车把你拉走了,但是你最后没死。虽然有点夸张,但是我觉得做事极致投入,永远想更进一步,是很重要的。 坦诚: 对自己、对同事、对事情绝对坦诚。不会因为不会而装会,搞砸了就承认,不要为了面子影响效率。 利他: 公司里有很多“缝隙”,如果每个人都只盯着自己的KPI,这些缝就没人填。对于初创公司,需要每个人在有余力时主动填缝,这种利他性长期看对个人和团队成长都有益。 (作者注:戴密斯·哈萨比斯(Demis Hassabis)是英国著名人工智能科学家、Google DeepMind 联合创始人兼CEO、神经科学家,被誉为“AlphaGo之父”。) 我很欣赏段永平的“本分文化”,也欣赏前段时间一篇报道中提到的,Kimi“没有部门墙”的协作模式,我倾向于弹性、扁平的组织,很赞同黄仁勋、亚马逊那种鼓励一线员工直接向老板直接发邮件反馈问题的文化。 做全新物种的家庭机器人 《智能涌现》:很多To C的机器人是曲线救国,先从陪伴场景切入,但是感觉你们的您的产品路径和其他家很不一样。 许华哲:完全不一样。他们做的是陪伴,核心能力是大模型提供的对话能力和娱乐。我们追求的 核心是物理世界的通用交互和干活能力。 我们的机器人是“家庭助理”,要能实际处理家务,所以在技术上,我们需要非常强的模型能力来保证通用性,但是很多家庭陪伴机器人是没做基础模型的。本质上,我们和他们是两个不同的品类。 《智能涌现》:你们最主要的技术的差异点是在模型侧吗? 许华哲:我们的一大亮点我们的模型能 用好强化学习 。过去机器人对强化学习的使用一般停留在单机的后训练上,但是其实强化学习上有很多自己独特的东西。 第一个就是价值函数(value function)。 价值函数 可以对数据质量进行评估,让模型知道哪些数据好、哪些次优、哪些失败。数据带着权重,去让模型学习。 它带来的好处有两个,一是可以让模型学得更精准,二是可以理解失败的边界,这样模型就能够知道紧邻着成功的失败长什么样,让强化学习去把这些失败因素排除掉; 第二是,强化学习能同时在多个任务上保持高成功率高速度,而不过度拟合到单一任务。 第三是,强化学习也可以突破人类数据上限。以前我们用人采集的数据去做某件事,数据是什么样的,机器人就能做到怎么样的,甚至会更差,因为机器人是跟着数据学习的。 但是强化学习就是根据数据以及后续的自我改进,持续突破自己的上限,最终可能做出比人类示范数据更好的表现,上限更高。 《智能涌现》:你们的强化学习只用在后训练上吗? 许华哲:我们的预训练也会用离线的强化学习。预训练现在还是有一些卡点的,比如说模型的选择上有很多种,市面上有用VLA+VLM的,��有世界模型的,还有VLWAM,就是VLM后面再内嵌一个世界模型。 《智能涌现》:那你们还是用VLA的路线吗? 许华哲:现在模型的路线还远远没有收敛,我们的选择是 世界模型结合原生的机器人模型,不是用VLA的路线。 《智能涌现》:现在的世界模型有很多派别,有的人用的是偏3D视频的方向,有的又是偏向于世界仿真,你们对世界模型的理解方式是什么? 许华哲:我们输入的是视频和动作,在训练和推理的时候,输出的也是视频和动作。这些视频和动作里面是遵循物理规律的真实世界的数据。 《智能涌现》:你们做这些事情的过程中,遇到的最大的挑战是什么? 许华哲:要训练大模型所需的Infra (基础设施)是一个挺大的卡点,因为我们想做一个32B的大模型,要支撑比较大的数据量,GPU 集群的并行效率、数据吞吐都是一个很大的挑战和壁垒。 《智能涌现》:在模型侧你们提到了一项“UAG”架构,这个怎么理解? 许华哲:UAG(Unconditioned Action Guidance)是我们的一种模型训练架构。 相对于传统的瀑布式级联的模型训练方式,我们采用的是一种并联的方式,核心思想是 先对动作进行预训练,然后再对所有的动作做整体联合的训练,做一个动作预测器,然后再将动作预测器和视觉模型一起进行联合训练。 背后的原理是,一个小时的图片、视频是巨大的,但是一个小时的动作很少,可能就是一系列关节的运动,也就是一堆小的浮点数。 这种方式可以最大程度保留基础模型的泛化能力,同时大幅提升训练效率, 估计至少5倍以上。 《智能涌现》:数据也是你们新公司的亮点,你们大概有哪些方案? 许华哲:我们的数据方案主要分三层—— ①外骨骼数据采集: 提着机器人手臂直接操作,精度高,反馈更直接; ②UMI方案: 让人戴一个和机器人手部构型完全一样的“硬手套”进行操作,好处是没有机械臂的负担,采集效率高,数据量大。手套做硬是为了保持和机器人手的一致性,确保人能做的动作机器人都能做; ③第一人称视角人类数据: 在头上戴一个摄像头,记录人日常干活的视频。这是从人的视角(Ego-centric)采集海量自然行为数据。 《智能涌现》:这些采集方式其他家也在探索,你们最大的不同点在哪? 许华哲:采集的数据,表层方法可能相似,但内核有本质不同。比如umi手套是否打磨得足够好,足够通用?采集的数据质量如何保证?以及如何清洗和处理这些数据,提升数据质量? 我们一个很大的不同是,我们会大量使用评估数据,就是机器人自己做测试和探索的时候,自己在动的数据。这样的数据某种意义上是更“差”的数据,因为里面会有失败、会有次优。但是这种“差”其实也是“好”,会让模型更知道任务的目标是什么。 另外,手套的设计细节,比如摄像头位置、佩戴舒适度、是否适应不同手型等等,都需要针对家庭任务精心打磨,我们手套的构型设计是面向家庭任务,追求通用性的。我们会在8月末左右给大家看到我们和现在所有的形态都不一样的数采系统。 《智能涌现》:但是现在出来创业会不会太晚了?现在具身智能行业的融资环境怎么样? 许华哲:市场热度还可以,投资人还是比较有热情的。和之前比,投资人更懂了,大家被市场教育过一轮,所以会问得更细。 关于创业出来是否太晚,我认为——在技术没有收敛的今天,仍然有巨大的机会。同时,因为我们更晚,所以我们的时间压力更小、负担更小,但是各种基础设施比如本体等也更加成熟了。另一方面,走向通用家庭机器人,其实才刚上半场。虽然后发,但是谁能先至,也未可知。 封面来源|企业官方 end
文|邱晓芬 编辑|苏建勋 《智能涌现》独家获悉,自变量机器人已经于三月底至四月初完成近20亿元B轮融资,领投方为小米战投和红杉中国。 不久前,美团、阿里和字节分别在A轮、A+轮、A++轮领投或独投自变量机器人。截至目前,自变量已成为国内唯一一家同时被四家互联网大厂投资的具身智能企业。 对此,自变量方面暂无回应。 小米战投在具身智能机器人领域已落子,近两年公开的投资项目包括纬钛机器人(触觉传感)、曦诺未来(灵巧手)、萝博派对(本体)、章鱼动力(模型)。 除了对外投资布局,小米自己的机器人产品也正在快速推进中。不久前,2026年4月,小米机器人CyberOne已进入小米汽车工厂进行真产线实习,核心目标是跑通汽车制造中的柔性装配环节 。 在模型方面,2026年2月,小米也已经开源了视觉-语言-动作(VLA)模型 Xiaomi-Robotics-0。 有知情人士向《智能涌现》分析,不同于行业里“微调开源模型”的选择,自变量是国内极少数坚持完全自研具身智能基础模型的公司,并且一直坚持走端到端路线。 具体而言,在其自研的“WALL-A”模型中,自变量 将视觉、语言、触觉与动作信号,统一映射为一种连续的高维Token序列 。这些统一的语言会被放进单一的Transformer架构中,实现多模态联合输入与同步输出。 自变量联合创始人、CTO王昊去年年底接受《智能涌现》采访时曾表示,这种原生多模态的统一表征方式,有助于减少跨模态传递时衍生的信息损失问题,不仅能让机器人更直接感知物理世界,还能保证机器人在动态环境中实现感知、决策与操作的同步进行。 “‘微调’路线的问题在于,一旦上游不再开源,或者基础模型能力飞跃,可能会导致所有微调工作被颠覆,无法形成数据闭环和规模效应”,王昊表示。 而端到端统一架构,将为具身基础模型的scaling up奠定基础,未来,随着参数规模与高质量交互数据的显著增加,模型的泛化能力,尤其是零样本泛化将得到进一步加强。 在基础技术布局之外,今年以来,自变量在商业化方面也快速推进。 2026年3月, 自变量与58到家合作,推出了首个机器人进家庭的商业化保洁服务 ,将具身智能技术规模化引入民用家庭场景。近期,这一服务将在不同城市分别上线。 未来,依托58到家覆盖全国的“数字家庭场景库”,自变量的基础模型迭代将获取真实、多样化的数据来源,形成“落地即训练”的数据飞轮效应。 据《智能涌现》了解,除了家庭服务场景之外,自变量机器人未来还将进入工业制造、物流到养老场景,推动具身智能技术在真实场景中落地。 end
文|邱晓芬 编辑|苏建勋 2026年,AI正在加速从云端落地到端侧。近期,模型厂商和手机厂商都在背后开始发力—— 3月下旬,国内几大手机厂商几乎同时推送了端侧AI的大规模更新,把原本仅限于旗舰机的AI能力下放到中端和千元机市场。自此,端侧AI终于成为大部分智能手机的标配。 到了4月初,谷歌发布开源模型Gemma 4系列,通过架构创新显著降低了端侧AI部署门槛,让AI能力首次真正下沉至手机、IoT等边缘场景中。 尽管当前行业里对端侧AI落地方向的探索五花八门,但众多非共识中唯一的共识是,AI手机依旧是短期内端侧AI最佳的落地形式。 而此前在2025年,在全球AI浪潮下,荣耀已发起了一场转型,从一家智能手机制造商向AI终端生态公司转型,并且计划用五年时间在AI领域投资百亿美金。 荣耀AHI战略 在过去的探索中,荣耀一步步构建起了自己的AI打法——在操作系统侧,荣耀发布了原生、自进化的AI智能体操作系统MagicOS。在AI Agent产品侧,荣耀推出了核心载体YOYO智能体。“YOYO建议”、“一句话打车”,“一句话购物比价”等都是荣耀手机上特色的AI功能。 转型的迫切,也体现在组织管理层面。2025年,荣耀在研发侧重构了组织架构,设立了AI&软件部门,整合操作系统、AI产品、互联网产品等团队,进一步构建荣耀AI核心竞争力。 如果体验荣耀最新的旗舰机Magic V6,可以发现AI手机的体验已经有了本质区别。 在过去,AI在手机上更多是不痛不痒的“问答”功能,而在荣耀Magic V6上,手机逐渐有了向生产力演进的趋势——比如, “AI会议参谋” 功能,能够在会前提醒用户、会中实现AI托管、会后一键生成结构化会议纪要和待办事项等等;在“AI文档智能体”上,用户还可以实现“拍照转文档”,“拍照即编辑”。 AI会议参谋 荣耀MagicOS AI产品专家李向东向《智能涌现》分析,背后反映了未来的AI手机的三个迭代方向。 首先,AI手机将支持Agent自动执行,相当于长出了“手”和“脚”。与此同时,手机是用户最高频使用的硬件终端,AI手机也会有专属的知识库和记忆系统,实现“越用越懂你”。在未来,AI手机大概率是千人千面的。另外,未来AI手机也将支持多模态交互,从过去的语音文字,向视频、照片甚至是具身智能延伸。 在李向东看来,未来AI手机的迭代,也会带来用一场颠覆性的改变,比如人机交互模式、甚至是重构过去手机上的流量分配逻辑。 近期,《智能涌现》与李向东聊了聊他对于AI手机和端侧AI的理解、以及荣耀在AI上的思路,以下是交流实录(略经摘编) AI手机将重构一切 《智能涌现》: 如果概括来讲,你认为未来的AI手机相比目前的手机,最大的不同会是什么? 李向东: 主要有三点根本性变化。首先是 越用越懂你, 手机将会给用户提供高度个性化的服务,AI手机将会是千人千面的。 其次, 人机交互范式从“人适应GUI”转变为“系统主动服务于人”。举个例子, 我们现在的“YOYO建议”,会对你的航班飞行旅程做全流程主动提醒,这就是主动服务的雏形。 最后,未来的AI手机将具备强大的自动执行能力。 AI能像秘书一样,理解用户复杂、级联的需求并拆解任务工作流、自动完成任务,用户只需做选择题或反馈意见。 《智能涌现》: 今年也有很多厂商在水下布局AI手机,你认为2026年这个行业有哪些值得关注的重点趋势? 李向东: 首先是 智能体与自动执行, Agent能力将会与手机场景的深度结合; 其次,AI手机上也会开始强调全局记忆 ,手机将 基于全局的长上下文记忆,落地“越用越懂你”的个性化服务。 最后是多模态交互,AI手机上将 结合视觉、语音、文字的融合交互与服务,比如前段时间荣耀发布了HONOR Robot Phone,它能“看你所看,听你所听”,进行陪伴式讲解并生成总结,这也代表了多模态的未来方向。 《智能涌现》: 在自动执行这个方向,手机厂商在推进中会有难点吗,因为现在大量的用户数据都存在于各大APP里。 李向东: 这确实是个生态问题,不过从客观上讲,这是 终端厂商相比APP厂商和大模型厂商更有优势的地方。 因为APP厂商只知道用户在自家应用内的习惯,而大模型厂商只在用户使用时才能了解需求,但是终端厂商却能全天候、跨应用地理解用户。 我们也在和大型APP厂商推进战略合作,大家的目标都是在保护用户隐私基础上,为用户提供更好体验,实现商业共赢。 《智能涌现》: 但是未来的AI手机可能会重塑手机里现有的流量分配逻辑吗? 李向东: 这是 毋庸置疑的 。当前的商业模式是应用厂商、大模型厂商和终端厂商等,各展所长、共同竞争,相对稳定。 但随着AI的发展,尤其是以用户意图为中心的AI自动执行与主动服务趋势推进,必然会 重塑原有的商业模式和流量分配,各方终将达成新的平衡,重塑过程需要各方探索与磨合。 《智能涌现》: 智能体出现之后有很多厂商在探索AI手机,比如模型厂商、互联网厂商还有手机厂商。不同背景的厂商做这个方向,你认为各自的优劣势是什么? 李向东: 模型厂商的优势在于大模型基座能力、算力和推理技术,对硬件的理解和投入、以及对终端消费行业的积累可能不足。 终端厂商的优势在于对终端消费者的深刻理解、以及积累的海量用户、软硬件一体化的能力,还具备了成熟的消费品操盘经验,但无法像大模型厂商那样去All in基座模型研发。 各方所长、投入焦点不同,大家也会基于自身优势去做融合与合作,共同服务好用户。 一家手机厂商的AI决心 《智能涌现》: 荣耀在AI上一直持续投入,如果要梳理的话,大概可以分为几个阶段? 李向东: 荣耀对AI的深耕可追溯至2016年第一代Magic系列智能手机、Magic Live智慧引擎的诞生。到2020年,荣耀进入AI核心探索阶段。 2020年到2023年,我们是在进行整体的平台级AI部署与AI战略布局阶段,当时我们基于MagicOS 7.0发布了平台级AI,基于Magic Live智慧引擎提供了 基于意图识别的人机交互体验; 2024年上半年,我们发布了MagicOS 8.0及端侧AI能力 “任意门”功能。任意门基于业界首个端侧意图识别框架,允许用户通过简单的拖拽,跨应用快速调取所需服务。也是在这一年,荣耀对意图识别框架和端侧AI四层架构做了清晰定义,用AI重构了 操作系统和端云协同 ; 到2024年下半年,我们已经洞察到了整个行业开始有迈向AI智能体的技术趋势,开始探索智能体帮用户自动执行任务的功能; 到2025年,我们 全面迈向智能体和AI自进化 ,不仅发布了我们基于端侧的AI智能体三层架构,还发布了最新的魔法家族大模型。 从2020年到2025年,荣耀完成了整个AI技术底层架构、核心战略的奠定,近期OpenClaw和Hermes智能体的热度,也印证了荣耀在技术路径上投入的价值与前瞻性。 《智能涌现》: 从产品的层面,我们发现在新发布的荣耀Magic V6上,AI的体验上好像比以前更丰富了,比如会有很明显的AI个性化服务,和用户也有了更深的情感链接,好像更《HER》了。 李向东: 是的。在荣耀Magic V6上,我们精准瞄准了 目标人群。 我们经过调研发现, 他们的核心痛点是高频会议与文档处理,所以我们打造了完整的AI会议参谋体验,包括会前提醒、会中分人转写与实时总结、还有会后自动生成精准纪要和待办。 另外,我们还针对目标人群推出了文档智能体,让纸质文档可以一键转成可编辑文件。 还有,我们针对投资人群做了“AI情报官”,用户可以在手机上定制信息主动推送,这些都基于真实场景解决了用户痛点。这背后本质的理念是, 让AI从玩具变成了生产力工具。 《智能涌现》: 荣耀也完成了从手机厂商向“AI终端生态公司”的转型,体现在架构上,荣耀去年也成立了专门的AI一级部门,把AI提到很高的战略高度。在这个部门出现的前后,荣耀在做AI上有哪些主要区别? 李向东: 区别还是很显著。在成立前,AI是操作系统部门下的二级板块,主要聚焦OS内的智慧引擎和AI平台。 成立后 ,打通OS、AI、互联网、生态等关键模块,在AI上的投入更聚焦、更系统化。 《智能涌现》: 为不同硬件匹配不同的AI功能,有没有一些例子? 李向东: 以我们的 旗舰机荣耀 Magic V6为例,其算力强、配置高,是打造AI核心竞争力的重点。我们会将行业前沿方向,如智能体(Agent)自动执行、全局记忆、多模态交互等,集中在旗舰机上使能和发力。 对于 中低端机型 ,用户核心诉求是流畅、不卡顿、长续航。我们也提供了一套 系统级的轻量化AI Native解决方案。 这套方案重构了OS,通过AI技术让系统更轻量化,从而在芯片和存储相对有限的中低端手机上,也能实现接近旗舰机的流畅丝滑体验。这项能力也提升了大量中低端机型用户的体验和用户黏性。 《智能涌现》: 荣耀如何决定某一个AI功能做与不做,背后的决策逻辑是什么? 李向东:我们的核心逻辑从“AI能做什么”转向“AI应该做什么”, 根本目标是让AI“越用越懂你”,更好地服务用户。所以我们具体围绕三个方向布局: 首先是针对不同硬件产品的目标用户需求,规划功能。比如,我们为荣耀Magic V6的商务人群打造了 “AI会议参谋”和“文档智能体” 的功能; 其次,我们也围绕核心AI产品“YOYO”作产品拓展, 目标是让用户实现“万事找YOYO”; 最后,我们也将AI Agent深度融入MagicOS,实现主动服务和自动执行,如 YOYO建议、任意门。 我们会舍弃那些 用户使用复杂、频率不高、学习成本高 ,或当前AI准确率不足、需要大量三方适配的功能,追求AI与产品、用户需求的紧密结合,提供闭环、好用的体验。 《智能涌现》: 你们做了不少有特色的AI功能,比如任意门等等。你们内部会如何评估某一项AI功能是否真正为用户提供了真实价值,也就是现在大家常说的PMF(产品市场适配度)? 李向东: 这是我们擅长的领域。我们拥有成熟的To C消费品评估体系,具体会分三个层面操作: 首先,针对不同硬件,我们前期会针对目标人群的核心场景去规划功能,并通过用户共创、以及后调(如用户满意度)来做验证。 其次,针对核心AI产品“ YOYO”,我们采用的是互联网产品快速迭代模式,比如A/B测试、用户反馈、日活等维度,来评估AI功能的表现; 最后,针对MagicOS的原生AI体验,我们在系统级应用中注入AI后,比如闹钟、任意门等功能,我们也会持续观察用户使用率、满意度和留存率。通过分层分级的验证体系,我们会确保AI功能能真正解决目标用户痛点。 手机厂没做“豆包手机”,不是能力不够 《智能涌现》: 我很好奇你怎么看待“豆包手机”? 李向东: 豆包手机是一次 重要的行业探索, 它的亮点在于打通系统底层能力,实现了泛化的跨应用的Agent自动执行和后台任务处理。 同时,它的成功也有特定背景,包括基于手机厂商的合作,获取系统级权限,并以不计成本的大模型及算力投入打造标杆场景。 《智能涌现》: 手机厂商一直在讲AI手机的故事,但是也有很多人提出疑问,为什么类豆包手机不是手机厂商最先做出来? 李向东: 其实类似于豆包手机的想法我们很早就考虑过,目前还没有商用落地。主要是 终端厂商考虑问题的逻辑不同。 手机厂商的立场首先是 保证用户体验, 我们面向海量用户,必须确保功能的稳定、闭环和普适性,任何体验上的瑕疵都可能引发大规模用户不满。 其次是成本考量。 当海量用户高频调用AI服务,Token的成本是终端厂商必须考虑的可持续性问题。对于大模型厂商而言,AI产品走向规模化时,也必然面临成本压力,未来可能转向限次使用或付费模式,进而影响用户体验。 所以,类豆包手机最早不是由手机厂商做出来,这不是能力问题,而是 商业逻辑和对用户体验的标准及要求不同。 尽管豆包手机的探索具有启发性、小龙虾全球爆火,但AI发展刚刚开始,远未到终局。 《智能涌现》: 系统级的GUI Agent路线,会是AI手机未来的雏形吗? 李向东: 它是一次很重要的探索,但它不一定是最终形态,因为它目前仍是基于APP来执行,但未来AI Native的系统和手机, 可能会打破当前APP的格局 ,转向用户所需即服务的模式。 举个例子,未来用户订机票可能不再需要打开特定APP,只需说出需求,AI在理解用户意图及偏好后,直接呈现机票信息卡片,让用户决策付款,对于用户来说,无需关心服务来自哪个应用。我认为这可能是一种更长远的形态。 《智能涌现》: 你认为OpenClaw的出现对AI手机产生了什么影响? 李向东: OpenClaw的火爆验证了智能体Agent与自动执行的价值,其实,荣耀也一直在布局这个方向,比如我们打造了荣耀龙虾宇宙“YOYO Claw”,它可以支持手机控制荣耀PC、Pad等跨设备部署,或三方云、三方设备部署的小龙虾进行任务执行,实现生态养虾,并注重安全性。 OpenClaw的出现说明行业正从“AI问答”阶段进入“AI自动执行”阶段, 这正是我们关注的核心方向。 《智能涌现》: 现在也有很多厂商在探索手机之外的全新品类,你认为未来的核心入口硬件可能会具备什么重要的特点?以及你更相信什么品类最终能胜出? 李向东: 目前确实是 百花齐放、共同探索 的阶段,我认为一个成功的AI Native终端品类,必须具备的特点是能高效且低成本解决用户核心痛点,具体而言可能具备三个特征—— 首先它是能够做到物理世界与数字世界感知的融合, 具备摄像头、麦克风等传感器后,实现多模态感知,并可以做到拟人化交互。比如,HONOR Robot Phone可以在用户逛博物馆的时候,摄像头看到文物,就可以给用户进行拟人化的讲解。 其次是具备 长上下文记忆与个性化预判,会 基于用户历史习惯提供个性化服务; 最后,是具备 自动执行与主动服务能力, 能跨设备、跨生态执行用户的要求。 现在手机仍然是AI的核心载体,其他设备多为手机的辅助,端侧AI探索的方向还没收敛。 但最终哪个形态能胜出, 取决于其提供的AI智慧化体验能否在价值层面实现跨代领先。 《智能涌现》: 到现在感觉各家手机厂商在AI上的做法都不太一样,但也慢慢形成自己的特色和打法了。你会怎么评价荣耀在AI手机浪潮中的身位和战略? 李向东: 其实本质上具体的AI功能只是“相”,是一个外在呈现,如果比喻成一颗大树,这些只是差异化竞争的一个“枝干”,但本质大家还是要考虑 AI与终端结合将给用户带来什么核心价值。 荣耀的主航道非常清晰,沿着 主动服务、Agent自动执行、个人知识库、多模态交互 这几个方向持续发力,迭代沉淀,我认为只要坚持沿着创造用户价值的主航道前进,就能笑到最后。 《智能涌现》: 我们两年前和手机厂商的高管聊,大家会说AI还没有真正撬动用户购机,到现在这个情况有变化吗? 李向东: 出现了积极变化。前几年,AI更多是卖点而非买点,但从2025年开始,经过我们的新机用户调研, AI已能进入购机考量因素的TOP 4,在部分机型中,比如荣耀Magic V5、Magic V6,甚至已经进入TOP 3。 这得益于我们将AI特性聚焦在目标用户的核心痛点和场景,并做到了体验闭环。当然,目前在一些机型中,排名第一的购机因素可能仍是硬件特性,如折叠屏的轻薄、长续航,但AI已成为越来越重要的决策因素。 封面来源|企业官方 end end