WWW.YOUINFO.SITE
标签聚合 命题

/tag/命题

V2EX - 技术 · 2026-06-11 19:38:39+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 19:03:18+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 17:06:53+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 16:26:07+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 16:23:41+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 13:23:10+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

V2EX - 技术 · 2026-06-11 11:19:56+08:00 · tech

昨天早早蹬完了 Fable 5 的额度,由于全用于审查各个项目的上层命题,以及大的策略规划,代码能力没太感受出来,不过风格上似乎更注重数据和执行的有效性,可靠性。 最近 5.5 xHigh 正持续帮我诊断游戏加载。所以我让 Fable 复盘了 5.5 的各项总结报告,而 5.5 也采纳了不少建议: 例如,Fable 会把归因搞得更具体,5.5 xHigh 总一个劲埋头“泛化排查”,而 Fable 知道要先解决个别 Fatal ,并固化个别归因工具。而且有注意到 IO 重叠问题,也说出了一些空引用可能带来的污染。对排查问题的先后顺序,指导得比较明确,这是 GPT 5.5 xHigh 没达到的。 5.5 xHigh 也对 Fable 做了个评价:“二线架构诊断顾问,方法比普通泛泛建议强很多,但很多细节坑它还是不知道,必须自己的证据落地。我的评价是 8/10:方法论靠谱,但也不是啥都懂。”

LinuxDo 最新话题 · 2026-05-28 00:27:10+08:00 · tech

我不知道该用什么样的开头,去描述"人生的意义"这样一个宏大的命题。 但我觉得,当一个人问"人生有什么意义"的时候,他大概并不是想要一个字典式的解释,也不是想听别人端出一套标准答案。很多时候,我们问这个问题,只是因为我们真的有点迷茫,甚至有点痛苦。我们希望有人能给我们一点启发,给我们一种"原来还可以这样想"的震动,哪怕不能彻底解决问题,至少能让我们在某个瞬间觉得:我好像还能继续往前走。 可是这个问题实在太大了。不同的人有不同的答案。有人说人生的意义是爱,有人说是工作,有人说是赚钱,有人说是快乐,有人说是成家立业,有人说是为社会创造价值。也许他们说的都对。也许他们真的从这些东西里找到了支撑自己活下去的理由。但我又忍不住怀疑:这些答案真的是他们自己想明白的吗?还是他们只是用某种说法骗自己继续生活下去? 就像"等鸡吃完了米,狗舔完了面,火烧断了锁"那样,人总要给自己找一个"以后会变好"的理由,然后靠着这个理由继续忍耐。也许这种自我欺骗并不坏,甚至很多人就是靠它活得挺开心。可我相信点进来看这篇文章的人,大概多少都不太甘心只接受这种答案。也许你也还没有找到属于自己的答案。 当弗洛伊德被问到"一个正常人应该怎么做才能活得好"时,他的回答是"爱与工作",而他也因此得以流芳后世。如果心理治疗能让一个人学会如何好好爱人及工作,那么这个治疗就算成功,在马斯洛非常著名的"需求层次理论"中,人的生理需求一旦满足之后(如食物及安全感)就会转而追求爱,最后则是追求别人对自己的尊敬,后者大多是通过工作来达到。在弗洛伊德之前,托尔斯泰便曾说过:"只要人知道如何工作,如何爱人,人就可以在这世上活得更精彩,我们要为自己所爱的人工作,也要热爱自己的工作。这是当今社会的大多数人所认可的答案,我自己也有一点认可,但是我内心深处就有会有一个声音来问自己,这不就是按部就班吗,和很多人一样过着NPC的生活这种生活还有什么意义呢?我自己觉得这种一眼望到头的生活没几把一点意思,但同时自己又常常夜里幻想做一个改变世界的人,做一些事情被大家所知道,夸赞也好辱骂也罢,被人看见就好了,或许是自己太过于压抑了吧,也许出去走走就会好了点 ?但我不知道你点进来这篇文章的时候所想的是什么,因为什么会点进来这篇文章,也许你和我一样只是最近感到了不开心进来看看来寻找一下答案,亦或者你是半夜睡不着觉随便点进来解闷,不得不承认的是我们绝对不是时时刻刻的在想着人生的意义是什么,因为在生活中总有一点小事来让你感到开心,如他人的赞扬,也亦如中国的谚语说的那样:他乡遇故知,洞房花烛夜,金榜题名时,我想,没人会在这种时候不开心吧?但是开心之后呢,这些东西总归是短暂的,开心之后我总是会想这些东西存在的意义是什么呢,难道人活着的意义就是为了开心吗,不开心的话就去寻找开心的生活,去制造开心,就如那张梗图所说:"人活着的意义是什么?去码头整点薯条。"但在那之后呢,还是会不开心还是会想起这个该死的问题,如果真的是这样的话那不就陷入了死刑循环吗?“上帝已死,永恒轮回”,我没有系统读过尼采,也不知道他原本想表达的到底是不是我理解的意思。但用在这里,我总觉得很贴切。有的人会说,哪儿几把有什么人生的意义啊,你作为一个智人的主线任务就是每天摄入2000大卡然后去寻找一个温暖的栖息地让自己活下去,其他的都是支线任务,但为什么 "些人,生来就注定可以悠闲地坐在河边;有些人,就会被闪电击中;有些人,会音乐;有些人,是艺术家;有些人,是游泳健将;有些人,懂纽扣;有些人,懂莎士比亚;有些人,是妈妈;有些人,是舞者。而我却像一个傻逼一样天天抱怨,天天像傻逼一样到处问人生的意义是什么呢??。这是他们的支线任务做的太棒了吗,做的太出色了吧,我不知道他们的人生快不快乐,但从表面看来挺开心的,因为如果遵守弗洛伊德的言论的话,他们有出色的工作热爱自己的生活,那么在大多数的时间中来说,他们就是快乐的啊,我也想和他们一样尝试坚持下去寻找自己热爱的东,去深研,去和其他人交流,但我做不到啊,是我太懒了吗还是我太笨了,我不知道啊,我总是三分钟热度,会对这些事情提不出兴趣,我发现我这几天最爱的最顺心的事情就是躺在床上闭着眼睛来思考这些B事儿╬▔皿▔)凸我不知道自己是病了还是怎么了,为什么会没兴趣,我也不知道为什么自己的身体总有两种声音,一个用来思考一些宏大的正确的事情,但每当我正要行动的时候那另一个该死的声音就会冒出来,来对我说,你不行的,你就是个废物,你做不成功的,你做这些事情毫无意义,而我也总是听从这个声音,我不知道是否很多人都和我一样是这种情况,也亦或是我只是单纯的懒?是不是只要找到了一点事情做,找到让自己喜欢的事情找到一个好工作,就是人生的意义,就可以让自己不再天天胡思乱想 如果按马斯洛的需求层次来理解,只要一个人足够有钱,底层需求被满足得足够充分,他是不是就会少很多烦恼?甚至几乎没有烦恼?我自己是个穷人,我不知道真正有钱的人每天在想什么。如果有经历过的人,也许可以说说。从普通人的角度看,好像只要努力赚钱,努力过上自己想要的生活,人生就会圆满。很多现实烦恼都会在赚钱的过程中慢慢烟消云散。也许大多数人都是这样想的。如果我也能单纯地这样想,可能会轻松很多。 也许我每天都是在无病呻吟,过着幸福的生活却不自知?还是我要求太多,想的太多。 之前我问过 ChatGPT,它给了我一个答案。它说,如果把"人生的意义"理解成一个全人类共同认可的唯一答案,那么哲学、宗教和科学都没有给出一个能被最终证明的结论。但如果把它理解成一种可以被识别、培养和检验的生活结构,那么有意义的人生大概包含三层东西:连贯性、目的性和重要性。连贯性,就是我能理解自己的经历和身份。目的性,就是我知道自己大概要往哪里走。重要性,就是我觉得自己的存在、关系和行动是值得的。这个答案很理性,也有道理。可说到底,是不是还是要找一个方向?是不是只要找到一件喜欢的事,找到一个不错的工作,找到一种能坚持下去的生活,人就不会再天天胡思乱想?是不是所谓人生意义,最后还是会落到某种具体的行动上?我不知道。我只是觉得,人可能不能一直靠思考活着。想得太多,想不出答案的时候,思想就会变成一种内耗。它本来应该帮你开路,结果最后变成了一把反复割自己的刀。可我又做不到完全不想。所以我写下这些东西。也许这篇文章没有结论,甚至很多句子都不通顺。本人笔拙,还请各位佬友见谅,如果你点进来看到这里,谢谢你读完。也许你只是无聊,也许你也刚好不开心,也许你也在找一个答案。 13 个帖子 - 13 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-23 00:30:41+08:00 · tech

关于“乐极生悲”的一个结构性解释 核心命题 这里要解释的不是一般意义上的“开心之后容易倒霉”,而是一个更窄的现象:在某些高水平任务中,越是在结束前后感觉自己做得极顺、极完整、几乎没有遗漏,后面越容易在客观评价中暴露出明显问题。 这个现象的关键不在情绪,而在视野。当你感觉“已经全都处理完了”时,往往不是因为任务真的被完整覆盖,而是因为更高的参照暂时退出了视野。你看到的只剩下自己当前能力能够处理的部分,于是能力边界被误认为任务边界。 这就是本文所说的“完美塌缩”或“视野闭合”:完美不再作为外部参照存在,而是塌缩进当前能力范围之内。它在心理层面表现为强烈的顺畅和完成感,在客观层面则表现为对能力范围之外要求的遗漏。 所以,“感觉极好”和“后来翻车”不是简单的先后因果,也不是玄学意义上的平衡。它们是同一个认知状态的两个后果:参照消失以后,心理上获得确定感,客观上失去校准能力。 从认识论角度看,这个状态可以叫“完美塌缩”或“视野闭合”;从工程角度看,它也可以叫“全权操控”或“自由度挤压”。这些说法指向的是同一个机制,只是切入点不同。 四个范围 任何具体行动都发生在四个范围之间: 范围 含义 完美 这件事在理想状态下可以达到的上限;它本身不可真正抵达 良 外部标准定义的足够好,包括合格、达成、中位数以上等 能力所及 你当前能力实际能够覆盖的边界 所做事 你最终实际产出的东西 这里有一个关键前提:在高水平任务中,“良”并不完全包含在“能力所及”之内。也就是说,外部标准中有一部分要求,会超出你当前能力的自然覆盖范围。 这不是偶然情况,而是高水平任务的定义性特征。如果“良”已经完全落在你的能力所及之内,那么这件事对你来说就不是高水平任务。 因此,能否达成“良”,不只取决于你已经会什么,还取决于“完美”这个参照是否仍然留在你的认知视野里。 两种状态 “顺”的状态:完美塌缩,视野闭合 在这种状态里,“完美”不再作为一个独立参照出现在视野中。重点不是你误以为自己已经达到完美,而是“完美”这个坐标本身暂时消失了。 视野里只剩下能力所及的范围。由于没有更高的参照,所做事一旦填满了能力所及,就会被判定为已经完成。 这种状态的内部体感通常很好。因为没有任何超出当前位置的参照持续制造不安,认知系统会获得一种收束感、完成感和确定感。 但客观标准不会因为视野闭合而改变。“良”中超出能力所及的那一部分依然存在,只是没有被看见;没有被看见,就不会被处理;没有被处理,就会成为失分或失败的来源。 “不顺”的状态:完美保留,视野敞开 在这种状态里,“完美”仍然作为参照留在视野中。 于是你能同时看到完美、良、能力所及三者之间的距离。你清楚地知道自己已经做到了什么,也能感到还有一些东西没有抵达。 这种状态的内部体感往往是不安的。不是因为事情一定做得差,而是因为参照系没有关闭,视野之外的要求还在持续施压。 这种不安会迫使能力所及向外扩展。你会重新怀疑、重读、修正,转向原本没有纳入考虑的方向。在设置合理的高水平任务中,这种扩展有可能使能力所及覆盖“良”。 两种状态的结构差异 维度 完美塌缩:“顺” 完美保留:“不顺” 完美的位置 塌缩进能力所及 保留为独立参照 视野形态 闭合,只剩能力所及 敞开,层次仍然分明 心理状态 极好,因为没有参照外的不安 不安,因为距离仍被感知 能力所及 固化 流动并可能扩展 “良”中超出能力的部分 容易被遗漏 有机会被覆盖 客观结果 失败风险被锁定 达成仍然可能 这里要区分两种判断:“顺到闭合”足以导致失败,但“不顺到敞开”并不自动保证达成。 闭合使超出能力所及的部分从视野中消失,因此它构成失败的充分条件。敞开只保留了继续扩展的可能,它是达成的必要条件,而不是充分条件。最终能否达成,还取决于扩展速度,以及“良”与当前能力之间的距离。 这个不对称很重要。它说明问题不在于“不安本身有价值”,而在于视野是否还保留着足够的外部参照。 心理上的顺与事实上的差 “心理上感觉极好”和“客观上出现失误”不是一前一后的因果关系。它们是完美塌缩这一动作在两个层面上产生的后果。 在心理层面,完美塌缩消除了顶部参照,于是体感变成“极好”。 在客观层面,完美塌缩并没有改变“良”和“能力所及”的相对位置,超出能力所及的部分仍然存在,也仍然会被遗漏。 两个后果来自同一个认知动作,所以它们会稳定共现。 因此,预先记录中所谓的“命中”,并不需要被理解为统计意义上的偶然相关。只要记录捕捉到的是这个机制启动的瞬间,那么命中就来自机制本身。 为什么是“翻车”,而不只是“不完美” 困难任务本来就很难达到完美,但普通的不完美不会自然产生“翻车”的体感。要形成这种体感,需要两个条件叠加。 第一,“感觉极好”和“任务困难”在这里是绑定的。 “极好”不是一般性的顺畅感,而是明显偏离基线的完成感。它出现的前提,是任务本身有挑战、有不确定性,并且原本存在“可能做不到”的压力。只有当任务足够困难,而你又在当前视野内把它处理到近乎穷尽时,体感才会被推到“极好”。 但困难任务的含义,正是它不能被当前能力一次性完全覆盖。于是,“感觉极好”出现时,你往往正处在一个客观上无法真正完美解决的情境中。主观完成感越强,越说明视野内部已经被填满;而高水平任务的外部标准中,恰恰可能还有没有进入视野的部分。 第二,主观基准会被临时拉高。 平常状态下,内部基准通常接近“良”或预期的正常水平。结果落在这个范围附近时,体感也只是正常。 但在完美塌缩发生时,内部基准会短暂升到“完美”的高度。事后真正面对结果时,实际结果不是和“良”相比,而是和刚才那个被误当作完成状态的内部基准相比。落差因此被明显放大。 这两个条件叠加之后,机制层面的视野闭合带来了真实的客观下降,主观基准的临时拉高又把这种下降放大成“翻车”的体验。 机制只在某类任务上启动 简单任务的视野深度不够,通常不足以让完美塌缩产生“感觉极好”的强烈体感。日常生活中的大多数事件不会进入这个机制。 这个机制更容易出现在足够困难、足够重要、且有清晰评价标准的任务中。只有在这类任务里,能力所及、外部标准和完美参照之间的张力才会足够强,闭合与敞开才会对结果产生明显影响。 这也解释了为什么人能够从大量事件中挑出“乐极生悲”的样本。不是因为样本选择天然有偏,而是因为机制本身只会在特定类型的任务中启动。 这个机制的认识论位置 这个机制不是命运,不是玄学,也不是某种平衡法则。它描述的是自我观测系统中的一个结构性事实。 它之所以感觉像命运,是因为它同时具有三个特征。 第一,事发当时很难识破。识破它需要重新看见已经被塌缩掉的参照,而完美塌缩的完整形态,正是连“我正在塌缩完美”这件事本身也不在视野里。 第二,它能够跨场景稳定出现。机制不依赖具体场景,而依赖“完美塌缩”这个认知事件。只要任务足够困难,这个认知事件就可能发生。 第三,它会精准击中能力强、流程严格的人。因为只有这类人更可能把任务推进到“视野内穷尽”的程度。流程粗疏的人通常还没有抵达这种穷尽状态,也就不容易触发完整的完美塌缩。 机制的内在不可见性 闭合状态不能被实时直接观察。因为观察它所需的视角,正是“完美仍然作为参照存在”;而在闭合状态中,被拿掉的恰好就是这个参照。 对闭合的理解,只能从敞开状态反推。敞开时,完美仍在视野里,不安仍在持续,扩展仍在发生。这些内部体验是有内容的。 闭合则是这些内容全部缺席之后的状态。它作为认知对象,并不是一个可以被直接看见的东西,而是参照系内容的缺席。缺席本身无法被直接观察,只能通过事后的结构差异被识别。 这不是认知能力不足,而是机制本身的边界。 推论 “感觉极好”是诊断信号,不是问题的原因。它标记的是“完美已经在视野中塌缩”这个事实。试图单纯阻止自己感觉极好,只是在压制信号,而不是处理机制。 防御不能主要依靠情绪管理。完美塌缩在认知上有自动化倾向。任务推进到某个程度时,大脑会自然生成收尾感,这是认知节能的一部分,不能靠意志完全关闭。 真正能做的是两层操作:一是降低塌缩频率,在日常认知中保留怀疑和余地;二是减少塌缩后果,在“感觉极好”出现时启动工程化程序,把已经闭合的视野重新松动。 预先记录是次优但可行的策略。它不能阻止塌缩,却可以识别塌缩;而识别本身已经创造了干预空间。 1 个帖子 - 1 位参与者 阅读完整话题

36氪 · None · tech

文|周鑫雨 编辑|张雨忻 杨轩 《智能涌现》从多个信源处独家获悉,2026 年,字节 AI 有四个重要的命题: 加大对世界模型训练的投入,年底前,模型 性能达到现阶段世界模型全球 SOTA(最佳)Google Genie 3 的水平。 视频模型继续保持领先地位, 探索“动态生成”等新方向。 进一步打好 Coding 的地基, 做好 Coding 的 Dogfooding(数据回流、评测,形成飞轮),提升 Agent 能力。 豆包强化商业化能力, 重点场景是“办公”。 字节的未竟之地:世界模型 如今,字节的 AI 矩阵中,有让字节终于得以进入中国大模型第一梯队的 Seed 2.0,还有做到世界 SOTA 水平的 Seedance 2.0,另外在应用侧,豆包也形成了断层式领先—— 我们从多方了解到,2026 年春节过后,豆包 DAU 达到 2 亿 。 “没有明显短板。”一名大厂 AI 战略如此评价字节的 AI 业务矩阵。 但在一众模型中,唯独少了大模型研究下一阶段的关键:世界模型。 几名接近 Seed 团队人士告诉我们,字节是入场世界模型赛道较晚的玩家。 2024 年,刚从阿里加入字节的周畅,扛起了世界模型研究的大旗 。 但当时内部的判断是,世界模型路线和商业化场景还不明确,更重要的是打好视频模型的仗。 直到 2025 年,字节才在小范围内成立研究组,开始对世界模型中的 VLA(视觉-语言-动作模型)路线进行探索。带队人有两位: 一是字节 AI Lab 负责人李航——2025 年 4 月,AI Lab 整体(包含 Robotics 团队)并入了 Seed,目的之一是提升模型和应用(具身智能)之间的沟通效率——主要基于仿真数据进行世界模型训练。 另一位是 Seed 多模态研究员王文千,主要基于自然数据做训练。 来到 2026 年,吴永辉终于在 Seed 全员会上为世界模型设立了一个明确的目标: 2026 年底之前至少发布一版世界模型���性能对标目前的世界 SOTA(最佳)—— Google 在 2025 年 8 月发布的 Genie 3 。 但从目前的进度来看,追赶的速度不够。一位接近 Seed 人士告诉我们,吴永辉多次在 Seed 内部会直言字节世界模型和具身智能的效果不及预期。 另有 Seed 成员透露,根据内部评测,截至2026年初,字节世界模型的综合性能距离全球 SOTA 还存在 10% 的差距。 但这场仗代表未来。 一方面,世界模型的下游,便是至少千亿美金体量的具身智能市场,以及想象空间极大的游戏和娱乐场景。 一名前 Seed 研究员曾对我们表示,字节机器人此前的落地场景主要为物品运输、工业搬运,但内部判断天花板较低,“市场前景更广阔的人形机器人是字节一定会入局的方向。” 另一方面,世界模型的路线仍然存在诸多非共识,包括视频生成派、VLA(视觉-语言-动作模型)派、JEPA(像素预测)派等。 “赌,以字节的人才密度和资金投入,大概率能赢。”一名AI投资人对我们分析,“不赌,则一定会输。” 围绕跻身世界第一梯队的目标,2026年以来,字节针对世界模型训练,也已经做了不少调整。 《智能涌现》得知,2026年春节后, Seed 新设立了一支世界模型研究组,负责人为前Meta FAIR Lab研究员范浩奇,汇报给 Seed 多模态和世界模型负责人周畅; 与此同时,原来李航和王文千带领的两个 VLA 研究组合并,统一向周畅汇报。 多名知情人士告诉《智能涌现》,原来李航和王文千的研究组所探索的路线,主要是 VLA,追求“即兴”、“真实”,目标应用场景是具身智能;而范浩奇带领的新队伍走的则是 3D 仿真路线,主打娱乐和游戏这类应用场景。 除了人力和探索路线的扩张,世界模型在资金投入上也是文本、Coding、视频等多个模型方向中最高的一个。 很显著的是数据预算。一名字节数据平台的员工告诉我们,训练数据“走量”的策略,此前在 LLM(大语言模型)和 Seedance 2.0 上取得了显著收益,团队计划将同样的“数海战术”应用在世界模型的训练上。 这也对应着更高昂的数据投入——我们从多方了解到,2026 年,字节批给世界模型的训练数据(包括VLA、长视频、3D 等模态)的预算,在各个模态中是最高的,金额达到数千万元。 一名数据供应商提到,字节在世界模型上的数据投入,能达到其它厂商的 3-4 倍。 Coding :追求更极致的数据工程 Coding 能力是基础,是决定 Agent 效果上限的关键——这已成为业界的共识。 多名知情者曾对我们提及字节对 Coding 的重视。“字节对 Coding 的投入一直很高,仅次于今年的世界模型。”有接近 Seed 的人士告诉《智能涌现》。 比如,内部会定向采购数据,或是研究 Claude Code、CodeX 等海外顶尖 Coding 模型的训练数据 demo。 在 2025 年的火山引擎 Force 大会上,字节跳动技术副总裁洪定坤也表示,Coding 作为一种高度结构化、逻辑严密的任务,对模型理解复杂的语义结构、逻辑推理、算法设计和精确表达都有很高的要求,能助力模型智能上限的探索。 但在外界,字节 Coding 业务的存在感一直不强。无论是 2025 年 11 月发布的模型 Doubao-Seed-Code,还是 2025 年初发布的 AI 编程工具 Trae,效果和声量都不及智谱的 GLM 5 和月之暗面的 K2。 “字节 Coding 效果难以取得突破的原因在于缺少数据回流。” 一名知情者评价。由于模型能力有限,字节相关业务都不愿意使用 Seed-Code。 就连 AI Coding 应用 Trae,最早接入的也是 DeepSeek 和 Claude Code,以及产品内部自己训练的 Coding 模型。 这就导致,字节 Coding 模型缺少来自真实应用场景的反馈。 2026 年以来,不少字节员工感受到,各个业务方正在加大对 Seed 模型的支持力度。一名 Seed 员工告诉《智能涌现》,原来字节并不限制业务侧使用第三方 Coding 模型做开发,但 2026 年以来,多个应用部门被强制要求使用 Seed 模型。 不过,在更极致的数据投入下,Seed 在人才招聘上的速度倒是稍有放缓。 有AI 圈猎头告诉《智能涌现》,字节 HR 现在对外释放的信号是:粗放高薪招聘的时代已经结束了,接下来的命题是内部培养、提拔年轻人才,提高算法待遇。 如今,Seed 为数不多的招聘口子,主要开放给了来自DeepSeek,以及OpenAI、DeepMind、Meta 等海外大厂的 AI 人才,比如前 DeepSeek 核心成员郭达雅、前英伟达研究员董鑫。 Seedance 如何保持 SOTA 地位 2026 年字节在 AI 模型上的另一个重点,则是维持 Seedance 在全球视频生成领域的 SOTA 地位。 “Seedance 2.0 的胜利,是数据的胜利。”某视频生成初创企业的创始人曾对《智能涌现》这样评价 Seedance 2.0。我们得知, 庞大的训练数据量和超过 2000 人的评测团队,造就了 Seedance 2.0 的亮眼效果。 但持续靠“走量”的训练方式也存在隐忧。一些研究表明,视频生成领域存在“Anti-Scaling Law”现象,简单而言,训练数据越多,模型越容易“偷懒”,只学习某些关键帧,而忽视完整叙事——因此,越到训练后期,数据“走量”的收益往往越低。 两名数据侧的知情人士告诉我们, Seedance在预训练上已经做到了天花板,接下来想要提升性能,就必须清洗训练数据,进行更精细的后训练。 与此同时, “动态生成”能力是 2026 年 Seedance 团队关注的新方向。 所谓的“动态生成”,也就是互动视频,指的是用户可以输入指令,随时调整视频生成的内容和剧情。在这一赛道上,已经跑出了估值高达 13.2 亿美金的Vivix AI(前商汤高级研究总监刘宇创立)。 多名知情者告诉《智能涌现》,周畅一直十分看好动态生成的落地前景。 “互动视频可以做成小游戏,也可以做互动剧集,同时也能和世界模型的探索接轨(视频生成也是世界模型的一条探索路径)。”一名接近 Seed 人士表示。 加速豆包的商业化和出海 36氪曾独家报道 ,豆包预计将在 6 月下旬正式上线付费内容;与此同时,豆包也在计划与抖音电商打通,完善付费场景。 2026 年 5 月初,豆包曾在 App Store 中更新过付费订阅方案,月订阅价格在免费到500元不等。 6 月 3 日,豆包官方也宣布,即将针对专业人群的生产力需求推出“豆包专业版”,包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。 多名知情者透露,春节后, 豆包 DAU 已经突破 2 亿 。“今年豆包的投流预算很低。”在一名知情者看来,高 DAU 带来的是高昂的推理成本和运维压力,豆包在这个时间点推进商业化,带有降一降增长的增速,以及自我造血的双重目的。 而 PPT 生成,是豆包建立用户付费心智的核心切入点 。“豆包希望加强 PPT 生成功能,是为了面向金融、法律等高净值行业的白领收费。”一名接近豆包人士告诉《智能涌现》, 下一阶段,豆包还计划推出企业版,与企业内部的系统打通,但内部仍在讨论具体的结合方式 。 他表示,这一想法,是受到了海外模型商业模式的启发。目前,面向办公场景收费这条商业化路径,在海外已经得到了验证。据 Anthropic 披露的数据,Claude Code 上线仅 6 个月,ARR 就达到了 10 亿美元;上线一年后,2026 年 2 月的 ARR 已经达到了 25 亿美元。 面向企业开发场景的 Claude Code 带来的可观现金流,也让成立比 OpenAI 晚了 6 年的 Anthropic,在今年年初一跃反超 OpenAI 的 ARR。 那么现在,豆包要解决的问题就是把自己的用户心智从一个可以免费问一切的“通用入口”转变为一个虽然要花钱但能帮你提高效率的“办公助手”。 不过,豆包想进入的这个市场已经开始拥挤。有豆包人士对智能涌现提到,在调研企业客户的过程中,字节发现企业 AI 工具市场已经被不少行业 AI 解决方案供应商占领,迟来的豆包必然要面对更高的获客成本。 《智能涌现》了解到,出海也是豆包今年的重要命题之一。 此前,据《界面新闻》报道,豆包海外版应用 Dola 在 2025 年底的 DAU 已经突破千万。《智能涌现》了解到, Dola 2026 年的增长目标为:年底达到 3000万 DAU。 一名知情人士表示,小语种国家是 Dola 面向的主要市场。目前,海外 AI Chatbot 市场,已经基本被 ChatGPT、Claude、Gemini 占据。不在欧美市场与“AI 御三家”正面对抗,差异化切入小语种市场,是 Dola 的增长策略。 第三方数据显示,2025 年下半年以来,Dola 频频登上印尼、马来西亚、墨西哥等国家的应用商店下载榜。 —— 加入字节一年来,吴永辉的命题就是带领 Seed 一边修 Bug,一边做 SOTA 模型。而 2026 年,在AI 的每一个战场中,字节的目标都是做赢家。 如今,Seed 2.0、Seedance 2.0 成果初显,Seed 积累的工程、数据经验、人才,也将会以更高效的方式,复用到新一轮战争中。 (《智能涌现》作者邓咏仪对本文亦有贡献。) 封面来源|AI生成、视觉中国 欢迎交流! 欢迎交流!