参考链接: 1 个帖子 - 1 位参与者 阅读完整话题
原标题:《 xAI 再失华人大将:预训练负责人已离职,马斯克又留不住人了 》 xAI 再失一名华人大将,预训练负责人庄钧堂昨日官宣了自己已经离职的消息。 此前,庄钧堂已经在 xAI 工作了两年。这期间,他主导了从 Grok 多个版本模型的预训练,同时负责预训练 Grok 在 X 和 Tesla 上的语音模型及 xAI 企业 API 模型。 虽然他在官宣前两个月就已离开,但这波刚好赶上 xAI 不再独立运营后的新一轮离职潮。仅一天之内,就有多名员工相继宣布离职。如此高密度的人员离职,让人不禁感叹,xAI 到底是怎么了? 谁是庄钧堂? 2024 年,庄钧堂加入 xAI。 此后两年,Grok 多代模型的预训练都由他主导。 Grok 在 X 和 Tesla 上的语音模型,xAI 对外的企业 API 模型,也都由他牵头预训练。 在此之前,他在 OpenAI 工作了两年。 这期间,他是 GPT-4 技术报告的联合作者,还参与了 GPT-4o 和 DALL-E 3 的核心开发,提出了 GPT4-Turbo 128k 算法,并作为第一贡献者搭建了 OpenAI 的 Embedding 模型。 这几件事,分别对应着 OpenAI 在语言模型、多模态、图像生成和向量检索等方向上的关键节点产品。 他的学术背景,和这份工作履历放在一起,有一定的反差。 庄钧堂本科就读于清华大学,但读的专业并非计算机,而是工程物理,还辅修了法律。 他的硕博生涯是在耶鲁度过的,硕士读的是统计学,博士则是生物医学工程。 读博期间,庄郡堂的研究课题是判断自闭症患者的脑连接组中哪些连接异常与自闭症的诊断相关。 在这个课题中,他使用的工具是神经网络。 在博士期间,他提出了 AdaBelief 优化器,其核心思路是根据模型对当前梯度的置信程度来自适应地调整步长。 如果当前观测到的梯度方向与模型的预期偏差很大,说明此刻的观测不可信,应该迈小步;如果梯度方向与预期接近,说明信号可靠,可以迈大步。 这个设计触及了深度学习训练中一个长期存在的痛点 —— 现有优化器对噪声梯度的处理过于粗糙。 这篇论文在 NeurIPS 2020 拿到了 Spotlight,随后被 PyTorch、TensorFlow、Google Flax、DeepMind Optax 等主流框架相继收录,成为研究者工具箱里的常备选项。 马斯克留不住人 就在庄钧堂宣布离职的同一天,xAI 还有多名员工相继发出了同样的消息。 三天前,马斯克刚刚宣布 xAI 不再作为独立公司运营,并入 SpaceX,统一更名为“SpaceXAI”。这个消息发出后没多久,离职的消息就接连来了。 与此同时,另一批人正在进场 ——Cursor 的员工开始出现在 xAI 的办公室里,由 xAI 现任研究负责人 Aman Madaan 主持联合会议。 Cursor 的到来,目的之一就是解决马斯克一直以来“留不住人”的困境。 从 2024 年中开始,xAI 的联创就在陆续离开,SpaceX 完成收购后密集爆发,到今年 3 月底,11 位联创全部清零。 Fast Company 统计,过去一年内 xAI 可查证的离职员工已超过 80 人。 马斯克也在试图解决人事危机,但专门挖来的人也是说走就走。 今年 3 月,马斯克把 Mistral AI 和 Thinking Machines Lab 联创 Devendra Chaplot 请来,直接向他汇报,但 Debendra 入职才一个月,便离职了。 马斯克承认,xAI“没有建立在正确的基础上,正在从头重建”。今年 4 月,他转向外部,与 Cursor 达成合作,于是便有了 Cursor 员工进驻 xAI 办公室的一幕。 Grok 正常更新 尽管马斯克在人事问题上屡遭滑铁卢,但 xAI 的主要产品 Grok,也刚刚宣布了一波更新。 新版增加了连接器功能,支持接入邮件、日历、Notion 等工具,帮助用户提取邮件、整理日程。 同时马斯克还下场驳斥了“Grok 将死”的传闻。 毕竟一边是团队不再独立运行,另一边又刚刚把 Colossus 集群租给了 Anthropic,让人很难不遐想。 但马斯克表示,新的 Grok 模型正在 Colossus 2 集群上正常训练中,也算是解开了 Colossus 出租的疑云。 那就等着看看,马斯克还能交出怎样的模型吧。 参考链接: [1] https://x.com/archanfel_anoth/status/2052878350868484361 [2] https://x.com/elonmusk/status/2052269744120869106
IT之家 4 月 27 日消息,《刺客信条:女巫》(Assassin's Creed Hexe)游戏总监伯努瓦・里歇尔宣布已离开该项目,成为今年第二位离职的本作开发团队总监级核心成员。 里歇尔官宣已从育碧离职,加入总部位于魁北克的独立工作室 Servo Games。他将与同样出身育碧的资深开发者吕克・特伦布莱、丹尼・马库、亚历克斯・德龙共同创办这家工作室,并担任联合创始人兼游戏总监。 这位前《刺客信条:女巫》开发负责人表示:“这是人生新篇章的开端。我很荣幸能为魁北克创意产业生态贡献力量,并助力其发展壮大。”里歇尔并未透露新作项目细节,但承诺后续会公布更多相关信息。 距离创意总监克林特・霍金官宣离职仅两个月后,里歇尔也离开了《刺客信条:女巫》项目。育碧发言人曾在 2 月表示:“我们衷心感谢克林特多年来的创意远见、创作贡献与敬业付出,祝愿他未来一切顺遂。”同时官方保证,《刺客信条:女巫》仍由经验丰富的开发团队继续推进制作。育碧称:“本作将为《刺客信条》系列带来独具特色的全新体验,我们期待在未来公布更多游戏情报。” 随后,《刺客信条》品牌内容负责人让・盖东被任命为该项目新任创意总监。有消息称,盖东上任后已砍掉了《女巫》中所有带有魔法奇幻元素的内容。据业内爆料博主 @xj0nathan 透露,游戏原本设定玩家可以操控猫咪,但随着盖东接手项目,这一设定最终被取消。 IT之家注意到,不止里歇尔与霍金,还有多名核心人员离开了《刺客信条:女巫》项目。早在去年 10 月,系列前负责人马克 - 亚历克西斯・科特也离开了该项目并从育碧离职。科特本人表示,自己并非主动离职,而是被育碧要求退居二线、调离项目。今年 1 月有消息曝出,科特离职后已正式起诉育碧。 至于《刺客信条:女巫》,目前这款作品依旧迷雾重重。该项目于 2022 年首次公布,当时设定灵感源自欧洲女巫传说,游戏至今尚未公布发售日期。 虽然《刺客信条:女巫》仍需漫长等待,但《刺客信条 4:黑旗》重制版已尘埃落定。历经数月爆料泄露后,本作定于 7 月 9 日正式发售,登陆 PS5、Xbox Series X|S 以及 PC 平台。
IT之家 4 月 16 日消息,前 OpenAI 首席技术官米拉・穆拉蒂创立的人工智能初创公司 Thinking Machines Lab,又一名创始成员被 Meta 挖走。 据约书亚・格罗斯的领英资料显示,这位资深软件工程师从零到一打造并推出了 Thinking Machines Lab 的旗舰产品 Tinker。 他已于上月加入 Meta 超智能实验室(Meta Superintelligence Labs),目前负责领导工程团队。格罗斯此前曾在 OpenAI 和 Meta 任职。 Thinking Machines Lab 去年以 120 亿美元估值完成了高达 20 亿美元的融资,已成为人工智能人才聚集地。随着硅谷人工智能人才争夺战愈演愈烈,该公司接连遭到大型科技公司的人才挖角。 截至目前,Meta 已挖走该实验室 5 名创始成员,其中包括联合创始人安德鲁・塔洛克。与此同时,OpenAI 则聘请了该公司前首席技术官巴雷特・佐夫以及顶尖网络安全专家乔琳・帕里什。 IT之家注意到,Thinking Machines Lab 也有不少亮眼的人才收获。据 Business Insider 此前报道,该公司聘请了 Meta 的苏米特・钦塔拉接任首席技术官,他正是开源人工智能项目 PyTorch 的创始人;此外,该公司还低调招入曾斩获三枚国际编程奥林匹克金牌的程序员 Neal Wu。 据知情人士透露,这家总部位于旧金山的初创公司自去年成立以来,团队规模已扩张四倍多,员工总数约 130 人。