带队 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

cnBeta全文版 · 2026-05-28 14:05:53+08:00 · tech

SpaceX计划执行首趟私人火星飞越任务，由亿万富翁王春担任任务指挥官，他将搭乘星舰进行人类首次跨行星私人飞行。 SpaceX和王春均未透露此次历史性任务的具体时间，但预计飞行将持续约两年。资料显示，王春出生并成长于天津，后获得马耳他公民身份，靠加密货币成为亿万富翁。他曾在2025年领导了人类首次极地轨道载人任务Fram2，并公开表示希望成为首批登陆火星的人。王春说，现在星舰V3已经亮相，离多行星文明的目标又近了一步。他在Fram2任务训练时，讨论最多的是如何在火卫一可靠降落，虽然这次飞越任务不会在火卫一停留，但凡事都得从第一步开始。他解释，为什么不选月球而是火星。他觉得，就算没有私人投资，月球也会因为中美竞争很快实现基地建设，自己更愿意旁观。但他对有生之年看到火星登陆没信心，所以想通过这次任务，让SpaceX别忘记火星，别把它推给下一代。很多人说载人飞越没什么科学价值，他觉得挺难过。人类太空飞行的科学很大程度上是医学科学，就算国际空间站运营多年，我们对太空飞行对人体的影响还有很多空白。 Fram2任务里做的大多是医学研究，时间短但都是为未来深空飞行做准备，登陆前的前驱任务能回答地面实验解决不了的长期问题。有人说有核发动机就能解决一切，但现实是，就算技术再先进，我们还是得在深空中度过数月甚至数年才能到达目标。轨道力学不会骗人，所以现在的每一步尝试都很重要。王春说，哆啦A梦的任意门不存在，只能靠一步步努力。这次任务不是为了冒险，而是要向公众证明，火星不是望远镜里的光点，是人类能飞到那里，活着健康回来的真实地方。查看评论

[酷工作] [北、上、深] 顶级 vc+大牛初创招聘大模型/agent 研究员、infra、后端

v2ex · 2026-05-07 20:52:41+08:00 · tech

顶级大模型初创公司，影响力大牛带队，超 20 亿首轮融资。薪资丰厚无上限地点：北京、上海、深圳倾向背景：大厂&头部 ai 公司核心团队，p6-p11 均有 hc 邮件： [email protected] 或微信：15210750729 招聘岗位：推理框架负责人（ Agent RL 训练） Agent Harness 系统算法专家 Agent 数据引擎算法专家&研究员 Agent 基模后训练算法专家&研究员 Agent 基模预训练算法专家&研究员 Agent 网关中转开发工程师 AI Infra 推理系统专家 AI Infra 后端开发工程师大模型训练系统专家（算子方向）全栈软件开发工程师（ AI 应用方向）通用后训练算法专家&研究员预训练数据引擎算法专家 Code & Search Agent 算法研究员

超越DeepSeek-V4 罗福莉交出小米最强开源模型首日适配5家国产芯片

plink.anyfeeder.com · 2026-04-28 12:36:38+08:00 · tech

刚刚，小米开源罗福莉带队研发的 MiMo-V2.5系列模型，采用MIT协议，允许商用推理部署与二次训练，无需额外授权。此前，该系列模型于4月23日开启公测，包括MiMo-V2.5-Pro、MiMo-V2.5两款模型。模型具备更强Agent能力，支持100万上下文，且Token效率大幅提升。 ▲MiMo-V2.5-Pro在Hugging Face的开源页面截图 MiMo-V2.5-Pro的完整基准测试结果今日公布，小米称其在GDPVal-AA（Elo）、Claw-Eval（pass^3）等多项测评中超过了最新开源的DeepSeek-V4-Pro模型，也超过了发布不久的Kimi K2.6等主流闭源模型，实现总体最佳。 ▲MiMo-V2.5-Pro的最新测评成绩开源首日，MiMo-V2.5-Pro宣布已完成与阿里平头哥、亚马逊云科技、AMD、百度昆仑芯、燧原科技、沐曦、天数智芯多个芯片厂商的接入适配。MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0适配。与此同时，小米还推出百万亿Token创造者激励计划，计划30天内免费发放总计100万亿Token权益；推出Agent生态共建计划，目前已与OpenCode、Hermes Agent、KiloCode等Agent框架厂商展开合作。模型权重合集： https://huggingface.co/collections/XiaomiMiMo/mimo-v25 更多细节参考模型Blog： https://mimo.xiaomi.com/index#blog 百万亿Token计划申请网址： https://100t.xiaomimimo.com/ 01 . 模型技术细节公布测评超越DeepSeek-V4 由小米最新公开的模型卡可知，小米迄今为止最强模型MiMo-V2.5-Pro是一款拥有1.02万亿（1.02T）个参数的混合专家模型，其中420亿（42B）个激活参数，基于混合注意力架构，相比前代模型在通用智能能力、复杂软件工程和长时域任务处理方面均实现了显著提升。 MiMo-V2.5-Pro继承了MiMo-V2-Flash的混合注意力机制和多标记预测（MTP）设计。局部滑动窗口注意力（SWA）和全局注意力（GA）以6:1的比例交错使用，窗口大小为128个Token，在长上下文情况下，通过可学习的注意力池偏置，将键值缓存存储空间减少了近7倍，同时保持了性能。一个轻量级的MTP模块，采用密集前馈神经网络（FFN），原生集成用于训练和推理，输出吞吐量大约提升了三倍，并加速了强化学习（RL）的部署。 ▲MiMo-V2.5-Pro的模型架构及训练过程该模型预训练使用27万亿（27T）个Token，采用FP8混合精度，原生序列长度为32K，上下文扩展至1M个Token。后训练遵循MiMo-V2-Flash中引入的三阶段范式：1、监督式微调，在精心挑选的数据对上建立基础的指令跟踪；2、领域专精训练，其中不同的教师模型分别通过针对特定领域的强化学习进行优化，涵盖数学、安全、智能工具使用等领域；3、多教师策略蒸馏（MOPD），其中单个学生模型在每位专精教师的Token级指导下，从自身的展开中学习策略，并将所有教师的能力融合到一个统一的模型中。再来看看MiMo-V2.5，这是一个3100亿（310B）参数的稀疏MoE模型，拥有150亿（15B）激活参数，在48万亿（48T）个Token上进行训练。它的语言主干框架继承了MiMo-V2-Flash的混合滑动窗口注意力机制，并搭载自研预训练视觉、音频编码器，两类编码器通过轻量化投影模块完成跨模块融合。 ▲MiMo-V2.5架构训练过程分为五个阶段：1、基于多样化语料开展文本预训练，搭建大语言模型主干网络；2、进行投影层预热训练，实现音视频、视觉投影器与语言模型的对齐融合；3、依托高质量跨模态数据集，开展大规模多模态预训练；4、执行监督微调与智能体后训练，在此过程中将上下文窗口从32K逐步扩容至256K，最终达到100万Token；5、最后是通过强化学习（RL）与多目标偏好蒸馏（MOPD），进一步强化模型的感知、逻辑推理与智能体执行能力。从小米最新公布的测评结果来看，MiMo-V2.5在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等多项测评中大幅超越了DeepSeek最新发布的DeepSeek-V4-Flash。 ▲MiMo-V2.5最新测评情况 02 . 开源首日，完成阿里平头哥沐曦等7家芯片厂商适配小米还公布了芯片生态与推理框架最新适配情况，MiMo-V2.5-Pro开源首日完成多个芯片厂商的接入适配：阿里平头哥：基于真武810E及全栈自研AI软件栈实现深度适配。亚马逊云科技：基于Trainium2芯片与Neuron SDK+vLLM推理框架完成深度适配，实现开源即全球可用的首日适配。下一代3nm制程Trainium3将进一步释放模型性能。 AMD：依托ROCm开源软件栈提供Day-0适配及全面优化支持。百度昆仑芯：通过底层算子优化与软硬件协同加速，保障模型稳定高效运行。燧原科技：基于自研驭算TopsRider软件栈深度优化，在燧原L600上完成全量适配。沐曦：基于曦云C系列及全栈自研MXMACA软件栈，实现Triton语法到沐曦GPU指令集的端到端原生支持。天数智芯：实现Day 0级深度适配。此外，MiMo-V2.5系列模型同步完成SGLang和vLLM主流推理框架的Day 0适配。 03 . 免费发放100万亿Token 已与Hermes Agent等合作与此同时，小米还同步推出MiMo Orbit计划，包含两部分：“百万亿Token创造者激励计划”，与面向Agent框架团队的“Agent生态共建计划”。在百万亿Token创造者激励计划方面，小米面向全球AI用户免费发放Token，30天内发放总计100万亿Token权益，赠完即止。该计划采取申请制，通过者最高获得Max档位Token Plan，包含16亿Credits，价值659元。活动时间：北京时间2026年4月28日00:00至5月28日00:00。 Agent生态共建计划方面，小米面向全球Agent框架团队提供专项支持，为框架提供MiMo Token限免支持，同时参与和赞助框架平台的AI Hackathon等共创活动。其目前已与OpenCode、Hermes Agent、KiloCode等Agent框架厂商展开深度合作。 04 . 结语：多款国产开源模型“亮剑”交锋近期，大模型行业开源力度持续加码，模型与国产及国际芯片的“Day 0”适配已从亮点变为刚需，推理效率和部署成本成为下一阶段竞争的核心。同时，百亿级Token免费激励与Agent框架生态共建，反映出行业正从“拼参数”转向“拼应用”。值得关注的是，小米MiMo-V2.5-Pro在多项基准评测中直接超越DeepSeek最新开源的DeepSeek-V4-Pro模型，可谓与DeepSeek在开源赛道发起“亮剑”交锋，有望倒逼行业更快降低推理成本、提升Agent真实任务完成率。查看评论

姚顺雨带队「重建」混元，首个大模型上线

linux.do · 2026-04-23 17:11:38+08:00 · tech

腾讯 Hy3 preview 来了。这是腾讯混元团队在架构、基础设施重新出发后的第一个版本，首批发布的模型尺寸较小，定位于实用性。同样值得关注的是， Hy3 preview 是姚顺雨归国加盟腾讯后的第一个重要成果，遵循了他「AI 下半场」的理念，模型在腾讯真实业务和复杂场景中打磨提升，关注在真实业务场景的效果与实用性。 1 个帖子 - 1 位参与者阅读完整话题

GPT Image 2团队曝光：无锡才俊带队 13人4个月封神

plink.anyfeeder.com · 2026-04-23 13:05:58+08:00 · tech

GPT Image2全网刷屏，但效果究竟为什么这么好？研究负责人陈博远揭秘：底层架构已彻底重构。但他又拒绝回答是否采用扩散模型或自回归技术，只是神秘的将其描述为“通用模型”或“图像领域的GPT”。陈博远的一条推文还透露，从去年12月底的GPT Image 1.5算起，只用了四个月就有如此大的改进。这样突破性的成果，核心团队只有13人。整个团队的负责人Gabriel Goh晒出了的团队成员AI全家福。评论区有网友感叹：怎么全是亚洲人？陈博远：从不懂Python到Research Lead GPT Image 2究竟是什么架构？ OpenAI恐怕很长一段时间都不会公布了，但从核心团队成员的学术经历可以看出一些痕迹。陈博远是团队的Research Lead，他和另一位成员Kiwhan Song在MIT读博时有同一位导师Vincent Sitzmann。他博士期间的代表作Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion入选了NeurIPS 2024。这项研究提出Diffusion Forcing这一全新序列生成训练范式，将逐token独立噪声级扩散与因果下一个token预测结合，融合自回归模型的可变长度生成与全序列扩散模型的长程引导优势。他在Google实习期间还以共同一作身份发表了SpatialVLM。通过过自动构建互联网规模的3D空间推理 VQA 数据集（1000 万图像、20 亿 QA 对），为视觉语言模型赋予定量 / 定性空间推理能力，可从单张 2D 图像输出米制距离、尺寸、方位等精确数值。这项研究把思维链空间推理应用到了具身智能领域。在Google实习期间，他开发的指令微调技术后续还被Gemini 2.0采用。他在高中参加科研夏令营时，还不懂Python的基本语法，那时结识的GoogleDeepMind资深研究员夏斐把他引入了AI世界。夏斐两次邀请他到DeepMind完成高质量实习，这些经历使陈博远积累了大规模模型训练的工程经验，也为他理解多模态系统的数据需求提供了宝贵视角。博士毕业后，陈博远于2025年6月加入OpenAI，迅速成为GPT图片生成五人核心成员之一，负责GPT图像生成模型的所有训练，同时也是Sora视频生成团队的一员。在演示中，他给家乡无锡做了一张海报。然后为来自首尔的队友做韩文海报，为来自Bangladesh的队友做孟加拉语海报。每一张中的文字渲染都精准无误。中科大Jianfeng Wang：让生图AI理解世界知识中科大博士毕业的Jianfeng Wang，在GPT Image 2团队负责的是另一个让人惊叹的能力：指令遵循和理解世界。旧模型画的永远时钟永远指向10:10，源于网络上的钟表广告图，几乎清一色都是10:10。这是因为钟表厂商找心理学家做过实验，认为这有助于刺激消费者买表的意愿。他让新模型画2:25、3:30、9:10、7:45，全部精准。这只是开胃菜。更多复杂的空间布局，苹果在中心、杯子在右边、书在上面、相机在左边、篮球在下面。模型全部精准执行。在加入OpenAI 之前，他在微软工作近9年。在微软期间就与OpenAI团队在DALLE-3上有合作。他在计算机视觉领域发表了多篇学术论文，研究内容可能涵盖图像分类、目标检测、语义分割、以及视觉表征学习等方向世界知识理解能力的大幅提升，对象的语义内容和功能结构有正确的理解 JianFeng Wang在演示视频结尾说到：GPT Image 2正在消除你的意图和模型产出之间的差距。真正做到你想要什么，模型就给你什么。 Yuguang Yang：生成高精度复杂信息图表 Yuguang Yang在GPT Image 2的发布活动中演示了生成信息图和PPT。整整75页的GPT-3论文拖进ChatGPT，自动生成7张幻灯片。他的经历可以说是团队成员中最丰富的，每换一个工作都是跨界，但都聚焦机器学习。他本科在浙大竺可桢学院学的工程，博士在约翰斯霍普金斯大学期间学的是计算化学物理与机器学习。他第一份全职工作是量化分析师，在清华做访问研究员期间亚牛的的是用于纳米机器人的强化学习和控制算法。后来他在亚马逊做过Alexa语音研究。又在微软做过Bing搜索的查询理解和检索、文档理解。 2025年初加入OpenAI后，除了图像生成还参与过ChatGPT智能体项目。他在个人账号上介绍GPT Image 2的信息图生成能力，可以为科研人员节省大量时间。还反复提醒大家，要做信息图不要忘记选择思考模式。从DALL-E到GPT Image 2.0 从团队成员Kenji Hata的自我介绍中得知，GPT Image 1.0也就是GPT-4o的图像生成部分。有一个人从DALL-E开始参与了OpenAI多模态系列研究的全程。他就是GPT Image 2.0团队负责人Gabriel Goh。从2019年加入OpenAI，他的早期研究更篇理论，专注于可解释性和凸优化等等。从DALL-E开始慢慢转向了图像生成。看到另一位团队成员Weixin Liang的研究履历，GPT Image 2的技术底色又揭开了一角。他在Meta实习期间的代表作Mixture-of-Transformers，引入模态解耦的MoE和解耦注意力，显著降低多模态模型预训练的计算成本。他博士毕业自斯坦福，本科也毕业自浙大竺可桢学院，不过比Yuguang Yang要晚好几年。 Weixin Liang与陈博远一样都是25年博士刚毕业就加入OpenAI，迅速成为团队的核心成员。其他GPT Image 2.0团队成员还包括： Ayaan Haque，之前在Luma AI 工作，参与过Luma的视频生成基础模型Dream Machine的训练。 Bing Liang，在Google干了5年多，参与Imagen3、Veo、Gemini Multimodal，2025年跳到OpenAI做图像生成研究。 Mengchao Zhong，本科上海交通大学校友，硕士毕业于得克萨斯农工大学，在Pinterest和Airtable做过软件工程师，在OpenAI负责多模态产品的工程。 Dibya Bhattacharjee，耶鲁大学，2015年IPhO铜牌，CIE A-Level数学和生物全球最高分。 Kiwhan Song是25年10月最晚加入的，除了做研究之外，他还是团队里的提示词大师，大家看到的官方演示图很多都出自他手。 …… 从最早的DALL-E到今天的GPT Image 2.0，这只团团队先后解决了。画得出来、画得清楚、画得好看、画得准。尽管近年来OpenAI的人才流动很大，但OpenAI还是那个能不断吸引各种有个性的人才，不限制专业、欢迎跨界，信奉自下而上涌现式研究的公司。从一个小团队开始，有了突破后公司倾斜更多资源，直到改变世界。 One More Thing 曾经，GPT-4o图像生成模仿吉卜力风格生成的头像席卷了全世界。如今GPT Image 2.0的团队成员，都把自己头像换成了这种奇脖子画风。那么这种画风的提示词是什么？团队成员也公布了出来 Use my photo only for identity. Redraw me as a very simple surreal Japanese sticker-style caricature: long thin neck， small deadpan face， minimal black outline， flat light coloring， almost no shading， very few facial details， simplified hair shape， lots of white space， plain white background， slightly awkward and funny. Ultratall 1:3 image. 参考链接： [1]https://x.com/gabeeegoooh/status/2046674385407512687?s=20 [2]https://venturebeat.com/technology/openais-chatgpt-images-2-0-is-here-and-it-does-multilingual-text-full-infographics-slides-maps-even-manga-seemingly-flawlessly 查看评论

何小鹏发内部信：本人亲自带队，最后200天冲刺机器人量产

36氪 · None · tech

何小鹏发出内部信，宣告自己将亲自下场直管机器人业务。何小鹏在内部信中称，小鹏人形机器人现在所处的阶段尤为关键，相当于8年前小鹏汽车即将完成第一款车G3发布的阶段，正站在量产交付的门槛上。按照何小鹏的规划：2026年第四季度，小鹏将实现人形机器人量产；2027年一季度，小鹏将人形机器人带入线下门店进行导购工作；2027年二季度，人形机器人将被推向海外市场；2028年，机器人将开始走向更多的家庭。（第一财经）

/tag/带队