IT之家 5 月 28 日消息,小米 MiMo 官方昨日宣布, 小米 MiMo-V2.5 系列 API 永久降价 ,相比原始 API 定价,新定价最高降幅可达 99%,且不再区分上下文窗口长度。 小米 MiMo 负责人罗福莉随后在 X 平台发文,谈到了 MiMo API 降价的技术原因,IT之家附罗福莉原文翻译如下: MiMo API 价格下调的背后: 最高降幅可达 99%,针对的是输入(缓存命中)。核心原因在于我们的推理框架现在支持针对 SWA 的分层 KV 缓存优化。生产推理引擎测试表明,该优化将缓存的 Token 容量提升了 5 倍, 相当于降低了 80% 的缓存成本 。再结合 Hybrid 模型中多个 Full Attention 模块之间的缓存读取重叠(Cache Read Overlap),实际成本得到了进一步降低。 输入(未命中缓存)和输出的价格也降低了约 60% 至 80%。这主要得益于模型架构带来的极致 1:7 Full:SWA 稀疏比(70 层的 MiMo-V2.5-Pro 的 prefill 计算量大致相当于一个 10 层的 GQA 模型)。这使得我们 原始推理成本远低于行业平均水平 ,在定价上自然留出了 2 到 3 倍的利润空间。此次价格调整, 只是我们决定把这些结构性成本优势直接让利给开发者 。 在新的、更低的 API 价格之下,我们的生产推理引擎已接近满负载运行,并且 我们基本上仍然可以维持收支平衡 (we can still essentially break even)。 我们此前曾建议大语言模型(LLM)公司不要“盲目降价”,正是因为很少有模型架构和推理优化能力,能够在 API 大幅降价后仍避免亏损 。如果未来出现更多能够节省计算量和 KV 缓存的架构,并配合更好的推理基础设施(Infra)来降低 API 成本,这将在行业内形成一个绝佳的良性循环。 更重要的是,价格合理、性能优异的模型 API 将驱动真实、持续且大规模的推理需求。这种上游需求拉动了整个 AI 基础设施链的发展 —— 包括芯片、服务器、光模块、PCB、液冷、电力、储能和数据中心 —— 并作为 AI 硬件系统性重估的战略支点。从长远来看,这为训练和推理管线注入了更廉价、更易获取的算力,从而加速了全球通用人工智能(AGI)在多个地区和技术路线上的并行演进。 更多技术细节,我们后续会发布一篇详细的 Blog。
先上我这7日的黑与白币的收支情况,最高的一天是收入3093#: 赚$详细攻略: 01.起手式:刚开始没有钱,没vip,只有6块地时: 到菜场买种子(注意是到菜场买,按价格排序,比种菜时直接购买便宜老多),买6个草莓(西瓜、南瓜也可以),种出的菜直接到交易所卖掉(注意:卖的时候不能全卖光,要留6个作为下一次种地的种子,如果不小心卖光的话,那就再从菜场买6个)。 02.攒$开Super Gamer: 每日固定项目:签到+大转盘+漂流瓶+种菜/卖菜, 赚够15,立马到菜场买6个杨桃作为备用种子, 然后继续赚够160,立马去开Super Gamer(可以先开7天的), 03.有了Super Gamer(功能1),马上开始无脑种杨桃,要及时收割(可以定个闹钟),为什么要种杨桃不种金苹果,参考夜予安大佬的帖子,我就是跟着夜予安大佬的帖子学的: 黑与白农场收益计算,别再种你的金苹果了!种它一天 500 刀轻轻松松 - 搞七捻三 - LINUX DO , 04.种杨桃的同时,Super Gamer(功能2)还附带抽卡特权,每天可以抽50次,每天都坚持抽卡,集齐卡片一次至少可以兑换1000$, 05.Super Gamer(功能3),还有漂流瓶也增加1次,每天都取2次漂流瓶,(漂流瓶里经常有大善人发福利,有时能开出价值最高的抽卡"金卡",有时能开出10000$), 06.然后赚到$后,马上添加新地块(注意留杨桃种子),继续种杨桃,反正只要有了够开辟新地块的钱,别犹豫继续无脑开辟新地块,无脑种杨桃,不断循环, 07.我是12天前看了夜予安大佬的帖子,现在已经有16块地了,可能明天就能开第17块地了(第17块地要5766),那每天保底收益就有800多$了, 08.偷菜:这一块收益很多佬友没重视,其实这也是很重要的一大收益,哈哈。欢迎加我好友,让我狠狠的偷你们种的菜,用户名:Yuntianming,ID:cmo5t614f7amqvjhqlp6rum0n 09.集换卡片:种杨桃也不是黑与白游戏里赚$最快的,赚$最快的是抽卡(100连抽),但前提条件非常高,必须要有很多很多的$储备才能赚,不然可能会亏死,(有的说要提前准备5W,有的说要15W,目前我也不知道得准备多少能保赚,有知道的大佬欢迎分享经验,另外我也不知道大佬们玩抽卡的原始积累都是怎么赚到的),目前我没有那么多的$储备,玩不了100连抽,只能每天50抽,后面也没别的事,就努力攒够$,攒够再去玩抽卡。 另外,种菜里的精炼室和集换卡片里的重铸工坊是可以搭配使用的,使用的时机,我感觉只想只靠这两个完成集卡,那裤衩子都得亏没,我感觉是当你的卡片,只缺少几个的时候,才考虑用这两个东西来补齐卡片,感觉不太容易操作。 关于补齐卡片,目前最好的方法还是到 【黑与白福利站】统一交换卡贴,后续请在本帖下交换 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO ,跟佬友交换,这个我玩的不深,只交换过一次,另外我感觉当剩余天数还有很多天的时候,不应该急着去交换,可以继续每天抽卡,再攒多点再看看到底会缺少什么,最后再交换(但留的时间要充足,别没交换完,活动周期结束了,翻车了就亏大了)。 以上方法,肯定不是最好的方法,但平时发现很多很多人的方法,还没有我上面的方法好,赚黑白币很慢,所以分享出来供佬友参考,有大佬有更好的方法,也欢迎一起跟大家分享。 14 个帖子 - 12 位参与者 阅读完整话题
李强主持召开国务院常务会议,研究2025年度中央预算执行和其他财政收支审计查出问题整改工作。(央视新闻)
泰国央行表示,泰铢稳定及对外收支状况强劲,意味着没有必要召开紧急利率会议。此前,印尼为支撑本币举行非常规政策会议加息。“鉴于泰铢的稳定性以及泰国强劲的对外收支情况,货币政策委员会无需像印尼那样召开特别会议,”泰国央行助理行长兼发言人Chayawadee Chai-Anant周三晚间在一份声明中表示。(新浪财经)
日本财务省8日公布的国际收支统计报告显示,4月日本旅游收支顺差为5465亿日元(1美元约合160日元),同比下降25.2%。数据显示,4月访日外国游客在日本消费7672亿日元,同比下降17.9%。日本游客海外消费2208亿日元,同比增长8.2%。(新华社)
6月8日,财政部经济建设司司长郭方明在国务院政策例行吹风会上表示,财政部统筹各项资金的渠道,支持城市更新重点任务。比如城镇保障性安居工程补助资金、地方政府专项债券、中央预算内投资、超长期特别国债资金等。“十五五”时期,中央财政还将保持较大支持力度,并不断优化政策设计,提高资金使用效率。除了财政资金支持之外,同步实施好税收支持政策,符合条件的城市更新主体,可享受现行的有关税收优惠政策。(证券时报)
36氪获悉,小米MiMo大模型团队在官方技术博客发布文章,首次完整公开MiMo-V2.5系列大模型API永久降价背后的技术路径。文章称,MiMO-V2.5实现了KVCache双池+SWA-aware前缀树、GCache分布式缓存、KVCache亲和调度、Decode阶段MTP加速、多模态推理优化五大核心突破,降价后仍能维持收支平衡。此外,4月28日推出的“百万亿Token创造者激励计划”,总申请人数超过54万人,累计发放100万亿免费Token,折合人民币超6500万元。
36氪获悉,国家外汇管理局公布2026年一季度我国国际收支平衡表初步数,2026年一季度,我国经常账户顺差12821亿元,其中,货物贸易顺差17212亿元,服务贸易逆差4139亿元,初次收入逆差520亿元,二次收入顺差268亿元。资本和金融账户(含当季净误差与遗漏)逆差12821亿元,其中来华直接投资保持净流入。按美元计值,2026年一季度,我国经常账户顺差1841亿美元,其中,货物贸易顺差2474亿美元,服务贸易逆差596亿美元,初次收入逆差75亿美元,二次收入顺差39亿美元。资本和金融账户(含当季净误差与遗漏)逆差1841亿美元。