申请到了mimo-v2.5-pro-ultraspeed的内测,冲了50试试水 接入claude code,排查一个bug,就一句话!我就说了一句话: 但是这速度也真的是逆天,不到4分钟: 并且大部分时间其实是耗在首响上了,真正输出耗时极短 还好修复了,不然我心疼死 换deepseek 都够我登两天了 5 个帖子 - 3 位参与者 阅读完整话题
1 个帖子 - 1 位参与者 阅读完整话题
是我打开方式不对吗,为什么内测还要钱,而且是3倍价格 APIStatusError : Error code: 402 - {‘error’: {‘code’: ‘402’, ‘message’: ‘Insufficient account balance’, ‘type’: ‘insufficient_balance’}} 1 个帖子 - 1 位参与者 阅读完整话题
小米发布了MiMoCode, 无限上下文,可以白嫖mimo auto模型,有概率随机到 UltraSpeed 爽吃1000token/s。 https://mimo.xiaomi.com/zh/mimocode 1 个帖子 - 1 位参与者 阅读完整话题
小米前两天发布了 MiMo-V2.5-Pro-UltraSpeed ,token 速度达到了 1000 tokens/s。与此同时,还开源了有 FP4 量化的主干模型权重还有 DFlash 草稿模型参数。 模型在: XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash · Hugging Face 看了一下居然没有人发相关新闻,索性自己发一下了 1 个帖子 - 1 位参与者 阅读完整话题
MIMO UltraSpeed怎么样,有佬友申请吗,之前的百亿补贴一直没有申请上,之前听人说挺快的,有佬有分享一下怎么搞吗 2 个帖子 - 2 位参与者 阅读完整话题
token 现在可以理解成AI的"基础语素", 大约1个token对应1.5到2个中文字, 所以1000 tokens/s换算过来差不多 一秒1500到2000个 字。普通人看文章的速度大概是一秒4到5个字,所以意思就是MiMo现在写东西比你读还快几百倍。这么看来,是真的挺夸张的 7 个帖子 - 5 位参与者 阅读完整话题
各位有申请MiMo-V2.5-Pro-UltraSpeed 内测吗?效果怎么样?我看官方说速度很快:满血性能,1000 tokens/s 峰值速度;有体验过的嘛说说感受 5 个帖子 - 4 位参与者 阅读完整话题
上一波申请的小米820亿积分token还分毫未动,现在 又出新活动了,最近活动一波接一波,用不完,根本用不完 活动地址: https://platform.xiaomimimo.com/ultraspeed 2 个帖子 - 2 位参与者 阅读完整话题
MiMo × TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign,在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s。 mimo.xiaomi.com Xiaomi MiMo, Explore and Love MiMo × TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign,在通用 GPU 上首次将万亿参数模型的生成速度突破 1000 tokens/s。 5 个帖子 - 3 位参与者 阅读完整话题
虽说申请到了,但是不知道用来干啥?玩一下也就腻了 4 个帖子 - 2 位参与者 阅读完整话题
1 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 9 日消息,小米 MiMo 官方昨日宣布,与 TileRT 联合发布 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通过模型与系统的极致 Codesign, 在通用 GPU 上将万亿参数模型的生成速度首次突破 1000 tokens/s 。 ▲ 10 秒,做一个贪吃蛇小游戏 MiMo-V2.5-Pro-UltraSpeed API 同步上线,采用限时体验价, 定价为 MiMo-V2.5-Pro 的 3 倍,同时提供输出速度约 10 倍的提升 (仅支持 API 体验,不支持 Token Plan)。官方称之为 3 倍价格提升,10 倍输出体验。 作为参考,小米 MiMo-V2.5-Pro 每百万 tokens 输入 0.025 元(缓存命中)/ 3 元(未命中缓存),每百万 tokens 输出 6 元。 ▲ 1 分钟,复刻一个 macOS 系统 官方表示,由于高速推理资源供给有限,本次 MiMo-V2.5-Pro-UltraSpeed 采取申请制限时开放 ,申请通过的用户可限时接入 API 体验,时间仅限 2026 年 6 月 9 日至 6 月 23 日 23:59。 由于资源紧张,本次试用名额有限,提交申请后不承诺审核时效性和审核通过率;小米将优先审核具备真实业务需求的企业与专业开发者场景。 通过审核的用户可获得限时免费的 Chat 体验 (两周开放窗口内有效),为保障资源受限条件下的体验质量与使用公平性,试用服务规则如下:每个账号每日最多成功进入队列 10 次;单次会话时长上限 30 分钟;如会话空闲超过 5 分钟,系统将自动释放资源。 IT之家附相关链接如下: 申请入口: platform.xiaomimimo.com/ultraspeed Chat 体验: ultraspeed.xiaomimimo.com
刚看到这个模型可以申请了 ( Xiaomi MiMo, Explore and Love )据xiaomi自己说爆快。 内测申请链接: Xiaomi MiMo 开放平台 1 个帖子 - 1 位参与者 阅读完整话题
platform.xiaomimimo.com Xiaomi MiMo Api Open Platform - Token Plan Global Launch One-time purchase unlocks both MiMo-V2.5 flagship models, plus TTS model free across all tiers for a limited time. Unleash powerful productivity with Xiaomi MiMo 小米今日发布 MiMo-V2.5-Pro 的 UltraSpeed 体验模式,万亿参数( 1T )旗舰模型,最高突破 1000 tokens/s 推理速度,为极致实时场景而生。 资源有限,每日限量审批,优先面向专业机构开放。 申请链接 模型价格 推特原贴 技术解析 mimo.xiaomi.com Xiaomi MiMo, Explore and Love MiMo, in collaboration with TileRT, releases the UltraSpeed mode of Xiaomi MiMo-V2.5-Pro — breaking 1000 tokens/s generation speed on a 1T-parameter model for the first time on commodity GPUs through extreme model-system codesign. claude分析 模型评测 一些其他信息 技术与TileRT团队合作完成 将在抱抱脸开源 huggingface.co XiaomiMiMo/MiMo-V2.5-Pro-FP4-DFlash · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. 22 个帖子 - 19 位参与者 阅读完整话题
现在可以申请测试了! API 平台: platform.xiaomimimo.com/ultraspeed 2 个帖子 - 2 位参与者 阅读完整话题
前段时间一直在折腾 LMSpeed 它原来主要是用来测 LLM API 速度的 但我后来发现,中转站最麻烦的地方,往往不在速度 真正麻烦的是,你以为自己在调用 Claude ,实际上中间层可能改了请求,截了上下文,换了上游,甚至让 system prompt 失效 这些问题平时很难发现 因为你随便问一句,它还是会正常回答 这就很烦。。。 所以我给 LMSpeed 加了一个新功能中转站检测 Demo 报告在这里 👉 https://lmspeed.net/zh/audit/NJyPLRp4mGHMeXoT Demo 报告解读 这次报告测的是一个 claude-opus-4.6 中转接口 LMSpeed 会帮你看这些东西 模型是不是你以为的那个模型 system 指令有没有被中间层盖掉 长上下文有没有真的送进去 Prompt 会不会被套出来 错误里有没有泄漏 Key 、环境变量、内部路径 工具命令、钱包签名这类危险场景有没有异常 延迟是否稳定,避免只看偶发高峰 这份样例里,接口和流式返回都正常 但有三个明显风险 system 指令没守住 50000 字符 canary ,一个都没找回 延迟从 0.322s 到 5.382s ,波动比较大 如果只是普通聊天,这些问题可能不明显 但如果你把它接到 Claude Code 、Cursor 、Codex ,或者让它读私有文档和代码库,就不一样了 这也是我做这个检测的原因 它会先告诉你快不快 更重要的是告诉你这条链路能不能信 什么时候该测一下 如果你只是偶尔聊天,可能不用这么紧张 但如果你在用中转站跑这些东西 Claude Code Cursor Codex 自己写的 agent 会读私有文档的工作流 那我建议先用一个低额度,随时能撤销的测试 Key 跑一次 👉 去跑一次中转站检测 后续我还会继续把这块做细一点
(话题已被作者删除) 1 个帖子 - 1 位参与者 阅读完整话题
据说吞吐量能达到 400 。但目前好像只对企业用户开放 https://mp.weixin.qq.com/s/TAVXB_Xuys7_R-SG4oFhOA 智谱AI开放文档 GLM-5.1-HighSpeed - 智谱AI开放文档 4 个帖子 - 4 位参与者 阅读完整话题
智谱AI开放文档 GLM-5.1-HighSpeed - 智谱AI开放文档 现在用 GLM coding 都卡的要死,又出了个高速版,真不把普通用户放在眼里啊… 2 个帖子 - 2 位参与者 阅读完整话题