以下是Gemini换算的过程:设定是99元套餐,pro模型,90%命中率
【MiMo v2.5-pro 110亿额度】耐用度计算推演
基于官方最新 v2.5 计费表,按 90% 缓存命中率 深度测算:
1. 综合输入单价(Input):
-
命中 (90%):2.5 \\times 0.9 = 2.25
-
未命中 (10%):300 \\times 0.1 = 30
-
平均输入单价:32.25 Credits/token
2. 综合实战单价(Input + Output):
按对话场景普遍的 4:1 比例(4输入:1输出)推算:
-
4个输入:32.25 \\times 4 = 129
-
1个输出:600 \\times 1 = 600
-
5个 Token 总计消耗:729 Credits
-
平均综合单价:145.8 Credits/token
3. 最终可用量(110亿额度):
\$\$11,000,000,000 / 145.8 \approx 7,545 \text{万 Token}
结论:
-
纯处理长文本(只读): 约 3.41 亿 Token
-
正常对话(有来有回): 约 7545 万 Token
避坑指南:
v2.5-pro 的输出成本是缓存命中输入的 240 倍。如果你的应用场景是"短输入、长输出",额度会崩得很快;如果场景是"长上下文、短输出",这版计费体系就是真香。
1 个帖子 - 1 位参与者