我用gemini算了下新小米模型的plan,只能说雷老板还是营销天才。

我用gemini算了下新小米模型的plan,只能说雷老板还是营销天才。
我用gemini算了下新小米模型的plan,只能说雷老板还是营销天才。

以下是Gemini换算的过程:设定是99元套餐,pro模型,90%命中率

【MiMo v2.5-pro 110亿额度】耐用度计算推演

基于官方最新 v2.5 计费表,按 90% 缓存命中率 深度测算:

1. 综合输入单价(Input):

  • 命中 (90%):2.5 \\times 0.9 = 2.25

  • 未命中 (10%):300 \\times 0.1 = 30

  • 平均输入单价:32.25 Credits/token

2. 综合实战单价(Input + Output):

按对话场景普遍的 4:1 比例(4输入:1输出)推算:

  • 4个输入:32.25 \\times 4 = 129

  • 1个输出:600 \\times 1 = 600

  • 5个 Token 总计消耗:729 Credits

  • 平均综合单价:145.8 Credits/token

3. 最终可用量(110亿额度):

\$\$11,000,000,000 / 145.8 \approx 7,545 \text{万 Token}

:bar_chart: 结论:

  • 纯处理长文本(只读):3.41 亿 Token

  • 正常对话(有来有回):7545 万 Token

避坑指南:

v2.5-pro 的输出成本是缓存命中输入的 240 倍。如果你的应用场景是"短输入、长输出",额度会崩得很快;如果场景是"长上下文、短输出",这版计费体系就是真香。

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文