阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?
阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……

来源: V2EX - 技术查看原文