薅了个小米的Pro套餐,一个晚上就用了一半额度。
我还在想为什么这么不经用
直到看到这个
Claude Code从 2.1.36版本开始,会在每个API请求的系统提示词开头,加入含随机5位十六进制cch 字段的 x-anthropic-billing-header内容。 由于第三方API将其视为普通提示词计算缓存key, cch每次变化会导致缓存命中率归零,引发 token消耗暴涨、推理变慢。 真不做个人啊。 [Image1779008565042647]
其他的厂商如deepseek和glm都专门对此做了适配避免无法命中缓存,但是小米貌似没有
9 个帖子 - 6 位参与者