前情提要:
背景: 经过连续一年的广进现在公司就剩两程序员了, 被迫 ALL IN AI, 从年前就疯狂催促公司层面出钱采购 token 一直拖到这个月事情终于有着落了. 需求: 预算为 500+/month, 超过四位数不好下来 用量就是 2 人站起来蹬, 目前统计是 6 个奥特曼 Plus 差不多能覆盖峰值 问题 哪家速度快? 哪家有货? 核心问题: 反代给同办公室两人使用, 会封号吗
一个月过去被国货剧透, 4月初的时候所有 Coding Plan 都买不到, 找到个不限购的不知名小厂 Alaya Code , 699 / 月买了个中级套餐试用, 额度确实是给足了, 但是 GLM5.1 只有离谱的 剧透, 属实过于离谱.
疯狂抱怨一个月之后这个 Alaya Code 的套餐终于要过期了, 决定采购阿里云百炼新推出的 Token Plan 团队版, 按席位算钱, 想着大厂出品, 套餐消费 698 每月的中级档两个席位就算涨价了比以前的那些 Coding Plan贵, 但是都 1400 每月了怎么说都够用了吧? 于是盲选 5.21 下午让财务付了钱, 随便发几个 hi 测试一下就下班了;
第二天另一位同事没来, 我随便试用了一下, opencode 用 Qwen3.7 Max 让他分析一下内部的老框架十几个二方包(都是浅封装仓库多代码量不多) 出一份报告和升级计划.
然后, 1400 买的套餐, 总额度就去掉了 20.8% …
问了老同学他们公司内部也遇到了这个问题, 说是 Qwen3.7 Max 没有隐式缓存, 要么手动调用显式创建缓存要么没缓存原价, 这纯纯的坑客户行为, 没有任何明显的位置标注这个模型不支持自动隐式缓存!!!
行吧行吧, 我的问题是吧, 我认, 那我换别的模型, 昨天换成了 GLM5.1 这种支持隐式缓存的, 检查日志也确实有缓存, 然后又随便几个小对话进去, 总额度又啪的掉了 4% !!!
然后我按照官方给出的计费示例手动测算了一下, 698 / 席位的套餐, 100,000 Credits 额度换算下来相当于 剧透 / 月… 套餐相当于直接充 API 定价的 7 折, 也是有够离谱的

6 个帖子 - 6 位参与者