事情是怎么开始的
一个很普通的问题
最近 Claude 官方不是发布了 claude-opus-4.8 嘛,我就想着去查一下价格,我打开官网---看价格--结束。价格确实很美丽,但是我的钱包很差劲,思来想去我便开始走上了“不归路”。
于是我开始在浏览器里面一个个搜:
Claude Azure Anthropic 各种聚合平台 各种 API 中转站 .....
打开第 20 个网页的时候
我开始怀疑人生了,开始不相信我的眼睛,开始几个网页来回跳转对不,明明是同一个模型,不同的平台
为什么价格完全不一样?
我发现了一个离谱现象
同一个 claude-opus-4.8 ,价格差几十倍
平台 输入价(M) 输出价(M) 缓存价(M) 平台 1 ¥0.80 ¥4 ¥0.08 平台 2 ¥1 ¥5 ¥0.10 平台 3 ¥1 ¥5 ¥0.10 平台 4 ¥1.50 ¥7.50 ¥0.15 平台 5 ¥2.25 ¥11.25 ¥0.23 平台 6 ¥2.50 ¥12.50 — 平台 7 ¥2.50 ¥12.50 ¥0.25 平台 8 ¥3 ¥15 ¥0.30 平台 9 ¥3 ¥15 ¥0.30 平台 10 ¥3.18 ¥15.90 ¥0.32 平台 11 ¥3.90 ¥19.50 ¥0.39 平台 12 ¥4 ¥20 ¥0.40 平台 13 ¥4.08 ¥20.40 ¥0.41 平台 14 ¥4.80 ¥24 ¥0.48 平台 15 ¥4.80 ¥24 ¥0.48 平台 16 ¥4.80 ¥24 ¥0.48 平台 17 ¥5 ¥25 — 平台 18 ¥5 ¥25 ¥0.50 平台 19 ¥5.40 ¥27 ¥0.54 平台 20 ¥8 ¥40 ¥0.80 平台 21 ¥15.75 ¥78.75 ¥1.57 平台 22 ¥20.75 ¥103.75 ¥2.08 平台 23 ¥25 ¥125 ¥2.50 平台 24 (官网) ¥33.85 ¥169.24 ¥33.80最低的输入价是 0.8 ,最高的是官网 33.85 ,其他的基本上都在 1-8 之间,只有少数几家是在 15-25 ,就一个模型就有这么多不同的价格
一开始我以为有人标错了
来来回回看了好几遍,才发现原来
问题出在:
来源不同:我表格中记录的这些有官网和中转,还有三方聚合的
线路不同:线路我没有写出来,但是大概有 20 多条线路
计费方式不同:有些平台有起充门槛,价格就相对便宜点,但是如果是第一次接触到这个平台,很少有人一上来就充个大几十或者是大几百的,基本上都是要充小部分试一下的,有些平台起充就是 1 元,但是模型的价格相对会贵一点
价格背后到底差在哪
我把我看过的网页做了一下简单的分类,主要有以下 4 类:
1.官方 最容易理解,简单来讲就是直接向模型厂商购买,比如 国外的 OpenAI 、Anthropic ,国内的 deepseek
特点:
来源最明确 稳定性通常最好 文档最完善 价格一般也是最高 售后也更有保障
适合:
企业客户 对稳定性要求高的团队 2.云服务商 云厂商把模型接进自己的平台,例如 国外 Azure 、AWS 、Google Cloud ,国内阿里云,火山云等
特点:
统一管理方便 可以和现有云服务一起使用 企业采购流程比较成熟
适合:
已经在使用云服务的团队 3.聚合平台 把多个模型厂商的能力聚合到一个平台,一个账号就能调用多个模型。比如硅基流动
特点:
接入方便 支持模型多 不需要分别注册多个账号 价格通常介于官方和中转之间
适合:
开发者 创业团队 需要频繁切换模型的人 4.中转服务 通过兼容接口、转发线路或二次封装的方式提供模型能力,也是目前市场上价格差异最大的部分。
特点:
价格跨度非常大 有的比官网便宜很多 有的甚至比官网更贵 稳定性差异也比较明显
适合:
对成本比较敏感的用户 个人创业者 于是我开始整理数据
最开始我只是想简单的记录一下,主要是为了方便自己查询
就只记录:
模型 输入价格 输出价格 缓存价格 平台
可是到后面越整理越多,从几个模型,变成几十个模型,从几个平台变成几十个平台。直到有一次和朋友聊天才知道原来很多人都在重复做同样的事情。
每次选模型:
查价格。 查平台。 查稳定性。 查支持情况。
大家都在重复劳动,每次也都要来来回回去对比。
比价格更有意思的发现 最便宜的不一定最省钱
其实一开始我最关注的是输入价格,谁便宜就排前面,后来发现事情没这么简单。
举个例子,我统计的 24 个平台里。平台 1 的输入价格只有:¥0.8 / 百万 Token ;而平台 24 的价格是:
¥33.85 / 百万 Token ,两者相差超过 42 倍。看到这里很多人第一反应都是:
那肯定选平台 1
我一开始也是这么想的。但继续往下看数据后发现,有些低价平台虽然便宜,但稳定性只有 60%~70%。
有些甚至更低,请求失败以后,程序会自动重试。,重试一次;就意味着同样的问题要重新消耗一次 Token 。
如果一天调用量很大,最后省下来的单价优势;可能被重试成本吃掉不少。所以很多团队真正算账的时候。已经不只是看单价了。而是在看:
稳定性 响应速度 成功率
以及最终的真实成本。
缓存能力对成本影响比想象中大
后来我又发现了一个很多人容易忽略的东西。
缓存价格。
一开始我甚至没太关注这一栏,后来仔细看数据的时候。
我人都傻了。
同样是 Claude Opus 4.8 。
平台 1 缓存价格:
¥0.08 / 百万 Token
平台 24 缓存价格:
¥33.8 / 百万 Token
差了超过 400 倍。
如果你的业务经常使用:
固定提示词 固定系统角色 相似上下文
缓存命中率会非常高。
这个时候。
真正决定成本的可能不是输入价格。
而是缓存价格。
很多人盯着输入价格看半天。
最后却忽略了最影响成本的地方。
不同平台的真实成本其实不一样
后来我尝试换了一个思路。
不看单价。
只看最终账单。
假设两家公司。
每个月都调用 1 亿 Token 。
表面上看。
平台 A 比平台 B 便宜很多。
但如果:
平台 A 稳定性低 平台 A 重试率高 平台 A 缓存能力差
最终实际花费可能反而更高。
这也是为什么后来我发现。
大家讨论模型的时候。
聊的已经不是:
哪个模型最强。
而是:
哪个平台最适合自己的场景。
因为影响成本的因素。
远远不只是价格表上的那个数字。
查到第 20 个网页的时候。
后来我决定把这些东西整理到一起
我想解决的不是:
推荐大家用哪个模型。
而是把选模型之前最容易被忽略的信息整理清楚。
比如:
价格到底差多少 缓存成本怎么算 平台稳定性怎么样 同样调用量下真实成本是多少
说白了。
就是让大家少一点信息差。
少一点重复踩坑。
我们目前在整理什么
我们现在主要整理五类信息:
模型价格、缓存价格、供应商来源、稳定性数据,以及不同场景下的使用成本。
说白了,不是想告诉大家“哪个模型最好”。
而是想让大家在选模型之前,先把价格、稳定性和真实成本看明白。
做这个过程中的最大收获
做完这轮整理后,我最大的感受是:
模型选型不能只看排行榜。
真正落到使用里,影响最大的往往是三件事:
成本 稳定性 适不适合自己的业务场景
有时候,最贵的不一定最好。
最便宜的,也不一定最省钱。
写在最后
做这件事之前,我一直以为模型选型最重要的是能力。
做完以后才发现。
很多团队真正头疼的其实是信息差。
价格在哪里看。
缓存怎么算。
平台稳不稳。
同一个模型为什么差这么多。
这些问题远比排行榜更实际。
如果重新来一次。
我大概率不会再打开那二十多个网站。
但如果没经历过这次折腾。
可能也不会发现这些问题。
后来我把整理的数据做成了一个公开页面。
至少下次再查价格的时候。
不用再一个网页一个网页翻了。