[人工智能] 为了查 Claude Opus 4.8 价格,我连续打开了 20 多个网站

[人工智能] 为了查 Claude Opus 4.8 价格,我连续打开了 20 多个网站
[人工智能] 为了查 Claude Opus 4.8 价格,我连续打开了 20 多个网站

事情是怎么开始的

一个很普通的问题

最近 Claude 官方不是发布了 claude-opus-4.8 嘛,我就想着去查一下价格,我打开官网---看价格--结束。价格确实很美丽,但是我的钱包很差劲,思来想去我便开始走上了“不归路”。

于是我开始在浏览器里面一个个搜:

Claude Azure Anthropic 各种聚合平台 各种 API 中转站 .....

打开第 20 个网页的时候

我开始怀疑人生了,开始不相信我的眼睛,开始几个网页来回跳转对不,明明是同一个模型,不同的平台

为什么价格完全不一样?

我发现了一个离谱现象

同一个 claude-opus-4.8 ,价格差几十倍

平台 输入价(M) 输出价(M) 缓存价(M) 平台 1 ¥0.80 ¥4 ¥0.08 平台 2 ¥1 ¥5 ¥0.10 平台 3 ¥1 ¥5 ¥0.10 平台 4 ¥1.50 ¥7.50 ¥0.15 平台 5 ¥2.25 ¥11.25 ¥0.23 平台 6 ¥2.50 ¥12.50 — 平台 7 ¥2.50 ¥12.50 ¥0.25 平台 8 ¥3 ¥15 ¥0.30 平台 9 ¥3 ¥15 ¥0.30 平台 10 ¥3.18 ¥15.90 ¥0.32 平台 11 ¥3.90 ¥19.50 ¥0.39 平台 12 ¥4 ¥20 ¥0.40 平台 13 ¥4.08 ¥20.40 ¥0.41 平台 14 ¥4.80 ¥24 ¥0.48 平台 15 ¥4.80 ¥24 ¥0.48 平台 16 ¥4.80 ¥24 ¥0.48 平台 17 ¥5 ¥25 — 平台 18 ¥5 ¥25 ¥0.50 平台 19 ¥5.40 ¥27 ¥0.54 平台 20 ¥8 ¥40 ¥0.80 平台 21 ¥15.75 ¥78.75 ¥1.57 平台 22 ¥20.75 ¥103.75 ¥2.08 平台 23 ¥25 ¥125 ¥2.50 平台 24 (官网) ¥33.85 ¥169.24 ¥33.80

最低的输入价是 0.8 ,最高的是官网 33.85 ,其他的基本上都在 1-8 之间,只有少数几家是在 15-25 ,就一个模型就有这么多不同的价格

一开始我以为有人标错了

来来回回看了好几遍,才发现原来

问题出在:

来源不同:我表格中记录的这些有官网和中转,还有三方聚合的

线路不同:线路我没有写出来,但是大概有 20 多条线路

计费方式不同:有些平台有起充门槛,价格就相对便宜点,但是如果是第一次接触到这个平台,很少有人一上来就充个大几十或者是大几百的,基本上都是要充小部分试一下的,有些平台起充就是 1 元,但是模型的价格相对会贵一点

价格背后到底差在哪

我把我看过的网页做了一下简单的分类,主要有以下 4 类:

1.官方 最容易理解,简单来讲就是直接向模型厂商购买,比如 国外的 OpenAI 、Anthropic ,国内的 deepseek

特点:

来源最明确 稳定性通常最好 文档最完善 价格一般也是最高 售后也更有保障

适合:

企业客户 对稳定性要求高的团队 2.云服务商 云厂商把模型接进自己的平台,例如 国外 Azure 、AWS 、Google Cloud ,国内阿里云,火山云等

特点:

统一管理方便 可以和现有云服务一起使用 企业采购流程比较成熟

适合:

已经在使用云服务的团队 3.聚合平台 把多个模型厂商的能力聚合到一个平台,一个账号就能调用多个模型。比如硅基流动

特点:

接入方便 支持模型多 不需要分别注册多个账号 价格通常介于官方和中转之间

适合:

开发者 创业团队 需要频繁切换模型的人 4.中转服务 通过兼容接口、转发线路或二次封装的方式提供模型能力,也是目前市场上价格差异最大的部分。

特点:

价格跨度非常大 有的比官网便宜很多 有的甚至比官网更贵 稳定性差异也比较明显

适合:

对成本比较敏感的用户 个人创业者 于是我开始整理数据

最开始我只是想简单的记录一下,主要是为了方便自己查询

就只记录:

模型 输入价格 输出价格 缓存价格 平台

可是到后面越整理越多,从几个模型,变成几十个模型,从几个平台变成几十个平台。直到有一次和朋友聊天才知道原来很多人都在重复做同样的事情。

每次选模型:

查价格。 查平台。 查稳定性。 查支持情况。

大家都在重复劳动,每次也都要来来回回去对比。

比价格更有意思的发现 最便宜的不一定最省钱

其实一开始我最关注的是输入价格,谁便宜就排前面,后来发现事情没这么简单。

举个例子,我统计的 24 个平台里。平台 1 的输入价格只有:¥0.8 / 百万 Token ;而平台 24 的价格是:

¥33.85 / 百万 Token ,两者相差超过 42 倍。看到这里很多人第一反应都是:

那肯定选平台 1

我一开始也是这么想的。但继续往下看数据后发现,有些低价平台虽然便宜,但稳定性只有 60%~70%。

有些甚至更低,请求失败以后,程序会自动重试。,重试一次;就意味着同样的问题要重新消耗一次 Token 。

如果一天调用量很大,最后省下来的单价优势;可能被重试成本吃掉不少。所以很多团队真正算账的时候。已经不只是看单价了。而是在看:

稳定性 响应速度 成功率

以及最终的真实成本。

缓存能力对成本影响比想象中大

后来我又发现了一个很多人容易忽略的东西。

缓存价格。

一开始我甚至没太关注这一栏,后来仔细看数据的时候。

我人都傻了。

同样是 Claude Opus 4.8 。

平台 1 缓存价格:

¥0.08 / 百万 Token

平台 24 缓存价格:

¥33.8 / 百万 Token

差了超过 400 倍。

如果你的业务经常使用:

固定提示词 固定系统角色 相似上下文

缓存命中率会非常高。

这个时候。

真正决定成本的可能不是输入价格。

而是缓存价格。

很多人盯着输入价格看半天。

最后却忽略了最影响成本的地方。

不同平台的真实成本其实不一样

后来我尝试换了一个思路。

不看单价。

只看最终账单。

假设两家公司。

每个月都调用 1 亿 Token 。

表面上看。

平台 A 比平台 B 便宜很多。

但如果:

平台 A 稳定性低 平台 A 重试率高 平台 A 缓存能力差

最终实际花费可能反而更高。

这也是为什么后来我发现。

大家讨论模型的时候。

聊的已经不是:

哪个模型最强。

而是:

哪个平台最适合自己的场景。

因为影响成本的因素。

远远不只是价格表上的那个数字。

查到第 20 个网页的时候。

后来我决定把这些东西整理到一起

我想解决的不是:

推荐大家用哪个模型。

而是把选模型之前最容易被忽略的信息整理清楚。

比如:

价格到底差多少 缓存成本怎么算 平台稳定性怎么样 同样调用量下真实成本是多少

说白了。

就是让大家少一点信息差。

少一点重复踩坑。

我们目前在整理什么

我们现在主要整理五类信息:

模型价格、缓存价格、供应商来源、稳定性数据,以及不同场景下的使用成本。

说白了,不是想告诉大家“哪个模型最好”。

而是想让大家在选模型之前,先把价格、稳定性和真实成本看明白。

做这个过程中的最大收获

做完这轮整理后,我最大的感受是:

模型选型不能只看排行榜。

真正落到使用里,影响最大的往往是三件事:

成本 稳定性 适不适合自己的业务场景

有时候,最贵的不一定最好。

最便宜的,也不一定最省钱。

写在最后

做这件事之前,我一直以为模型选型最重要的是能力。

做完以后才发现。

很多团队真正头疼的其实是信息差。

价格在哪里看。

缓存怎么算。

平台稳不稳。

同一个模型为什么差这么多。

这些问题远比排行榜更实际。

如果重新来一次。

我大概率不会再打开那二十多个网站。

但如果没经历过这次折腾。

可能也不会发现这些问题。

后来我把整理的数据做成了一个公开页面。

至少下次再查价格的时候。

不用再一个网页一个网页翻了。

https://www.oken.ai/

来源: v2ex查看原文