中问 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-03 15:30:08+08:00 · tech

上个月用kiro反代的时候，就发现缓存命中率太低了，用gpt更是只有%10几，但是codex用gpt能有90%以上的缓存命中率，是不是只要不是官方的，缓存命中就上不来 14 个帖子 - 8 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-02 11:13:48+08:00 · tech

如题，我把君の的公益大佬的new-api接到了直接sub2api里，然后电脑上用Claude Code接入使用gpt模型，发现缓存总是命中不到，怎么解决啊？是我的sub2api配置问题吗 5 个帖子 - 4 位参与者阅读完整话题

[推广] [送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

v2ex · 2026-05-20 11:57:34+08:00 · tech

工具地址： https://aiapidoctor.com 最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填（比如模板就有空值扣费的问题，必须手动查缺补漏才行）比如； - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复，usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣很多时候，用户讨论中转站会问： “这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？” 但这些问题如果只靠嘴说，很容易变成口水仗。所以我最近做了一个小工具： AI API Doctor 它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：这个 API 的扣费信号是否透明。如果不透明，或者漏洞不修，风险就比较大 --- 目前主要测这些： 1. usage 是否完整会看 API 返回里有没有： - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。 2. token 是否异常会做一些短请求测试，比如只让模型回复 OK 。正常情况下，极短回复不应该出现很离谱的 completion_tokens 。如果短回复 token 异常偏高，工具会提示： “存在扣费不可解释风险。” 3. max_tokens 是否生效有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。工具会测试： max_tokens = 5 时，输出是否明显超出限制。如果 max_tokens 不生效，长期使用时费用就可能不可控。 4. usage 是否稳定同样的短请求重复几次，看 usage 字段是否大幅波动。如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测现在很多商家会宣传： “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回： - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。如果检测到高缓存命中，会显示缓存命中分。如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示： “未验证，API 未暴露缓存字段，无法验证缓存宣传。” 这点很重要。因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。 --- 除了扣费相关，它也顺手测了几个辅助项： - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常但我自己觉得最有价值的还是： usage 、token 、缓存、max_tokens 。因为这些直接关系到钱。 --- 使用方式： 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ，或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图检测会发起少量测试请求，页面里会提示：预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。 --- 我想说明一下边界：这个工具不能证明： - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假它能做的是：把 API 层能看到、能复现的信号测出来。比如： - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。欢迎在楼里发： 1. 验货分（ API Doctor 验货报告） 2. Link-AI 注册 ID 数字注意：不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。 --- 福利：为了收集更多真实样本，本帖灰测期内：在本帖回复： - AI API Doctor 验货截图 - Link-AI 注册 ID 数字我手动赠送 $10 API 余额。注册链接： https://link-ai.cc ID 可以在个人信息页查看。我每天晚上集中处理一次，并在楼层回复已加。这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

[推广] [送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

v2ex · 2026-05-20 10:35:03+08:00 · tech

工具地址： https://aiapidoctor.com 最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填（比如模板就有空值扣费的问题，必须手动查缺补漏才行）比如； - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复，usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣很多时候，用户讨论中转站会问： “这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？” 但这些问题如果只靠嘴说，很容易变成口水仗。所以我最近做了一个小工具： AI API Doctor 它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：这个 API 的扣费信号是否透明。如果不透明，或者漏洞不修，风险就比较大 --- 目前主要测这些： 1. usage 是否完整会看 API 返回里有没有： - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。 2. token 是否异常会做一些短请求测试，比如只让模型回复 OK 。正常情况下，极短回复不应该出现很离谱的 completion_tokens 。如果短回复 token 异常偏高，工具会提示： “存在扣费不可解释风险。” 3. max_tokens 是否生效有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。工具会测试： max_tokens = 5 时，输出是否明显超出限制。如果 max_tokens 不生效，长期使用时费用就可能不可控。 4. usage 是否稳定同样的短请求重复几次，看 usage 字段是否大幅波动。如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测现在很多商家会宣传： “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回： - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。如果检测到高缓存命中，会显示缓存命中分。如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示： “未验证，API 未暴露缓存字段，无法验证缓存宣传。” 这点很重要。因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。 --- 除了扣费相关，它也顺手测了几个辅助项： - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常但我自己觉得最有价值的还是： usage 、token 、缓存、max_tokens 。因为这些直接关系到钱。 --- 使用方式： 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ，或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图检测会发起少量测试请求，页面里会提示：预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。 --- 我想说明一下边界：这个工具不能证明： - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假它能做的是：把 API 层能看到、能复现的信号测出来。比如： - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。欢迎在楼里发： 1. 验货分（ API Doctor 验货报告） 2. Link-AI 注册 ID 数字注意：不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。 --- 福利：为了收集更多真实样本，本帖灰测期内：在本帖回复： - AI API Doctor 验货截图 - Link-AI 注册 ID 数字我手动赠送 $10 API 余额。注册链接： https://link-ai.cc ID 可以在个人信息页查看。我每天晚上集中处理一次，并在楼层回复已加。这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

[推广] [送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

v2ex · 2026-05-20 10:35:03+08:00 · tech

工具地址： https://aiapidoctor.com 最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填（比如模板就有空值扣费的问题，必须手动查缺补漏才行）比如； - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复，usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣很多时候，用户讨论中转站会问： “这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？” 但这些问题如果只靠嘴说，很容易变成口水仗。所以我最近做了一个小工具： AI API Doctor 它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：这个 API 的扣费信号是否透明。如果不透明，或者漏洞不修，风险就比较大 --- 目前主要测这些： 1. usage 是否完整会看 API 返回里有没有： - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。 2. token 是否异常会做一些短请求测试，比如只让模型回复 OK 。正常情况下，极短回复不应该出现很离谱的 completion_tokens 。如果短回复 token 异常偏高，工具会提示： “存在扣费不可解释风险。” 3. max_tokens 是否生效有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。工具会测试： max_tokens = 5 时，输出是否明显超出限制。如果 max_tokens 不生效，长期使用时费用就可能不可控。 4. usage 是否稳定同样的短请求重复几次，看 usage 字段是否大幅波动。如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测现在很多商家会宣传： “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回： - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。如果检测到高缓存命中，会显示缓存命中分。如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示： “未验证，API 未暴露缓存字段，无法验证缓存宣传。” 这点很重要。因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。 --- 除了扣费相关，它也顺手测了几个辅助项： - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常但我自己觉得最有价值的还是： usage 、token 、缓存、max_tokens 。因为这些直接关系到钱。 --- 使用方式： 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ，或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图检测会发起少量测试请求，页面里会提示：预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。 --- 我想说明一下边界：这个工具不能证明： - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假它能做的是：把 API 层能看到、能复现的信号测出来。比如： - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。欢迎在楼里发： 1. 验货分（ API Doctor 验货报告） 2. Link-AI 注册 ID 数字注意：不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。 --- 福利：为了收集更多真实样本，本帖灰测期内：在本帖回复： - AI API Doctor 验货截图 - Link-AI 注册 ID 数字我手动赠送 $10 API 余额。注册链接： https://link-ai.cc ID 可以在个人信息页查看。我每天晚上集中处理一次，并在楼层回复已加。这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

[推广] [送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

v2ex · 2026-05-20 10:35:03+08:00 · tech

工具地址： https://aiapidoctor.com 最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填（比如模板就有空值扣费的问题，必须手动查缺补漏才行）比如； - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复，usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣很多时候，用户讨论中转站会问： “这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？” 但这些问题如果只靠嘴说，很容易变成口水仗。所以我最近做了一个小工具： AI API Doctor 它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：这个 API 的扣费信号是否透明。如果不透明，或者漏洞不修，风险就比较大 --- 目前主要测这些： 1. usage 是否完整会看 API 返回里有没有： - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。 2. token 是否异常会做一些短请求测试，比如只让模型回复 OK 。正常情况下，极短回复不应该出现很离谱的 completion_tokens 。如果短回复 token 异常偏高，工具会提示： “存在扣费不可解释风险。” 3. max_tokens 是否生效有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。工具会测试： max_tokens = 5 时，输出是否明显超出限制。如果 max_tokens 不生效，长期使用时费用就可能不可控。 4. usage 是否稳定同样的短请求重复几次，看 usage 字段是否大幅波动。如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测现在很多商家会宣传： “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回： - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。如果检测到高缓存命中，会显示缓存命中分。如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示： “未验证，API 未暴露缓存字段，无法验证缓存宣传。” 这点很重要。因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。 --- 除了扣费相关，它也顺手测了几个辅助项： - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常但我自己觉得最有价值的还是： usage 、token 、缓存、max_tokens 。因为这些直接关系到钱。 --- 使用方式： 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ，或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图检测会发起少量测试请求，页面里会提示：预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。 --- 我想说明一下边界：这个工具不能证明： - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假它能做的是：把 API 层能看到、能复现的信号测出来。比如： - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。欢迎在楼里发： 1. 验货分（ API Doctor 验货报告） 2. Link-AI 注册 ID 数字注意：不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。 --- 福利：为了收集更多真实样本，本帖灰测期内：在本帖回复： - AI API Doctor 验货截图 - Link-AI 注册 ID 数字我手动赠送 $10 API 余额。注册链接： https://link-ai.cc ID 可以在个人信息页查看。我每天晚上集中处理一次，并在楼层回复已加。这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

[推广] [送 $10] 被中转站扣费搞怕了，做了个工具专门看中转站 usage 透不透明、缓存命中问题

v2ex · 2026-05-20 10:35:03+08:00 · tech

工具地址： https://aiapidoctor.com 最近自己的站点升级，但是发现各种 Claude / GPT / Gemini 接口和客户端配置。折腾久了之后，发现很多站点是按照模板搭建的，但是后台有很多坑要填（比如模板就有空值扣费的问题，必须手动查缺补漏才行）比如； - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存，但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复，usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣很多时候，用户讨论中转站会问： “这个站稳不稳？” “这个站真不真？” “这个站是不是 Pro 反代？” “这个站有没有缓存？” “这个站会不会偷扣？” 但这些问题如果只靠嘴说，很容易变成口水仗。所以我最近做了一个小工具： AI API Doctor 它的核心不是“鉴定真假模型”，而是先帮你看一件更实际的事：这个 API 的扣费信号是否透明。如果不透明，或者漏洞不修，风险就比较大 --- 目前主要测这些： 1. usage 是否完整会看 API 返回里有没有： - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失，或者字段不完整，用户就很难核对真实消耗。 2. token 是否异常会做一些短请求测试，比如只让模型回复 OK 。正常情况下，极短回复不应该出现很离谱的 completion_tokens 。如果短回复 token 异常偏高，工具会提示： “存在扣费不可解释风险。” 3. max_tokens 是否生效有些接口虽然兼容 OpenAI 格式，但 max_tokens 不一定真的受控。工具会测试： max_tokens = 5 时，输出是否明显超出限制。如果 max_tokens 不生效，长期使用时费用就可能不可控。 4. usage 是否稳定同样的短请求重复几次，看 usage 字段是否大幅波动。如果同样的 prompt ，token 统计波动很大，那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测现在很多商家会宣传： “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。它会用两次完全相同的长 prompt 做探测，看第二次 API 是否返回： - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。如果检测到高缓存命中，会显示缓存命中分。如果 API 没暴露缓存字段，它不会直接说商家造假，只会显示： “未验证，API 未暴露缓存字段，无法验证缓存宣传。” 这点很重要。因为有些上游确实可能有缓存，但中转接口不一定把字段透出来。工具只基于 API 响应给证据，不做过度判断。 --- 除了扣费相关，它也顺手测了几个辅助项： - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常但我自己觉得最有价值的还是： usage 、token 、缓存、max_tokens 。因为这些直接关系到钱。 --- 使用方式： 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ，或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图检测会发起少量测试请求，页面里会提示：预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测，不会上传到 AI API Doctor 服务器。如果不想暴露 Base URL ，可以直接用工具里的复制验货分功能，或者保存分享图，Base URL 会自动脱敏。 --- 我想说明一下边界：这个工具不能证明： - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假它能做的是：把 API 层能看到、能复现的信号测出来。比如： - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。欢迎在楼里发： 1. 验货分（ API Doctor 验货报告） 2. Link-AI 注册 ID 数字注意：不要发 API Key 。不要发完整敏感 Base URL 。工具保存图默认会脱敏 Base URL 。 --- 福利：为了收集更多真实样本，本帖灰测期内：在本帖回复： - AI API Doctor 验货截图 - Link-AI 注册 ID 数字我手动赠送 $10 API 余额。注册链接： https://link-ai.cc ID 可以在个人信息页查看。我每天晚上集中处理一次，并在楼层回复已加。这个福利主要是感谢大家提供真实测试样本。工具本身不限制只能测 Link-AI ，也欢迎测其他站。

octopus 缓存命中问题

LinuxDo 最新话题 · 2026-05-14 12:50:22+08:00 · tech

原版的octopus 貌似会有缓存问题，最近使用一个中转的时候发现总是出现缓存不命中，如图上游渠道的记录：让AI分析了一下，有概率是octopus同格式的请求不进行透传导致的，他内部还会进行一次格式转换，所以后面让AI把同格式的请求改成了透传，大家需要的可以试试，我fork的这个版本还新增了一些codex oauth 和用量卡片的功能，日志记录也做了一些优化。 github.com GitHub - chicring/octopus: 自用修改版自用修改版 2 个帖子 - 2 位参与者阅读完整话题

在codex中问模型型号都是回答GPT-5？

LinuxDo 最新话题 · 2026-05-12 21:31:43+08:00 · tech

刚把gpt的账号加在CPA中，之前没有注意过，现在不管选gpt-5.4还是5.5，问它模型型号都是回答GPT-5。这是加入到CPA中降智了吗，还是正常现象呀？ 7 个帖子 - 3 位参与者阅读完整话题

[Ark api]用gemini缓存不触发命中问题

LinuxDo 最新话题 · 2026-05-12 13:49:11+08:00 · tech

我接这个佬的公益站到hermes,但是用下来，一直都没有缓存命中，有哪位佬和我有一样的问题？ 1 个帖子 - 1 位参与者阅读完整话题

Deepseek 缓存命中问题

LinuxDo 最新话题 · 2026-05-10 22:50:08+08:00 · tech

Flash 和 Pro 是否不共用缓存。现在在做逆向，给codex做补充，大家推荐用flash 还是pro。 1 个帖子 - 1 位参与者阅读完整话题

小米是不是蒸馏claude蒸多了

linux.do · 2026-05-06 19:09:13+08:00 · tech

如图，再pi中问mimo-v2.5-pro问它是什么模型，一直回答是claude，切换模型后仍是如此，用的百万亿token套餐 14 个帖子 - 10 位参与者阅读完整话题

kimi真的太让我吃惊了

linux.do · 2026-04-28 14:07:43+08:00 · tech

kimicode，49的套餐，5小时第一次用，在claudecode中问了一个问题，任务都还没执行完，额度就没了，我能接收说便宜的套餐额度小点，但你这一个任务都执行不完，我要你何用各位佬有什么kimi的渠道，额度多点的吗？感觉现在没什么便宜的套餐了，gpt也不能爽用，上下文窗口一大撑不住现在买的是minimax199顶配，周末我在家5小时窗口不停的满上下文跑，4500次采用了几百，算下来感觉可以养好几个龙虾24小时运行都够了，就是复杂的活不太聪明的样子，好在量大管饱，公司报销（虽然还没批下来） 11 个帖子 - 7 位参与者阅读完整话题

英特尔发布 32.0.101.8735 版本锐炫 Arc 显卡驱动，修复《识质存在》中问题

www.ithome.com · 2026-04-22 17:06:03+08:00 · tech

IT之家 4 月 22 日消息，Intel（英特尔）在本月 16 日发布了 32.0.101.8724 版本锐炫 Arc 显卡 Windows 图形驱动程序，支持卡普空新作《识质存在》(PRAGMATA)。不过 8724 版本驱动在《识质存在》中仍存在问题：所有受支持英特尔显卡以 DirectX 12 API 运行该作时，加载游戏菜单阶段都可能会发生应用程序崩溃。为此英特尔在 21 日发布了最新的 8735 版本驱动，修复了这个共性问题。 IT之家注意到。英特尔还在发行说明中列举了其它的一些已知问题，涉及《堡垒之夜》《终极角逐》《四海兄弟：故乡》《使命召唤：黑色行动 6》《沙丘：觉醒》《红色沙漠》《战地 6》以及 PugetBench 的 Davinci Resolve Studio 基准测试。

/tag/中问