上个月用kiro反代的时候,就发现缓存命中率太低了,用gpt更是只有%10几,但是codex用gpt能有90%以上的缓存命中率,是不是只要不是官方的,缓存命中就上不来 14 个帖子 - 8 位参与者 阅读完整话题
如题,我把君の的公益大佬的new-api接到了直接sub2api里, 然后电脑上用Claude Code接入使用gpt模型,发现缓存总是命中不到,怎么解决啊?是我的sub2api配置问题吗 5 个帖子 - 4 位参与者 阅读完整话题
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行) 比如; - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复,usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣 很多时候,用户讨论中转站会问: “这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?” 但这些问题如果只靠嘴说,很容易变成口水仗。 所以我最近做了一个小工具: AI API Doctor 它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事: 这个 API 的扣费信号是否透明。 如果不透明,或者漏洞不修,风险就比较大 --- 目前主要测这些: 1. usage 是否完整 会看 API 返回里有没有: - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。 2. token 是否异常 会做一些短请求测试,比如只让模型回复 OK 。 正常情况下,极短回复不应该出现很离谱的 completion_tokens 。 如果短回复 token 异常偏高,工具会提示: “存在扣费不可解释风险。” 3. max_tokens 是否生效 有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。 工具会测试: max_tokens = 5 时,输出是否明显超出限制。 如果 max_tokens 不生效,长期使用时费用就可能不可控。 4. usage 是否稳定 同样的短请求重复几次,看 usage 字段是否大幅波动。 如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测 现在很多商家会宣传: “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。 它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回: - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。 如果检测到高缓存命中,会显示缓存命中分。 如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示: “未验证,API 未暴露缓存字段,无法验证缓存宣传。” 这点很重要。 因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。 --- 除了扣费相关,它也顺手测了几个辅助项: - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常 但我自己觉得最有价值的还是: usage 、token 、缓存、max_tokens 。 因为这些直接关系到钱。 --- 使用方式: 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ,或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图 检测会发起少量测试请求,页面里会提示: 预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。 如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。 --- 我想说明一下边界: 这个工具不能证明: - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假 它能做的是: 把 API 层能看到、能复现的信号测出来。 比如: - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档 我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。 你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。 欢迎在楼里发: 1. 验货分( API Doctor 验货报告) 2. Link-AI 注册 ID 数字 注意: 不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。 --- 福利: 为了收集更多真实样本,本帖灰测期内: 在本帖回复: - AI API Doctor 验货截图 - Link-AI 注册 ID 数字 我手动赠送 $10 API 余额。 注册链接: https://link-ai.cc ID 可以在个人信息页查看。 我每天晚上集中处理一次,并在楼层回复已加。 这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行) 比如; - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复,usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣 很多时候,用户讨论中转站会问: “这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?” 但这些问题如果只靠嘴说,很容易变成口水仗。 所以我最近做了一个小工具: AI API Doctor 它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事: 这个 API 的扣费信号是否透明。 如果不透明,或者漏洞不修,风险就比较大 --- 目前主要测这些: 1. usage 是否完整 会看 API 返回里有没有: - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。 2. token 是否异常 会做一些短请求测试,比如只让模型回复 OK 。 正常情况下,极短回复不应该出现很离谱的 completion_tokens 。 如果短回复 token 异常偏高,工具会提示: “存在扣费不可解释风险。” 3. max_tokens 是否生效 有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。 工具会测试: max_tokens = 5 时,输出是否明显超出限制。 如果 max_tokens 不生效,长期使用时费用就可能不可控。 4. usage 是否稳定 同样的短请求重复几次,看 usage 字段是否大幅波动。 如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测 现在很多商家会宣传: “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。 它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回: - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。 如果检测到高缓存命中,会显示缓存命中分。 如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示: “未验证,API 未暴露缓存字段,无法验证缓存宣传。” 这点很重要。 因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。 --- 除了扣费相关,它也顺手测了几个辅助项: - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常 但我自己觉得最有价值的还是: usage 、token 、缓存、max_tokens 。 因为这些直接关系到钱。 --- 使用方式: 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ,或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图 检测会发起少量测试请求,页面里会提示: 预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。 如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。 --- 我想说明一下边界: 这个工具不能证明: - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假 它能做的是: 把 API 层能看到、能复现的信号测出来。 比如: - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档 我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。 你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。 欢迎在楼里发: 1. 验货分( API Doctor 验货报告) 2. Link-AI 注册 ID 数字 注意: 不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。 --- 福利: 为了收集更多真实样本,本帖灰测期内: 在本帖回复: - AI API Doctor 验货截图 - Link-AI 注册 ID 数字 我手动赠送 $10 API 余额。 注册链接: https://link-ai.cc ID 可以在个人信息页查看。 我每天晚上集中处理一次,并在楼层回复已加。 这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行) 比如; - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复,usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣 很多时候,用户讨论中转站会问: “这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?” 但这些问题如果只靠嘴说,很容易变成口水仗。 所以我最近做了一个小工具: AI API Doctor 它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事: 这个 API 的扣费信号是否透明。 如果不透明,或者漏洞不修,风险就比较大 --- 目前主要测这些: 1. usage 是否完整 会看 API 返回里有没有: - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。 2. token 是否异常 会做一些短请求测试,比如只让模型回复 OK 。 正常情况下,极短回复不应该出现很离谱的 completion_tokens 。 如果短回复 token 异常偏高,工具会提示: “存在扣费不可解释风险。” 3. max_tokens 是否生效 有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。 工具会测试: max_tokens = 5 时,输出是否明显超出限制。 如果 max_tokens 不生效,长期使用时费用就可能不可控。 4. usage 是否稳定 同样的短请求重复几次,看 usage 字段是否大幅波动。 如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测 现在很多商家会宣传: “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。 它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回: - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。 如果检测到高缓存命中,会显示缓存命中分。 如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示: “未验证,API 未暴露缓存字段,无法验证缓存宣传。” 这点很重要。 因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。 --- 除了扣费相关,它也顺手测了几个辅助项: - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常 但我自己觉得最有价值的还是: usage 、token 、缓存、max_tokens 。 因为这些直接关系到钱。 --- 使用方式: 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ,或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图 检测会发起少量测试请求,页面里会提示: 预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。 如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。 --- 我想说明一下边界: 这个工具不能证明: - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假 它能做的是: 把 API 层能看到、能复现的信号测出来。 比如: - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档 我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。 你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。 欢迎在楼里发: 1. 验货分( API Doctor 验货报告) 2. Link-AI 注册 ID 数字 注意: 不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。 --- 福利: 为了收集更多真实样本,本帖灰测期内: 在本帖回复: - AI API Doctor 验货截图 - Link-AI 注册 ID 数字 我手动赠送 $10 API 余额。 注册链接: https://link-ai.cc ID 可以在个人信息页查看。 我每天晚上集中处理一次,并在楼层回复已加。 这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行) 比如; - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复,usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣 很多时候,用户讨论中转站会问: “这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?” 但这些问题如果只靠嘴说,很容易变成口水仗。 所以我最近做了一个小工具: AI API Doctor 它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事: 这个 API 的扣费信号是否透明。 如果不透明,或者漏洞不修,风险就比较大 --- 目前主要测这些: 1. usage 是否完整 会看 API 返回里有没有: - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。 2. token 是否异常 会做一些短请求测试,比如只让模型回复 OK 。 正常情况下,极短回复不应该出现很离谱的 completion_tokens 。 如果短回复 token 异常偏高,工具会提示: “存在扣费不可解释风险。” 3. max_tokens 是否生效 有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。 工具会测试: max_tokens = 5 时,输出是否明显超出限制。 如果 max_tokens 不生效,长期使用时费用就可能不可控。 4. usage 是否稳定 同样的短请求重复几次,看 usage 字段是否大幅波动。 如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测 现在很多商家会宣传: “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。 它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回: - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。 如果检测到高缓存命中,会显示缓存命中分。 如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示: “未验证,API 未暴露缓存字段,无法验证缓存宣传。” 这点很重要。 因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。 --- 除了扣费相关,它也顺手测了几个辅助项: - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常 但我自己觉得最有价值的还是: usage 、token 、缓存、max_tokens 。 因为这些直接关系到钱。 --- 使用方式: 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ,或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图 检测会发起少量测试请求,页面里会提示: 预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。 如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。 --- 我想说明一下边界: 这个工具不能证明: - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假 它能做的是: 把 API 层能看到、能复现的信号测出来。 比如: - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档 我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。 你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。 欢迎在楼里发: 1. 验货分( API Doctor 验货报告) 2. Link-AI 注册 ID 数字 注意: 不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。 --- 福利: 为了收集更多真实样本,本帖灰测期内: 在本帖回复: - AI API Doctor 验货截图 - Link-AI 注册 ID 数字 我手动赠送 $10 API 余额。 注册链接: https://link-ai.cc ID 可以在个人信息页查看。 我每天晚上集中处理一次,并在楼层回复已加。 这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。
工具地址: https://aiapidoctor.com 最近自己的站点升级,但是发现各种 Claude / GPT / Gemini 接口和客户端配置。 折腾久了之后,发现很多站点是按照模板搭建的,但是后台有很多坑要填 (比如 模板就有空值扣费的问题,必须手动查缺补漏才行) 比如; - 你不知道这次请求到底用了多少 token - usage 字段给不全 - prompt_tokens / completion_tokens 看不明白 - max_tokens 到底有没有生效 - 商家说 98% 缓存,但 API 里看不到任何 cached_tokens 证据 - 一个很短的 OK 回复,usage 里却显示一堆 token - 后台余额到底是不是按你理解的方式在扣 很多时候,用户讨论中转站会问: “这个站稳不稳?” “这个站真不真?” “这个站是不是 Pro 反代?” “这个站有没有缓存?” “这个站会不会偷扣?” 但这些问题如果只靠嘴说,很容易变成口水仗。 所以我最近做了一个小工具: AI API Doctor 它的核心不是“鉴定真假模型”,而是先帮你看一件更实际的事: 这个 API 的扣费信号是否透明。 如果不透明,或者漏洞不修,风险就比较大 --- 目前主要测这些: 1. usage 是否完整 会看 API 返回里有没有: - prompt_tokens - completion_tokens - total_tokens 如果 usage 缺失,或者字段不完整,用户就很难核对真实消耗。 2. token 是否异常 会做一些短请求测试,比如只让模型回复 OK 。 正常情况下,极短回复不应该出现很离谱的 completion_tokens 。 如果短回复 token 异常偏高,工具会提示: “存在扣费不可解释风险。” 3. max_tokens 是否生效 有些接口虽然兼容 OpenAI 格式,但 max_tokens 不一定真的受控。 工具会测试: max_tokens = 5 时,输出是否明显超出限制。 如果 max_tokens 不生效,长期使用时费用就可能不可控。 4. usage 是否稳定 同样的短请求重复几次,看 usage 字段是否大幅波动。 如果同样的 prompt ,token 统计波动很大,那至少说明这个接口的扣费可审计性不太好。 5. 缓存命中检测 现在很多商家会宣传: “98% 缓存” “缓存后极低成本” “Opus 低倍率” 所以工具加了一个缓存命中检测。 它会用两次完全相同的长 prompt 做探测,看第二次 API 是否返回: - cached_tokens - cache_read_tokens - cache_read_input_tokens 这类缓存命中字段。 如果检测到高缓存命中,会显示缓存命中分。 如果 API 没暴露缓存字段,它不会直接说商家造假,只会显示: “未验证,API 未暴露缓存字段,无法验证缓存宣传。” 这点很重要。 因为有些上游确实可能有缓存,但中转接口不一定把字段透出来。 工具只基于 API 响应给证据,不做过度判断。 --- 除了扣费相关,它也顺手测了几个辅助项: - 模型能力是否有明显异常 - 稳定性采样 - Base URL / Key / Model 是否兼容 - Cline / Continue 配置是否可导出 - 来源透明度是否异常 但我自己觉得最有价值的还是: usage 、token 、缓存、max_tokens 。 因为这些直接关系到钱。 --- 使用方式: 1. 打开 https://aiapidoctor.com 2. 填 Base URL 3. 填 API Key 4. 填 Model ID ,或者点自动识别模型 5. 点击检测 6. 拿到一张验货报告图 检测会发起少量测试请求,页面里会提示: 预计消耗低于 $0.05 API Key 只在当前浏览器内用于本次检测,不会上传到 AI API Doctor 服务器。 如果不想暴露 Base URL ,可以直接用工具里的复制验货分功能,或者保存分享图,Base URL 会自动脱敏。 --- 我想说明一下边界: 这个工具不能证明: - 商家的真实成本 - 商家的真实上游合同 - 商家的真实倍率 - 商家到底有没有人工补贴 - 法律意义上的真假 它能做的是: 把 API 层能看到、能复现的信号测出来。 比如: - usage 是否完整 - token 是否异常 - max_tokens 是否受控 - cached_tokens 是否存在 - 稳定性是否波动 - 模型能力是否明显掉档 我觉得这比单纯问“这站真不真”更有用。 --- 这次想邀请大家帮我灰测一下。 你可以拿自己正在用的 OpenAI-compatible API / 中转站来测。 欢迎在楼里发: 1. 验货分( API Doctor 验货报告) 2. Link-AI 注册 ID 数字 注意: 不要发 API Key 。 不要发完整敏感 Base URL 。 工具保存图默认会脱敏 Base URL 。 --- 福利: 为了收集更多真实样本,本帖灰测期内: 在本帖回复: - AI API Doctor 验货截图 - Link-AI 注册 ID 数字 我手动赠送 $10 API 余额。 注册链接: https://link-ai.cc ID 可以在个人信息页查看。 我每天晚上集中处理一次,并在楼层回复已加。 这个福利主要是感谢大家提供真实测试样本。 工具本身不限制只能测 Link-AI ,也欢迎测其他站。
原版的octopus 貌似会有缓存问题, 最近使用一个中转的时候发现总是出现缓存不命中,如图 上游渠道的记录: 让AI分析了一下,有概率是octopus同格式的请求不进行透传导致的,他内部还会进行一次格式转换,所以后面让AI把同格式的请求改成了透传,大家需要的可以试试, 我fork的这个版本还新增了一些codex oauth 和 用量卡片的功能,日志记录也做了一些优化。 github.com GitHub - chicring/octopus: 自用修改版 自用修改版 2 个帖子 - 2 位参与者 阅读完整话题
刚把gpt的账号加在CPA中,之前没有注意过,现在不管选gpt-5.4还是5.5,问它模型型号都是回答GPT-5。这是加入到CPA中降智了吗,还是正常现象呀? 7 个帖子 - 3 位参与者 阅读完整话题
我接这个佬的公益站到hermes,但是用下来,一直都没有缓存命中,有哪位佬和我有一样的问题? 1 个帖子 - 1 位参与者 阅读完整话题
Flash 和 Pro 是否不共用缓存。现在在做逆向,给codex做补充,大家推荐用flash 还是pro。 1 个帖子 - 1 位参与者 阅读完整话题
如图,再pi中问mimo-v2.5-pro问它是什么模型,一直回答是claude,切换模型后仍是如此,用的百万亿token套餐 14 个帖子 - 10 位参与者 阅读完整话题
kimicode,49的套餐,5小时第一次用,在claudecode中问了一个问题,任务都还没执行完,额度就没了,我能接收说便宜的套餐额度小点,但你这一个任务都执行不完,我要你何用 各位佬有什么kimi的渠道,额度多点的吗?感觉现在没什么便宜的套餐了,gpt也不能爽用,上下文窗口一大撑不住 现在买的是minimax199顶配,周末我在家5小时窗口不停的满上下文跑,4500次采用了几百,算下来感觉可以养好几个龙虾24小时运行都够了,就是复杂的活不太聪明的样子,好在量大管饱,公司报销(虽然还没批下来) 11 个帖子 - 7 位参与者 阅读完整话题
IT之家 4 月 22 日消息,Intel(英特尔)在本月 16 日发布了 32.0.101.8724 版本锐炫 Arc 显卡 Windows 图形驱动程序,支持卡普空新作《识质存在》(PRAGMATA)。 不过 8724 版本驱动在《识质存在》中仍存在问题: 所有受支持英特尔显卡以 DirectX 12 API 运行该作时 , 加载游戏菜单阶段都可能会发生应用程序崩溃 。为此英特尔在 21 日发布了最新的 8735 版本驱动, 修复了这个共性问题 。 IT之家注意到。英特尔还在发行说明中列举了其它的一些已知问题,涉及《堡垒之夜》《终极角逐》《四海兄弟:故乡》《使命召唤:黑色行动 6》《沙丘:觉醒》《红色沙漠》《战地 6》以及 PugetBench 的 Davinci Resolve Studio 基准测试。