WWW.YOUINFO.SITE
标签聚合 gateway

/tag/gateway

LinuxDo 最新话题 · 2026-06-11 20:11:23+08:00 · tech

Vercel 发布 2026 年 6 月 AI Gateway 生产指数。报告显示,得益于 5 月上线 Vercel 网关的 DeepSeek V4 系列(含 Flash 与 Pro 模型)推动,DeepSeek 的 Token 流量份额单月内从不足 1% 飙升至 17%,超越 OpenAI(13%)位居第三。然而由于定价极低,所有用户使用 DeepSeek 的总成本之和仅占网关整体资金支出的 1% 左右。 价格是 DeepSeek 迅速爆发的主因。DeepSeek V4 Flash 百万 Token 输入与输出收费仅为 0.14 美元和 0.28 美元,较 Anthropic 同类前沿模型便宜 20 至 50 倍,较 Qwen 3.6 Plus 与 Kimi K2.6 也低 8 至 12 倍。评测表明 DeepSeek V4 性能达标,促使开发团队迅速在生产中部署。 尽管低成本模型流量暴涨,但在资金消耗上,前沿模型仍占主导。5 月 Anthropic 支出份额从 61% 增至 65%,在应用生成、后台智能体及编程等高难度场景占 70% 到 80% 支出。例如在编程智能体场景,DeepSeek 贡献了 49% 的 Token 流量,但仅占 4% 的费用,而 Anthropic 以 28% 的流量耗费了 70% 的资金。 开发团队正通过智能路由管理预算,将高频低风险任务分流至低成本模型,仅在关键环节使用前沿模型。对投资回报率(ROI)的考量也减缓了模型升级。例如谷歌 5 月推出的 Gemini 3.5 Flash 定价高于 3.0 版本,导致迁移缓慢,月底时 3.0 Flash 仍占 Flash 系列 90% 的流量,而 3.5 Flash 仅占 7%。同时,AI 智能体表现出极高 Token 消耗密度,以四分之一的请求量消耗了过半 Token。 Vercel DeepSeek enters the fight for token volume, Anthropic continues to dominate... The June 2026 AI Gateway production index: DeepSeek's token share jumped to 17% as low-cost models entered production, while Anthropic held 65% of all spend. 13 个帖子 - 11 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 13:08:30+08:00 · tech

cc switch 配置 any claude 桌面版 报错 Your gateway couldn’t serve claude-opus-4-7 . This model may not be configured on your gateway, or access may be restricted. message: Gateway rejected model "claude-opus-4-7" (HTTP 400) httpStatus: 400 requestUrl: https://a-ocnfniawgw.cn-shanghai.fcapp.run/v1/messages probedModel: claude-opus-4-7 responseBody: {"error":"1m 上下文已经全量可用,请启用 1m 上下文后重试","type":"error"} endpoint: https://a-ocnfniawgw.cn-shanghai.fcapp.run/ checkedAt: 2026-06-10T05:01:55.418Z 这个是怎么回事 我已经开启了1M 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 11:07:10+08:00 · tech

unexpected status 502 Bad Gateway: {“error”:{“message”:“Upstream request failed”,“type”:“upstream_error”}}event: response.failed data: {“type”:“response.failed”,“response”:{“id”:“resp_3d59569dfe714f778f4d3a86e03cd7a9”,“object”:“response”,“model”:“gpt-5.5” ,“status”:“failed”,“output”: ,“error”:{“code”:“upstream_error”,“message”:“Upstream request failed”}}}, url: https://qinghuan86.top/responses , request id: 3d59569d-fe71-4f77-8f4d-3a86e03cd7a9 unexpected status 502 Bad Gateway: error code: 502, url: https://sub.kedaya.xyz/responses , cf-ray: a0917ff36d08a0b0-HKG 我分别使用两家中转站,都报错,昨天突然出现,之前都还正常使用,有佬知道为什么吗。我用cc-switch管理的 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-08 13:31:54+08:00 · tech

有没有佬友知道是怎么个情况,报错 Reached the gateway over HTTP, but the live WebSocket (/api/ws) connection failed: WebSocket connection failed. The HTTP check can pass while the WebSocket is blocked by a proxy, firewall, or gateway auth/origin guard. 会话密钥是.env里面加入HERMES_DASHBOARD_SESSION_TOKEN就行了吗 已经使用hermes dashboard --host 0.0.0.0 --port 3000 --insecure开启webui并通过3000端口正常访问 3 个帖子 - 2 位参与者 阅读完整话题

v2ex · 2026-06-04 22:36:28+08:00 · tech

复杂局域网里的 WebRTC 稳定性,重点不只是 WebRTC offer/answer 怎么转发,还包括外围控制链路如何恢复。 这个场景不是 2C 通话,而是更接近医疗、养老等机构里的设备群:大量共享设备长时间在线,集中运维,现场环境可能比较嘈杂,同时还要保证一定收音距离和通话音质。 我遇到的核心问题是:长连接不一定会明确断开,有时会出现“看起来还连着,但应用消息已经不通”的状态。结果是设备页面显示在线,但呼叫事件发不到对端,超时、挂断、多人通话清理都会变得不一致。 这篇文章聚焦几个点: WebSocket 长连接假连接为什么危险 为什么只依赖客户端主动重连不够 gRPC Gateway 如何做双向控制 自动发现和主节点状态表怎么帮助恢复 呼叫超时、自动挂断、一对一挂断、多人挂断如何收敛 嘈杂环境下,音频可观测性为什么也属于稳定性的一部分 我的结论是:这不是简单的 WebSocket 换 gRPC ,而是要补齐发现、状态和恢复闭环。媒体链路仍然走 WebRTC ,Go/gRPC 更适合做控制面和状态收敛。 原文地址: https://www.lodan.me/posts/webrtc-grpc-gateway-discovery-recovery/ 想听听大家在局域网、弱网、设备长时间运行场景里,是怎么处理长连接假在线和通话状态恢复的。