WWW.YOUINFO.SITE
标签聚合 Openrouter

/tag/Openrouter

LinuxDo 最新话题 · 2026-06-05 12:56:30+08:00 · tech

openrouter.ai Nemotron 3 Ultra (free) - API Pricing & Benchmarks NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). $0 per million input tokens, $0 per million output tokens. 1,000,000 token context window, maximum output... 自家模型build算力应该是给够了,要不就是目前还没什么人用,无等待时间,40t/s NVIDIA NIM nemotron-3-ultra-550b-a55b Model by NVIDIA | NVIDIA NIM Open, efficient hybrid Mamba-Transformer MoE with 1M context, excelling in agentic reasoning, coding, planning, tool calling, and more 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-26 11:46:31+08:00 · tech

通过openrouter的preset设置了只启用deepseek官方provider: { "only": [ "deepseek" ], "sort": { "by": "price", "partition": null }, "order": [ "deepseek" ], "allow_fallbacks": true } 然后claude code接入: "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-flash@preset/ds-open-router", "ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-flash@preset/ds-open-router", "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash@preset/ds-open-router", "CLAUDE_CODE_SUBAGENT_MODEL": "deepseek-v4-flash@preset/ds-open-router", 实际使用只要不reject模型的请求可以正常使用, 只要reject了(Edit请求 工具请求 AskQuestion请求), 必定报错400 Provider returned error, 排查半天无果, 想请教下有没有同样接入场景的佬有碰到同样问题有解决方案的 4 个帖子 - 2 位参与者 阅读完整话题

cnBeta全文版 · 2026-05-18 13:05:09+08:00 · tech

根据OpenRouter最新数据测算,上周(5月11日至5月17日)全球AI大模型总调用量为26.9万亿Token,较此前一周增长4.7%,连续四周上涨。其中,上榜的AI大模型中,中国AI大模型周调用量达7.693万亿Token,规模与前一周基本持平;同期美国AI大模型周调用量为4.24万亿Token,环比上涨12.77%。从数据对比来看,中国大模型周调用量已达到美国的1.81倍,连续三周实现反超并稳居全球首位。 《每日经济新闻》注意到,上周,全球调用量排名前三中,前两款均为中国AI大模型,分别为Hy3 preview和DeepSeek-V4-Flash。其中,登顶榜单的腾讯Hy3 preview周调用量达2.66万亿Token,环比上涨210%。此前两周,Hy3 preview (free)曾连续位居榜首。随着限免期结束,Hy3 preview正式接棒,登顶榜单。 值得注意的是,此前一周,DeepSeek旗下DeepSeek-V4-Flash、DeepSeek-V3.2以及DeepSeek-V4-Pro三款模型同步上榜。在5月11日至5月17日,上述三款模型仍稳居榜单,且调用量均实现环比上升。其中,DeepSeek-V4-Flash排名第二,周调用量达2.06万亿Token,环比上涨86%。月之暗面Kimi K2.6周调用量为1.05万亿Token,环比下滑35%,跌出榜单前五。 值得注意的是,匿名模型Owl Alpha登上榜单,排名第八,周调用量达0.895万亿Token,环比上涨121%。据OpenRouter,该模型为面向Agent(智能体)工作流的高性能基础模型,支持工具调用、百万上下文、代码生成和复杂指令执行。 旗下产品的周调用量份额来看,《每日经济新闻》注意到,在OpenRouter上,DeepSeek旗下模型的周调用总量达4.25万亿Token,超过Anthropic、谷歌,位居第一。这意味着,降价策略为DeepSeek延揽了更多用户,同时也展示出中国大语言模型在推理成本上的优势。 查看评论