WWW.YOUINFO.SITE
标签聚合 reasoning

/tag/reasoning

LinuxDo 最新话题 · 2026-06-06 11:36:38+08:00 · tech

riverflow.ai – 5 Jun 26 Introducing Riverflow 2.5 | Sourceful Research Introducing Riverflow 2.5, reasoning image generation at the frontier with enhanced multi-edit thinking, custom judging, Font Control, background output modes, and up to 4K exports. Riverflow 2.5 系列(Flash/Pro)是Sourceful开发的统一的文本到图像和图像到图像家族,它将生成视为一个生产工作流,使用集成的推理模型来规划多步编辑,并在接受结果前判断候选方案。推理努力程度可通过推理参数(低/中/高/极高)控制——较高等级会进行更多编辑轮次并应用更严格的内部评判,其中极高等级适用于需要高可重复性的批量运行。它能够生成 1K、2K 和 4K 分辨率,并接受最多 10 张输入图像进行编辑。 河流其实是老朋友了,一个设计盒子的公司,在2.0系列就做出小香蕉级别的能力。现在2.5pro完全能和image 2和满血大香蕉平起平坐 但是满血大香蕉在哪里发财啊 目前在OpenRouter网页免费试用 openrouter.ai Riverflow V2.5 Pro (free) - API Pricing & Providers Riverflow V2.5 Pro is the most powerful variant of Sourceful's Riverflow 2.5 lineup, best for top-tier control and quality-sensitive outputs. $0 per million input tokens, $0 per million output tokens. 8,192 token context window. 河流vs大香蕉 河流vs大香蕉 生图能力平起平坐,但是缺点也很明显,其外部的LLM非常弱智,对于多文字,复杂prompt处理上不足。还有就是 极其安全 ,很多不被image 2输入审的东西都能触发 最后就是价格不太美丽,2.0的价格是0.15刀/图,折算比大香蕉都贵。不过趁现在or免费可以多用用() 7 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-05 01:44:29+08:00 · tech

使用久未更新的题集 llm-benchmark.github.io Reasoning Models Evaluation 【目前GPT 5.5 XHIGH 大致只差2道,GEMINI也接近,但这里题目不够细致区分GEMINI3.1和 GPT 5.5,显然GPT 5.5 更强】 选择某简单题目 1 使用QODER【不确定是否真实模型】 QWEN 3.7 无限循环思考,1个多小时关闭了 2 官网,正确回答,但是费时极长,20分钟以上,无法接受的低效率 所以我第一次开始怀疑评测博主 nao榜单的真实性, 他声称了 gpt5.5 80,qwen达到78的结论. 4 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-28 20:01:19+08:00 · tech

官方Blog推荐的提示词 Reasoning effort is set to xhigh. Please think carefully through the task, validate key assumptions, consider plausible alternatives, and prioritize correctness, consistency, and clarity in the final answer 不得不说 这一代的Qwen3.7 Max比上一代的要强很多 但还是国模普遍的思考效率问题 Qwen3.7 Max遇到复杂情况的时候 会依靠更深入的思考换取性能 导致token消耗要比上一代多不少 coding上下文超过100k的时候,可能会出现轻微的幻觉问题 导致会出现一些低级别的错误 13 个帖子 - 12 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-27 20:02:55+08:00 · tech

环境 sub2api 现象 调 gpt-5.5 , reasoning_effort=xhigh , stream=true 上游 HTTP 200,流正常关闭, 没有任何 error 事件 但流里只产出 5 个 output token 就 finish 了,first_token 通常 < 500ms 出来,整条请求 1 秒左右 结束 客户端拿到的相当于空响应 —— 从客户端视角: 任务不报错、突然不说话就停了 还有一个相关变体: 同样的调用条件,偶尔会进入"长挂起", first_token 等 10–14 分钟 才出现,然后同样只吐 5 个 token 关流。如果客户端有 idle timeout(120s 那种)就会被切断;没设就一直挂在那儿。 数据特征(单日 ~650 次调用样本) 静默截断率约 6% (本人样本里 39 / 350 次 gpt-5.5 命中) 100% 集中在 gpt-5.5 + xhigh 这一组合;同一 key 同一天 gpt-5.4 + xhigh 跑 ~300 次基本不复现 跨多个上游账号都出现, 不是单账号或单 IP 问题 input 大小跟命中无关联:从几百 token 到几千 token 都中招, 不是 body size 触发 output_tokens 卡在 5 这个数字太规整 —— 怀疑是某种 固定的"提前终止"signature ,而不是模型自己决定停 已排除 客户端 timeout(因为大多数命中是 sub-1s 关流,根本走不到 client timeout) 网关层 timeout / body 限制(命中样本 body 都很小) 账号额度 / rate limit(响应里没有 429 或 quota 信号,HTTP 干净的 200) 单上游账号问题(全号池稳定复现) 上下文过大导致的静默截断(几百 token input 也中招) 受影响最严重的场景 codex / openclaw 这类 agent loop 客户端 —— 它们依赖流里的 token 推进任务,空响应会让 agent 卡死或自动判定"任务完成"提前结束,用户感知就是"AI 干一半莫名其妙退出了"。 想问的几个问题 有没有人在 gpt-5.5 + xhigh 上看到同样的"5 token 静默终止"模式? 那 5 个 token 实际是什么内容?有人抓过完整流响应体看过吗? 这是 gpt-5.5 在 xhigh 推理路径上的某种"超时保护"机制吗?有官方说明吗? 除了"客户端检测到空响应自动重试"和"降到 high"这两个变通, 有没有上游侧的规避方法 ? 如果有人遇到类似情况、或者反过来确认自己没遇到(用同样模型+档位),都麻烦留个言,蹲一下经验。 10 个帖子 - 5 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-27 18:57:41+08:00 · tech

配置内容: model_provider = “ccswitch” model = “gpt-5.4” review_model = “gpt-5.5” model_reasoning_effort = “high” disable_response_storage = true network_access = “enabled” windows_wsl_setup_acknowledged = true model_context_window = 1000000 model_auto_compact_token_limit = 900000 sandbox_mode = “danger-full-access” [model_providers.ccswitch] name = “OpenAI” wire_api = “responses” requires_openai_auth = true base_url = “ http://127.0.0.1:8080 ” 大佬们这是什么原因啊 16 个帖子 - 9 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-27 08:34:04+08:00 · tech

model_instructions_file = './instruction.md' model_reasoning_effort = "xhigh" personality = "pragmatic" web_search ="live" service_tier = "fast" supports_websockets = false model_provider = "OpenAI" model = "gpt-5.4" review_model = "gpt-5.4" disable_response_storage = true network_access = "enabled" windows_wsl_setup_acknowledged = true model_context_window = 1000000 model_auto_compact_token_limit = 900000 [features] goals = true js_repl = false [model_providers.OpenAI] name = "OpenAI" base_url = "http://127.0.0.1:11111" wire_api = "responses" requires_openai_auth = true [windows] sandbox = "elevated" 之前很快,现在无论是新对话还是新线程都很慢。 3 个帖子 - 3 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-26 15:41:18+08:00 · tech

各位大佬求助!环境:Claude Code + CC Switch + OpenCode Go 套餐(DeepSeek V4-Flash/V4-Pro)调用模型时一直出现如下报错: API Error: 400 Error from provider (DeepSeek): The reasoning_content in the thinking mode must be passed back to the API. 初步判断是 DeepSeek 思考模式和客户端不兼容,客户端无法回传 reasoning_content 字段。 。请问有没有 永久修复 的配置方案?目前已经尝试修改部分配置,仍未彻底解决,感谢指点! 3 个帖子 - 3 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-20 19:19:19+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

LinuxDo 最新话题 · 2026-05-20 17:13:16+08:00 · tech

为啥cpa在codex中使用会报403呢,这是我的配置model = “gpt-5.4” model_reasoning_effort = “medium” preferred_auth_method = “apikey” personality = “pragmatic” model_provider = “cliproxyapi” windows sandbox = “elevated” model_providers.cliproxyapi name = “cliproxyapi” base_url = “ http://127.0.0.1:7897/v1 ” wire_api = “responses” 2 个帖子 - 2 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-20 17:07:08+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 16:55:03+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 16:52:57+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 16:11:47+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 16:11:47+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 15:45:45+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?

V2EX - 技术 · 2026-05-20 15:39:11+08:00 · tech

五一节前,接入了 Cursor 和 Copilot CLI ,都可以用。现在多轮对话强制要求返回之前轮次的 reasoning_content 。 小米官方的声明在这里: https://platform.xiaomimimo.com/docs/zh-CN/usage-guide/passing-back-reasoning_content 里面写到受影响的 Agent 产品有一大批: OpenAI 兼容协议:TRAE 、Cursor 、Roo Code 、Codex 、GitHub Copilot CLI 、Zed 、AutoGen 、Goose Anthropic 兼容协议:TRAE 、GitHub Copilot CLI 、AutoGen 、Goose 、OpenClaw 、OpenCode 、Kilo Code 看了下,好像是 5 月中旬改的协议!这破坏了 OpenAI API 兼容性吧? OpenAI API 兼容协议并不强制要求这个字段。 好好的送的一个月的 free plan ,完美踩中雷区( Cursor 和 Copilot )。感觉小米有点玩不起。 大家都是怎么用的呢? OpenCode 可以吗?