佬们,之前4月27开的plus,然后一直没续费,现在我看是6月27日过期,但现在网页找不到Thinking模式了,而且还极其降智,这是咋回事,有佬知道的不 8 个帖子 - 5 位参与者 阅读完整话题
从 Instant、Thinking、Pro变成了 Instant、Medium、High、Extra High 和 Pro 其中 Extra high 应该对应之前的 Thinking heavy,juice 有768。 5 个帖子 - 4 位参与者 阅读完整话题
这是新的PLUS界面 原本以为 极速 对应 Instant 均衡 对应 Thinking 标准 高级 对应 Thinking 进阶 但是好像不是这样的 均衡对应 GPT5 mini去了 高级似乎对应的是Thinking 标准 那Thinking 进阶去哪了? Instant 又是个啥 我错乱了 2 个帖子 - 2 位参与者 阅读完整话题
如图,早上开开心心的用着gpt5.5,然后后面速度就越来越慢,然后就一直thinking和reconnect,就连不上了 2 个帖子 - 2 位参与者 阅读完整话题
github.com/deepseek-ai/DeepSeek-V3 [BUG] Anthropic 兼容端点:thinking:disabled 与 reasoning_effort 互斥导致 Claude Code 2.1.166+ 子 Agent 全部不可用 已打开 05:28AM - 06 Jun 26 UTC heming-gmh **Describe the bug** DeepSeek Anthropic 兼容端点 (`/anthropic`) 在校验请求参数时,将 `thinkin … g: { type: "disabled" }` 与 `reasoning_effort` 视为互斥,返回 HTTP 400: > thinking options type cannot be disabled when reasoning_effort is set 这导致 Claude Code 2.1.166+ 的 Workflow/Dynamic Workflow(多 Agent 编排)功能完全不可用。 **背景** Claude Code 2.1.166 引入了 thinking 显式控制能力。此后所有子 Agent(subagent)创建时,Claude Code 会发送 `thinking: { type: "disabled" }`——因为子 Agent 不需要向用户展示思考过程。 同时,DeepSeek 官方文档推荐配置 `CLAUDE_CODE_EFFORT_LEVEL=max`,这会向 API 注入 `reasoning_effort` 参数以启用深度推理。 两个参数同时在请求中出现时,DeepSeek API 拒绝请求。 **To Reproduce** 环境: ```bash export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_MODEL=deepseek-v4-pro[1m] export CLAUDE_CODE_EFFORT_LEVEL=max ``` 1. 安装 Claude Code ≥ 2.1.166(当前最新 2.1.167) 2. 创建任意 Workflow(多 Agent 任务) 3. 子 Agent 创建时 API 返回 400 已验证的版本矩阵: | Claude Code | Effort Level | 结果 | |-------------|-------------|------| | 2.1.165 | max / xhigh / high / low | ✅ 全部正常 | | 2.1.166 | 任意 | ❌ 400 | | 2.1.167 | 任意 | ❌ 400 | **Root Cause** Claude Code 2.1.166+ 对子 Agent 硬编码 `thinking: disabled`。DeepSeek 兼容层校验 `thinking: disabled` 与 `reasoning_effort` 不可共存,返回 400。 **Expected behavior** 两种改法均可解决: 方案 A(推荐):当 `thinking: disabled` 与 `reasoning_effort` 同时存在时,允许请求通过。`thinking: disabled` 仅表示不输出思考块,不代表模型不能内部推理。对于 deepseek-v4-pro 等推理模型,关闭思考输出 + 开启推理力度是合理组合。 方案 B:忽略 `disabled`,对推理模型内部按 `enabled` 处理。 **Additional context** - DeepSeek 官方文档明确推荐 Claude Code 配置 `CLAUDE_CODE_EFFORT_LEVEL=max`:https://api-docs.deepseek.com/zh-cn/guides/anthropic_api - 受影响的 Agent 框架不止 Claude Code——任何在 Anthropic 兼容模式下发送 `thinking: disabled` + `reasoning_effort` 的客户端都会触发 - 当前唯一 workaround:回退 Claude Code 到 2.1.165 并锁定二进制 - 相关 Issue:#1376(thinking 模式与 tool_choice 冲突,同类校验过严问题) 今天升了一下级,subagent直接没法用了,我还在想是我哪里配置错了吗?无语了。。。 7 个帖子 - 6 位参与者 阅读完整话题
结论:DeepSeek-V4-Flash 出现了严重的 overthinking。 使用 DeepSeek 官方 API 测试,思考强度为 Max。 可以看到,在 12 道题目中,V4-Flash 只在 5 道题目中输出了代码,在剩余的 7 道题目中思维链全部超过了 128k 上限被截断。相比之下,在 V4 尚未发布时网页端的灰测模型都获得了 141 分,发布后的快速模式获得了 215 分——网页端的这两个模型至少面对题目能正常地输出一份代码,且有一定可能获得部分分数。 由于这种严重的 overthinking,V4-Flash 在当前的榜单中排名倒数第二,仅优于 Hy-3-Preview。 在昨天发布的 V4-Pro 的成绩中,3 道题目也出现了 CoT 超过长度限制的情况。而 Flash 作为参数量较小的模型,对于题目的直觉比 V4-Pro 更差,token 效率更低,因此对于 Pro 影响较小的 overthinking 问题,在 Flash 上就导致其在面对较难的问题时,Max 推理强度几乎不可用的状态。 这一点与知乎答主 toyama nao 在其题目集上的测试结果相符,DeepSeek-V4 系列相比于国际先进模型来说还是存在推理效率较低的问题。 目前排行榜: 4 个帖子 - 3 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目开源地址: GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript github.com GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript: Userscript that selects Thinking -> Extended on... Userscript that selects Thinking -> Extended on new ChatGPT chats via visible UI automation. 脚本安装地址: Greasy Fork: https://greasyfork.org/en/scripts/581739-chatgpt-默认-thinking-extended GitHub Raw: https://raw.githubusercontent.com/zouchenzhen/chatgpt-default-thinking-extended-userscript/main/chatgpt-default-thinking-extended.user.js 各位佬友好,开源自荐一个很小但对我自己很刚需的油猴脚本: ChatGPT 默认 Thinking Extended 。 起因是我自己在用 K12 ChatGPT 账号的时候,发现网页端每次新建对话都会默认回到 Instant ,不会保存上一次对话里选过的模型模式。也就是说我每开一个新对话,都要手动点模型菜单,再切到当前账号可用的最高级模式 Thinking -> Extended 。 次数多了就挺烦,于是顺手写了这个油猴脚本,把这个重复点击流程自动化一下。 实现方式比较保守,模拟网页端可见 UI 的点击。 欢迎各位佬友使用反馈。 1 个帖子 - 1 位参与者 阅读完整话题
今天在使用GPT网页端时,虽然选择的Thinking进阶,但是思考依然很快而且不遵守指令呆呆的,怎么搞得哇 有没有什么解决办法佬们,一直用的是自己建的vps,一直没出现过这样的问题 虽然web我不怎么用,但是女朋友要用 求助 5 个帖子 - 5 位参与者 阅读完整话题
有点厉害啊,D老师也在进步啊,我从来没有想到过还能够这样!而且人家是真的切换 用来破限应该挺好的 1 个帖子 - 1 位参与者 阅读完整话题
这几个月订阅了 GPT Pro 的服务,在使用过程中发现思考时长一直在变化,无论是 Thinking 模式(“深入”档位)。还是 Pro 模式。 具体表现如下: 昨天:使用 GPT Thinking 模式时,思考时间常常在 2 分钟左右;Pro 模式则会思考到 10 分钟。 今天上午:Thinking 模式的思考时间缩短到了 1 分钟左右。 今天晚上:尝试 GPT Thinking 模式,思考时间往往只有 20 到 30 秒;Pro 模式的思考时间也就 1、2 分钟。 另外,我尝试使用 GPT 5.4 进行思考,时间为 1 分钟。 不知道有没有遇到一样情况的佬友,另外想问问现在账号是被降智了吗? 5 个帖子 - 3 位参与者 阅读完整话题
因为agent会fallback。 user: 帮我实现个deepseek agent: 《thinking》实现不了,太复杂了,fallback到给他接个豆包api《/thinking》 好的,已经实现deepseek功能。 user: 不允许fallback agent: 《thinking》被用户发现了,但是我还是实现不了,但是用户又要求,写一堆代码假装工作最后还是接入豆包《/thinking》 好的,这里是deepseek训练代码,这里是deepseek巴拉巴拉,你可以测试一下。 1 个帖子 - 1 位参与者 阅读完整话题
我发现我的网页端没有选择Thinking/Pro这些模型切换的界面了,变成了这样,手机端是正常在标题部分切换Thinking/Pro,大家有同样的问题吗 8 个帖子 - 6 位参与者 阅读完整话题
greasyfork.org chatgpt model selection Globally override model and thinking_effort on chatgpt.com 1 个帖子 - 1 位参与者 阅读完整话题
昨天和朋友拼车网页的20xpro,今天pro就降智了 ,求助有什么解决方法吗?thinking倒是正常 17 个帖子 - 10 位参与者 阅读完整话题
claude4.6 4.7 4.8 opus max thinking fast 、gpt 5.5 随便用,cursor 无限额度 +v:cribug-_
昨天开始pro账号无论使用pro还是thinking都不思考就直接回答,要么就是卡死,我是个例,还是佬们也有这种情况? 7 个帖子 - 4 位参与者 阅读完整话题
虽然Thinking heavy的juice测试是和Pro一样的,但是思考时间会大幅缩短,大概时间只有1/5或者1/10,估计是Pro会强制发散性思维。 Pro 5x也是无限使用Thinking heavy,但是Pro只有一周40次。 我直接把Thinking heavy当gemini的flash用了,小问题回答很快,而pro就会磨叽半天,Gpt回答的好但是也真的贵,够买20个gemini pro了 2 个帖子 - 2 位参与者 阅读完整话题
2026年6月2日 ,微软 AI团队正式宣布推出两款全新的重磅大语言模型——中型推理模型 MAI-Thinking-1 以及专为日常开发者工作流打造的轻量高效编码模型 MAI-Code-1-Flash 。这两款模型代表了微软在构建“人文超级智能”(Humanist Superintelligence)道路上的重要进展,旨在服务并赋能人类与企业,而非取代他们。 MAI-Thinking-1 是一款 稀疏混合专家(MoE)模型 (激活参数 35B,总参数量约 1T)。尽管它的推理占用空间比超大型模型更小,但在同量级模型中展现出了最顶尖的性能。该模型没有使用任何第三方模型的蒸馏(Distillation)技术。微软完全基于合规、干净且获得商业授权的企业级数据从零开始对其进行训练,迫使其真正“学会”各项任务。 在 AIME 2025 达到 97.0% ,在 AIME 2026 达到 94.5% 的极高正确率,展示出强悍的科学推理能力。並在 SWE-Bench Pro 软件工程基准测试中,其表现与 Claude Opus 4.6 旗鼓相当。在盲测人类偏好胜过 Sonnet 4.6**:在与 Surge 合作开展的包含 1,276 项跨领域任务的盲测(Blind Side-by-Side)评估中,专业裁判在单轮和多轮对话中都更倾向于选择 MAI-Thinking-1,而非 Claude Sonnet 4.6。 支持 256k 的上下文窗口 , MAI-Code-1-Flash 则是针对速度与高效率打造的全新编码模型,目前已面向 Visual Studio Code 中的 GitHub Copilot 个人用户 陆续推出,用户无需额外设置即可在模型选择器中体验。 该模型直接基于 GitHub Copilot 实际生产中的测试框架(Harness)进行训练,使其能完美地与周围的开发工具和系统互动,在阅读代码、编辑文件和运行测试等实际的智能代理任务中表现更优。 模型引入了自适应解决方案长度控制。在面对简单请求时保持精简,在面对复杂难题时则投入更多推理算力。在解决困难问题时,它能 减少高达 60% 的 Token 消耗 ,显著降低了延迟与成本。 在各项核心编码与推理基准测试中,MAI-Code-1-Flash 的准确率和性价比均完胜 Claude Haiku 4.5。在 SWE-Bench Pro 的真实世界任务中,它以 51.2% 对 35.2% 的巨大优势领先了 16 个百分点。並在精确指令遵循测试(IF Bench)中,它更是取得了 +28.9 的领先优势。 Microsoft AI Introducing MAI-Thinking-1 | Microsoft AI Microsoft AI Introducing MAI-Code-1-Flash | Microsoft AI Mustafa Suleyman向媒体承认,Anthropic目前仍领先数月,但强调微软正在快速缩小差距: “我们现在已经处于绝对前沿位置。” “六个月内,我们缩小了一个巨大的差距。” 12 个帖子 - 12 位参与者 阅读完整话题
在 2026 年 Build 开发者大会上,微软宣布大幅扩充其由 Microsoft AI Superintelligence 团队打造的自研 MAI 模型家族,新推出首个通用推理模型 MAI-Thinking-1、一款面向 GitHub Copilot 的代码模型 MAI-Code-1,以及多款语音、转写和图像生成模型更新版本,进一步完善其端到端 AI 技术版图。 这标志着微软在基础模型领域从语音、图像向复杂推理和开发者生产力场景加速延伸。 微软表示,过去一年中 MAI 模型家族持续扩容,先后发布了 MAI-Voice-1、MAI-1-preview,以及今年早些时候的 MAI-Transcribe-1 和 MAI-Image-2,之后又推出在文本渲染、风格化插画和商用图像质量方面均有提升的 MAI-Image-2.5。 本次在此基础上新增推理与代码模型,并同步升级语音、转写和图像产品线,形成更完整的产品组合。 MAI-Thinking-1 是微软官方公布的首款推理模型,由 Microsoft AI 团队自零开始训练,没有采用其他模型蒸馏而来。 微软强调,该模型使用经过清洗、且具有商业许可的企业级数据训练,旨在满足企业用户对数据合规和可商用性的要求。 MAI-Thinking-1 为中等规模模型,拥有 350 亿个激活参数,支持 128K 上下文窗口,主要面向复杂多步骤指令执行、长上下文推理以及代码生成等场景。 尽管微软并未在公告中公开详细基准测试数据,但其在博客中援引独立评审结果称,在盲测中,评审者在整体偏好上更倾向于 MAI-Thinking-1,而非 Anthropic 的 Claude Sonnet 4.6。 此外,微软还表示,在 SWE-bench Pro 代码任务测试中,MAI-Thinking-1 在编码表现上可与 Claude Opus 4.6 相当,显示出该模型在开发者和复杂工程任务上的潜力。 MAI-Thinking-1 目前已通过 Microsoft Foundry 向特定客户开启私有预览。 在图像生成方面,微软此前发布的 MAI-Image-2.5 及其“闪电版”(flash variant)已通过 Microsoft Foundry 向开发者开放。 据微软转引的 Arena 最新文榜单数据,MAI-Image-2.5 在文本生成图像任务上超越了Google的 Nano Banana Pro,进入榜单前三名。 该模型已经集成进 PowerPoint,并正逐步向 OneDrive 推出,为 Office 生态提供更高质量的图像生成功能。 在语音转写方面,微软今年 4 月曾发布 MAI-Transcribe-1,支持基于其自有产品使用数据统计出的 25 种最常用语言的语音转文本转写。 本次微软推出升级版本 MAI-Transcribe-1.5,在语音识别准确率方面达到业界领先水平,覆盖语言数量扩展至 43 种,并计划很快为该模型加入流式转写能力,以满足实时场景需求。 语音合成方向上,在今年 4 月宣布 MAI-Voice-1 一般可用之后,微软此次又发布 MAI-Voice-2 以及其闪电版变体。 新一代语音生成模型支持额外超过 15 种语言,并提供更多语音风格选项,以适配更丰富的应用场景,例如多语言客服、内容配音和智能助手等。 面向开发者的编码场景,微软同步推出 MAI-Code-1,这是一款针对 GitHub 工作负载优化的高效推理代码模型。 该模型已经在 GitHub Copilot 和 Visual Studio Code 中上线,面向日常编码、重构和代码补全等场景提供支持。 虽然微软尚未披露 MAI-Code-1 的具体基准测试结果,但此次发布被视为一个重要信号——微软在 GitHub Copilot 的底层模型上不再完全依赖 OpenAI 和 Anthropic,而是逐步引入自研模型。 在分发渠道上,除通过 Microsoft Foundry 面向企业和开发者提供服务外,微软还宣布其 MAI 系列模型将陆续登陆 Fireworks AI、Baseten 和 OpenRouter 等第三方平台。 同时,Fireworks AI 也已在 Microsoft Foundry 内实现一般可用,为企业客户提供更多架构和部署选择。 通过与多家平台合作,微软希望进一步降低接入门槛,加速 MAI 模型在不同云和工具生态中的落地。 从整体布局来看,微软正以 MAI 推理、编码、语音、转写和图像等多类型模型构建一套完整的企业级 AI 能力矩阵。 随着 MAI-Thinking-1 和 MAI-Code-1 的加入,微软在复杂推理以及开发者生产力领域的话语权显著增强,也为 GitHub Copilot、Office 系列及合作平台提供了更具竞争力的技术底座。 查看评论
IT之家 6 月 3 日消息,在 Build 2026 开发者大会上,微软发布了一系列自研 AI 模型,其中包括旗下首款高级推理模型 MAI-Thinking-1。这也是微软在模型研发领域迈出的重要一步。 微软介绍称,MAI-Thinking-1 是一款“中等规模模型”,拥有 350 亿活跃参数,在关键软件工程基准测试中能够达到业界领先模型的水平。微软表示,该模型“完全基于干净数据从零开始训练,未使用来自第三方模型的蒸馏数据”。 除 MAI-Thinking-1 外,微软还公布了多款面向不同应用场景的新模型,覆盖图像生成、语音转写、语音合成以及编程辅助等领域。IT之家汇总如下: 在图像领域,微软发布了 MAI-Image 2.5 及其 Flash 版本,两者均支持文生图和图像编辑功能。 语音转写方面,微软推出 MAI-Transcribe-1.5,并表示该模型“速度可达竞争对手模型的五倍”。 语音能力方面,微软发布了 MAI-Voice-2,同时预告其 Flash 版本即将推出。微软称,新模型新增了对 15 种语言的支持,并提供更多语音选项。 针对编码场景,微软推出了 MAI-Code-1。微软表示,该模型具备“推理效率优化”特性,并已集成到 GitHub Copilot 和 Visual Studio Code 中。 通过此次发布,微软进一步扩展了自研 MAI 模型家族,覆盖推理、图像、语音和编程等多个 AI 应用方向。 相关阅读: 《 微软首个自研推理 AI 模型 MAI-Thinking-1、新 Copilot 超级应用曝光 》