Thinking - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 22:58:01+08:00 · tech

佬们，之前4月27开的plus，然后一直没续费，现在我看是6月27日过期，但现在网页找不到Thinking模式了，而且还极其降智，这是咋回事，有佬知道的不 8 个帖子 - 5 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-11 22:45:06+08:00 · tech

从 Instant、Thinking、Pro变成了 Instant、Medium、High、Extra High 和 Pro 其中 Extra high 应该对应之前的 Thinking heavy，juice 有768。 5 个帖子 - 4 位参与者阅读完整话题

新版本Chatgpt已经有点看不懂了

LinuxDo 最新话题 · 2026-06-11 11:01:08+08:00 · tech

这是新的PLUS界面原本以为极速对应 Instant 均衡对应 Thinking 标准高级对应 Thinking 进阶但是好像不是这样的均衡对应 GPT5 mini去了高级似乎对应的是Thinking 标准那Thinking 进阶去哪了？ Instant 又是个啥我错乱了 2 个帖子 - 2 位参与者阅读完整话题

公益站用了一段时间就一直在Thinking，连不上，有佬知道怎么回事么

LinuxDo 最新话题 · 2026-06-10 17:23:24+08:00 · tech

如图，早上开开心心的用着gpt5.5，然后后面速度就越来越慢，然后就一直thinking和reconnect，就连不上了 2 个帖子 - 2 位参与者阅读完整话题

Claude Code真别手贱升级，已踩坑

LinuxDo 最新话题 · 2026-06-10 13:20:41+08:00 · tech

github.com/deepseek-ai/DeepSeek-V3 [BUG] Anthropic 兼容端点：thinking:disabled 与 reasoning_effort 互斥导致 Claude Code 2.1.166+ 子 Agent 全部不可用已打开 05:28AM - 06 Jun 26 UTC heming-gmh **Describe the bug** DeepSeek Anthropic 兼容端点 (`/anthropic`) 在校验请求参数时，将 `thinkin … g: { type: "disabled" }` 与 `reasoning_effort` 视为互斥，返回 HTTP 400： > thinking options type cannot be disabled when reasoning_effort is set 这导致 Claude Code 2.1.166+ 的 Workflow/Dynamic Workflow（多 Agent 编排）功能完全不可用。 **背景** Claude Code 2.1.166 引入了 thinking 显式控制能力。此后所有子 Agent（subagent）创建时，Claude Code 会发送 `thinking: { type: "disabled" }`——因为子 Agent 不需要向用户展示思考过程。同时，DeepSeek 官方文档推荐配置 `CLAUDE_CODE_EFFORT_LEVEL=max`，这会向 API 注入 `reasoning_effort` 参数以启用深度推理。两个参数同时在请求中出现时，DeepSeek API 拒绝请求。 **To Reproduce** 环境： ```bash export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_MODEL=deepseek-v4-pro[1m] export CLAUDE_CODE_EFFORT_LEVEL=max ``` 1. 安装 Claude Code ≥ 2.1.166（当前最新 2.1.167） 2. 创建任意 Workflow（多 Agent 任务） 3. 子 Agent 创建时 API 返回 400 已验证的版本矩阵： | Claude Code | Effort Level | 结果 | |-------------|-------------|------| | 2.1.165 | max / xhigh / high / low | ✅ 全部正常 | | 2.1.166 | 任意 | ❌ 400 | | 2.1.167 | 任意 | ❌ 400 | **Root Cause** Claude Code 2.1.166+ 对子 Agent 硬编码 `thinking: disabled`。DeepSeek 兼容层校验 `thinking: disabled` 与 `reasoning_effort` 不可共存，返回 400。 **Expected behavior** 两种改法均可解决：方案 A（推荐）：当 `thinking: disabled` 与 `reasoning_effort` 同时存在时，允许请求通过。`thinking: disabled` 仅表示不输出思考块，不代表模型不能内部推理。对于 deepseek-v4-pro 等推理模型，关闭思考输出 + 开启推理力度是合理组合。方案 B：忽略 `disabled`，对推理模型内部按 `enabled` 处理。 **Additional context** - DeepSeek 官方文档明确推荐 Claude Code 配置 `CLAUDE_CODE_EFFORT_LEVEL=max`：https://api-docs.deepseek.com/zh-cn/guides/anthropic_api - 受影响的 Agent 框架不止 Claude Code——任何在 Anthropic 兼容模式下发送 `thinking: disabled` + `reasoning_effort` 的客户端都会触发 - 当前唯一 workaround：回退 Claude Code 到 2.1.165 并锁定二进制 - 相关 Issue：#1376（thinking 模式与 tool_choice 冲突，同类校验过严问题）今天升了一下级，subagent直接没法用了，我还在想是我哪里配置错了吗？无语了。。。 7 个帖子 - 6 位参与者阅读完整话题

【SNSE Bench】DeepSeek V4 Flash 倒数第二？

LinuxDo 最新话题 · 2026-06-09 16:52:16+08:00 · tech

结论：DeepSeek-V4-Flash 出现了严重的 overthinking。使用 DeepSeek 官方 API 测试，思考强度为 Max。可以看到，在 12 道题目中，V4-Flash 只在 5 道题目中输出了代码，在剩余的 7 道题目中思维链全部超过了 128k 上限被截断。相比之下，在 V4 尚未发布时网页端的灰测模型都获得了 141 分，发布后的快速模式获得了 215 分——网页端的这两个模型至少面对题目能正常地输出一份代码，且有一定可能获得部分分数。由于这种严重的 overthinking，V4-Flash 在当前的榜单中排名倒数第二，仅优于 Hy-3-Preview。在昨天发布的 V4-Pro 的成绩中，3 道题目也出现了 CoT 超过长度限制的情况。而 Flash 作为参数量较小的模型，对于题目的直觉比 V4-Pro 更差，token 效率更低，因此对于 Pro 影响较小的 overthinking 问题，在 Flash 上就导致其在面对较难的问题时，Max 推理强度几乎不可用的状态。这一点与知乎答主 toyama nao 在其题目集上的测试结果相符，DeepSeek-V4 系列相比于国际先进模型来说还是存在推理效率较低的问题。目前排行榜： 4 个帖子 - 3 位参与者阅读完整话题

【开源自荐】适合 K12/Teachers 账号 ChatGPT 新建对话自动切 Thinking Extended 的油猴脚本

LinuxDo 最新话题 · 2026-06-09 09:50:41+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出项目开源地址： GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript github.com GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript: Userscript that selects Thinking -> Extended on... Userscript that selects Thinking -> Extended on new ChatGPT chats via visible UI automation. 脚本安装地址： Greasy Fork： https://greasyfork.org/en/scripts/581739-chatgpt-默认-thinking-extended GitHub Raw： https://raw.githubusercontent.com/zouchenzhen/chatgpt-default-thinking-extended-userscript/main/chatgpt-default-thinking-extended.user.js 各位佬友好，开源自荐一个很小但对我自己很刚需的油猴脚本： ChatGPT 默认 Thinking Extended 。起因是我自己在用 K12 ChatGPT 账号的时候，发现网页端每次新建对话都会默认回到 Instant ，不会保存上一次对话里选过的模型模式。也就是说我每开一个新对话，都要手动点模型菜单，再切到当前账号可用的最高级模式 Thinking -> Extended 。次数多了就挺烦，于是顺手写了这个油猴脚本，把这个重复点击流程自动化一下。实现方式比较保守，模拟网页端可见 UI 的点击。欢迎各位佬友使用反馈。 1 个帖子 - 1 位参与者阅读完整话题

关于GPT网页端降智问题

LinuxDo 最新话题 · 2026-06-08 23:15:54+08:00 · tech

今天在使用GPT网页端时，虽然选择的Thinking进阶，但是思考依然很快而且不遵守指令呆呆的，怎么搞得哇有没有什么解决办法佬们，一直用的是自己建的vps，一直没出现过这样的问题虽然web我不怎么用，但是女朋友要用求助 5 个帖子 - 5 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-08 11:28:40+08:00 · tech

有点厉害啊，D老师也在进步啊，我从来没有想到过还能够这样！而且人家是真的切换用来破限应该挺好的 1 个帖子 - 1 位参与者阅读完整话题

gpt网页端思考时长变化

LinuxDo 最新话题 · 2026-06-07 01:17:17+08:00 · tech

这几个月订阅了 GPT Pro 的服务，在使用过程中发现思考时长一直在变化，无论是 Thinking 模式（“深入”档位）。还是 Pro 模式。具体表现如下：昨天：使用 GPT Thinking 模式时，思考时间常常在 2 分钟左右；Pro 模式则会思考到 10 分钟。今天上午：Thinking 模式的思考时间缩短到了 1 分钟左右。今天晚上：尝试 GPT Thinking 模式，思考时间往往只有 20 到 30 秒；Pro 模式的思考时间也就 1、2 分钟。另外，我尝试使用 GPT 5.4 进行思考，时间为 1 分钟。不知道有没有遇到一样情况的佬友，另外想问问现在账号是被降智了吗？ 5 个帖子 - 3 位参与者阅读完整话题

Agent没法自己造出编译器的原因

LinuxDo 最新话题 · 2026-06-05 22:40:35+08:00 · tech

因为agent会fallback。 user: 帮我实现个deepseek agent: 《thinking》实现不了，太复杂了，fallback到给他接个豆包api《/thinking》好的，已经实现deepseek功能。 user: 不允许fallback agent: 《thinking》被用户发现了，但是我还是实现不了，但是用户又要求，写一堆代码假装工作最后还是接入豆包《/thinking》好的，这里是deepseek训练代码，这里是deepseek巴拉巴拉，你可以测试一下。 1 个帖子 - 1 位参与者阅读完整话题

chatGPT网页端改版没有Thinking/Pro选项了

LinuxDo 最新话题 · 2026-06-04 21:17:38+08:00 · tech

我发现我的网页端没有选择Thinking/Pro这些模型切换的界面了，变成了这样，手机端是正常在标题部分切换Thinking/Pro，大家有同样的问题吗 8 个帖子 - 6 位参与者阅读完整话题

ChatGPT 全局覆盖模型和推理等级

LinuxDo 最新话题 · 2026-06-04 19:33:43+08:00 · tech

greasyfork.org chatgpt model selection Globally override model and thinking_effort on chatgpt.com 1 个帖子 - 1 位参与者阅读完整话题

相关专题

gpt网页pro降智求助

LinuxDo 最新话题 · 2026-06-04 16:12:20+08:00 · tech

昨天和朋友拼车网页的20xpro，今天pro就降智了，求助有什么解决方法吗？thinking倒是正常 17 个帖子 - 10 位参与者阅读完整话题

v2ex · 2026-06-04 10:24:24+08:00 · tech

claude4.6 4.7 4.8 opus max thinking fast 、gpt 5.5 随便用，cursor 无限额度 +v：cribug-_

GPT网页端不思考

LinuxDo 最新话题 · 2026-06-04 09:24:50+08:00 · tech

昨天开始pro账号无论使用pro还是thinking都不思考就直接回答，要么就是卡死，我是个例，还是佬们也有这种情况？ 7 个帖子 - 4 位参与者阅读完整话题

ChatGPT网页版的Pro和Thinking heavy区别

LinuxDo 最新话题 · 2026-06-03 18:54:30+08:00 · tech

虽然Thinking heavy的juice测试是和Pro一样的，但是思考时间会大幅缩短，大概时间只有1/5或者1/10，估计是Pro会强制发散性思维。 Pro 5x也是无限使用Thinking heavy，但是Pro只有一周40次。我直接把Thinking heavy当gemini的flash用了，小问题回答很快，而pro就会磨叽半天，Gpt回答的好但是也真的贵，够买20个gemini pro了 2 个帖子 - 2 位参与者阅读完整话题

微软发布全新 AI 模型：MAI-Thinking-1 与 MAI-Code-1-Flash 登场，接近Sonnet 4.6水平

LinuxDo 最新话题 · 2026-06-03 08:11:47+08:00 · tech

2026年6月2日，微软 AI团队正式宣布推出两款全新的重磅大语言模型——中型推理模型 MAI-Thinking-1 以及专为日常开发者工作流打造的轻量高效编码模型 MAI-Code-1-Flash 。这两款模型代表了微软在构建“人文超级智能”（Humanist Superintelligence）道路上的重要进展，旨在服务并赋能人类与企业，而非取代他们。 MAI-Thinking-1 是一款稀疏混合专家（MoE）模型（激活参数 35B，总参数量约 1T）。尽管它的推理占用空间比超大型模型更小，但在同量级模型中展现出了最顶尖的性能。该模型没有使用任何第三方模型的蒸馏（Distillation）技术。微软完全基于合规、干净且获得商业授权的企业级数据从零开始对其进行训练，迫使其真正“学会”各项任务。在 AIME 2025 达到 97.0% ，在 AIME 2026 达到 94.5% 的极高正确率，展示出强悍的科学推理能力。並在 SWE-Bench Pro 软件工程基准测试中，其表现与 Claude Opus 4.6 旗鼓相当。在盲测人类偏好胜过 Sonnet 4.6**：在与 Surge 合作开展的包含 1,276 项跨领域任务的盲测（Blind Side-by-Side）评估中，专业裁判在单轮和多轮对话中都更倾向于选择 MAI-Thinking-1，而非 Claude Sonnet 4.6。支持 256k 的上下文窗口， MAI-Code-1-Flash 则是针对速度与高效率打造的全新编码模型，目前已面向 Visual Studio Code 中的 GitHub Copilot 个人用户陆续推出，用户无需额外设置即可在模型选择器中体验。该模型直接基于 GitHub Copilot 实际生产中的测试框架（Harness）进行训练，使其能完美地与周围的开发工具和系统互动，在阅读代码、编辑文件和运行测试等实际的智能代理任务中表现更优。模型引入了自适应解决方案长度控制。在面对简单请求时保持精简，在面对复杂难题时则投入更多推理算力。在解决困难问题时，它能减少高达 60% 的 Token 消耗，显著降低了延迟与成本。在各项核心编码与推理基准测试中，MAI-Code-1-Flash 的准确率和性价比均完胜 Claude Haiku 4.5。在 SWE-Bench Pro 的真实世界任务中，它以 51.2% 对 35.2% 的巨大优势领先了 16 个百分点。並在精确指令遵循测试（IF Bench）中，它更是取得了 +28.9 的领先优势。 Microsoft AI Introducing MAI-Thinking-1 | Microsoft AI Microsoft AI Introducing MAI-Code-1-Flash | Microsoft AI Mustafa Suleyman向媒体承认，Anthropic目前仍领先数月，但强调微软正在快速缩小差距： “我们现在已经处于绝对前沿位置。” “六个月内，我们缩小了一个巨大的差距。” 12 个帖子 - 12 位参与者阅读完整话题

微软发布全新MAI-Thinking-1推理模型和MAI-Code-1编程模型

cnBeta全文版 · 2026-06-03 07:06:00+08:00 · tech

在 2026 年 Build 开发者大会上，微软宣布大幅扩充其由 Microsoft AI Superintelligence 团队打造的自研 MAI 模型家族，新推出首个通用推理模型 MAI-Thinking-1、一款面向 GitHub Copilot 的代码模型 MAI-Code-1，以及多款语音、转写和图像生成模型更新版本，进一步完善其端到端 AI 技术版图。这标志着微软在基础模型领域从语音、图像向复杂推理和开发者生产力场景加速延伸。微软表示，过去一年中 MAI 模型家族持续扩容，先后发布了 MAI-Voice-1、MAI-1-preview，以及今年早些时候的 MAI-Transcribe-1 和 MAI-Image-2，之后又推出在文本渲染、风格化插画和商用图像质量方面均有提升的 MAI-Image-2.5。本次在此基础上新增推理与代码模型，并同步升级语音、转写和图像产品线，形成更完整的产品组合。 MAI-Thinking-1 是微软官方公布的首款推理模型，由 Microsoft AI 团队自零开始训练，没有采用其他模型蒸馏而来。微软强调，该模型使用经过清洗、且具有商业许可的企业级数据训练，旨在满足企业用户对数据合规和可商用性的要求。 MAI-Thinking-1 为中等规模模型，拥有 350 亿个激活参数，支持 128K 上下文窗口，主要面向复杂多步骤指令执行、长上下文推理以及代码生成等场景。尽管微软并未在公告中公开详细基准测试数据，但其在博客中援引独立评审结果称，在盲测中，评审者在整体偏好上更倾向于 MAI-Thinking-1，而非 Anthropic 的 Claude Sonnet 4.6。此外，微软还表示，在 SWE-bench Pro 代码任务测试中，MAI-Thinking-1 在编码表现上可与 Claude Opus 4.6 相当，显示出该模型在开发者和复杂工程任务上的潜力。 MAI-Thinking-1 目前已通过 Microsoft Foundry 向特定客户开启私有预览。在图像生成方面，微软此前发布的 MAI-Image-2.5 及其“闪电版”（flash variant）已通过 Microsoft Foundry 向开发者开放。据微软转引的 Arena 最新文榜单数据，MAI-Image-2.5 在文本生成图像任务上超越了Google的 Nano Banana Pro，进入榜单前三名。该模型已经集成进 PowerPoint，并正逐步向 OneDrive 推出，为 Office 生态提供更高质量的图像生成功能。在语音转写方面，微软今年 4 月曾发布 MAI-Transcribe-1，支持基于其自有产品使用数据统计出的 25 种最常用语言的语音转文本转写。本次微软推出升级版本 MAI-Transcribe-1.5，在语音识别准确率方面达到业界领先水平，覆盖语言数量扩展至 43 种，并计划很快为该模型加入流式转写能力，以满足实时场景需求。语音合成方向上，在今年 4 月宣布 MAI-Voice-1 一般可用之后，微软此次又发布 MAI-Voice-2 以及其闪电版变体。新一代语音生成模型支持额外超过 15 种语言，并提供更多语音风格选项，以适配更丰富的应用场景，例如多语言客服、内容配音和智能助手等。面向开发者的编码场景，微软同步推出 MAI-Code-1，这是一款针对 GitHub 工作负载优化的高效推理代码模型。该模型已经在 GitHub Copilot 和 Visual Studio Code 中上线，面向日常编码、重构和代码补全等场景提供支持。虽然微软尚未披露 MAI-Code-1 的具体基准测试结果，但此次发布被视为一个重要信号——微软在 GitHub Copilot 的底层模型上不再完全依赖 OpenAI 和 Anthropic，而是逐步引入自研模型。在分发渠道上，除通过 Microsoft Foundry 面向企业和开发者提供服务外，微软还宣布其 MAI 系列模型将陆续登陆 Fireworks AI、Baseten 和 OpenRouter 等第三方平台。同时，Fireworks AI 也已在 Microsoft Foundry 内实现一般可用，为企业客户提供更多架构和部署选择。通过与多家平台合作，微软希望进一步降低接入门槛，加速 MAI 模型在不同云和工具生态中的落地。从整体布局来看，微软正以 MAI 推理、编码、语音、转写和图像等多类型模型构建一套完整的企业级 AI 能力矩阵。随着 MAI-Thinking-1 和 MAI-Code-1 的加入，微软在复杂推理以及开发者生产力领域的话语权显著增强，也为 GitHub Copilot、Office 系列及合作平台提供了更具竞争力的技术底座。查看评论

微软发布其首款高级推理模型 MAI-Thinking-1：承诺未蒸馏第三方模型，自研 AI 模型阵容进一步扩充

IT之家 · 2026-06-03 02:22:47+08:00 · tech

IT之家 6 月 3 日消息，在 Build 2026 开发者大会上，微软发布了一系列自研 AI 模型，其中包括旗下首款高级推理模型 MAI-Thinking-1。这也是微软在模型研发领域迈出的重要一步。微软介绍称，MAI-Thinking-1 是一款“中等规模模型”，拥有 350 亿活跃参数，在关键软件工程基准测试中能够达到业界领先模型的水平。微软表示，该模型“完全基于干净数据从零开始训练，未使用来自第三方模型的蒸馏数据”。除 MAI-Thinking-1 外，微软还公布了多款面向不同应用场景的新模型，覆盖图像生成、语音转写、语音合成以及编程辅助等领域。IT之家汇总如下：在图像领域，微软发布了 MAI-Image 2.5 及其 Flash 版本，两者均支持文生图和图像编辑功能。语音转写方面，微软推出 MAI-Transcribe-1.5，并表示该模型“速度可达竞争对手模型的五倍”。语音能力方面，微软发布了 MAI-Voice-2，同时预告其 Flash 版本即将推出。微软称，新模型新增了对 15 种语言的支持，并提供更多语音选项。针对编码场景，微软推出了 MAI-Code-1。微软表示，该模型具备“推理效率优化”特性，并已集成到 GitHub Copilot 和 Visual Studio Code 中。通过此次发布，微软进一步扩展了自研 MAI 模型家族，覆盖推理、图像、语音和编程等多个 AI 应用方向。相关阅读：《微软首个自研推理 AI 模型 MAI-Thinking-1、新 Copilot 超级应用曝光》

相关专题

/tag/Thinking