King - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 22:58:01+08:00 · tech

佬们，之前4月27开的plus，然后一直没续费，现在我看是6月27日过期，但现在网页找不到Thinking模式了，而且还极其降智，这是咋回事，有佬知道的不 8 个帖子 - 5 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-11 22:45:06+08:00 · tech

从 Instant、Thinking、Pro变成了 Instant、Medium、High、Extra High 和 Pro 其中 Extra high 应该对应之前的 Thinking heavy，juice 有768。 5 个帖子 - 4 位参与者阅读完整话题

[酷工作] 荷兰招中级后端

v2ex · 2026-06-11 18:15:27+08:00 · tech

We are looking for someone who: - Has experience in C# (.NET 8+, ASP.NET Core) - Enjoys and has experience building RESTful APIs, preferably having built APIs from scratch - Has experience with Agile/Scrum - Has experience with CI/CD tools to get projects to production - Has experience applying good coding principles, testing and backend system architecture design - Has experience with SQL databases; familiarity with MySQL, MariaDB or PostgreSQL is a plus - Experience with Kubernetes and MS Azure hosting is a strong advantage - Annual Bonus: A well-deserved reward for your contributions. - Hybrid Working: Enjoy the flexibility to balance office and WFH. - 6 Weeks Working from Abroad: Take your work to inspiring locations around the world. - 25 Paid Days Off: Plus the option to buy more. 地点 Amsterdam 可以从中国之间请,不能远程全英文交流，这个必须有意就请发英文简历到 am9obmF3ZXNvbWUxN0BnbWFpbC5jb20= 顺便英语手写介绍一下情况，联系电话和方便联系的时间

新版本Chatgpt已经有点看不懂了

LinuxDo 最新话题 · 2026-06-11 11:01:08+08:00 · tech

这是新的PLUS界面原本以为极速对应 Instant 均衡对应 Thinking 标准高级对应 Thinking 进阶但是好像不是这样的均衡对应 GPT5 mini去了高级似乎对应的是Thinking 标准那Thinking 进阶去哪了？ Instant 又是个啥我错乱了 2 个帖子 - 2 位参与者阅读完整话题

公益站用了一段时间就一直在Thinking，连不上，有佬知道怎么回事么

LinuxDo 最新话题 · 2026-06-10 17:23:24+08:00 · tech

如图，早上开开心心的用着gpt5.5，然后后面速度就越来越慢，然后就一直thinking和reconnect，就连不上了 2 个帖子 - 2 位参与者阅读完整话题

Claude Code真别手贱升级，已踩坑

LinuxDo 最新话题 · 2026-06-10 13:20:41+08:00 · tech

github.com/deepseek-ai/DeepSeek-V3 [BUG] Anthropic 兼容端点：thinking:disabled 与 reasoning_effort 互斥导致 Claude Code 2.1.166+ 子 Agent 全部不可用已打开 05:28AM - 06 Jun 26 UTC heming-gmh **Describe the bug** DeepSeek Anthropic 兼容端点 (`/anthropic`) 在校验请求参数时，将 `thinkin … g: { type: "disabled" }` 与 `reasoning_effort` 视为互斥，返回 HTTP 400： > thinking options type cannot be disabled when reasoning_effort is set 这导致 Claude Code 2.1.166+ 的 Workflow/Dynamic Workflow（多 Agent 编排）功能完全不可用。 **背景** Claude Code 2.1.166 引入了 thinking 显式控制能力。此后所有子 Agent（subagent）创建时，Claude Code 会发送 `thinking: { type: "disabled" }`——因为子 Agent 不需要向用户展示思考过程。同时，DeepSeek 官方文档推荐配置 `CLAUDE_CODE_EFFORT_LEVEL=max`，这会向 API 注入 `reasoning_effort` 参数以启用深度推理。两个参数同时在请求中出现时，DeepSeek API 拒绝请求。 **To Reproduce** 环境： ```bash export ANTHROPIC_BASE_URL=https://api.deepseek.com/anthropic export ANTHROPIC_MODEL=deepseek-v4-pro[1m] export CLAUDE_CODE_EFFORT_LEVEL=max ``` 1. 安装 Claude Code ≥ 2.1.166（当前最新 2.1.167） 2. 创建任意 Workflow（多 Agent 任务） 3. 子 Agent 创建时 API 返回 400 已验证的版本矩阵： | Claude Code | Effort Level | 结果 | |-------------|-------------|------| | 2.1.165 | max / xhigh / high / low | ✅ 全部正常 | | 2.1.166 | 任意 | ❌ 400 | | 2.1.167 | 任意 | ❌ 400 | **Root Cause** Claude Code 2.1.166+ 对子 Agent 硬编码 `thinking: disabled`。DeepSeek 兼容层校验 `thinking: disabled` 与 `reasoning_effort` 不可共存，返回 400。 **Expected behavior** 两种改法均可解决：方案 A（推荐）：当 `thinking: disabled` 与 `reasoning_effort` 同时存在时，允许请求通过。`thinking: disabled` 仅表示不输出思考块，不代表模型不能内部推理。对于 deepseek-v4-pro 等推理模型，关闭思考输出 + 开启推理力度是合理组合。方案 B：忽略 `disabled`，对推理模型内部按 `enabled` 处理。 **Additional context** - DeepSeek 官方文档明确推荐 Claude Code 配置 `CLAUDE_CODE_EFFORT_LEVEL=max`：https://api-docs.deepseek.com/zh-cn/guides/anthropic_api - 受影响的 Agent 框架不止 Claude Code——任何在 Anthropic 兼容模式下发送 `thinking: disabled` + `reasoning_effort` 的客户端都会触发 - 当前唯一 workaround：回退 Claude Code 到 2.1.165 并锁定二进制 - 相关 Issue：#1376（thinking 模式与 tool_choice 冲突，同类校验过严问题）今天升了一下级，subagent直接没法用了，我还在想是我哪里配置错了吗？无语了。。。 7 个帖子 - 6 位参与者阅读完整话题

[推广] 一个开源实时数字人项目，一个月到 1.1K Star，复盘我们做对了什么

v2ex · 2026-06-09 21:45:28+08:00 · tech

我们最近在做实时数字人开源项目，OpenTalking 。项目开源大概一个月左右，现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功，但对一个比较重、比较工程向的数字人项目来说，反馈比我预期好不少。所以想简单复盘一下，我觉得这一个月里可能有几件事做对了。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 它做的事情其实挺直接：把一个数字人从“能生成一段视频”，往“能实时和人对话”推了一步。不是只给你一个 talking head 模型，然后让你自己去接语音、接大模型、接前端、接播放链路；而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象，也可以直接在 Web 页面里试一轮实时对话。第一个感受是，这个方向确实有人需要。过去一年看了不少数字人项目和 Demo ，很多效果都挺惊艳，但我自己真正想上手的时候，经常会卡在另一个问题上：这个东西能不能跑起来？能不能接自己的 LLM ？能不能换自己的声音？能不能在浏览器里实时说话？能不能部署到自己的 GPU 机器上？也就是说，大家缺的可能不只是一个更强的模型，而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目，而是更像一个数字人实验台：你可以先跑通最小链路，再慢慢换模型、换声音、换形象、换后端。第二个我觉得比较重要的是，没有一上来就把门槛拉满。数字人项目很容易变成这样：一堆模型权重、一堆环境依赖、一堆服务要启动，最后 README 看完人已经累了。效果可能很好，但普通开发者第一步就被挡住了。所以 OpenTalking 现在尽量把路线拆开：最简单可以用 mock 模式，不需要下载数字人模型，先把前端、对话、语音和 WebRTC 播放跑起来。如果想看真实视频效果，可以走 QuickTalk 或 Wav2Lip local ，在消费级显卡上先试起来。如果更关心私有化，可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。如果追求更高质量或者远端多卡部署，再接 OmniRT 和 FlashTalk 。这几个路线听起来只是文档组织问题，但我觉得对开源项目挺关键的。很多用户不是不愿意试，而是不知道自己应该从哪一步开始。第三个是，我们花了不少时间在“不性感但很有用”的地方。比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。这些东西单独拿出来都不像一个很大的 feature ，但它们决定了一个人 clone 项目之后，会不会真的继续往下跑。我现在越来越觉得，开源项目的第一印象不只是截图和 demo ，还是用户第一次执行命令时的体验。他遇到问题的时候，项目有没有告诉他下一步该看哪里。第四个是，数字人项目一定要多放真实场景。只讲 LLM 、TTS 、WebRTC 、audio2video ，其实大家很难有感觉。因为这些词很多人已经看麻了。所以我们在 README 里放了一些更具体的 demo ，比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美，而是让人更快理解：这个框架大概可以往哪些方向长。比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流，都是可以继续试的方向。第五个是，边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的，也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座，把不同模型、语音服务、前端交互和播放链路接到一起。模型后端可以是 local ，也可以是 mock 、direct_ws ，或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑，高质量模型也可以放到远端 GPU/NPU 机器上。把边界讲清楚之后，大家反而更容易判断它有没有用：如果你只想找一个模型，可能它不是最直接的答案；但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统，它会更合适。最后也同步一下后面想继续补的东西。现在项目还很早期，很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手，或者只是想研究实时数字人的工程链路，可以试一下 OpenTalking 。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 欢迎 star 、issue 、PR ，也欢迎直接提部署问题。这个方向现在还挺早，很多东西都需要在真实机器和真实场景里慢慢打磨。

[分享创造] 一个开源实时数字人项目，一个月到 1.1K Star，复盘我们做对了什么

v2ex · 2026-06-09 20:25:34+08:00 · tech

我们最近在做实时数字人开源项目，OpenTalking 。项目开源大概一个月左右，现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功，但对一个比较重、比较工程向的数字人项目来说，反馈比我预期好不少。所以想简单复盘一下，我觉得这一个月里可能有几件事做对了。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 它做的事情其实挺直接：把一个数字人从“能生成一段视频”，往“能实时和人对话”推了一步。不是只给你一个 talking head 模型，然后让你自己去接语音、接大模型、接前端、接播放链路；而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象，也可以直接在 Web 页面里试一轮实时对话。第一个感受是，这个方向确实有人需要。过去一年看了不少数字人项目和 Demo ，很多效果都挺惊艳，但我自己真正想上手的时候，经常会卡在另一个问题上：这个东西能不能跑起来？能不能接自己的 LLM ？能不能换自己的声音？能不能在浏览器里实时说话？能不能部署到自己的 GPU 机器上？也就是说，大家缺的可能不只是一个更强的模型，而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目，而是更像一个数字人实验台：你可以先跑通最小链路，再慢慢换模型、换声音、换形象、换后端。第二个我觉得比较重要的是，没有一上来就把门槛拉满。数字人项目很容易变成这样：一堆模型权重、一堆环境依赖、一堆服务要启动，最后 README 看完人已经累了。效果可能很好，但普通开发者第一步就被挡住了。所以 OpenTalking 现在尽量把路线拆开：最简单可以用 mock 模式，不需要下载数字人模型，先把前端、对话、语音和 WebRTC 播放跑起来。如果想看真实视频效果，可以走 QuickTalk 或 Wav2Lip local ，在消费级显卡上先试起来。如果更关心私有化，可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。如果追求更高质量或者远端多卡部署，再接 OmniRT 和 FlashTalk 。这几个路线听起来只是文档组织问题，但我觉得对开源项目挺关键的。很多用户不是不愿意试，而是不知道自己应该从哪一步开始。第三个是，我们花了不少时间在“不性感但很有用”的地方。比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。这些东西单独拿出来都不像一个很大的 feature ，但它们决定了一个人 clone 项目之后，会不会真的继续往下跑。我现在越来越觉得，开源项目的第一印象不只是截图和 demo ，还是用户第一次执行命令时的体验。他遇到问题的时候，项目有没有告诉他下一步该看哪里。第四个是，数字人项目一定要多放真实场景。只讲 LLM 、TTS 、WebRTC 、audio2video ，其实大家很难有感觉。因为这些词很多人已经看麻了。所以我们在 README 里放了一些更具体的 demo ，比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美，而是让人更快理解：这个框架大概可以往哪些方向长。比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流，都是可以继续试的方向。第五个是，边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的，也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座，把不同模型、语音服务、前端交互和播放链路接到一起。模型后端可以是 local ，也可以是 mock 、direct_ws ，或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑，高质量模型也可以放到远端 GPU/NPU 机器上。把边界讲清楚之后，大家反而更容易判断它有没有用：如果你只想找一个模型，可能它不是最直接的答案；但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统，它会更合适。最后也同步一下后面想继续补的东西。现在项目还很早期，很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手，或者只是想研究实时数字人的工程链路，可以试一下 OpenTalking 。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 欢迎 star 、issue 、PR ，也欢迎直接提部署问题。这个方向现在还挺早，很多东西都需要在真实机器和真实场景里慢慢打磨。

【SNSE Bench】DeepSeek V4 Flash 倒数第二？

LinuxDo 最新话题 · 2026-06-09 16:52:16+08:00 · tech

结论：DeepSeek-V4-Flash 出现了严重的 overthinking。使用 DeepSeek 官方 API 测试，思考强度为 Max。可以看到，在 12 道题目中，V4-Flash 只在 5 道题目中输出了代码，在剩余的 7 道题目中思维链全部超过了 128k 上限被截断。相比之下，在 V4 尚未发布时网页端的灰测模型都获得了 141 分，发布后的快速模式获得了 215 分——网页端的这两个模型至少面对题目能正常地输出一份代码，且有一定可能获得部分分数。由于这种严重的 overthinking，V4-Flash 在当前的榜单中排名倒数第二，仅优于 Hy-3-Preview。在昨天发布的 V4-Pro 的成绩中，3 道题目也出现了 CoT 超过长度限制的情况。而 Flash 作为参数量较小的模型，对于题目的直觉比 V4-Pro 更差，token 效率更低，因此对于 Pro 影响较小的 overthinking 问题，在 Flash 上就导致其在面对较难的问题时，Max 推理强度几乎不可用的状态。这一点与知乎答主 toyama nao 在其题目集上的测试结果相符，DeepSeek-V4 系列相比于国际先进模型来说还是存在推理效率较低的问题。目前排行榜： 4 个帖子 - 3 位参与者阅读完整话题

【开源自荐】适合 K12/Teachers 账号 ChatGPT 新建对话自动切 Thinking Extended 的油猴脚本

LinuxDo 最新话题 · 2026-06-09 09:50:41+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出项目开源地址： GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript github.com GitHub - zouchenzhen/chatgpt-default-thinking-extended-userscript: Userscript that selects Thinking -> Extended on... Userscript that selects Thinking -> Extended on new ChatGPT chats via visible UI automation. 脚本安装地址： Greasy Fork： https://greasyfork.org/en/scripts/581739-chatgpt-默认-thinking-extended GitHub Raw： https://raw.githubusercontent.com/zouchenzhen/chatgpt-default-thinking-extended-userscript/main/chatgpt-default-thinking-extended.user.js 各位佬友好，开源自荐一个很小但对我自己很刚需的油猴脚本： ChatGPT 默认 Thinking Extended 。起因是我自己在用 K12 ChatGPT 账号的时候，发现网页端每次新建对话都会默认回到 Instant ，不会保存上一次对话里选过的模型模式。也就是说我每开一个新对话，都要手动点模型菜单，再切到当前账号可用的最高级模式 Thinking -> Extended 。次数多了就挺烦，于是顺手写了这个油猴脚本，把这个重复点击流程自动化一下。实现方式比较保守，模拟网页端可见 UI 的点击。欢迎各位佬友使用反馈。 1 个帖子 - 1 位参与者阅读完整话题

bug team导入cpa之后一直working...

LinuxDo 最新话题 · 2026-06-09 09:38:03+08:00 · tech

这是什么问题 CPA面板中测试都是好的 2 个帖子 - 2 位参与者阅读完整话题

关于GPT网页端降智问题

LinuxDo 最新话题 · 2026-06-08 23:15:54+08:00 · tech

今天在使用GPT网页端时，虽然选择的Thinking进阶，但是思考依然很快而且不遵守指令呆呆的，怎么搞得哇有没有什么解决办法佬们，一直用的是自己建的vps，一直没出现过这样的问题虽然web我不怎么用，但是女朋友要用求助 5 个帖子 - 5 位参与者阅读完整话题

Cursor 使用问题 “Taking longer than expected” 如何解决

LinuxDo 最新话题 · 2026-06-08 14:25:30+08:00 · tech

看到有的帖子说是清理一些这个index就可以，是真的吗？我删除了一下好像是快了一次，但后面又自动100%了。还是说是因为cursor++使用的公益站本身连接/速度的问题？才开始用cursor和cursor++，各位佬有什么推荐的姿势么？问题截图： 3 个帖子 - 2 位参与者阅读完整话题

在使用ds4改pi的插件的时候发现自动从thinking切换到non-thinking了！

LinuxDo 最新话题 · 2026-06-08 11:28:40+08:00 · tech

有点厉害啊，D老师也在进步啊，我从来没有想到过还能够这样！而且人家是真的切换用来破限应该挺好的 1 个帖子 - 1 位参与者阅读完整话题

CVPR 2026上Google推出了3DCodeBench

LinuxDo 最新话题 · 2026-06-07 11:40:39+08:00 · tech

3dcodebench.com 3DCodeBench Benchmarking Agentic Procedural 3D Modeling Via Code, with a public 3DCodeArena for human-preference Elo rankings. 1 个帖子 - 1 位参与者阅读完整话题

gpt网页端思考时长变化

LinuxDo 最新话题 · 2026-06-07 01:17:17+08:00 · tech

这几个月订阅了 GPT Pro 的服务，在使用过程中发现思考时长一直在变化，无论是 Thinking 模式（“深入”档位）。还是 Pro 模式。具体表现如下：昨天：使用 GPT Thinking 模式时，思考时间常常在 2 分钟左右；Pro 模式则会思考到 10 分钟。今天上午：Thinking 模式的思考时间缩短到了 1 分钟左右。今天晚上：尝试 GPT Thinking 模式，思考时间往往只有 20 到 30 秒；Pro 模式的思考时间也就 1、2 分钟。另外，我尝试使用 GPT 5.4 进行思考，时间为 1 分钟。不知道有没有遇到一样情况的佬友，另外想问问现在账号是被降智了吗？ 5 个帖子 - 3 位参与者阅读完整话题

Agent没法自己造出编译器的原因

LinuxDo 最新话题 · 2026-06-05 22:40:35+08:00 · tech

因为agent会fallback。 user: 帮我实现个deepseek agent: 《thinking》实现不了，太复杂了，fallback到给他接个豆包api《/thinking》好的，已经实现deepseek功能。 user: 不允许fallback agent: 《thinking》被用户发现了，但是我还是实现不了，但是用户又要求，写一堆代码假装工作最后还是接入豆包《/thinking》好的，这里是deepseek训练代码，这里是deepseek巴拉巴拉，你可以测试一下。 1 个帖子 - 1 位参与者阅读完整话题

chatGPT网页端改版没有Thinking/Pro选项了

LinuxDo 最新话题 · 2026-06-04 21:17:38+08:00 · tech

我发现我的网页端没有选择Thinking/Pro这些模型切换的界面了，变成了这样，手机端是正常在标题部分切换Thinking/Pro，大家有同样的问题吗 8 个帖子 - 6 位参与者阅读完整话题

ChatGPT 全局覆盖模型和推理等级

LinuxDo 最新话题 · 2026-06-04 19:33:43+08:00 · tech

greasyfork.org chatgpt model selection Globally override model and thinking_effort on chatgpt.com 1 个帖子 - 1 位参与者阅读完整话题

goal之前一定要hi

LinuxDo 最新话题 · 2026-06-04 17:58:17+08:00 · tech

大佬们有没发现每次上下文压缩都会丢掉正在working的输出，直接从近期对话喂。如果goal之前是一个具体的任务，例如整理文档、做一个任务，就会在每轮开始或是上下文压缩时重做这个任务。所以每次开goal之前我都插一句hi，打断之前的任务。另外让codex自己写goal会比手写更好。goal默认只做“最小的正确步骤”，导致轮数很多，每轮都要验证也很浪费。因此我会强调“每轮完成一个大方向，禁止小修小补”可以明显降低轮数。 1 个帖子 - 1 位参与者阅读完整话题

/tag/King