WWW.YOUINFO.SITE
标签聚合 V4

/tag/V4

LinuxDo 最新话题 · 2026-06-11 22:14:12+08:00 · tech

佬友们,问下目前deepseekV4pro到底是什么水平,如何配合自家reasonix食用,能到什么程度,最近土耳其也涨价了,后面还是要回归国产,目前用过的国产模型只有kimi、MiniMax、MinMo、Qwen3.6、GML4.7,长期用的还是Kimi,MiniMax贼船是最近上的,目前想找一套合适国产套餐方案,其实是想Kimi + GML 5.1的,Kimi补充多模态跟做做前端,GML写后端,可是呢,这两模型的上下文太少了,GLM长期没货,而且听说很卡,前段时间又听说deepseekV4pro很强,也不知道真不真,其他模型就不考虑了,都是歪瓜裂枣,特别是MiniMax、MinMo,营销厉害,实际表现一言难尽,反正不适合用来写代码,养个龙虾勉强,属于模型界的卧龙凤雏了,各位佬友们有什么好的组合推荐或自己的搭建也可以来讨论,我每个月的预算大概就是200-300左右 3 个帖子 - 3 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-11 19:15:00+08:00 · tech

如题,我这是我的 ~/.codex/config.toml 中的配置,但是在实际使用时,deepseek-v4-pro显示的上下文的窗口大小还是258k,是我的配置有问题吗,求各位大佬帮忙看下 model_provider = "cpa" model = "codex/deepseek-v4-pro" model_reasoning_effort = "xhigh" disable_response_storage = true preferred_auth_method = "apikey" model_context_window = 1000000 model_auto_compact_token_limit = 900000 web_search = "live" 4 个帖子 - 3 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-09 23:30:10+08:00 · tech

在pi中使用opencode go的deepseek v4p,不会搜索,干脆用cc让它为pi写个skill,接入grok进行搜索,效果如下: deepseek搭配grok简直毫无底线。过程也很简单,随便找个能用的grok api,自己搭建,公益,中转也行,让ai测试搜索成功后,参考" Pi Documentation · Docs · Pi " 帮你写。gpt 5.5几分钟就完成了,重启pi cli就能用。不过pi的界面的确看不惯。。。 7 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-09 16:52:16+08:00 · tech

结论:DeepSeek-V4-Flash 出现了严重的 overthinking。 使用 DeepSeek 官方 API 测试,思考强度为 Max。 可以看到,在 12 道题目中,V4-Flash 只在 5 道题目中输出了代码,在剩余的 7 道题目中思维链全部超过了 128k 上限被截断。相比之下,在 V4 尚未发布时网页端的灰测模型都获得了 141 分,发布后的快速模式获得了 215 分——网页端的这两个模型至少面对题目能正常地输出一份代码,且有一定可能获得部分分数。 由于这种严重的 overthinking,V4-Flash 在当前的榜单中排名倒数第二,仅优于 Hy-3-Preview。 在昨天发布的 V4-Pro 的成绩中,3 道题目也出现了 CoT 超过长度限制的情况。而 Flash 作为参数量较小的模型,对于题目的直觉比 V4-Pro 更差,token 效率更低,因此对于 Pro 影响较小的 overthinking 问题,在 Flash 上就导致其在面对较难的问题时,Max 推理强度几乎不可用的状态。 这一点与知乎答主 toyama nao 在其题目集上的测试结果相符,DeepSeek-V4 系列相比于国际先进模型来说还是存在推理效率较低的问题。 目前排行榜: 4 个帖子 - 3 位参与者 阅读完整话题