佬友们,问下目前deepseekV4pro到底是什么水平,如何配合自家reasonix食用,能到什么程度,最近土耳其也涨价了,后面还是要回归国产,目前用过的国产模型只有kimi、MiniMax、MinMo、Qwen3.6、GML4.7,长期用的还是Kimi,MiniMax贼船是最近上的,目前想找一套合适国产套餐方案,其实是想Kimi + GML 5.1的,Kimi补充多模态跟做做前端,GML写后端,可是呢,这两模型的上下文太少了,GLM长期没货,而且听说很卡,前段时间又听说deepseekV4pro很强,也不知道真不真,其他模型就不考虑了,都是歪瓜裂枣,特别是MiniMax、MinMo,营销厉害,实际表现一言难尽,反正不适合用来写代码,养个龙虾勉强,属于模型界的卧龙凤雏了,各位佬友们有什么好的组合推荐或自己的搭建也可以来讨论,我每个月的预算大概就是200-300左右 3 个帖子 - 3 位参与者 阅读完整话题
看了下,貌似可以开启ultracode,有佬试过吗,是纯max好还是ultracode模式好?deepseek v4 pro接入的cc 3 个帖子 - 3 位参与者 阅读完整话题
(话题已被作者删除) 1 个帖子 - 1 位参与者 阅读完整话题
如题,我这是我的 ~/.codex/config.toml 中的配置,但是在实际使用时,deepseek-v4-pro显示的上下文的窗口大小还是258k,是我的配置有问题吗,求各位大佬帮忙看下 model_provider = "cpa" model = "codex/deepseek-v4-pro" model_reasoning_effort = "xhigh" disable_response_storage = true preferred_auth_method = "apikey" model_context_window = 1000000 model_auto_compact_token_limit = 900000 web_search = "live" 4 个帖子 - 3 位参与者 阅读完整话题
之前在白山薅了不少羊毛,今天一看更新了Deepseek V4模型,虽然价格比官方还贵(哈哈,你没听错,官方之前的价格)但是白嫖的额度也够用挺久了 1 个帖子 - 1 位参与者 阅读完整话题
先叠甲,这个在咱们L站能发不。锐评的结果很尖锐,也很令人痛心… 我先发几张没那么尖锐的图。 使用的是claude code + deepseek v4 pro 免责声明:以上内容基于封面新闻等公开报道整理,仅代表个人关注社会事件的看法,不构成任何法律建议。文中信息来源于媒体公开 报道,如有不准确之处以官方通报为准。如涉及当事人隐私,请联系删除。 2 个帖子 - 1 位参与者 阅读完整话题
准备放到腾讯云服务器上,自己部署了hermes用 2 个帖子 - 2 位参与者 阅读完整话题
日内瓦,真的不能碰吗 4 个帖子 - 3 位参与者 阅读完整话题
目前看来已经被其他国模超过了啊 6月真的有V4.1吗 稳稳跟上 狠狠反超 泯然众人 点击以查看投票。 10 个帖子 - 8 位参与者 阅读完整话题
如果强的话大概比v4强多少,如果弱的话又比v4弱多少) 看榜挺高的(当然我们知道哈基米一直是刷榜小能手) 希望能给真实反馈 5 个帖子 - 5 位参与者 阅读完整话题
接入Claudecode中开启Ultra code模式高强度使用,并未发现与Gpt5.5差异明显的短板 16 个帖子 - 12 位参与者 阅读完整话题
上周DMIT的ipv4挂了到现在还没好,也不知道要什么时候才恢复换IP业务。想用一分机场中转结果发现不知道为什么它的节点还经常访问不了DMIT,不清楚是DMIT的安全策略还是什么原因。 有哪家机场可以稳定访问DMIT的?只要能连DMIT就行,对解锁其他服务没有任何要求,最好支持买流量包 2 个帖子 - 2 位参与者 阅读完整话题
5 个帖子 - 3 位参与者 阅读完整话题
在pi中使用opencode go的deepseek v4p,不会搜索,干脆用cc让它为pi写个skill,接入grok进行搜索,效果如下: deepseek搭配grok简直毫无底线。过程也很简单,随便找个能用的grok api,自己搭建,公益,中转也行,让ai测试搜索成功后,参考" Pi Documentation · Docs · Pi " 帮你写。gpt 5.5几分钟就完成了,重启pi cli就能用。不过pi的界面的确看不惯。。。 7 个帖子 - 4 位参与者 阅读完整话题
base64 网址:aHR0cHM6Ly9xb2Rlci5jb20uY24vcmVmZXJyYWw/cmVmZXJyYWxfY29kZT1XOGdhbkV4Q2lYWmNCT3JYM0RJZHdydWp6U0xQdDhkRg==
base64 网址:aHR0cHM6Ly9xb2Rlci5jb20uY24vcmVmZXJyYWw/cmVmZXJyYWxfY29kZT1XOGdhbkV4Q2lYWmNCT3JYM0RJZHdydWp6U0xQdDhkRg==
base64 网址:aHR0cHM6Ly9xb2Rlci5jb20uY24vcmVmZXJyYWw/cmVmZXJyYWxfY29kZT1XOGdhbkV4Q2lYWmNCT3JYM0RJZHdydWp6U0xQdDhkRg==
结论:DeepSeek-V4-Flash 出现了严重的 overthinking。 使用 DeepSeek 官方 API 测试,思考强度为 Max。 可以看到,在 12 道题目中,V4-Flash 只在 5 道题目中输出了代码,在剩余的 7 道题目中思维链全部超过了 128k 上限被截断。相比之下,在 V4 尚未发布时网页端的灰测模型都获得了 141 分,发布后的快速模式获得了 215 分——网页端的这两个模型至少面对题目能正常地输出一份代码,且有一定可能获得部分分数。 由于这种严重的 overthinking,V4-Flash 在当前的榜单中排名倒数第二,仅优于 Hy-3-Preview。 在昨天发布的 V4-Pro 的成绩中,3 道题目也出现了 CoT 超过长度限制的情况。而 Flash 作为参数量较小的模型,对于题目的直觉比 V4-Pro 更差,token 效率更低,因此对于 Pro 影响较小的 overthinking 问题,在 Flash 上就导致其在面对较难的问题时,Max 推理强度几乎不可用的状态。 这一点与知乎答主 toyama nao 在其题目集上的测试结果相符,DeepSeek-V4 系列相比于国际先进模型来说还是存在推理效率较低的问题。 目前排行榜: 4 个帖子 - 3 位参与者 阅读完整话题
base64 网址:aHR0cHM6Ly9xb2Rlci5jb20uY24vcmVmZXJyYWw/cmVmZXJyYWxfY29kZT1XOGdhbkV4Q2lYWmNCT3JYM0RJZHdydWp6U0xQdDhkRg==
base64 网址:aHR0cHM6Ly9xb2Rlci5jb20uY24vcmVmZXJyYWw/cmVmZXJyYWxfY29kZT1XOGdhbkV4Q2lYWmNCT3JYM0RJZHdydWp6U0xQdDhkRg==