接着 claude-opus-4-8蒸馏了太多qwen模型,导致自我认知出了问题,基本认为自己是qwen 继续讨论
有没有可能,这是官方针对中文区故意的掺假行为,自己采购了qwen和deepseek的官方api或者干脆是自己部署的(按照成本推算,估计qwen是自己部署的qwen plus,deepseek是买的官方的v4 pro。ds自己部署,哪有买官方的便宜
)然后A
这边有个models route,根据问题的难度,分流到不同的模型回答,就像之前英国的几万亿参数的模型用GLM那样。不过,A
这招是不是有点太损了?你想蒸馏我,我就让你吃自己拉的![]()
22 个帖子 - 19 位参与者