WWW.YOUINFO.SITE
标签聚合 一是

/tag/一是

linux.do · 2026-04-19 02:58:49+08:00 · tech

Qwen 3.6 35B-A3B 智商测试 之前没考虑过本地部署 LLM——一是没卡没好设备,二是感觉小模型智商不会高到哪里去。 但最近对 Claude Opus 的降智略感失望,本地部署个不错的 LLM 至少不会降智。看佬儿友分享最近发布的 Qwen 3.6 ,看起来不错,手痒试了一下。一番调研后选择了 MLX 的 Q8 量化,兼顾速度和精度。 1)比大小 / 洗车问题 / 色盲问题 表现不错,全部一次答对 2)糖果问题 第一次答错了,第二次在提醒下答对了 后续 明天继续测代码能力,以及其他小参数模型: 模型 量化 Gemma 4 31B Q8 Qwen 3.5 122B-A10B Q4 (应该是这台电脑的极限了) 环境 & 参数 设备 :MBP M3 Max 128G 环境 :LM Studio 量化 :Q8_0 速度 :60.87 tok/sec temperature = 1.0 top_p = 0.95 top_k = 20 min_p = 0.0 repetition_penalty = 1.0 1 个帖子 - 1 位参与者 阅读完整话题