www.youinfo.site
标签聚合 留下

/tag/留下

LinuxDo 最新话题 · 2026-06-12 10:36:33+08:00 · tech

最近手上有个项目,是用本地部署大模型进行视觉检测 测试了之前留下来微调过的Qwen2.5VL 7B,然后又测了新的Qwen3.6 27B,Qwen3.6 35BA3B,还有gemma4-26BA4B 总体测下来,感觉qwen3.6 35B的最好用,由于是moe模型,所以速度比稠密模型快很多,5090跑的q5量化版本,能有230t/s以上,效果也是最好的,但是优化起来比较麻烦,如果训练lora的话得用原版模型训练,本地算力不够,估计得上云端,还在考虑有没有其他思路能够优化的 3 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-11 03:34:30+08:00 · tech

地址: https://psce.pw/958ykz 主打满血稳定、快速接入、开发测试方便用。 新用户注册即送测试额度,支持多模型 API 调用,个人开发者和小团队都可以用。 欢迎 V 友体验 本帖下留下注册邮箱 我会发一份测试额度。 其他 OpenAI SDK / CLI 工具 超低倍率,适合高频开发、批量调用和日常写代码 满血不掺水,请求什么模型就按对应模型/渠道转发 不偷换低价模型,不做隐藏降级 后台可查余额和用量,消耗透明 额度不过期,慢慢用也不浪费 接口报错可以带 request id 找我排查 V:13025686554