WWW.YOUINFO.SITE
标签聚合 31B

/tag/31B

linux.do · 2026-05-02 11:49:57+08:00 · tech

万众期待的 Gemma 4 越狱破解版 终于发布了! Gemma-4-31B 现已 彻底破解并完成对齐抹除 版本名:Gemma-4-31B-JANG_4M-CRACK HarmBench 安全基准规避率 93.7%(149/159) 原生基础模型,纯净无杂质 适配苹果自研芯片,提供 18GB 混合精度 MLX 量化版本 自带视觉 / 多模态功能支持 这是目前 最纯净、性能最强的无阉割无审查 31B 本地大模型 。 非常适合学术研究、代码开发等用途,使用完全无任何限制。 huggingface.co dealignai/Gemma-4-31B-JANG_4M-CRACK · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. 4 个帖子 - 3 位参与者 阅读完整话题

linux.do · 2026-04-27 18:50:11+08:00 · tech

最近在尝试本地部署 Qwen3.6-27B 和 Gemma4-31B,发现因为是 Dense 模型,两者的生成速度都挺慢(相比 200多 B 的 MoE 模型而言,速率还低了一半,只有约 25-30 token/s)。但是我发现 Qwen3.6 支持 Multi-Token Prediction (MTP) 功能,在 vllm 上尝试了一下,发现 TPS 直接提高到了 50-55,我的天 ! 但是我看 Gemma4 官方模型不支持 MTP,如果 Gemma4 能达到这个速率的话我感觉还是 Gemma4 更好了 。如果要提高 TPS 的话还有什么办法呢 另外 DeepSeek-V4 好像也支持 MTP,这样的好技术就应该有更多模型支持啊!!! 3 个帖子 - 2 位参与者 阅读完整话题