WWW.YOUINFO.SITE
标签聚合 MT

/tag/MT

V2EX - 技术 · 2026-06-09 20:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

V2EX - 技术 · 2026-06-09 19:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

LinuxDo 最新话题 · 2026-06-07 09:27:58+08:00 · tech

在 2026 台北电脑展上,技嘉超频团队使用海盗船 DDR5 内存冲击至 13556 MT/s,刷新世界纪录。此次超频基于技嘉 Z890 AORUS TACHYON DUO X ICE 主板,并借助液氮等极端散热手段达成。 同一团队此前曾在该主板上达成 12917 MT/s 的风冷纪录,后借助液氮进一步推至 13407.8 MT/s。在本次芝奇超频大赛中,他们另用 AMD 平台拿下 10 项全球第一。这些极限成绩主要展示硬件工程极限,不代表普通用户的日常体验。 ithome.com 刷新世界纪录:技嘉联手海盗船将 DDR5 内存超至 13556 MT/s,并联合芝奇夺得 10 项全球第一 - IT之家 技嘉超频团队在台北电脑展上,使用专为极限设计的 Z890 主板和海盗船内存,将 DDR5 频率推至 13556 MT/s,刷新世界纪录。该成绩属于芝奇超频大赛的一部分,团队还凭借 X870 主板在 AMD 平台拿下 10 项全球第一。#DDR5 超频# #COMPUTEX2026# 2 个帖子 - 2 位参与者 阅读完整话题

IT之家 · 2026-06-06 23:23:18+08:00 · tech

IT之家 6 月 6 日消息,在 2026 台北国际电脑展上,技嘉内部超频团队将海盗船 DDR5 内存超至前所未有的 13556 MT/s,再次刷新了内存超频世界纪录。 这项新纪录由技嘉超频团队缔造,核心平台选用了专为极限超频设计的技嘉 Z890 AORUS TACHYON DUO X ICE 主板,搭配海盗船 Vengeance DDR5 内存。 该主板搭载了创新的 CQDIMM 技术,通过优化的布线设计与 BIOS 调校有效降低内存通道负载并提升信号完整性,为冲击极限频率提供了关键的电气性能保障。 此次挑战属于芝奇( G.SKILL )主办的第 12 届年度超频世界纪录舞台活动的一部分,汇聚了全球顶级超频玩家同场竞技。 在刷新这项终极纪录之前,技嘉超频团队已经在该主板上展现了强大的超频实力。团队成员 Saltycroissant 曾使用同一款 Z890 AORUS TACHYON DUO X ICE 主板,在纯风冷条件下将海盗船 Vengeance DDR5 内存超至 12917 MT/s,随后借助液氮散热进一步推至 13407.8 MT/s。 此外,在芝奇超频大赛期间,技嘉团队还使用 X870 AORUS INFINITY 主板搭配 AMD 锐龙 9 9950X3D2 处理器,在 CPU 频率及多项效能测试中一举拿下 10 项全球第一的佳绩。 需要指出的是,这类极限超频纪录普遍使用了液氮(IT之家注:沸点约-196℃)等极端散热手段,旨在挖掘硬件的物理潜力,不代表普通玩家的日常使用体验。这种追求极限的做法,更多是硬件厂商和超频爱好者对工程技术实力的一次炫技,证明了其主板电气设计与内存颗粒在超高压、超低温等严苛条件下的稳定性,但对于普通用户日常游戏、办公等场景的体验并无直接助益。

LinuxDo 最新话题 · 2026-06-05 09:58:36+08:00 · tech

我是minimax的token plan plus用户,我昨天使用了大概17Mtoken,显示5小时额度使用了40%,那么可以估算出5小时额度为17除以40%约为42.5M, 按照我老用户无限额算、一天约5个五小时刷新周期,那么一个月30天可使用额度为42.5X5X30=6375M 目前官方文档中没有说明具体周限额为多少,暂且按照以前文档中周限额为5小时限额的10倍计算 今日上午10点前下单用户周限额为150%,按照5小时限额的15倍计算,一个月一般为4周多两到三天,按照5周的周限额算,一月可使用42.5X15X5=3187.5M,而正常100%周限额用户一个月可使用额度为42.5X10X5=2125M,也就是说无周限额老用户,一个月满打满算的实际用量可以达到60亿token,而周限额150%的用户一个月可以使用32亿的token,而周限额为100%的用户一个月可以使用22亿的token,我上述计算是否有错误地方 老用户一个月可以使用63亿左右token,周限额150%用户可以使用32亿左右token,周限额100%的用户以恶个月可以使用22亿左右的token 3 个帖子 - 2 位参与者 阅读完整话题