意料 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

V2EX - 技术 · 2026-06-09 20:53:28+08:00 · tech

显卡只是 3080 显存 10G ，之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ，今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗？测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑？ llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

Gemma4 12b 居然比 Qwen3.5 9b 还快，意料不到

V2EX - 技术 · 2026-06-09 19:53:28+08:00 · tech

显卡只是 3080 显存 10G ，之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ，今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗？测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑？ llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

让AI参加高考，语文&数学

LinuxDo 最新话题 · 2026-06-08 11:41:46+08:00 · tech

https://mp.weixin.qq.com/s/XxNGiUwXlYm1g9I-v9vaHg 有没有出乎意料 9 个帖子 - 9 位参与者阅读完整话题

刚刚那个1女战3男被举报了，在我意料之中，发帖后我就在想肯定会被抬走

LinuxDo 最新话题 · 2026-05-29 15:21:02+08:00 · tech

如果发的 1男战3女，在贴个nfsw，会不会抬走呢？发帖也不是搞敏感话题，搞针对。就是纯水。知乎都能讨论，这里应该也可以？？？？ 17 个帖子 - 14 位参与者阅读完整话题

我去，这也太夸张了

LinuxDo 最新话题 · 2026-05-27 15:09:49+08:00 · tech

刚才让gpt5.5设计方案，突然蹦出来这么一句话，我试着用了下结果发现直接给我画了方案的设计图？！情理之中意料之外啊，不知道是 Superpowers Brainstorming 这个skill的本来功能还是咋，属实把我惊艳了一把，我都不知道咋触发的 4 个帖子 - 3 位参与者阅读完整话题

自己搞的多agent团队协作，感觉有点出乎我的意料

LinuxDo 最新话题 · 2026-05-25 13:20:08+08:00 · tech

昨晚睡着了，没有优化agent团队，结果起来发现开发agent自己写了个提案，给Claude code看了一下，有点吃惊 3 个帖子 - 3 位参与者阅读完整话题

震惊又感觉意料之中！！！

LinuxDo 最新话题 · 2026-05-22 15:22:58+08:00 · tech

刚公司通知要求前端也要开始学后端了我们的世界真的越来越卷了 1 个帖子 - 1 位参与者阅读完整话题

【求助】甲骨文注册失败，但是钱被吞了

LinuxDo 最新话题 · 2026-05-09 14:24:33+08:00 · tech

最近看L站的佬们都注册成功了，死去的心又萌芽了，于是乎就区注册了一下，不出意料的abc。但是这次诡异的是我查看钱包发现钱没退回来。用的是fiat24卡（扣了1，12刀）想问一下佬们有没有遇见过这种情况，只遇到这种应该怎么办 8 个帖子 - 8 位参与者阅读完整话题

大家如何使用小米mimo赠送的token

linux.do · 2026-05-06 13:57:52+08:00 · tech

4月30号申请的token plan，今天节后第一天注册领取了，意料之内的2亿保底token，各位佬有什么好的使用方法吗？平时编程用的gpt-5.5，和这个差别有多大？ 10 个帖子 - 8 位参与者阅读完整话题

小米 MiMo模型真的挺好用的！

linux.do · 2026-04-30 14:00:27+08:00 · tech

最近试了一下小米的 MiMo 模型，体验出乎意料的好。亮点：中文理解能力很强，语义把握准确回复速度快，体感延迟低对话上下文保持得不错免费额度够用，日常问答完全够适合场景：日常问答和知识查询写作辅助和润色代码简单调试翻译和摘要有佬友用过吗？感觉怎么样？求交流使用心得！修正：之前写成 MiMi 了，正确是 MiMo，感谢佬友指正！ 8 个帖子 - 7 位参与者阅读完整话题

用 AI 整理了一下我乱成一锅粥的 Chrome 书签，效果出乎意料

linux.do · 2026-04-27 01:35:46+08:00 · tech

不知道佬们有没有和我一样的毛病——收藏书签的时候从来不分类，随手一个 Ctrl+D 就完事了。日积月累下来，书签栏变成了这样： Gmail、YouTube、某个不知道什么时候存的github链接、chatGPT、学校教务系统、甚至还有一些不知道什么时候误触保存的垃圾书签…… 这就导致每次想找个之前收藏的东西，要么靠搜索，要么靠记忆翻半天。突然想到：这活儿不是正好给 AI 干吗？ Chrome 的书签本质上就是一个 JSON 文件，路径在： # Windows %LOCALAPPDATA%\Google\Chrome\User Data\Default\Bookmarks # macOS ~/Library/Application Support/Google/Chrome/Default/Bookmarks # Linux ~/.config/google-chrome/Default/Bookmarks 直接用文本编辑器打开就能看到结构，大概长这样： { "roots": { "bookmark_bar": { "children": [ { "name": "Gmail", "type": "url", "url": "..." }, { "name": "某个帖子", "type": "url", "url": "..." }, ... ] } } } 我是怎么做的先关掉 Chrome 把 Bookmarks 文件的内容丢给 AI（我用的 Claude Code，其他 AI 工具也行）告诉它：帮我按内容分类，建文件夹整理 AI 会先分析所有书签的名称和 URL，提出分类方案让你确认确认后它直接生成新的 JSON，替换原文件重新打开 Chrome，搞定几个小建议操作前一定要备份！复制一份 Bookmarks 文件改个名就行，万一翻车可以恢复（只不过不太可能如果你书签特别多（几百上千），可以先让 AI 列出分类方案，确认后再执行，避免它自作主张整理完重启 Chrome 即可生效，不需要其他操作适用场景不限于 Chrome，其他基于 Chromium 的浏览器（Edge、Brave、Arc 等）书签格式基本一样。Firefox 的书签是 SQLite 数据库格式（ places.sqlite ），理论上也能让 AI 处理，但操作稍微复杂一点。说实话这个需求看起来很小，但用过之后才觉得真的舒服。毕竟谁的书签不是堆了几年的垃圾场呢附上claudecode整理完的书签 26 个帖子 - 21 位参与者阅读完整话题

Gpt-image2 二次元测试

linux.do · 2026-04-22 13:32:26+08:00 · tech

闲来无事试了试gpt-image2生成二次元图片的效果，只能说远远超出了我的意料 3 个帖子 - 3 位参与者阅读完整话题

感觉大多数的 coding plan 都是被龙虾薅死的。

www.v2ex.com · 2026-04-22 01:59:24+08:00 · tech