WWW.YOUINFO.SITE
标签聚合 意料

/tag/意料

V2EX - 技术 · 2026-06-09 20:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

V2EX - 技术 · 2026-06-09 19:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

linux.do · 2026-04-30 14:00:27+08:00 · tech

最近试了一下小米的 MiMo 模型,体验出乎意料的好。 亮点: 中文理解能力很强,语义把握准确 回复速度快,体感延迟低 对话上下文保持得不错 免费额度够用,日常问答完全够 适合场景: 日常问答和知识查询 写作辅助和润色 代码简单调试 翻译和摘要 有佬友用过吗?感觉怎么样?求交流使用心得! 修正:之前写成 MiMi 了,正确是 MiMo,感谢佬友指正! 8 个帖子 - 7 位参与者 阅读完整话题

linux.do · 2026-04-27 01:35:46+08:00 · tech

不知道佬们有没有和我一样的毛病——收藏书签的时候从来不分类,随手一个 Ctrl+D 就完事了。 日积月累下来,书签栏变成了这样: Gmail、YouTube、某个不知道什么时候存的github链接、chatGPT、学校教务系统、甚至还有一些不知道什么时候误触保存的垃圾书签…… 这就导致每次想找个之前收藏的东西,要么靠搜索,要么靠记忆翻半天。 突然想到:这活儿不是正好给 AI 干吗? Chrome 的书签本质上就是一个 JSON 文件,路径在: # Windows %LOCALAPPDATA%\Google\Chrome\User Data\Default\Bookmarks # macOS ~/Library/Application Support/Google/Chrome/Default/Bookmarks # Linux ~/.config/google-chrome/Default/Bookmarks 直接用文本编辑器打开就能看到结构,大概长这样: { "roots": { "bookmark_bar": { "children": [ { "name": "Gmail", "type": "url", "url": "..." }, { "name": "某个帖子", "type": "url", "url": "..." }, ... ] } } } 我是怎么做的 先关掉 Chrome 把 Bookmarks 文件的内容丢给 AI(我用的 Claude Code,其他 AI 工具也行) 告诉它: 帮我按内容分类,建文件夹整理 AI 会先分析所有书签的名称和 URL,提出分类方案让你确认 确认后它直接生成新的 JSON,替换原文件 重新打开 Chrome,搞定 几个小建议 操作前一定要备份! 复制一份 Bookmarks 文件改个名就行,万一翻车可以恢复(只不过不太可能 如果你书签特别多(几百上千),可以先让 AI 列出分类方案,确认后再执行,避免它自作主张 整理完 重启 Chrome 即可生效,不需要其他操作 适用场景 不限于 Chrome,其他基于 Chromium 的浏览器(Edge、Brave、Arc 等)书签格式基本一样。Firefox 的书签是 SQLite 数据库格式( places.sqlite ),理论上也能让 AI 处理,但操作稍微复杂一点。 说实话这个需求看起来很小,但用过之后才觉得真的舒服。毕竟谁的书签不是堆了几年的垃圾场呢 附上claudecode整理完的书签 26 个帖子 - 21 位参与者 阅读完整话题

www.v2ex.com · 2026-04-22 01:59:24+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-22 00:59:24+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 23:59:24+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 22:59:24+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 22:59:24+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 22:49:39+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 22:45:01+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。

www.v2ex.com · 2026-04-21 22:32:59+08:00 · tech

阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。