显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432
显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432
https://mp.weixin.qq.com/s/XxNGiUwXlYm1g9I-v9vaHg 有没有出乎意料 9 个帖子 - 9 位参与者 阅读完整话题
如果发的 1男战3女,在贴个nfsw, 会不会抬走呢? 发帖也不是搞敏感话题,搞针对。就是纯水。知乎都能讨论,这里应该也可以???? 17 个帖子 - 14 位参与者 阅读完整话题
刚才让gpt5.5设计方案,突然蹦出来这么一句话,我试着用了下 结果发现直接给我画了方案的设计图?!情理之中意料之外啊,不知道是 Superpowers Brainstorming 这个skill的本来功能还是咋,属实把我惊艳了一把,我都不知道咋触发的 4 个帖子 - 3 位参与者 阅读完整话题
昨晚睡着了,没有优化agent团队,结果起来发现开发agent自己写了个提案,给Claude code看了一下,有点吃惊 3 个帖子 - 3 位参与者 阅读完整话题
刚公司通知要求前端也要开始学后端了 我们的世界真的越来越卷了 1 个帖子 - 1 位参与者 阅读完整话题
最近看L站的佬们都注册成功了,死去的心又萌芽了,于是乎就区注册了一下,不出意料的abc。但是这次诡异的是我查看钱包发现钱没退回来。用的是fiat24卡(扣了1,12刀) 想问一下佬们有没有遇见过这种情况,只遇到这种应该怎么办 8 个帖子 - 8 位参与者 阅读完整话题
4月30号申请的token plan,今天节后第一天注册领取了,意料之内的2亿保底token,各位佬有什么好的使用方法吗?平时编程用的gpt-5.5,和这个差别有多大? 10 个帖子 - 8 位参与者 阅读完整话题
最近试了一下小米的 MiMo 模型,体验出乎意料的好。 亮点: 中文理解能力很强,语义把握准确 回复速度快,体感延迟低 对话上下文保持得不错 免费额度够用,日常问答完全够 适合场景: 日常问答和知识查询 写作辅助和润色 代码简单调试 翻译和摘要 有佬友用过吗?感觉怎么样?求交流使用心得! 修正:之前写成 MiMi 了,正确是 MiMo,感谢佬友指正! 8 个帖子 - 7 位参与者 阅读完整话题
不知道佬们有没有和我一样的毛病——收藏书签的时候从来不分类,随手一个 Ctrl+D 就完事了。 日积月累下来,书签栏变成了这样: Gmail、YouTube、某个不知道什么时候存的github链接、chatGPT、学校教务系统、甚至还有一些不知道什么时候误触保存的垃圾书签…… 这就导致每次想找个之前收藏的东西,要么靠搜索,要么靠记忆翻半天。 突然想到:这活儿不是正好给 AI 干吗? Chrome 的书签本质上就是一个 JSON 文件,路径在: # Windows %LOCALAPPDATA%\Google\Chrome\User Data\Default\Bookmarks # macOS ~/Library/Application Support/Google/Chrome/Default/Bookmarks # Linux ~/.config/google-chrome/Default/Bookmarks 直接用文本编辑器打开就能看到结构,大概长这样: { "roots": { "bookmark_bar": { "children": [ { "name": "Gmail", "type": "url", "url": "..." }, { "name": "某个帖子", "type": "url", "url": "..." }, ... ] } } } 我是怎么做的 先关掉 Chrome 把 Bookmarks 文件的内容丢给 AI(我用的 Claude Code,其他 AI 工具也行) 告诉它: 帮我按内容分类,建文件夹整理 AI 会先分析所有书签的名称和 URL,提出分类方案让你确认 确认后它直接生成新的 JSON,替换原文件 重新打开 Chrome,搞定 几个小建议 操作前一定要备份! 复制一份 Bookmarks 文件改个名就行,万一翻车可以恢复(只不过不太可能 如果你书签特别多(几百上千),可以先让 AI 列出分类方案,确认后再执行,避免它自作主张 整理完 重启 Chrome 即可生效,不需要其他操作 适用场景 不限于 Chrome,其他基于 Chromium 的浏览器(Edge、Brave、Arc 等)书签格式基本一样。Firefox 的书签是 SQLite 数据库格式( places.sqlite ),理论上也能让 AI 处理,但操作稍微复杂一点。 说实话这个需求看起来很小,但用过之后才觉得真的舒服。毕竟谁的书签不是堆了几年的垃圾场呢 附上claudecode整理完的书签 26 个帖子 - 21 位参与者 阅读完整话题
闲来无事试了试gpt-image2生成二次元图片的效果,只能说远远超出了我的意料 3 个帖子 - 3 位参与者 阅读完整话题
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。
阿里、腾讯取消了 coding plan ,意料之中。当时为了引流大力推龙虾,一群人觉得龙虾牛逼的不行。 我当时安装试了试,龙虾真是消耗 token 并且没啥大产出的产品,消耗的 token 一大半都是浪费状态,完全没有产出有价值的东西。吹龙虾的不知道还有几个在用。 这些这些厂商也难了,被龙虾薅的不行了,都纷纷关 coding plan 了,改 token plan 了。还是 a 社聪明一开始就把这垃圾龙虾屏蔽了。