目前 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-12 10:04:35+08:00 · tech

目前还是只有国内版，望周知 1 个帖子 - 1 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-12 10:00:19+08:00 · tech

本人情况：大三下二本目前正在进行第三段实习不过三个都是小公司都是做的Java后端、同时也有一些开源贡献，nacos、cc switch、cc gui 等等基本上是一直在coding的薪资情况：武汉 150/天 → 杭州 200/天 → 杭州 250/天这是我这三次实习的薪资个人觉得薪资有点太低了，当初选这个专业一半为了感兴趣一半是为了就业高薪，我还没接触过正式工的谈薪阶段，目前拿到最高的是北京450/天的实习，以后正式工的薪资也是这么廉价嘛，同时，我的秋招大概谈到多少薪资比较合适呢，求解疑～ 6 个帖子 - 6 位参与者阅读完整话题

V2EX - 技术 · 2026-06-12 09:54:53+08:00 · tech

在昨天研究 qwen3.6-27B 的优化时，看到了这个问题： server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是，因为 llama.cpp 的缓存巡回逻辑有问题，导致你 n 次调用大模型（ n>1 ）时，大概率 llama.cpp 找不到之前的对话，会从头再次 prefill 你的对话全文。翻译成大白话讲，就是你对一个人，每多说一句话，就要从第一句开始重复一遍。更为悲惨的是：在 5 月份，llama.cpp 制作组引入了另外一个 checkpoint 逻辑，使得缓存巡回性能再次下降： Commit e98cb51 经过此帖中大神实测，NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时，上下文 50K 的长度下，每次请求 LLM 都会浪费 40 秒： 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是，目前的 llama.cpp+qwen3.6-27B 这个组合，在 Agent 工具这个场景下，性能不可用。目前此 issues 还是 open 状态，待修复。

v2ex · 2026-06-12 09:54:53+08:00 · tech

在昨天研究 qwen3.6-27B 的优化时，看到了这个问题： server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是，因为 llama.cpp 的缓存巡回逻辑有问题，导致你 n 次调用大模型（ n>1 ）时，大概率 llama.cpp 找不到之前的对话，会从头再次 prefill 你的对话全文。翻译成大白话讲，就是你对一个人，每多说一句话，就要从第一句开始重复一遍。更为悲惨的是：在 5 月份，llama.cpp 制作组引入了另外一个 checkpoint 逻辑，使得缓存巡回性能再次下降： Commit e98cb51 经过此帖中大神实测，NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时，上下文 50K 的长度下，每次请求 LLM 都会浪费 40 秒： 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是，目前的 llama.cpp+qwen3.6-27B 这个组合，在 Agent 工具这个场景下，性能不可用。目前此 issues 还是 open 状态，待修复。

giffgaff实体卡激活后收不到任何短信

LinuxDo 最新话题 · 2026-06-12 09:53:30+08:00 · tech

giffgaff实体卡，已在6.11日官网激活，但没收到官方短信目前插在苹果12上，信号满格，运营商选择中国移动，已开启数据漫游，关了蜂窝网络尝试向43030和2020发送NUMBER但没有回信尝试通过国内手机号发短信，但是giffgaff依旧收不到官网登录时的验证码也接不到，只能通过邮箱验证码登录 9 个帖子 - 6 位参与者阅读完整话题

高强度使用 Web Pro 模型是否会导致降智？

LinuxDo 最新话题 · 2026-06-12 09:51:36+08:00 · tech

从关于反代 ChatGPT 网页 Pro 模型的降智问题继续讨论。目前我怀疑降智的原因只剩下两个：一个是 IP 的问题，一个是使用量过大的问题。目前我的 Pro 模型使用量大概是一天 50 次左右，我用的是 Pro 20x。我现在的情况是，两并发就会降智，一并发偶尔也会降智。所以我想问问其他的佬友，高强度使用会不会也遇到降智的情况（就在 IP 特别稳定的情况下）？补充一下，我试了香港、台湾还有美国的真家宽，都无一例外地有降智的情况，但是我也没法排除不是 IP 的问题，因为我不知道是不是我的几个 IP 都被 OpenAI 标记了，之前有过自动化的操作。 1 个帖子 - 1 位参与者阅读完整话题

V2EX - 技术 · 2026-06-12 09:35:47+08:00 · tech

在昨天研究 qwen3.6-27B 的优化时，看到了这个问题： server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是，因为 llama.cpp 的缓存巡回逻辑有问题，导致你 n 次调用大模型（ n>1 ）时，大概率 llama.cpp 找不到之前的对话，会从头再次 prefill 你的对话全文。翻译成大白话讲，就是你对一个人，每多说一句话，就要从第一句开始重复一遍。更为悲惨的是：在 5 月份，llama.cpp 制作组引入了另外一个 checkpoint 逻辑，使得缓存巡回性能再次下降： Commit e98cb51 经过此帖中大神实测，NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时，上下文 50K 的长度下，每次请求 LLM 都会浪费 40 秒： 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是，目前的 llama.cpp+qwen3.6-27B 这个组合，在 Agent 工具这个场景下，性能不可用。目前此 issues 还是 open 状态，待修复。

v2ex · 2026-06-12 09:32:36+08:00 · tech

在昨天研究 qwen3.6-27B 的优化时，看到了这个问题： server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是，因为 llama.cpp 的缓存巡回逻辑有问题，导致你 n 次调用大模型（ n>1 ）时，大概率 llama.cpp 找不到之前的对话，会从头再次 prefill 你的对话全文。翻译成大白话讲，就是你对一个人，每多说一句话，就要从第一句开始重复一遍。更为悲惨的是：在 5 月份，llama.cpp 制作组引入了另外一个 checkpoint 逻辑，使得缓存巡回性能再次下降： Commit e98cb51 经过此帖中大神实测，NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时，上下文 50K 的长度下，每次请求 LLM 都会浪费 40 秒： 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是，目前的 llama.cpp+qwen3.6-27B 这个组合，在 Agent 工具这个场景下，性能不可用。目前此 issues 还是 open 状态，待修复。

V2EX - 技术 · 2026-06-12 09:26:27+08:00 · tech

在昨天研究 qwen3.6-27B 的优化时，看到了这个问题： server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是，因为 llama.cpp 的缓存巡回逻辑有问题，导致你 n 次调用大模型（ n>1 ）时，大概率 llama.cpp 找不到之前的对话，会从头再次 prefill 你的对话全文。翻译成大白话讲，就是你对一个人，每多说一句话，就要从第一句开始重复一遍。更为悲惨的是：在 5 月份，llama.cpp 制作组引入了另外一个 checkpoint 逻辑，使得缓存巡回性能再次下降： Commit e98cb51 经过此帖中大神实测，NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时，上下文 50K 的长度下，每次请求 LLM 都会浪费 40 秒： 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是，目前的 llama.cpp+qwen3.6-27B 这个组合，在 Agent 工具这个场景下，性能不可用。目前此 issues 还是 open 状态，待修复。

相关专题

今天土区Plus499续费了，下个周期显示还是499

LinuxDo 最新话题 · 2026-06-12 09:19:49+08:00 · tech

佬友们，喜闻乐见，土区GPT今天续费还是499，照目前看来，下个周期也是499，但是不知道还能维持几个月。按照其他佬友经验，应该快发邮件了。建议里拉不要一次充太多了。 1 个帖子 - 1 位参与者阅读完整话题

fable5怎么破限？

LinuxDo 最新话题 · 2026-06-12 01:31:18+08:00 · tech

目前手上的一个逆向项目，想用A/ 新的fable5分析一下，直接秒降智，有没有好用的破限方法？ 17 个帖子 - 14 位参与者阅读完整话题

相关专题

[升学咨询]：川某9，ECE专业，未来申香港的可能性大吗

LinuxDo 最新话题 · 2026-06-12 00:42:13+08:00 · tech

如题，学校这个专业不强，目前大二，暑假后大三，rank是在1/140，有一篇AWPL的独立一作，未来可能也继续走通信/计算电磁方向。目前的想法是去港大直博，但是港大的bar很高，同时香港我觉得太拥挤了~但是美国难申也不稳定。国内的话清北的组应该是可以去的，想问问各位佬，未来我可能学术界/业界是8:2的愿景，有没有佬在香港读书或者在国内高校的，可以给迷茫的小登一点建议 3 个帖子 - 3 位参与者阅读完整话题

让我看看any大善人fable的实力！！！

LinuxDo 最新话题 · 2026-06-11 23:52:50+08:00 · tech

目前让他审查了一个项目，等等看看质量如何？不知道能不能让我aha一下对于还没用上的佬，可以试试让codex帮你配置提示词：帮我看一下我的claude code配置。我用的anyrouter渠道，帮我看一下为什么我一直用不了。你帮我顺便在 Linux do以及相关的社区找一下相关的一个资讯，看看怎么用上 claude fable 5。我目前用anyrouter url，系统代理+tun模式，大家可以参考下 24 个帖子 - 21 位参与者阅读完整话题

相关专题

敌人从内部攻破：一个可能缓解Fable 5撞墙的小设置（目前已阵亡）

LinuxDo 最新话题 · 2026-06-11 23:20:14+08:00 · tech

众所周知，寓言5 开启了打地鼠游戏，看用户哪里不对就打哪里（其实哪里对也打），然后动不动就把章鱼48 扔你脸上恶心你一下。重要的是，你如果执行的是一个长时间任务，根本不知道它是从哪里悄悄变身章鱼战士的。所以你得到的编程/任务结果是一堆… 寓言章鱼？今天晚上，我又例行公事强制脱掉cc裤子，打上刺身/model claude-fable-5[1m]，然后开始分析我的一个病历档案（高危warning场景）。毫无意外，在经历了一会会的你侬我侬之后，Fable 5突然出现了金色传说，开始准备变身章鱼… “ 植物 ”！我放下手中的烟（假装），准备 ctrl+c c 再开一局。结果突然发现一句话：这啥意思？这是谁发的？发给谁的？寓言如何？难道是被蒸馏的DS 偷偷从内部给出的破解信号？于是我果断一个ESC伺候，打断了正在变身的克劳德。Interrrrrrrupted一个急刹车！！！然后飞速敲下/config，找到那行任天堂乱入 switch models，一声脆响的空格键，false去吧你！！！然后一声霸气的 **继续！**唆使寓言5继续讲寓言，结果，您猜怎么着儿？已经闷头15分钟了，寓言还是那个寓言，那叫一个地道儿 ~！ 16 个帖子 - 9 位参与者阅读完整话题

老ios这几个月开始不能通过旧版iTunes搜索下载以前没下载过的应用了，目前是不是只能安装巨魔来下载兼容旧版ios的应用了？

LinuxDo 最新话题 · 2026-06-11 22:55:37+08:00 · tech

以前没折腾过，只是想下载一些以前没下载过的应用（显示要求高的ios版本的） 4 个帖子 - 4 位参与者阅读完整话题

预测一下Gemini 3.5 Pro

LinuxDo 最新话题 · 2026-06-11 22:50:39+08:00 · tech

目前Gemini被群嘲“美国豆包”，5月仅发布Flash 3.5也让市场失望，有人认为谷歌已经严重掉队。我这段时间使用Flash 3.5近一个月，我认为作为一款轻量模型，他的提升是巨大的，能力已经可以媲美很多更大参数量的模型，这不仅让人联想，本月即将发布的Pro 3.5会不会再次冲击巅峰，成为今年的黑马？当前市场可能低估了谷歌的能力，但是他的技术基础是非常强大的，Claude也使用了谷歌TPU训练。所以对即将发布的新Pro模型，我还是很期待的，不知道大家怎么看，让我们一起预测一下。在 2026 年 5 月 19 日的 Google I/O 大会主题演讲中，谷歌首席执行官桑达尔·皮查伊在发布 Gemini 3.5 架构时亲自给出了官方时间线： “We’re also excited for Gemini 3.5 Pro. We are using it internally… and it will be coming next month.”（我们对 Gemini 3.5 Pro 感到非常兴奋。目前谷歌内部正在使用它，它展现了巨大的提升，并将在下个月面世。） 16 个帖子 - 15 位参与者阅读完整话题

相关专题

今年要去香港留学了，问下有那边的在校研究生身份的话能薅到什么羊毛吗

LinuxDo 最新话题 · 2026-06-11 22:38:06+08:00 · tech

如题目前主要在搞ai、编程、ai画画这类东西，比较想知道这方面有没有什么羊毛或者还有没有什么生活或者旅游方面的福利 3 个帖子 - 3 位参与者阅读完整话题

相关专题

macOS PD 虚拟机 PJ 请教

LinuxDo 最新话题 · 2026-06-11 22:36:55+08:00 · tech

话说各位佬目前 PD 虚拟机都用的是什么渠道的？破解？咸鱼？目前市面上有很多的破解版本。闲鱼上好多卖的也是破解版的，想着还是用破解版的吧。但是不知道有没有什么问题，有些站点感觉还是不太敢用。找了一个社区推荐的版本，比较新（26.3.1），传到 VT 上，是全绿的。想问问各位佬有没有什么建议。或者靠谱点的安装包，或者其他渠道。 2 个帖子 - 2 位参与者阅读完整话题

佬友们，问下关于国内编码套餐的

LinuxDo 最新话题 · 2026-06-11 22:14:12+08:00 · tech

佬友们，问下目前deepseekV4pro到底是什么水平，如何配合自家reasonix食用，能到什么程度，最近土耳其也涨价了，后面还是要回归国产，目前用过的国产模型只有kimi、MiniMax、MinMo、Qwen3.6、GML4.7，长期用的还是Kimi，MiniMax贼船是最近上的，目前想找一套合适国产套餐方案，其实是想Kimi + GML 5.1的，Kimi补充多模态跟做做前端，GML写后端，可是呢，这两模型的上下文太少了,GLM长期没货，而且听说很卡，前段时间又听说deepseekV4pro很强，也不知道真不真，其他模型就不考虑了，都是歪瓜裂枣，特别是MiniMax、MinMo，营销厉害，实际表现一言难尽，反正不适合用来写代码，养个龙虾勉强，属于模型界的卧龙凤雏了，各位佬友们有什么好的组合推荐或自己的搭建也可以来讨论，我每个月的预算大概就是200-300左右 3 个帖子 - 3 位参与者阅读完整话题

Fable 5 太敏感肌了吧，用来更新简历都不行

LinuxDo 最新话题 · 2026-06-11 21:34:58+08:00 · tech

下午用codex把目前的项目总结了一下形成了一个文档，然后晚上发现Any的Fable 5可以用，就让它帮我总结一下更新一下markdown格式的简历，然后就出现下面的提示，我的项目都是些深度学习的，或者一些全栈的后台网站，根本没有任何敏感的地方啊： 5 个帖子 - 5 位参与者阅读完整话题

相关专题

/tag/目前