目前还是只有国内版,望周知 1 个帖子 - 1 位参与者 阅读完整话题
本人情况:大三下 二本 目前正在进行第三段实习 不过三个都是小公司 都是做的Java后端、同时也有一些开源贡献,nacos、cc switch、cc gui 等等 基本上是一直在coding的 薪资情况:武汉 150/天 → 杭州 200/天 → 杭州 250/天 这是我这三次实习的薪资 个人觉得薪资有点太低了,当初选这个专业 一半为了感兴趣 一半是为了就业高薪 ,我还没接触过正式工的谈薪阶段,目前拿到最高的是 北京450/天的实习,以后正式工的薪资也是这么廉价嘛,同时,我的秋招大概谈到多少薪资比较合适呢 ,求解疑~ 6 个帖子 - 6 位参与者 阅读完整话题
在昨天研究 qwen3.6-27B 的优化时,看到了这个问题: server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是,因为 llama.cpp 的缓存巡回逻辑有问题,导致你 n 次调用大模型( n>1 )时,大概率 llama.cpp 找不到之前的对话,会从头再次 prefill 你的对话全文。 翻译成大白话讲,就是你对一个人,每多说一句话,就要从第一句开始重复一遍。 更为悲惨的是: 在 5 月份,llama.cpp 制作组引入了另外一个 checkpoint 逻辑,使得缓存巡回性能再次下降: Commit e98cb51 经过此帖中大神实测,NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时,上下文 50K 的长度下,每次请求 LLM 都会浪费 40 秒: 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是,目前的 llama.cpp+qwen3.6-27B 这个组合,在 Agent 工具这个场景下,性能不可用。 目前此 issues 还是 open 状态,待修复。
在昨天研究 qwen3.6-27B 的优化时,看到了这个问题: server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是,因为 llama.cpp 的缓存巡回逻辑有问题,导致你 n 次调用大模型( n>1 )时,大概率 llama.cpp 找不到之前的对话,会从头再次 prefill 你的对话全文。 翻译成大白话讲,就是你对一个人,每多说一句话,就要从第一句开始重复一遍。 更为悲惨的是: 在 5 月份,llama.cpp 制作组引入了另外一个 checkpoint 逻辑,使得缓存巡回性能再次下降: Commit e98cb51 经过此帖中大神实测,NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时,上下文 50K 的长度下,每次请求 LLM 都会浪费 40 秒: 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是,目前的 llama.cpp+qwen3.6-27B 这个组合,在 Agent 工具这个场景下,性能不可用。 目前此 issues 还是 open 状态,待修复。
giffgaff实体卡,已在6.11日官网激活,但没收到官方短信 目前插在苹果12上,信号满格,运营商选择中国移动,已开启数据漫游,关了蜂窝网络 尝试向43030和2020发送NUMBER但没有回信 尝试通过国内手机号发短信,但是giffgaff依旧收不到 官网登录时的验证码也接不到,只能通过邮箱验证码登录 9 个帖子 - 6 位参与者 阅读完整话题
从 关于反代 ChatGPT 网页 Pro 模型的降智问题 继续讨论。 目前我怀疑降智的原因只剩下两个:一个是 IP 的问题,一个是使用量过大的问题。 目前我的 Pro 模型使用量大概是一天 50 次左右,我用的是 Pro 20x。我现在的情况是,两并发就会降智,一并发偶尔也会降智。 所以我想问问其他的佬友,高强度使用会不会也遇到降智的情况(就在 IP 特别稳定的情况下)? 补充一下,我试了香港、台湾还有美国的真家宽,都无一例外地有降智的情况,但是我也没法排除不是 IP 的问题,因为我不知道是不是我的几个 IP 都被 OpenAI 标记了,之前有过自动化的操作。 1 个帖子 - 1 位参与者 阅读完整话题
在昨天研究 qwen3.6-27B 的优化时,看到了这个问题: server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是,因为 llama.cpp 的缓存巡回逻辑有问题,导致你 n 次调用大模型( n>1 )时,大概率 llama.cpp 找不到之前的对话,会从头再次 prefill 你的对话全文。 翻译成大白话讲,就是你对一个人,每多说一句话,就要从第一句开始重复一遍。 更为悲惨的是: 在 5 月份,llama.cpp 制作组引入了另外一个 checkpoint 逻辑,使得缓存巡回性能再次下降: Commit e98cb51 经过此帖中大神实测,NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时,上下文 50K 的长度下,每次请求 LLM 都会浪费 40 秒: 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是,目前的 llama.cpp+qwen3.6-27B 这个组合,在 Agent 工具这个场景下,性能不可用。 目前此 issues 还是 open 状态,待修复。
在昨天研究 qwen3.6-27B 的优化时,看到了这个问题: server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是,因为 llama.cpp 的缓存巡回逻辑有问题,导致你 n 次调用大模型( n>1 )时,大概率 llama.cpp 找不到之前的对话,会从头再次 prefill 你的对话全文。 翻译成大白话讲,就是你对一个人,每多说一句话,就要从第一句开始重复一遍。 更为悲惨的是: 在 5 月份,llama.cpp 制作组引入了另外一个 checkpoint 逻辑,使得缓存巡回性能再次下降: Commit e98cb51 经过此帖中大神实测,NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时,上下文 50K 的长度下,每次请求 LLM 都会浪费 40 秒: 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是,目前的 llama.cpp+qwen3.6-27B 这个组合,在 Agent 工具这个场景下,性能不可用。 目前此 issues 还是 open 状态,待修复。
在昨天研究 qwen3.6-27B 的优化时,看到了这个问题: server: fix context checkpoint restore for hybrid/recurrent models (DeltaNet/Mamba) 大概意思就是,因为 llama.cpp 的缓存巡回逻辑有问题,导致你 n 次调用大模型( n>1 )时,大概率 llama.cpp 找不到之前的对话,会从头再次 prefill 你的对话全文。 翻译成大白话讲,就是你对一个人,每多说一句话,就要从第一句开始重复一遍。 更为悲惨的是: 在 5 月份,llama.cpp 制作组引入了另外一个 checkpoint 逻辑,使得缓存巡回性能再次下降: Commit e98cb51 经过此帖中大神实测,NVIDIA RTX PRO 6000 Blackwell 在运行 qwen3.6-27B Q8 时,上下文 50K 的长度下,每次请求 LLM 都会浪费 40 秒: 3 consecutive full re-processings logged: ┌───────────┬────────────────────┬───────┐ │ Turn │ Tokens reprocessed │ Time │ ├───────────┼────────────────────┼───────┤ │ Task 2795 │ 67,608 │ 38.4s │ ├───────────┼────────────────────┼───────┤ │ Task 3241 │ 71,211 │ 41.0s │ ├───────────┼────────────────────┼───────┤ │ Task 3401 │ 71,105 │ 41.4s │ └───────────┴────────────────────┴───────┘ Root cause visible in logs: The new prompt is ~19k tokens, but all checkpoints sit at positions 39k–71k (from previous longer requests). Every checkpoint is checked against 19340 and rejected because they're all beyond the new prompt length. Result: 0 usable checkpoints → full reprocess from BOS. 结论是,目前的 llama.cpp+qwen3.6-27B 这个组合,在 Agent 工具这个场景下,性能不可用。 目前此 issues 还是 open 状态,待修复。
佬友们,喜闻乐见,土区GPT今天续费还是499,照目前看来,下个周期也是499,但是不知道还能维持几个月。按照其他佬友经验,应该快发邮件了。建议里拉不要一次充太多了。 1 个帖子 - 1 位参与者 阅读完整话题
目前手上的一个逆向项目,想用A/ 新的fable5分析一下,直接秒降智,有没有好用的破限方法? 17 个帖子 - 14 位参与者 阅读完整话题
如题,学校这个专业不强,目前大二,暑假后大三,rank是在1/140,有一篇AWPL的独立一作,未来可能也继续走通信/计算电磁方向。 目前的想法是去港大直博,但是港大的bar很高,同时香港我觉得太拥挤了~但是美国难申也不稳定。国内的话清北的组应该是可以去的,想问问各位佬,未来我可能学术界/业界是8:2的愿景,有没有佬在香港读书或者在国内高校的,可以给迷茫的小登一点建议 3 个帖子 - 3 位参与者 阅读完整话题
目前让他审查了一个项目,等等看看质量如何?不知道能不能让我aha一下 对于还没用上的佬,可以试试让codex帮你配置 提示词: 帮我看一下我的claude code配置。我用的anyrouter渠道,帮我看一下为什么我一直用不了。你帮我顺便在 Linux do以及相关的社区找一下相关的一个资讯,看看怎么用上 claude fable 5。 我目前用anyrouter url,系统代理+tun模式,大家可以参考下 24 个帖子 - 21 位参与者 阅读完整话题
众所周知, 寓言5 开启了打地鼠游戏,看用户哪里不对就打哪里(其实哪里对也打),然后动不动就把 章鱼48 扔你脸上恶心你一下。重要的是,你如果执行的是一个长时间任务,根本不知道它是从哪里悄悄变身章鱼战士的。所以你得到的编程/任务结果是一堆… 寓言章鱼 ? 今天晚上,我又例行公事强制脱掉cc裤子,打上刺身/model claude-fable-5[1m],然后开始分析我的一个病历档案(高危warning场景)。毫无意外,在经历了一会会的你侬我侬之后,Fable 5突然出现了 金色传说 ,开始准备变身章鱼… “ 植物 ”!我放下手中的烟(假装),准备 ctrl+c c 再开一局。结果突然发现一句话: 这啥意思?这是谁发的?发给谁的?寓言如何? 难道是 被蒸馏的DS 偷偷从内部给出的破解信号? 于是我果断一个ESC伺候,打断了正在变身的克劳德。Interrrrrrrupted一个急刹车!!! 然后飞速敲下/config,找到那行 任天堂乱入 switch models,一声脆响的空格键,false去吧你!!! 然后一声霸气的 **继续!**唆使寓言5继续讲寓言,结果,您猜怎么着儿? 已经闷头15分钟了,寓言还是那个寓言, 那叫一个地道儿 ~! 16 个帖子 - 9 位参与者 阅读完整话题
以前没折腾过,只是想下载一些以前没下载过的应用(显示要求高的ios版本的) 4 个帖子 - 4 位参与者 阅读完整话题
目前Gemini被群嘲“美国豆包”,5月仅发布Flash 3.5也让市场失望,有人认为谷歌已经严重掉队。 我这段时间使用Flash 3.5近一个月,我认为作为一款轻量模型,他的提升是巨大的,能力已经可以媲美很多更大参数量的模型,这不仅让人联想,本月即将发布的Pro 3.5会不会再次冲击巅峰,成为今年的黑马? 当前市场可能低估了谷歌的能力,但是他的技术基础是非常强大的,Claude也使用了谷歌TPU训练。所以对即将发布的新Pro模型,我还是很期待的,不知道大家怎么看,让我们一起预测一下。 在 2026 年 5 月 19 日的 Google I/O 大会主题演讲中,谷歌首席执行官桑达尔·皮查伊在发布 Gemini 3.5 架构时亲自给出了官方时间线: “We’re also excited for Gemini 3.5 Pro. We are using it internally… and it will be coming next month.”(我们对 Gemini 3.5 Pro 感到非常兴奋。目前谷歌内部正在使用它,它展现了巨大的提升,并将在下个月面世。) 16 个帖子 - 15 位参与者 阅读完整话题
如题 目前主要在搞ai、编程、ai画画这类东西,比较想知道这方面有没有什么羊毛 或者还有没有什么生活或者旅游方面的福利 3 个帖子 - 3 位参与者 阅读完整话题
话说各位佬目前 PD 虚拟机都用的是什么渠道的? 破解? 咸鱼? 目前市面上有很多的破解版本。 闲鱼上好多卖的也是破解版的,想着还是用破解版的吧。 但是不知道有没有什么问题,有些站点感觉还是不太敢用。 找了一个社区推荐的版本,比较新(26.3.1),传到 VT 上,是全绿的。 想问问各位佬有没有什么建议。或者靠谱点的安装包,或者其他渠道。 2 个帖子 - 2 位参与者 阅读完整话题
佬友们,问下目前deepseekV4pro到底是什么水平,如何配合自家reasonix食用,能到什么程度,最近土耳其也涨价了,后面还是要回归国产,目前用过的国产模型只有kimi、MiniMax、MinMo、Qwen3.6、GML4.7,长期用的还是Kimi,MiniMax贼船是最近上的,目前想找一套合适国产套餐方案,其实是想Kimi + GML 5.1的,Kimi补充多模态跟做做前端,GML写后端,可是呢,这两模型的上下文太少了,GLM长期没货,而且听说很卡,前段时间又听说deepseekV4pro很强,也不知道真不真,其他模型就不考虑了,都是歪瓜裂枣,特别是MiniMax、MinMo,营销厉害,实际表现一言难尽,反正不适合用来写代码,养个龙虾勉强,属于模型界的卧龙凤雏了,各位佬友们有什么好的组合推荐或自己的搭建也可以来讨论,我每个月的预算大概就是200-300左右 3 个帖子 - 3 位参与者 阅读完整话题
下午用codex把目前的项目总结了一下形成了一个文档,然后晚上发现Any的Fable 5可以用,就让它帮我总结一下更新一下markdown格式的简历,然后就出现下面的提示,我的项目都是些深度学习的,或者一些全栈的后台网站,根本没有任何敏感的地方啊: 5 个帖子 - 5 位参与者 阅读完整话题