/context 查看当前token占用情况, 如果存在某个地方占比太多可尝试优化 若 skills 加载过多, 可以尝试用过cc-switch 进行统一控制, 或者在头部加上 disable-model-invocation:true 这样 skill 的描述不会进入上下文,只有用户手动调用 时才会加载完整内容; user-invocable: false 可以用于skill在菜单的可见性 善用/init 总结项目, 如果claude.md太多, 可以按照设置 rules/ 文件夹定义paths 参数, 控制特定路径下文件规则, 并且只会在匹配到paths时才加载进入上下文中 善用 sub-agent ; 保护主上下文的token占用; 对于一些比较基础的工作, 完全可以定义个对应的sub-agent, 然后指定便宜的 model :haiku , mcp, skill 等属性 , 加载指定工具, 去节省token开支; 而且如果之前上下文已经启用了这个sub-agent, 后续还有相同的工作, 可以继续resume或者 SendMessage 复用之前的sub-agent 对于 mcp 这个加载的占用token情况最严重 , 除非必要的mcp, 不然最好还是禁止加载,定义参数toolsearch: “ENABLE_TOOL_SEARCH”: “true” 交于claude code 控制加载; 以及需要的时候在定义在当前项目的json文件中; 然后如果存在对应的cli 工具, 建议直接诶使用cli 工具提供的skill, 将其token占用进一步收敛, 毕竟skill也是按需加载, 需要的时候才会把上下文加载进去; 建议多手动**/compact** , 在70/80 % 时, 可以手动总结, 防止模型失智; 并且可以自定义相关hooks 在新模型中自动加载之前上下文总结内容, 预防新开窗口失忆 (这个后续hooks可以新开一篇详细说说) 市面上也有相关的工具, 例如 rtk 精简命令执行; caveman 简化输出风格; 或者直接/config 自定义一个 Output style; 1 个帖子 - 1 位参与者 阅读完整话题
在私密环境下语音输入法实在是太好用了,极大的节省了我的时间。不管是vibe还是快速的回复聊天。 个人主要是快速聊天、对话ai、vibe等。长文本写作不推荐使用语音输入。写作是一个需要给大脑时间加工的过程的。长加工也有助于记住信息,甚至手写更好。(DDL除外,我还给你输入呢,AI大人一键生成) 但找到一个好用的软件 太难了 ,我使用过如下: 秘塔回响(win) 微信输入法(ios) 迅飞(win) 智谱输入法(win) 但没有一款让人满意。 秘塔回响: 优点: 使用很方便,没有时长限制。不到半秒的输入都能响应。比如:好的、ok、行。在需要快速回复的时候真的很方便。 可以选择原封不动还是优化识别内容。 缺点: 他有个问答模式,不是输入而是ai对话。选中文字时触发,或ai自动触发。 准确率不行,尤其是中英混输的时候。 在pycharm里有bug,按右ctrl就会自动选择所有文字。然后触发对话(还没法关这个对话功能 产品经理你过来 ) 迅飞 2026年了,我想要语音输入我还得单开一个窗口?你是什么老东? 微信输入法 优点: 准确度还行 缺点: 好像没法自定义快捷键?而且输入时强制静音,听歌人无法接受。 自定义项太少了 它不是输入法!! * 智谱输入法(win) 优点: 输入相当准确。也支持加自定义词。 能自定义不同身份喵~,用于不同领域或用途喵~(自动猫娘化 ) 能直接写提示词,美化识别内容还是原封不动都行。 缺点: 输入反应慢,最长的时候将近一秒;有时说了一长串,但是出错了,那你再说一次吧。(这次我还出错~) 有最短语音长度要求,我就说个ok,但是得按键1秒多。。太痛苦了。 综上,有啥好用的吗? github虽然上有一堆,但是参差不齐的。虽然可以挨个试试,但为什么不来问问万能的佬呢! 4 个帖子 - 4 位参与者 阅读完整话题
codex怎样使用能降低token量?怎样能节省话题处理时间 1 个帖子 - 1 位参与者 阅读完整话题
大家拼车都是为了啥?节省成本?用来vibe coding? 顺便吐槽下和我合租两个claude max5x车友,第一个合租一半跳车了不用退款,第二个把钱给我就查无此人。。。 2 个帖子 - 2 位参与者 阅读完整话题
试了下这功能,本质感觉就是先排个计划然后多路并行,节省等待时间,质量其实没啥区别,缺点就是起几个子agent是它帮你一开始决定的,不像agents team自己控制。但是简单任务也用max effort实在是有点慢 高强度使用了一天我算了下token花了120刀,说实话真不便宜。我个人觉得修bug什么没必要用,贵又慢,没什么优势。适合完整一个feature开发或者代码重构 1 个帖子 - 1 位参与者 阅读完整话题
大致感受罗列了下 内容压得很实,没有太多无效信息,跟 linux 一样节省空间 网站 UI 风格维持稳定,但完全不觉得落后时代 有很多花了心思的设计,比如深度嵌入的经济系统、说人话的说明文档、给人测试用的沙盒节点……有种 linux 的雕琢感,比那些粗糙的套壳论坛真的好很多 不知有跟我一样感受的嘛
6.1儿童节快乐,没什么福利可发,把在网站上节省来的钱做成口令红包给大家了,金额不大,拼手气吧 口令【六一儿童节快乐佬们】 没领到的佬友也不要担心,我发现 送10个openai接码(不能二验),一次性 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO 送10个openai接码(不能二验),一次性 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO 总共都没到20层,后面的我就挪到这里来了,21楼、34楼、55楼、89楼、144楼私我领码子。 30 个帖子 - 30 位参与者 阅读完整话题
大致感受罗列了下 内容压得很实,没有太多无效信息,跟 linux 一样节省空间 网站 UI 风格维持稳定,但完全不觉得落后时代 有很多花了心思的设计,比如深度嵌入的经济系统、说人话的说明文档、给人测试用的沙盒节点……有种 linux 的雕琢感,比那些粗糙的套壳论坛真的好很多 不知有跟我一样感受的嘛
大致感受罗列了下 内容压得很实,没有太多无效信息,跟 linux 一样节省空间 网站 UI 风格维持稳定,但完全不觉得落后时代 有很多花了心思的设计,比如深度嵌入的经济系统、说人话的说明文档、给人测试用的沙盒节点……有种 linux 的雕琢感,比那些粗糙的套壳论坛真的好很多 不知有跟我一样感受的嘛
大致感受罗列了下 内容压得很实,没有太多无效信息,跟 linux 一样节省空间 网站 UI 风格维持稳定,但完全不觉得落后时代 有很多花了心思的设计,比如深度嵌入的经济系统、说人话的说明文档、给人测试用的沙盒节点……有种 linux 的雕琢感,比那些粗糙的套壳论坛真的好很多 不知有跟我一样感受的嘛
大致感受罗列了下 内容压得很实,没有太多无效信息,跟 linux 一样节省空间 网站 UI 风格维持稳定,但完全不觉得落后时代 有很多花了心思的设计,比如深度嵌入的经济系统、说人话的说明文档、给人测试用的沙盒节点……有种 linux 的雕琢感,比那些粗糙的套壳论坛真的好很多 不知有跟我一样感受的嘛
最近在使用国产大模型和国外大模型,想知道在使用过程中你们觉得那个模型更好用更节省token? 8 个帖子 - 7 位参与者 阅读完整话题
本人是做SRC的,之前一直用claude辅助,节省了很多时间。这次一更新提到任何相关方面的词立马被截断。。真的是神人更新,去官网提交合规申请白名单,给以往的赏金记录摆出来都不给过。。真服了 1 个帖子 - 1 位参与者 阅读完整话题
RT,用的中转站烧CC,按请求次数计费,烧的有点过于快了,目前自己主要用来写科研的项目,想问问有什么办法可以节省一些吗 4 个帖子 - 3 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 start 介绍 这是一个轻量化同时让你的订阅物尽其用的harness 工作流。 github.com GitHub - DoraemonHugU/oh-my-harness 通过在 GitHub 上创建帐户来为 DoraemonHugU/oh-my-harness 开发做出贡献。 下文称为 OMH 首先OMH是一个依靠Github PR的工作流,他借助了订阅中其他可以使用的额度来节省我们的必要的代码修改的codex额度。 在实际开发中,一个GPT plus订阅 + opencode go套餐就可以完成很不错的项目。 当前阶段我只做了Codex和Opencode支持,正在做其他平台的适配,如果有佬友对这个项目有兴趣,欢迎提交PR。 轻量化的OMH OMH 只有四个 skill。 核心SKILL: harness harness 核心循环: 1.收集信息(只读) → 2.制定plan(计划可写) → 3.实现plan(代码可写) → 4.审查实现(只读) → 5.反馈调整(默认可能回到1,2,3甚至4阶段) 辅助 SKILL(常规情况下,开发者不需要了解该三个skill的存在) 来自 mattpocock 的 tdd skill的修改版本: 提供tdd开发策略。 来自 superpowers 的 systematic-debugging 和 receving-code-review skill的适配版本: 提供debug能力和接受代码审查的能力。 我的开发理念促生了OMH工作流 当下我们知道 harness 理念正火。 我对harness的理解就如上面所说的。 我的vibe coding的看法 让每个plan目标清晰明确。 一个plan你可以做多个事情,但前提是plan明确清晰,最佳策略还是一次plan一个任务。 这个产生于 PR 开发。 一个PR一般都任务很清晰,同时只做一个事情。 但是我为了提高效率,我一般会将几个小任务打包成一个实现pr,但是每个子任务都很明确。 放弃在主分支上直接进行实现。 改用分支(worktrees)进行实现 分支开发的优点: 不会影响主分支。 当任务实现我们不认可时,我们可以轻松的回退之前的版本。 支持更清晰的并发开发。 例如两个模块是无关的,我们可以一个分支开发A,一个开发B。 古人云: 知己知彼百战百胜 知彼: 任务开始前,先进行信息收集。假设你要开始一件任务,你应该先去收集该任务的信息。 我喜欢主agent自己收集+子代理作为补充。 此时产生的是最纯净的上下文信息。 Q: 为什么是最纯净的上下文信息? (点击了解更多详细信息) 知己: 己是agent和我, agent负责写代码。 我们要做的是知道agent和我协作能解决什么问题? 怎么和他交流? 他可能会踩什么坑? 等等。 这依赖我们对于agent的了解。 在我的看法中,要完成一个任务,你首先要做的就是收集足够清晰的信息。 信息不足,未来就会掉坑里。 更少的上下文腐败 >> 持有更长的上下文 多 agent 并发并不一定就更优。 不同目标清晰才是 比如之前的我,喜欢让多个agent讨论辨析,但事实情况好像是三个臭皮匠一讨论好像更臭了。 一个agent听了另一个agent的说法,就盲信了, 不信的话又需要重新的进行验证, 而多agent讨论出来的结果还会倾向于复杂化, 这在一些开发中是很不好的。 但在一些任务中,你应该依赖多agent去不同方向进行审查或者信息搜集,例如一个审查代码bug,一个审查静默失败等。 这样是多agent的合理用法。 如果可以,构建你的测试 因为 agent 是个react,只要你能找到问题并能进行反馈,那agent就可以开始进行修复。 考虑合适的工具进行e2e测试。 如果你的项目实现了合适的自我反馈的测试工具,那么agent就可以自动的修复工作。 合理分配不同阶段的模型 计划阶段需要强大的模型,实现阶段只需要次旗舰。 审查阶段应该是一个审查偏好的模型(未必是旗舰,因为旗舰模型写代码好,但是审查未必强) 让你的订阅物尽其用(以ChatGPT plus订阅为例) Q: 我们购买了订阅,但是订阅都包含什么东西? A: plus具有抠搜的codex额度,但同时具有慷慨的每周三千次的网页端的5.5 thk模型的调用以及对个人开发而言够用的 codex review 云端审查(20-50/5h,仅有5h限制,不和codex额度共享。且由gpt 5.3 codex驱动) Q: 我们的订阅,如果我们用于编程,都花在了什么阶段? A: 1。 在生成plan之前的讨论是大头(对应harness的收集信息和制定plan阶段),我们在这个阶段,Agent需要多轮的工具调用和生成回答, 对话导致变长的上下文更加剧的token的消耗。 2。 没有按照 harness 工程导致的代码质量差,最终导致的返工产生的消耗。 你阐述了你的需求,但未来实现忘掉了你的需求 或者 你没有审查你的impl是否对齐了你的需求 你可能没有遵循 harness 循环。 3。 你的review阶段agent的消耗。 review阶段会是一个新的agent,reviewer会冷启动,不会利用你的上下文缓存,导致了你的花费。 4。 你的实现阶段, 这是一个较少的消耗。 因为在具有清晰的plan时,agent的实现将会目标清晰,是项目开发的必要消耗而非浪费。 Q: 基于上述的问题,我们应该怎么节省我们的token并发挥最大效果? A: 解耦,让 harness 的不同阶段采用不同的策略。 我们可以看到 harness 循环, 1和2阶段是一种只读状态。 它无需进行代码修改。那为什么我们要用codex? 与其我们不舍得使用codex的gpt 5.5 进行探索讨论。 为什么我们不把这个工作放到 GPT web端? web端慷慨的5.5额度,而我们又不需要本地代码的修改。 而我们只需要该阶段生成任务plan。 3阶段,是一个必要的本地代码修改。在具有清晰的plan后,我们可以选择任何一个agent工具,无论是Codex还是cc接手plan,而且此时你可以选择一个 次旗舰模型 去实现plan,来实现更低的消耗。 例如我会选择gpt 5.4(他的额度是gpt 5.5的2倍,甚至我可以选择gpt 5.3 codex模型,又或者你可以选择ds模型作为worker,他会带来更低的消耗) 4阶段, 这也是个只读任务。 所以我们不需要用 codex 额度进行review。 Q: 如何使用上一个问题的策略那? A: 策略: 只读操作不在codex中进行。 只在codex进行必要的编码 在1和2阶段,我们可以使用GPT web端 + github 连接器连接到我们的私有仓库,进行只读操作,然后可以生成PR以及对应的PR的plan。 (不建议直接使用连接器进行修改代码,因为他不能patch修改,只能重写,这样代码质量会很低)。 类似的Grok,notion和claude等也可以使用连接器链接到github仓库用于分析生成plan。 在3阶段,在本地的codex中使用 $harness 接手 pr11任务 。 他就会拉取分支并读取plan并进行一次信息确定,然后开始实现任务, 实现后会自动触发云端的codex review。 4审查阶段, 审查的情况就交给云端的codex review,而不需要本地审查的token花费,且审查通常在10分钟内即可返回,此时本地的codex只需要耐心的等待即可。 我的经历和经验,废话太多了我就隐藏了, 未来有时间给佬友们好好分享下我的经验 (点击了解更多详细信息) OMH使用流程: 1。 首先你按照教程,用gpt,claude,grok 的web端链接到github 连接器。并绑定你当前的开发项目。并用 npx @doraemon-hug-u/oh-my-harness 初始化你的仓库。 OMH绑定仓库后 未来你的使用只需要在web端生成pr或者plan。 然后在本地的codex或者opencode调用harness skill并要求接手plan即可。 致谢 感谢 superpowers 和 mattpocock 社区提供的优秀的skill。 结尾 第一次写这个东西,难免写的不好,还望佬友们见谅。 项目问题以及关于我的上述讲述的问题,大家有任何疑问,欢迎佬友们在下面评论,我会逐个解答,并进行完善 如果有佬友对这个项目感兴趣,欢迎并感谢佬友们进行star,再次谢谢大家。 如果你对 harness 开发有自己的见解,欢迎评论区讨论或者提交PR,我们共同打磨这套工作流。 4 个帖子 - 3 位参与者 阅读完整话题
GPT5.5 是真的好用,就是额度太少了,用一用就没有了. 然后我就想GPT5.5 生成规划 分成多个Phase 由国产模型DeepSeek V4 Pro 进行代码编写干活 然后让GPT5.5 再逐个Phase验收 就生成了两个 Skill 一个Planner 一个Qa 但是实际用下来DeepSeek V4 Pro 达不到GPT的聪明,倒也能完成任务,只是需要Qa检验然后再反馈给DeepSeek修复,大概反复3-5轮即可通过 进行下一个Phase 但是有个新的问题出现,似乎这并没有起到节省Token的作用? 这样搭配下来 DeepSeek帮我完成了 2个Phase GPT帮我规划+反复Qa验收并指出问题 目前GPT5小时限额还有9% DeepSeek 花了7块钱 用了两三个小时时间 而全程用GPT5.5估计也是同样的消耗 并且也用不了这么长时间? 因为只是简单的建表+RBAC. 总觉得这是增本降效? 有大佬分享一下实际的工作流吗? 给老弟学习一下? 纯国产 或者纯CodeX 或者Claude 或者任意搭配 都可以 主要是想真正学点节省Token的开发流程. 中转站就别来回复了,我用到自会站内寻找. 16 个帖子 - 11 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 最近在看《凡人修仙传》的时候,感觉剧情太拖沓,注水字数太多 ,对于正本书几百万字来说剧情推进太慢。 所以就想做一个“网文脱水器”,只保留核心人物的剧情和剧情,将注水部分通过ai脱水,节省阅读时间(更好的摸鱼)。 系统设定为至少脱水70%的文字,除此之外的优点有: 只适用于超长的注水网文,文学作品还是推荐正常阅读。 目前只测试了《凡人》的前1000章,还不是很完善。新手vibe的第一个项目,大佬轻喷 项目地址: GitHub - SilenceX9/novel-dehydrator: AI-powered tool to condense Chinese web novels into fast-read summaries · 用 AI 把长篇网文脱水成精华速读版 · GitHub 5 个帖子 - 5 位参与者 阅读完整话题
IT之家 5 月 22 日消息,AI 光学基础设施企业 Lightmatter 美国当地时间 21 日公布了业界首款液冷激光网卡 Guide DR,宣称其 可较传统外部激光小型可插拔模块 (ELSFP) 节省 75% 的机架占用 。该产品将于 2026Q4 出样。 Guide DR 将数十个激光器集成到一个尺寸符合 OCP NIC 3.0 标准的液冷式机箱内模块中,输出端配备行业标准的可插拔光纤连接器。 其最多可通过 64 根光纤驱动 256 条 200Gbps 通道 ,并为每根光纤提供 200 mW 的光功率。这意味着在 1RU 高度内部署四个 Guide DR 模块即可实现 204.8 Tbps 的 CPO 规模化交换带宽,而 传统 ELSFP 方案达成同等带宽需要 4RU 的空间 。
5月22日,据彭博社报道,埃隆·马斯克(Elon Musk)将SpaceX、xAI和X公司重组为一个紧密关联的企业集团,此举已经带来了可观的财务收益:每年节省近10亿美元的利息支出。周三,就在SpaceX开启历史性的IPO前,该公司提交的监管文件显示,它已从银行获得了一笔200亿美元的过桥贷款,这笔资金将被用来偿还马斯克的社交媒体和AI公司所承担的175亿美元高息垃圾债务。 马斯克 也就是说,马斯克利用优质资产(SpaceX)的低息融资,为高息资产(X和xAI的垃圾债)进行再融资或还款。 文件显示,截至今年3月31日,这笔过桥贷款的实际利率为4.58%,远低于X和xAI所承担的垃圾债券和杠杆贷款的利率,后者的利率高达12.5%。据彭博社计算,综合来看,这一操作使马斯克公司每年承担的总利息成本大约减半,降至约9亿美元。 马斯克经常利用债务市场来收购或扩张自己的企业,他获得了数十亿美元的银行授信,并设计了复杂的融资结构,但过程并非一帆风顺。他在2022年收购推特(后更名为X)的交易,使该公司背负了约125亿美元的债务,给华尔街银行带来了臭名昭著的“烫手债务”困境,导致这些银行最初无法将债务出售给投资者。不过,这些银行最终在去年成功出售了这一债务。 随后,马斯克的xAI在2025年3月收购了X,并于同年6月额外借款50亿美元。当SpaceX在今年2月收购xAI时,同时负责两家公司债务融资的摩根士丹利告诉现有贷款机构,这笔债务将全额偿还,但没有说明具体方式。 最终,SpaceX使用了来自多家银行的200亿美元贷款,这些银行包括高盛集团、美国银行、花旗集团、摩根大通和摩根士丹利。 查看评论
IT之家 5 月 22 日消息,据彭博社今日报道,埃隆 · 马斯克将 SpaceX、xAI 和 X 合并为集团企业后,已经带来了可观的意外之财: 每年节省近 10 亿美元(IT之家注:现汇率约合 68.11 亿元人民币)的利息 。 在 SpaceX 历史性 IPO 之前提交的监管文件显示,该公司从银行获得了 200 亿美元 (现汇率约合 1362.19 亿元人民币)的过桥贷款,这是 X 公司和 xAI 人工智能公司用于偿还 175 亿美元(现汇率约合 1191.92 亿元人民币)高息垃圾债务的资金来源。 也就是说,马斯克利用优质资产(SpaceX)的低息融资,为高息资产(X 和 xAI)进行再融资或还款。 文件显示,截至 2026 年 3 月 31 日, 这笔过桥贷款的实际利率为 4.58% ,远低于 X 和 xAI 所承担的垃圾债券和杠杆贷款的 12.5% 利率。据彭博社计算,综合来看,这一操作使马斯克公司每年承担的总利息成本大约减半,降至约 9 亿美元。