claude code 的一些节省token技巧自用分享

发布时间：2026-06-10T11:15:11+08:00 阅读：0 分类：tech

/context 查看当前token占用情况, 如果存在某个地方占比太多可尝试优化

若skills 加载过多, 可以尝试用过cc-switch 进行统一控制, 或者在头部加上 disable-model-invocation:true这样 skill 的描述不会进入上下文，只有用户手动调用时才会加载完整内容; user-invocable: false 可以用于skill在菜单的可见性
善用/init 总结项目, 如果claude.md太多, 可以按照设置rules/ 文件夹定义paths 参数, 控制特定路径下文件规则, 并且只会在匹配到paths时才加载进入上下文中
善用sub-agent; 保护主上下文的token占用; 对于一些比较基础的工作, 完全可以定义个对应的sub-agent, 然后指定便宜的model :haiku , mcp, skill 等属性 , 加载指定工具, 去节省token开支; 而且如果之前上下文已经启用了这个sub-agent, 后续还有相同的工作, 可以继续resume或者 SendMessage 复用之前的sub-agent
对于mcp 这个加载的占用token情况最严重 , 除非必要的mcp, 不然最好还是禁止加载,定义参数toolsearch: “ENABLE_TOOL_SEARCH”: “true” 交于claude code 控制加载; 以及需要的时候在定义在当前项目的json文件中; 然后如果存在对应的cli 工具, 建议直接诶使用cli 工具提供的skill, 将其token占用进一步收敛, 毕竟skill也是按需加载, 需要的时候才会把上下文加载进去;
建议多手动**/compact** , 在70/80 % 时, 可以手动总结, 防止模型失智; 并且可以自定义相关hooks 在新模型中自动加载之前上下文总结内容, 预防新开窗口失忆 (这个后续hooks可以新开一篇详细说说)
市面上也有相关的工具, 例如rtk 精简命令执行; caveman 简化输出风格; 或者直接/config 自定义一个Output style;

1 个帖子 - 1 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文

延伸阅读