/context 查看当前token占用情况, 如果存在某个地方占比太多可尝试优化
-
若skills 加载过多, 可以尝试用过cc-switch 进行统一控制, 或者在头部加上
disable-model-invocation:true这样 skill 的描述不会进入上下文,只有用户手动调用 时才会加载完整内容;user-invocable: false可以用于skill在菜单的可见性 -
善用/init 总结项目, 如果claude.md太多, 可以按照设置rules/ 文件夹定义paths 参数, 控制特定路径下文件规则, 并且只会在匹配到paths时才加载进入上下文中
-
善用sub-agent; 保护主上下文的token占用; 对于一些比较基础的工作, 完全可以定义个对应的sub-agent, 然后指定便宜的
model :haiku, mcp, skill 等属性 , 加载指定工具, 去节省token开支; 而且如果之前上下文已经启用了这个sub-agent, 后续还有相同的工作, 可以继续resume或者 SendMessage 复用之前的sub-agent -
对于mcp 这个加载的占用token情况最严重 , 除非必要的mcp, 不然最好还是禁止加载,定义参数toolsearch:
“ENABLE_TOOL_SEARCH”: “true”交于claude code 控制加载; 以及需要的时候在定义在当前项目的json文件中; 然后如果存在对应的cli 工具, 建议直接诶使用cli 工具提供的skill, 将其token占用进一步收敛, 毕竟skill也是按需加载, 需要的时候才会把上下文加载进去; -
建议多手动**/compact** , 在70/80 % 时, 可以手动总结, 防止模型失智; 并且可以自定义相关hooks 在新模型中自动加载之前上下文总结内容, 预防新开窗口失忆 (这个后续hooks可以新开一篇详细说说)
-
市面上也有相关的工具, 例如
rtk精简命令执行;caveman简化输出风格; 或者直接/config 自定义一个Output style;
1 个帖子 - 1 位参与者