节省 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-10 11:15:11+08:00 · tech

/context 查看当前token占用情况, 如果存在某个地方占比太多可尝试优化若 skills 加载过多, 可以尝试用过cc-switch 进行统一控制, 或者在头部加上 disable-model-invocation:true 这样 skill 的描述不会进入上下文，只有用户手动调用时才会加载完整内容; user-invocable: false 可以用于skill在菜单的可见性善用/init 总结项目, 如果claude.md太多, 可以按照设置 rules/ 文件夹定义paths 参数, 控制特定路径下文件规则, 并且只会在匹配到paths时才加载进入上下文中善用 sub-agent ; 保护主上下文的token占用; 对于一些比较基础的工作, 完全可以定义个对应的sub-agent, 然后指定便宜的 model :haiku , mcp, skill 等属性 , 加载指定工具, 去节省token开支; 而且如果之前上下文已经启用了这个sub-agent, 后续还有相同的工作, 可以继续resume或者 SendMessage 复用之前的sub-agent 对于 mcp 这个加载的占用token情况最严重 , 除非必要的mcp, 不然最好还是禁止加载,定义参数toolsearch: “ENABLE_TOOL_SEARCH”: “true” 交于claude code 控制加载; 以及需要的时候在定义在当前项目的json文件中; 然后如果存在对应的cli 工具, 建议直接诶使用cli 工具提供的skill, 将其token占用进一步收敛, 毕竟skill也是按需加载, 需要的时候才会把上下文加载进去; 建议多手动**/compact** , 在70/80 % 时, 可以手动总结, 防止模型失智; 并且可以自定义相关hooks 在新模型中自动加载之前上下文总结内容, 预防新开窗口失忆 (这个后续hooks可以新开一篇详细说说) 市面上也有相关的工具, 例如 rtk 精简命令执行; caveman 简化输出风格; 或者直接/config 自定义一个 Output style; 1 个帖子 - 1 位参与者阅读完整话题

锐评近期用过的语音输入法，没一个省心的。

LinuxDo 最新话题 · 2026-06-09 11:49:49+08:00 · tech

在私密环境下语音输入法实在是太好用了，极大的节省了我的时间。不管是vibe还是快速的回复聊天。个人主要是快速聊天、对话ai、vibe等。长文本写作不推荐使用语音输入。写作是一个需要给大脑时间加工的过程的。长加工也有助于记住信息，甚至手写更好。（DDL除外，我还给你输入呢，AI大人一键生成）但找到一个好用的软件太难了，我使用过如下：秘塔回响（win）微信输入法（ios）迅飞（win）智谱输入法（win）但没有一款让人满意。秘塔回响：优点：使用很方便，没有时长限制。不到半秒的输入都能响应。比如：好的、ok、行。在需要快速回复的时候真的很方便。可以选择原封不动还是优化识别内容。缺点：他有个问答模式，不是输入而是ai对话。选中文字时触发，或ai自动触发。准确率不行，尤其是中英混输的时候。在pycharm里有bug，按右ctrl就会自动选择所有文字。然后触发对话（还没法关这个对话功能产品经理你过来）迅飞 2026年了，我想要语音输入我还得单开一个窗口？你是什么老东？微信输入法优点：准确度还行缺点：好像没法自定义快捷键？而且输入时强制静音，听歌人无法接受。自定义项太少了它不是输入法！！ * 智谱输入法（win）优点：输入相当准确。也支持加自定义词。能自定义不同身份喵~，用于不同领域或用途喵~（自动猫娘化）能直接写提示词，美化识别内容还是原封不动都行。缺点：输入反应慢，最长的时候将近一秒；有时说了一长串，但是出错了，那你再说一次吧。（这次我还出错~）有最短语音长度要求，我就说个ok，但是得按键1秒多。。太痛苦了。综上，有啥好用的吗？ github虽然上有一堆，但是参差不齐的。虽然可以挨个试试，但为什么不来问问万能的佬呢！ 4 个帖子 - 4 位参与者阅读完整话题

codex怎样使用能降低token量?怎样能节省话题处理时间

LinuxDo 最新话题 · 2026-06-08 13:25:46+08:00 · tech

codex怎样使用能降低token量?怎样能节省话题处理时间 1 个帖子 - 1 位参与者阅读完整话题

相关专题

大家拼车都是用来干嘛的

LinuxDo 最新话题 · 2026-06-04 10:41:48+08:00 · tech

大家拼车都是为了啥？节省成本？用来vibe coding？顺便吐槽下和我合租两个claude max5x车友，第一个合租一半跳车了不用退款，第二个把钱给我就查无此人。。。 2 个帖子 - 2 位参与者阅读完整话题

Claude code的动态workflow感觉就是用token换速度

LinuxDo 最新话题 · 2026-06-03 23:11:14+08:00 · tech

试了下这功能，本质感觉就是先排个计划然后多路并行，节省等待时间，质量其实没啥区别，缺点就是起几个子agent是它帮你一开始决定的，不像agents team自己控制。但是简单任务也用max effort实在是有点慢高强度使用了一天我算了下token花了120刀，说实话真不便宜。我个人觉得修bug什么没必要用，贵又慢，没什么优势。适合完整一个feature开发或者代码重构 1 个帖子 - 1 位参与者阅读完整话题

[V2EX] 感觉 V2EX 设计很像 Linux ，有懂的吗

v2ex · 2026-06-01 22:35:31+08:00 · tech