WWW.YOUINFO.SITE
标签聚合 实用

/tag/实用

LinuxDo 最新话题 · 2026-06-08 14:28:09+08:00 · tech

不同 API 服务的对我来说,非常实用。 毕竟想省tokens,我还在用很多免费的模型,就是怕不稳定. 只讲实际能用、配置里能落地的部分,避免把不存在的配置项写进去 。 如果有错误欢迎佬友指正 我的Hermes 的模型配置思路 Hermes 的配置核心在 ~/.hermes/config.yaml 。 模型相关配置主要分几层: 主对话模型 :负责正常聊天、代码、工具调用、任务执行。 辅助模型 :负责压缩上下文、图片理解、网页提取等后台任务。 Fallback Providers :主模型失败时切到备用供应商。 Custom Providers :接入 OpenAI 兼容接口,比如 vLLM、Ollama、LM Studio、SGLang 或第三方中转 API。 Credential / Auth :API Key 或 OAuth 凭据。 最常见的配置结构大致是: model: default: gpt-5.5 provider: custom base_url: https://example.com/v1 api_key: sk-xxx context_length: 128000 其中: model.default :模型名称 model.provider :供应商名称 model.base_url :自定义 OpenAI 兼容端点时使用 model.api_key :API Key model.context_length :上下文长度 Hermes 要求模型上下文窗口不能太小。实际使用 Agent、工具调用、长会话压缩时,建议至少 64K tokens 起步。本地模型也建议把上下文开到 65536 或以上。 Hermes 支持哪些供应商我就不说了佬友自己就可以看到 切换模型的几种方式 方式一:交互式选择 hermes model 这是最推荐的方式。它会引导你选择 provider、填写凭据、选择模型。 方式二:查看和修改配置 查看配置: hermes config 打开配置文件: hermes config edit 也可以直接设置某个配置项,例如: hermes config set model.provider openrouter hermes config set model.default anthropic/claude-sonnet-4 如果是自定义接口: hermes config set model.provider custom hermes config set model.default your-model-name hermes config set model.base_url https://example.com/v1 API Key 建议放在 .env 或配置里由 Hermes 管理,不要写进公开文章、截图或 Git 仓库。 方式三:会话内临时切换 在 Hermes 会话里可以用: /model openrouter/anthropic/claude-sonnet-4 这种方式适合临时测试。长期默认模型还是建议写入 config.yaml 。 主模型和辅助模型 Hermes 不是所有任务都必须用同一个模型。 主模型负责核心对话和 Agent 执行;辅助模型可以负责压缩、视觉、网页提取等后台任务。这样可以避免“用旗舰模型做摘要”这种浪费。 常见配置示例: model: default: claude-sonnet-4 provider: anthropic auxiliary: compression: provider: openrouter model: openai/gpt-5-mini vision: provider: openrouter model: openai/gpt-4o 建议: 主模型 :选择工具调用稳定、上下文长、代码能力强的模型。 压缩模型 :选择便宜但摘要能力不错的模型。 视觉模型 :选择明确支持图片输入的模型。 如果辅助模型没有配置好,某些任务可能会回退到自动检测逻辑,或者使用主模型兜底。为了稳定,建议主动配置。 Fallback Providers:主模型备用链 当主模型遇到限流、服务错误或连接失败时,Hermes 可以尝试备用模型。 正确的配置项是 fallback_providers ,不是 fallback_models 。 示例: model: default: gpt-5.5 provider: custom base_url: https://primary.example.com/v1 api_key: sk-primary fallback_providers: - provider: custom base_url: https://backup.example.com/v1 api_key: sk-backup model: claude-sonnet-4 - provider: openrouter model: anthropic/claude-sonnet-4 触发条件一般包括: HTTP 429 :限流 HTTP 503 :服务错误 HTTP 529 :过载 连接失败 需要注意: Fallback 是按顺序尝试的,不存在 fallback_strategy: random 、 cheapest_first 这类配置。 也不存在 fallback_on 这种配置项;触发条件是内置的。 主模型 fallback 一旦在当前会话触发,通常会在该会话里继续使用 fallback 后的模型。 旧版可能支持单个 fallback_model ,但新写法建议使用列表形式的 fallback_providers 。 辅助任务也可以单独配置 fallback 辅助任务不继承主模型的 fallback_providers ,它们有自己的 fallback 链。 示例: auxiliary: compression: provider: custom base_url: https://primary.example.com/v1 api_key: sk-primary model: gpt-5-mini fallback_chain: - provider: custom base_url: https://backup.example.com/v1 api_key: sk-backup model: deepseek-chat - provider: openrouter model: openai/gpt-5-mini vision: provider: openrouter model: openai/gpt-4o fallback_chain: - provider: anthropic model: claude-sonnet-4 辅助任务 fallback 的触发更偏 向容量或额度 问题,例如: HTTP 402 :余额或额度耗尽 明确的日/月额度耗尽 连接失败 注意: 普通临时 429 不一定会触发辅助 fallback,因为 Hermes 会尊重你显式指定的 provider。 自定义 OpenAI 兼容端点 我相信很多佬友跟我一样会用本地模型或第三方中转服务,这时最常见的就是 custom provider。 例如 Ollama: model: provider: custom default: qwen3-coder:latest base_url: http://127.0.0.1:11434/v1 api_key: ollama context_length: 65536 例如 vLLM: model: provider: custom default: Qwen/Qwen3-Coder base_url: http://127.0.0.1:8000/v1 api_key: dummy context_length: 131072 vLLM 启动时可以类似这样: vllm serve Qwen/Qwen3-Coder --max-model-len 131072 Ollama 需要确认模型上下文已开够。不同版本设置方式不完全一样,不建议只写死一个命令,重点是确认 context 至少 64K。 多个自定义供应商 如果有多个自定义端点,建议用 custom_providers 起不同名字。(我就是这么干的,感觉特别方便,需要多少自己加) 示例: 然后在主模型或 fallback 里引用: model: default: gpt-5.5 provider: custom base_url: https://api.example.com/v1 api_key: sk-tSeI...YFZLSQwfQV9Jd fallback_providers: - provider: custom base_url: https://api.example2.com/v1 api_key: sk-wiu...4ycq0Pg7tQnMb model: gpt-5.4-mini 注意 : custom_providers 的 name 必须唯一。重复名字可能导致后面的配置覆盖前面的配置。 小结 Hermes 的模型配置体系,重点不是“支持多少模型”,而是它把模型、供应商、辅助任务、fallback、自定义端点拆开了。 这样做的好处是 : 主模型可以选最强的; 辅助任务可以选便宜的; 一个供应商挂了可以切备用; 本地模型和第三方 OpenAI 兼容服务都能接; 不同平台、不同任务可以逐步做精细化配置。 对小白用户来说,最推荐的入门路线是 : 先用 hermes model 跑通一个主模型; 再配置 fallback_providers ; 然后配置 auxiliary ; 最后再折腾本地 vLLM / Ollama / LM Studio。 这样最稳,也最不容易把配置写乱。 我以前就是这么做的,后来慢慢的学,特别在Linux 学到很多以前看不到的技术 最后如有错误的地方,欢迎佬友们指正 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-08 11:06:00+08:00 · tech

想做一个开源的结合 AI 来写简历的项目,各位帮看看想法如何,提提建议。 想法其实也很简单,就是贴合 AI 去辅助写简历,一个是为了噱头,另一个是为了贴合 AI 去做一些事情。 首先这个这种类似的项目 github 上很多,不过 AI 的使用我看还是停留在内容、模板优化之类的。 我想的是让 AI 去分析自己做过的项目,然后产出项目描述、技术栈、求职者参与了多久,贡献了多少 commit 、主要负责哪些模块、有多少人开发等等。这部分内容主要来源于项目和 git commit 信息。 然后再加上 leetcode ,配置 cookie 等形式(类似 idea 上的插件),去抓取求职者的发布的题解、解了多少题、擅长于做什么题等等内容。基于分析内容绘制一些简单的图表或者提交的趋势图之类的。 再加上 github 内容,类似 leetcode ,除了提交内容、参与了什么项目、提交趋势、技术栈等等。再找到求职者最近提交有价值的 commit 汇总成文字描述,让求职责自行选择用哪些。不过 github 的还不太清楚用什么来抓这些信息。 其他什么模板之类的优化就是锦上添花了。 这样一个项目,各位觉得是否有实用价值和场景?

v2ex · 2026-06-08 10:53:18+08:00 · tech

想做一个开源的结合 AI 来写简历的项目,各位帮看看想法如何,提提建议。 想法其实也很简单,就是贴合 AI 去辅助写简历,一个是为了噱头,另一个是为了贴合 AI 去做一些事情。 首先这个这种类似的项目 github 上很多,不过 AI 的使用我看还是停留在内容、模板优化之类的。 我想的是让 AI 去分析自己做过的项目,然后产出项目描述、技术栈、求职者参与了多久,贡献了多少 commit 、主要负责哪些模块、有多少人开发等等。这部分内容主要来源于项目和 git commit 信息。 然后再加上 leetcode ,配置 cookie 等形式(类似 idea 上的插件),去抓取求职者的发布的题解、解了多少题、擅长于做什么题等等内容。基于分析内容绘制一些简单的图表或者提交的趋势图之类的。 再加上 github 内容,类似 leetcode ,除了提交内容、参与了什么项目、提交趋势、技术栈等等。再找到求职者最近提交有价值的 commit 汇总成文字描述,让求职责自行选择用哪些。不过 github 的还不太清楚用什么来抓这些信息。 其他什么模板之类的优化就是锦上添花了。 这样一个项目,各位觉得是否有实用价值和场景?

v2ex · 2026-06-08 10:19:48+08:00 · tech

想做一个开源的结合 AI 来写简历的项目,各位帮看看想法如何,提提建议。 想法其实也很简单,就是贴合 AI 去辅助写简历,一个是为了噱头,另一个是为了贴合 AI 去做一些事情。 首先这个这种类似的项目 github 上很多,不过 AI 的使用我看还是停留在内容、模板优化之类的。 我想的是让 AI 去分析自己做过的项目,然后产出项目描述、技术栈、求职者参与了多久,贡献了多少 commit 、主要负责哪些模块、有多少人开发等等。这部分内容主要来源于项目和 git commit 信息。 然后再加上 leetcode ,配置 cookie 等形式(类似 idea 上的插件),去抓取求职者的发布的题解、解了多少题、擅长于做什么题等等内容。基于分析内容绘制一些简单的图表或者提交的趋势图之类的。 再加上 github 内容,类似 leetcode ,除了提交内容、参与了什么项目、提交趋势、技术栈等等。再找到求职者最近提交有价值的 commit 汇总成文字描述,让求职责自行选择用哪些。不过 github 的还不太清楚用什么来抓这些信息。 其他什么模板之类的优化就是锦上添花了。 这样一个项目,各位觉得是否有实用价值和场景?

v2ex · 2026-06-08 10:08:32+08:00 · tech

想做一个开源的结合 AI 来写简历的项目,各位帮看看想法如何,提提建议。 想法其实也很简单,就是贴合 AI 去辅助写简历,一个是为了噱头,另一个是为了贴合 AI 去做一些事情。 首先这个这种类似的项目 github 上很多,不过 AI 的使用我看还是停留在内容、模板优化之类的。 我想的是让 AI 去分析自己做过的项目,然后产出项目描述、技术栈、求职者参与了多久,贡献了多少 commit 、主要负责哪些模块、有多少人开发等等。这部分内容主要来源于项目和 git commit 信息。 然后再加上 leetcode ,配置 cookie 等形式(类似 idea 上的插件),去抓取求职者的发布的题解、解了多少题、擅长于做什么题等等内容。基于分析内容绘制一些简单的图表或者提交的趋势图之类的。 再加上 github 内容,类似 leetcode ,除了提交内容、参与了什么项目、提交趋势、技术栈等等。再找到求职者最近提交有价值的 commit 汇总成文字描述,让求职责自行选择用哪些。不过 github 的还不太清楚用什么来抓这些信息。 其他什么模板之类的优化就是锦上添花了。 这样一个项目,各位觉得是否有实用价值和场景?

LinuxDo 最新话题 · 2026-06-07 14:56:25+08:00 · tech

滤镜软件更新啦~ 本次更新带来了几项实用的新功能,欢迎体验! 设置界面 & 后台托盘 新增独立设置界面,主题调整已迁移至设置页面。同时新增后台托盘持久化能力——如不需要可随时关闭,主要为快捷键切换功能服务。 通知提醒 新增通知功能,切换方案时可在右下角弹出提示,操作反馈更直观。 快捷键切换方案 支持通过快捷键快速切换主题方案,也可以一键恢复默认设置,效率拉满。 显示适配 新增显示适配选项,可自定义右下角托盘快捷方案的显示条目数量。 原帖地址: 最近搓了三角洲滤镜,有需要的兄弟嘛? 软件地址: https://filter-manage.6ya.site 开源项目,允许二创。觉得好用的话给项目点个小星星,十分感谢! 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-04 18:04:04+08:00 · tech

房屋概况] · 面积:50 平实用面积(无公摊水分,比很多同面积商品房还大) · 楼层朝向: 高楼层、安静、正对深圳河,视野无遮挡 · 装修状态:2023 年全屋墙面翻新,整洁白净,无老旧异味 [核心优势] 家电半新: 沙发、洗衣机、燃气灶均为半年内更换的新设备,使用感极佳。 隔音静谧: 窗户隔音效果好,适合对睡眠环境要求高、居家办公的人。 没有中介费: 和房东本人重新签合同,押金有保障,价格稳定。 · 急转,随时可搬,看房方便(工作日晚上/周末全天) 我的微信:lgmsuchislife 备注 V 站转租

IT之家 · 2026-06-03 02:46:25+08:00 · tech

IT之家 6 月 3 日消息,微软现已推出新一代量子芯片 Majorana 2,新品采用全新材料栈和新一代量子比特, 可靠性相比上一代产品提升 1000 倍 。 据介绍,Majorana 2 使用的量子比特(Qubit)相比上一代产品,可靠性提升 1000 倍。这一里程碑式进展得益于全新材料栈设计,以及 Discovery 智能体 AI 的协助。 微软技术院士 Chetan Nayak 透露,Majorana 2 相比 Majorana 1 拥有更加稳定的拓扑相(topological phase),使用铅材料取代铝超导体, 并将半导体活性区域更新为砷化铟(IT之家注:Indium Arsenide)+ 砷化铟锑(Indium Arsenide Antimonide)组合 ,显著提升量子比特性能。 他解释道:“使用铝材料的 Majorana 1 拥有 1 毫秒到 12 毫秒之间的量子比特寿命;而在 Majorana 2 中, 我们将寿命提升到 20 秒以上 ,稳定性提升超 1000 倍,部分比特甚至能达到分钟级寿命”。 由于这一进展足够重大,微软决定将实用量子计算机原型的目标推出时间缩短一半, 剑指 2029 年发布 。

LinuxDo 最新话题 · 2026-05-31 11:20:30+08:00 · tech

最近很多人同时用 Claude Code 和 Codex。我觉得没必要争谁替代谁,更实用的方式是分工。 我的一个简单流程: Claude Code:快速实现和探索 Codex:跑测试、审查 diff、修边界问题 为什么这样分 Claude Code 很适合连续改代码、跟着项目上下文推进。 Codex 很适合在工作区里跑命令、读失败、做 review、处理 GitHub/浏览器/本地环境。 当然这不是绝对,只是一个好用的默认分工。 一个实际流程 先让 Claude Code 实现 MVP。 提交前让 Codex review diff。 Codex 按测试失败修一轮。 再让 Claude Code 做小范围优化。 最后 Codex 跑验收命令。 prompt 示例 给 Claude Code: 实现这个功能,优先保持现有架构,不要大规模重构。完成后列出改动文件。 给 Codex: Review the uncommitted diff for correctness bugs, missing tests, and regression risk. Then run the repo's verification commands and fix only the issues required to pass. 可以做成两个 Skill fast-implementation :快速实现,少争论。 bug-focused-review :严格审查,只抓真实风险。 注意 不要让两个 agent 同时大范围改同一批文件。 比较稳的是:一个负责实现,另一个负责验证;或者明确文件边界。 这个工作流的核心不是“多开 AI”,而是让每个 agent 有清晰职责。 5 个帖子 - 3 位参与者 阅读完整话题

v2ex · 2026-05-27 00:11:28+08:00 · tech

Feedalyze 是什么 Feedalyze 是一款帮助产品团队从用户反馈中识别真实需求的工具。它能够多渠道收集、高效协同处理、可视化分析反馈,帮助团队更清晰地理解用户需求,从而让产品朝着正确的方向加速迭代。地址: https://feedalyze.com/ 解决什么问题 如何将分散在不同渠道的用户反馈,变成统一可管理的信息资产 如何从大量反馈中持续提炼真实需求,而不是依赖主观判断 如何让产品决策可以被反馈验证,而不只是事后判断对错 本质上,就是解决团队或独立开发者经常遇到的三个问题:我理解的需求对不对?产品能不能持续做对?方向有没有偏? 适合谁用 SaaS / AI / 工具类产品团队及独立开发者 处于持续迭代阶段的创业团队与中小企业 拥有较多用户反馈,但缺乏结构化分析与需求提炼能力的团队 更适合已经开始重视用户反馈体系建设的团队 为什么不用微信群管理用户反馈? 微信群很适合沟通,但不适合作为长期的反馈管理系统。如果你管理过 300 人以上的活跃用户群,就会明白我在说什么 反馈很容易被聊天流覆盖,重要问题会被淹没或遗忘。你不可能记住所有反馈,也更难从中分析背后的真实需求 缺乏统一的分类与标签体系,难以进行长期分析与管理,最终容易变成“不断重复处理问题的客服” 缺乏责任归属与处理状态,无法持续跟踪反馈进度。如果某条反馈没人响应,用户很快就会流失 历史反馈难以沉淀为可复用的产品决策依据。10 条、100 条反馈或许并不重要,但当它变成 1000 条、10000 条时,难道真的还不重要吗? 产品逻辑与流程图 欢迎试用 目前产品还处于最后的内测阶段,整体功能与体验仍在持续打磨中。 我们会为参与试用的团队提供 3-6 个月免费试用,并免费协助搭建完整的用户反馈管理体系。 如果你对这个方向感兴趣,或者愿意参与内测体验,欢迎在网站底部留言,或直接微信联系我:M-ing2020 也欢迎大家交流、提建议,感谢支持。 Feedalyze - https://feedalyze.com/

v2ex · 2026-05-25 20:24:48+08:00 · tech

分享一个 Cursor 的邀请链接,通过该链接注册或升级 Pro 会员,首月可享受 50% 的折扣。 https://cursor.com/referral?code=CMMHUJNJESO9 根据 Cursor 官方的说法,Composer 2.5 是他们迄今为止最强大的模型。相较于前代,它在智能水平、长周期任务的持续工作能力,以及复杂指令的依从性上,都实现了跨越式的提升。 Composer 2.5 定价白皮书: - 标准版: 每百万( 1M )输入 Token 仅需 0.50 美元,每百万( 1M )输出 Token 仅需 2.50 美元。 - Fast 变体版: 智能水平相同但速度极快,价格为每百万输入 Token 3.00 美元,每百万输出 Token 15.00 美元。