WWW.YOUINFO.SITE
标签聚合 量级

/tag/量级

LinuxDo 最新话题 · 2026-06-08 14:55:12+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目地址: https://github.com/CodingOX/CodeRecall 致谢 :本项目基于 hsingjui/ContextWeaver 修改和扩展而来,相比于原版而言,主要有以下几点: 处理成了 CLI 的方式,方便通过 skill 进行调用。【MCP 在我看来导致启动慢,上下文浪费】 搜索时支持纯代码搜索,不把文档搜索纳入进来。 集成了常见的通用开发语言包,不用再各自安装对应的语言包,更方便。 这个项目大体的设计思路是很简单的: 把对应的语言翻译成对应的文本逻辑; 把它向量化; 搜索的时候,把你的输入再向量化一次,找出对应的片段; 再重排序一下,交给大模型。 在使用上也非常简单,唯有一点点难度,就是需要先注册一个硅基流动的 key(你也可以注册阿里云的 key)。 硅基流动目前可以免费提供,对于个人和小项目来说是足够了的。如果你的项目比较大,也可以多注册几个好友的 key。这里需要注意的是,限流是以用户为维度,而不是以 Key 为维度。 安装 npm install -g @alistar.max/coderecall 硅基流动(SiliconFlow) 注册账户,完成实名认证 创建免费的 Key 就可以了 先初始化一下,会生成一个模板配置,然后你编辑一下 key。 coderecall init 位置 ~/.coderecall/.env ,编辑文件 # Embedding API(必需) EMBEDDINGS_API_KEYS=your-embedding-api-key EMBEDDINGS_BASE_URL=https://api.siliconflow.cn/v1/embeddings EMBEDDINGS_MODEL=BAAI/bge-m3 # Reranker API(必需) RERANK_API_KEYS=your-reranker-api-key RERANK_BASE_URL=https://api.siliconflow.cn/v1/rerank RERANK_MODEL=BAAI/bge-reranker-v2-m3 将 skills/coderecall-search/ 目录复制到 用户目录的 ~/.claude/skills/ 或者 ~/.codex/skills 下即可 对于这个使用而言,会自动识别增量文件,然后进行向量化。你不需要初始化你的项目,但是为了避免卡住,建议在你的项目文件很大的情况下下手动到你的项目目录初始化一次。 cd /project # 手动向量一次 coderecall index . 上面就是最简单的用法或者最简单的配置。 接下来使用的时候,你可以强行让这个skill来帮你做语义化的搜索。但是对于 skill 而言,在不做强制手动引用的情况下,调不调用全靠大模型的心情,也全靠这个 skill 的提示词。 我这个提示词是经过我琢磨的,也欢迎大家修改、PR 以及提意见。 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-03 20:18:29+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 正文 前段时间公司换了一批Mac电脑,自己平时开发又经常要格式化Json,于是就顺手试了几个Mac上的Json工具,但用下来总感觉不太顺手。 之前在Windows上我一直用的是uTools里的自带的Json格式化插件,体验挺好。但是我不太想为了这一个功能专门装一个uTools,所以干脆用AI按照自己的使用习惯搓了一个。 主要功能点 从聚焦搜索里打开并格式化本地的Json文件 打开程序页面后会自动格式化粘贴板第一条Json内容 格式化Json支持文本和树状展示 支持切换夜间/日间模式 支持自定义JS表达式操作Json内容 支持持久化Json到本地 示例图 仓库地址 github.com GitHub - resp-200/json_formatter: An app that automatically formats JSON under macOS An app that automatically formats JSON under macOS 项目不复杂,主要就是解决自己日常开发里的一个小需求。也顺便开源出来,看看能不能帮到有同样需求的人。欢迎佬友们安装体验,有问题也欢迎提issue或PR。 2 个帖子 - 2 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-03 10:43:51+08:00 · tech

最近写了个零外部依赖的轻量级 Agent 框架: Lite Agent 。 它就像一瓶“万能胶水”,只要写个简单的 Python 函数加个 @skill 装饰器,就能瞬间把本地原本散落的脚本、系统运维、爬虫等工具全部接入进来。目前支持飞书、钉钉、企微和原生 OpenAI 接口(方便用 ChatBox 等直接连)。 把繁杂的旧工具全交给自然语言去调度,感觉爽多了,分享给有同样折腾需求的朋友。 项目地址: https://github.com/maifeipin/lite_agent

LinuxDo 最新话题 · 2026-05-31 15:58:39+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 距离上次在 Linuxdo 发 NeZha 也过去一个月多月的时间了,在这一个月的时间,NeZha 的 UI 也进行了很多优化,中间也做经历了 11 个版本的更新,超过 50 项的功能更新和 bug 修复。 相较于 Star 数, 中间收获最大的还是现在真的有一群人在用这个工具, 因为 NeZha 是没有任何遥测上报的,所以即使到现在我也不知道日活数据什么的,不过陆陆续续收到一些反馈发现确实有一一些人在用 NeZha 作为他们的日常开发工具,还是很开心的。 同时也遇到了几个愿意给 NeZha 贡献 PR 的小伙伴。 NeZha 是一款专为 AI 编程设计的轻量级跨平台 IDE, 基于 Tauri+Rust+React 打造,软件本体只有 10MB 左右,支持 Windows, Linux 和 MacOS。 NeZha 深度集成 Claude Code 和 Codex CLI, 你可以在 NeZha 同时管理多个 AI 编程会话,并在会话结束之后可视化回顾它。同时完善的 Git 集成,Git Worktree 支持, 代码编辑器,AI 编程时间线模式。 最新的版本支持 Skill 管理模式了,你可以设置一个文件夹作为 Skill 仓库,NeZha 会自动扫描文件夹下的技能,你可以选择把 Skill 通过外链的形式安装到不同的项目下。 经过这么多版本的打磨,现在的 NeZha 虽然只支持 Claude 和 Codex,但是也算是打磨到了一个我个人稍微满意的版本,如果你厌倦了那些过度封装的工具,既想要使用 CLI 的体验,又想要更方便的管理多个项目下的 AI 会话 ,那么现阶段的 Nezha 应该勉强算一个选择了。 NeZha: 开源轻量级跨平台 IDE 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-30 21:41:03+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 随着境外投资政策收紧,在当前的境外资产配置渠道中,普通投资者最常用且合规的路径主要是国内的 QDII 基金(如纳斯达克 100、标普 500 等)。然而,场内基金ETF严重溢价,场外基金由于各基金公司的外汇额度受限,QDII 基金的申购额度经常发生变动。今天限制 1000 元,明天可能就只限制 100 元,甚至直接暂停申购。 目前在主流基金平台上,获取这些限额信息并不直观,为了解决这些痛点,我Vide开发了一个自用的开源工具------ QDII Limit Monitor ,可以直观看到QDII 基金的额度情况,方便佬友投资。 希望能帮到有同样需求的佬友们,欢迎使用: 在线体验(Vercel) QDII Limit Monitor QDII 基金申购限额查询|QDII Limit Monitor 快速查看、检索和监控 QDII 与海外基金的最新申购限额及状态。支持多选联动筛选与服务端缓存。 Github开源地址 github.com GitHub - jomonylw/qdii-limit: QDII fund subscription limit monitor with... QDII fund subscription limit monitor with server-side Eastmoney data parsing, region/theme filters, quota sorting, and Vercel-friendly caching. 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-28 22:39:58+08:00 · tech

业界领先的轻量级文档解析视觉语言模型 PaddleOCR-VL-1.6 (0.9B) 。该模型以 96.3% 精度刷新 OmniDocBench v1.6,文本、公式、表格识别全面领先,并在古籍、生僻字、印章、图表等多场景能力显著增强,支持以 Markdown 和 JSON 格式输出结构化结果。 仓库地址: GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. · GitHub 权重: PaddlePaddle/PaddleOCR-VL-1.6 · Hugging Face 官网使用: PaddleOCR - 文档解析与智能文字识别 | 支持API调用与MCP服务 - 飞桨星河社区 1 个帖子 - 1 位参与者 阅读完整话题

IT之家 · 2026-05-28 15:19:08+08:00 · tech

IT之家 5 月 28 日消息,据博主 @数码闲聊站 今日爆料,小米澎湃 OS 4 系统将在 7 月或 8 月发布,按照惯例,会在发布之前开启 Beta 版测试, 小米 17 系列 / 红米 K90 系列肯定是第一批。 博主“猜测”,在此前后的新机还是预装澎湃 OS 3, 而澎湃 OS 4 的 正式版首发权,有望交由年度重量级的“大会师”产品或小米 18 系列新机 。 关于什么是“大会师”产品,博主解释称:“ 自研芯片 + 自研 AI 大模型大会师的新品。 ” 参考IT之家此前报道,在今年 1 月的 2025 小米“千万技术大奖”颁奖典礼上,小米集团创始人、董事长兼 CEO 雷军提到,2026 年, 小米预计将在一款终端上实现自研芯片、自研 OS、自研 AI 大模型“大会师” 。 雷军还在千万技术大奖现场披露,2025 年小米年度技术大奖获奖项目中,约有 2/3 的获奖项目运用了 AI 技术,用 AI 把现有的工作重做一遍,覆盖了底层材料与结构、芯片及 OS 、智能驾驶、科技家电等众多领域。 相关阅读: 《 雷军:小米今年预计将在一款终端上实现自研芯片、自研 OS、自研 AI 大模型“大会师” 》

LinuxDo 最新话题 · 2026-05-25 20:56:19+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: - 我的帖子已经打上 开源推广 标签: 是 - 我的开源项目完整开源,无未开源部分: 是 - 我的开源项目已链接认可 LINUX DO 社区: 是 - 我帖子内的项目介绍,AI 生成或润色部分已截图发出: 是 - 以上选择我承诺长期有效,并接受社区监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目文档及地址: GitHub: GitHub - Ariestar/sivtr: A unified agent memory workspace for human and agent · GitHub 项目文档: sivtr | sivtr deepwiki: Ariestar/sivtr | DeepWiki 剧透 缘起 在Ai编程中, 跨sessions的终端注意力管理与多Agent消息协同 ,一直是多终端、多Agent场景下的核心痛点。我看到了这个很有潜力的开源项目,并与作者 @wolllf (已因为非必要不抽奖被禁言 ) 一起开发了Sivtr——一个同时面向人和 Agent 的、基于 Rust 的轻量级 TUI / CLI 统一记忆共享 workspace。, 目前 Sivtr 已支持 Terminal、Codex、Claude Code、OpenCode、Pi Agent ,已在 Windows、Linux、macOS 平台可用,并提供 VS Code 插件 方便codex等插件快捷键呼出tui面板。 本项目的构想是: 终端输出和agent对话在同一个工作区中共享。人通过tui面板浏览获取,Agent通过Cli与skill检索。 Sivtr is a Unified Shared Working Memory for Humans and Agents。 对人:跨会话复制粘贴,一键解决 对人来说,Sivtr 解决的是多窗口、多终端、多 Agent 场景下的复制粘贴和上下文找回问题,跨 terminal、跨 session、跨 Agent 的复制粘贴,可以一键解决。少碰鼠标,少翻窗口。 同一项目中路径下的终端记录和agent对话记录会被Sivtr自动记录,然后你可以直接在一个窗口里进行浏览与搜索、复制与导出。 Ubuntu 24.04 TUI简单功能视频示例 在终端命令行中,通过 sivtr cc/ci/co m..n 快速复制前几条指令的输入/输出,还支持替换prompt,regex检索等功能。(可以看下面的简单玩法的第一个视频) 对 Agent Sivtr 同时提供 CLI 和 skill,这意味着 Agent 可以直接读写项目的工作记忆,缩短用户交互链条,提升交互效率。 我们希望通过Sivtr,实现将Terminal 输出、AI 对话、命令、报错、决策、diff、测试结果,通过cli的search和show指令(后面会支持更对利好agent检索的命令)变成一个可搜索、可追溯的上下文层。 例如终端里 cargo test 报错,Agent 可以自动拿到失败上下文,不需要你复制粘贴。你只需要说: “修刚才那个。” “继续终端的工作。” “接上一个 Agent 的工作。” Agent 可以从共享记忆里展开当前任务、最近改动和被否掉的方案。 而不是让你自己翻不同的agent对话、终端报错复制粘贴,特别麻烦,还容易漏掉,而agent一样需要借助复杂的记忆机制,甚至有时候依旧会有幻觉。 换 Agent 时,新 Agent 可以先搜原Agent记忆,不用你重新解释一遍背景。: sivtr search agent --match "当前任务|失败|TODO" --since today --- format timeline sivtr search terminal --status failure --latest 1 --format json 之后还会支持接入 远程 chat 记录 ,从其他人的电脑中读取记忆,让团队工作也能被 Agent 接力,我们希望能展开团队/企业级的服务支持。 我们期待在sivtr的实践下, Agent 活在人的工作现场里,人和 Agent 共同读写同一个共享工作记忆层。 当前能力 Rust 实现的轻量级 TUI / CLI,支持 Windows / Linux / macOS / VS Code。 支持 Terminal / tmux 工作流:捕获命令块、浏览长输出、搜索、选择、复制、diff。 支持 Codex、Claude Code、OpenCode、Pi 等 Agent 会话读取、搜索、展示、复制。 支持统一检索 terminal 与 agent 工作记录: 未来计划 支持更多agent provider 远程连接他人的工作区record 可选的数据rag化,便于agent语义搜索 … 指令说明 sivtr search terminal --status failure --latest 1 --format json sivtr search agent --match "当前任务|失败|TODO" --since today --format timeline sivtr search codex --match "borrow error" --format compact sivtr search claude --since today --format md sivtr search opencode --match "TODO|failed" --format timeline sivtr search pi --since today --sort oldest --format timeline 支持 timeline / compact / md / json 多种输出格式,既方便人扫读,也方便 Agent 获取。 支持稳定 ref 追溯上下文: terminal/session/record/line pi/session/turn/line claude/session/turn/line codex/session/turn/line 支持 sivtr search <ref> <filter> 快速检索, 然后用 sivtr show <ref> 精确展开上下文,让 Agent 能先 search 再 show: sivtr show pi/019e5abb/3 --format json sivtr show terminal/session_21176/8 --format json agent session和终端信息统一成 输入与输出 的形式,在tui中**i复制输入,o复制输出,y复制全部。**工作记忆保存在本机。 废话不多说直接上图:Windows TUI窗口下markdown渲染模式预览 配置 sivtr 使用 TOML 配置文件 。默认路径遵循各平台的配置目录。 命令 行为 sivtr config show 打印配置路径和有效文件内容或默认值 sivtr config init 如果配置不存在,则创建默认配置 sivtr config edit 必要时创建配置,并用配置的编辑器打开 架构 Sivtr 主要分两层: 二进制层( src/ ): CLI 解析、命令分发、TUI 状态和平台相关热键行为。 核心 crate( crates/sivtr-core/ ):捕获、解析、buffer、选择、搜索、历史、导出、配置和 Agent 会话解析。 Workspace sivtr/ |- Cargo.toml |- src/ | |- cli.rs | |- main.rs | |- app.rs | |- commands/ | `- tui/ `- crates/ `- sivtr-core/ `- src/ |- ai.rs |- buffer/ |- capture/ |- claude.rs |- codex.rs |- config/ |- export/ |- history/ |- opencode.rs |- parse/ |- pi.rs |- search/ |- selection/ `- session/ 几个简单玩法(多视频警告) 1. 复制最近一次命令输出 2. 让 Agent 查看最近失败的终端命令 3. 查看今天的 Agent 工作时间线 4. 挖掘潜藏todo 5. 复制某个 Agent 最近回复 你可以用 ctrl+y (需要先 sivtr hotkey start 启动快捷键)呼出tui面板,然后y直接复制 也可以用以下指令复制 sivtr copy claude out sivtr copy codex out 2..3(后面接比如 2..3复制倒数第2到3条) sivtr copy opencode in sivtr copy pi out 6. 跨agent共享进度 如果觉得喜欢有所收获就支持一下吧! 欢迎Star与讨论 GitHub: GitHub - Ariestar/sivtr: A unified agent memory workspace for human and agent · GitHub ) AI总结截图 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-25 16:49:02+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 09:11:27+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 09:11:27+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 09:11:27+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 01:10:31+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 01:10:31+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 00:10:31+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-25 00:10:31+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~

V2EX - 技术 · 2026-05-24 18:09:20+08:00 · tech

一直在 V 站潜水,现在做了个只需要 Vercel 部署的轻量级 AI API 中转,大佬们瞅瞅! 我的核心痛点: 不想搞 VPS ,只想用 Vercel 部署 能随时随地加 API Key 给我的 Hermes 用 为啥不用现有的: OpenRouter 是 SaaS ,按量付费,长期用不划算 OneAPI / new-api 要自己搞服务器,还得维护 我这个就是个纯中转层,轻量、免费、够用 AI Relay — 基于 Vercel Edge Runtime 的轻量级 AI API 中转 🔗 GitHub: https://github.com/MoyuFamily/ai-relay 主要功能: 多 Key 轮换 + 429 自动退避 多 Provider 路由( OpenAI / Claude / DeepSeek / MiMo / 自定义) 熔断器,Provider 挂了自动切换 管理后台,手机也能操作 临时 API Key ( HMAC 签名,用完即焚) 完全兼容 OpenAI SDK ,改个 base_url 就行 部署: 点击 Deploy 按钮 → 填 3 个 Key → 等 2 分钟 → 搞定 管理后台截图: 运行概览 密钥管理 辅助工具 整个项目基本都是由 Hermes 的 4 个 Agent 完成的,从调研、立项、开发到迭代、开源,绝大部分都是 Agent 自己做的,我只是提供权限和要求。 希望能给大家带来方便,有问题直接提 Issue~