基于 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-12 09:16:41+08:00 · tech

小红书刷到一堆昨天预测2:0的，什么基于大数据、赔率、最新消息建模的。都说自己是神医，好家伙，还真就给押对了 3 个帖子 - 3 位参与者阅读完整话题

小米MiMoCode 给的免费小垃圾模型MiMo Auto 限时一个月免费，基于 MiMo-V2.5

LinuxDo 最新话题 · 2026-06-11 20:13:37+08:00 · tech

没什么用佬友你们的其他模型都是你们自己的小米就只免费MiMo Auto（限时一个月免费，基于 MiMo-V2.5，支持 100 万 token 上下文） 2 个帖子 - 2 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-11 16:20:25+08:00 · tech

刚刚看到了小米发来的邮件，MIMO code横空出世看了下源码发现是基于opencode做的 github.com GitHub - XiaomiMiMo/MiMo-Code 通过在 GitHub 上创建帐户来为 XiaomiMiMo/MiMo-Code 开发做出贡献。 1 个帖子 - 1 位参与者阅读完整话题

[Solana] 关于 coin.v2ex.pro

v2ex · 2026-06-11 10:30:36+08:00 · tech

https://coin.v2ex.pro/ https://coin.v2ex.pro/coin/9raUVuzeWUk53co63M4WXLWPWE4Xc6Lpn7RS9dnkpump 基于 Coin Community SDK 的一个 Web Client： https://coincommunities.org/docs Coin Community SDK 是来自 Pump.fun 的一个后端服务：提供了 X 登录 token gate 逻辑验证内容和图片存储基于 Coin Community SDK ，每个在 Pump 上的 token 都可以构建一个属于自己的，类似 Twitter 体验的社区。如果你已经持有 $V2EX ，就可以直接加入体验。

github MiMo Code开源发布，免登录免费用MiMo

LinuxDo 最新话题 · 2026-06-11 08:43:57+08:00 · tech

小米突发MiMo Code，基于opencode fork的，已经用上了，不用登录免费用MiMo auto github.com GitHub - XiaomiMiMo/MiMo-Code 通过在 GitHub 上创建帐户来为 XiaomiMiMo/MiMo-Code 开发做出贡献。 12 个帖子 - 8 位参与者阅读完整话题

小米也搞了个opencode套壳的mimo code

LinuxDo 最新话题 · 2026-06-11 08:06:25+08:00 · tech

何意味啊，跟minimax code一样，都选择opencode这种成品套壳，而不是基于pi来做。而且minimax code好歹做了一套自己的gui，mimo code这个我都无力吐槽了不知道隔壁opencode害怕了吗？忘了带上链接 https://mp.weixin.qq.com/s/WkMPz-eBK2Hz0ZTQEwtx6w 附带一下qwen分析的mimocode的优势不过有一说一，mimo是我用过最容易死循环的LLM。真给它/GOAL,不会一晚上跑没额度吗 10 个帖子 - 8 位参与者阅读完整话题

[分享创造] vibe 了一个基于 cdp,聚合自己知乎/B 站/推特账号的推荐和关注流的 web 应用,开源.

v2ex · 2026-06-11 02:44:34+08:00 · tech

https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API：用你自己的浏览器登录态，把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源，再通过网页、RSS 和 JSON API 消费。它不是多用户托管服务，也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据，不提交到仓库。它做什么通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。使用你自己的登录态抓取平台推荐流： X/Twitter home timeline GraphQL 响应知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。将内容归一化为 Message / Author / Account 等 k8s 风格资源。提供 React 阅读界面：按源过滤、未读追踪、登录恢复、手动刷新。提供 RSS： /rss/<source>.xml 和 /rss/all.xml 。图片会本地化到 data/media ，方便 RSS 阅读器稳定回源。隐私边界仓库只放应用代码。以下运行态路径已被 git 忽略： profiles/ ：Chrome profile 、cookies 、登录态 data/ ：抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* ：本地部署配置公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。本地运行依赖： Bun pnpm Chrome / Chromium jq 、 xmllint （用于 verify.sh ）启动： pnpm install pnpm start 默认地址：后端 API： http://localhost:3001 前端网页： http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录，页面会提示登录；登录过程发生在受管 Chrome profile （默认 profiles/main ）里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时，会先检查本机 CDP： http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用，后端会自动拉起一个有窗口的 Chrome / Chromium： CDP 只监听本机 127.0.0.1 。默认 CDP 端口是 19223 ，可用 RADAR_CDP_PORT 修改。默认 profile 是 profiles/main ，可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测；找不到时用 RADAR_CHROME_BIN 指定。启动参数包含 --remote-debugging-port 和 --user-data-dir ，因此登录态会持久化在 profile 目录里。登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话，因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量： XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ，后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置： export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据，不依赖真实平台登录态。部署 Refresh 运行两个进程：后端： bun server/index.ts 前端/Vite 反代： bunx vite 公网部署时，把公网地址放进环境变量，然后用反向代理或 tunnel 暴露 Vite 端口。示例： export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会：在 tmux session 中启动后端和前端；用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ，保证 RSS 里的媒体地址能回源；从 REFRESH_PUBLIC_URL 推导 Vite allowed host ；将进程日志写入 data/logs/ 。公网代理或 tunnel 指向： http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问，因此通常只需要暴露 Web 端口。常用环境变量变量用途默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台，例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ，逗号分隔未设置 REFRESH_PUBLIC_URL 公网部署 URL ，供 scripts/ start-k2-tmux.sh 使用脚本必填文档文件内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项

[分享创造] vibe 了一个基于 cdp,聚合自己知乎/B 站/推特账号的推荐和关注流的 web 应用,开源.

v2ex · 2026-06-11 02:44:34+08:00 · tech

https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API：用你自己的浏览器登录态，把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源，再通过网页、RSS 和 JSON API 消费。它不是多用户托管服务，也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据，不提交到仓库。它做什么通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。使用你自己的登录态抓取平台推荐流： X/Twitter home timeline GraphQL 响应知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。将内容归一化为 Message / Author / Account 等 k8s 风格资源。提供 React 阅读界面：按源过滤、未读追踪、登录恢复、手动刷新。提供 RSS： /rss/<source>.xml 和 /rss/all.xml 。图片会本地化到 data/media ，方便 RSS 阅读器稳定回源。隐私边界仓库只放应用代码。以下运行态路径已被 git 忽略： profiles/ ：Chrome profile 、cookies 、登录态 data/ ：抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* ：本地部署配置公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。本地运行依赖： Bun pnpm Chrome / Chromium jq 、 xmllint （用于 verify.sh ）启动： pnpm install pnpm start 默认地址：后端 API： http://localhost:3001 前端网页： http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录，页面会提示登录；登录过程发生在受管 Chrome profile （默认 profiles/main ）里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时，会先检查本机 CDP： http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用，后端会自动拉起一个有窗口的 Chrome / Chromium： CDP 只监听本机 127.0.0.1 。默认 CDP 端口是 19223 ，可用 RADAR_CDP_PORT 修改。默认 profile 是 profiles/main ，可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测；找不到时用 RADAR_CHROME_BIN 指定。启动参数包含 --remote-debugging-port 和 --user-data-dir ，因此登录态会持久化在 profile 目录里。登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话，因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量： XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ，后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置： export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据，不依赖真实平台登录态。部署 Refresh 运行两个进程：后端： bun server/index.ts 前端/Vite 反代： bunx vite 公网部署时，把公网地址放进环境变量，然后用反向代理或 tunnel 暴露 Vite 端口。示例： export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会：在 tmux session 中启动后端和前端；用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ，保证 RSS 里的媒体地址能回源；从 REFRESH_PUBLIC_URL 推导 Vite allowed host ；将进程日志写入 data/logs/ 。公网代理或 tunnel 指向： http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问，因此通常只需要暴露 Web 端口。常用环境变量变量用途默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台，例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ，逗号分隔未设置 REFRESH_PUBLIC_URL 公网部署 URL ，供 scripts/ start-k2-tmux.sh 使用脚本必填文档文件内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项

[分享创造] vibe 了一个基于 cdp,聚合自己知乎/B 站/推特账号的推荐和关注流的 web 应用,开源.

v2ex · 2026-06-11 02:44:34+08:00 · tech

https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API：用你自己的浏览器登录态，把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源，再通过网页、RSS 和 JSON API 消费。它不是多用户托管服务，也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据，不提交到仓库。它做什么通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。使用你自己的登录态抓取平台推荐流： X/Twitter home timeline GraphQL 响应知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。将内容归一化为 Message / Author / Account 等 k8s 风格资源。提供 React 阅读界面：按源过滤、未读追踪、登录恢复、手动刷新。提供 RSS： /rss/<source>.xml 和 /rss/all.xml 。图片会本地化到 data/media ，方便 RSS 阅读器稳定回源。隐私边界仓库只放应用代码。以下运行态路径已被 git 忽略： profiles/ ：Chrome profile 、cookies 、登录态 data/ ：抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* ：本地部署配置公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。本地运行依赖： Bun pnpm Chrome / Chromium jq 、 xmllint （用于 verify.sh ）启动： pnpm install pnpm start 默认地址：后端 API： http://localhost:3001 前端网页： http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录，页面会提示登录；登录过程发生在受管 Chrome profile （默认 profiles/main ）里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时，会先检查本机 CDP： http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用，后端会自动拉起一个有窗口的 Chrome / Chromium： CDP 只监听本机 127.0.0.1 。默认 CDP 端口是 19223 ，可用 RADAR_CDP_PORT 修改。默认 profile 是 profiles/main ，可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测；找不到时用 RADAR_CHROME_BIN 指定。启动参数包含 --remote-debugging-port 和 --user-data-dir ，因此登录态会持久化在 profile 目录里。登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话，因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量： XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ，后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置： export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据，不依赖真实平台登录态。部署 Refresh 运行两个进程：后端： bun server/index.ts 前端/Vite 反代： bunx vite 公网部署时，把公网地址放进环境变量，然后用反向代理或 tunnel 暴露 Vite 端口。示例： export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会：在 tmux session 中启动后端和前端；用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ，保证 RSS 里的媒体地址能回源；从 REFRESH_PUBLIC_URL 推导 Vite allowed host ；将进程日志写入 data/logs/ 。公网代理或 tunnel 指向： http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问，因此通常只需要暴露 Web 端口。常用环境变量变量用途默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台，例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ，逗号分隔未设置 REFRESH_PUBLIC_URL 公网部署 URL ，供 scripts/ start-k2-tmux.sh 使用脚本必填文档文件内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项

一款基于 Flutter 的 AI 语音生成、音色设计与声音克隆应用

LinuxDo 最新话题 · 2026-06-11 00:36:32+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出我用 flutter 做了一个开源的语音生成 app，主要还是利用了目前小米免费的 mimo 语音生成模型并利用 ai 对需要生成的语音文字进行打标签和润色。当然需要填你自己的 MIMO 的 API，和用于润色这个文字的 AI 模型的 API。开源官网： https://shenghui.cloudlark.net/ 开源仓库： https://github.com/FuKun0113/shenghui-ai-voice-studio 软件截图： 1 个帖子 - 1 位参与者阅读完整话题

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 23:05:16+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 22:39:40+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 21:05:38+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 21:05:38+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 19:26:12+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 19:15:21+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

[分享创造] 基于 Claude Code Workflow 的 Loop Engineering 流水线 - Claude-lights-out

v2ex · 2026-06-10 18:44:07+08:00 · tech

分享个自己做的东西。问题用 AI 写代码越来越爽，但也越来越烦。主要几个痛点： 1. 你变成了人肉 QA Claude 说"搞定了"，你一跑全是 bug 。然后进入死循环：测→报→修→测→报→修…… 明明是让它帮你省时间的，结果你的时间全花在当测试员上了。 2. 完全黑盒让它搞个复杂点的东西，跑了 20 分钟，你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料你让它写个完整功能，它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。我的方案拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求，它必须走完 9 个阶段才交付： /lightsout 用 Express + SQLite + React 做个看板应用，支持拖拽、标签、到期提醒然后它自动跑：需求编写 → 独立 agent 审查（不过就打回重写）交互设计 → 独立 agent 审查技术架构 → 独立 agent 审查一致性检查 → 三份文档互相对不上的地方找出来修掉测试用例设计 → 写代码之前先把测试想清楚写代码 → 自主决定要不要拆分并行（全栈项目自动拆前后端） QA → 跑测试，没过就自己修，最多 5 轮 E2E 验证 → 真的把应用跑起来试最终检查 → 需求文档 vs 实际代码逐条对比，有遗漏就补全程你不需要介入。跑完之后你拿到的是： src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求（每个功能的场景、错误处理都写了） design.md # 交互设计 architecture.md # 技术架构（ ADR 、模块划分、技术选型理由） test-cases.md # 测试设计这些文档是项目的"记忆"——下次开新 session ，agent 读一遍 docs/ 就知道项目全貌，不用你重新解释。核心设计写的人和审的人必须是不同 agent 。自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。文档先行，代码最后。不是先写代码再补文档，而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依，测试有的放矢。代码阶段自己决定策略。简单项目（比如命令行工具）一个 agent 自己 TDD 搞定。复杂项目（全栈应用）它会自动拆分模块，先搞 shared types ，然后前后端并行开发，最后自己跑集成测试。每个环节自带修复循环。审查没过？打回重写。测试挂了？自己修。最多 5 轮。不需要你介入指挥。实测数据跑了 4 个全新项目：项目类型测试数结果批量文件重命名工具 Python CLI 67 个测试一次通过实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过个人记账 API + Dashboard FastAPI + React 50 个测试一次通过看板应用 Express + React + 拖拽 — 一次通过每个项目都手动验证过——真的能跑，功能正常。代价本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ，45 分钟到 2 小时不等。如果这个 token 开销让你肉疼，那可能不适合你。但如果你有公司报销，或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通，不如让它自己跑完所有环节，你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装： curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。欢迎反馈。

基于N卡vllm本地部署模型升级及踩坑实录

LinuxDo 最新话题 · 2026-06-10 18:00:45+08:00 · tech

昨天帮甲方升级了一下本地的老模型,因为本人并不是从事运维工作,只是临时补坑,还是浪费了点时间.现在回头做个梳理,希望佬友们在用得到的时候也有个参考(感觉都比较基础,专业的大佬可以跳过不看) 模型下载: 国内环境推荐直接使用 modelscope 下载,如果是内网环境的话,可以下载完再上传到服务器.这里重点关注2个地方模型选择一般来说我们首先考虑显存大小,先本地使用nvidia-smi,查看本机显存非量化模型可以有个简单的公式:显存 ≈ 参数量 × 2 ,然后基本上要留1/4以上余量提供给上下文kv cache,当然你如果已经安装完发现显存不够,可以通过量化参数–quantization降低显存要求 PS.这台服务器真让人流口水啊,也不用担心装不下的问题模型对应的配置要求: 注意仔细阅读模型的介绍页会有推荐的显卡,如果你的显卡等级比推荐的低,大概率就是装不了在安装方式那里,我们会看到要求的版本,现在好像vllm部署比较多,所以我们进入模型页面对应的vllm安装方式会看到这里就有第一个踩坑的点: 虽然他标注的vllm>=0.19.0,但是我建议你就安装对应的版本 .我昨天按文档上的安装了最新vllm版本运行后又会出现版本兼容问题,浪费了不少时间调版本(也不知道是不是vllm高版本不向下兼容的问题,反正vllm里提示transformers版本不对,然后我就问哈基米解决方案,来回升降vllm和transformers版本,最后也解决不了,这实际部署行为,大模型可信度有限) 服务器CUDA版本升级因为服务器是N卡而且现有的服务器CUDA版本太低了,对于要求版本的vllm不兼容,所以第一步先升级cuda. 先查询你要安装的cuda版本,这里我以要装的vllm 0.19.0为例: 安装要求： OS: Linux Python: 3.10 到 3.13 NVIDIA GPU: compute capability >= 7.0 官方依据： vLLM 0.19.0 GPU 安装要求： docs.vllm.ai GPU - vLLM NVIDIA GPU compute capability 官方查询表： NVIDIA Developer NVIDIA CUDA GPU Compute Capability Find the compute capability for your GPU. 这里如果显卡不满足cap的话就只能降vllm版本,装老一点的模型了然后开始具体安装=> 前置:停掉所有占用显卡的进程,查询指令如下 nvidia-smi --query-compute-apps=pid,name --format=csv,noheader,nounits 如果是systemd启动的话可以在列表中先找到相关的服务 systemctl list-units --type=service --state=running 然后直接kill 或者使用对应的systemctl stop xxxx停止服务和nv manager服务 # 停止 Fabric Manager systemctl unmask nvidia-fabricmanager systemctl stop nvidia-fabricmanager # 查询当前驱动和已安装的 fabricmanager dpkg -l | grep -E 'nvidia-fabricmanager|nvidia-driver' apt-mark showhold | grep -E 'nvidia|cuda' || true # 解除旧 fabricmanager 的 hold 并卸载,我本地的是nvidia-fabricmanager-550 apt-mark unhold nvidia-fabricmanager-550 nvidia-fabricmanager-580 2>/dev/null || true apt purge -y nvidia-fabricmanager-550 nvidia-fabricmanager-580 # 停止所有可能占用 GPU 的持久化服务 systemctl stop nvidia-persistenced 接着去NV官网下载对应的 CUDA Toolkit wget https://developer.download.nvidia.com/compute/cuda/12.9.0/local_installers/cuda_12.9.0_575.51.03_linux.run sh cuda_12.9.0_575.51.03_linux.run 根据提示页面输入’accept’和选择install即可,等待安装完毕安装完再系统的全局软链接更新指向新版本的 Toolkit mv /usr/local/cuda /usr/local/cuda.bak ln -s /usr/local/cuda-12.9 /usr/local/cuda # 查询 NVIDIA 驱动版本，fabricmanager 要匹配驱动版本，不是 CUDA toolkit 版本 nvidia-smi --query-gpu=driver_version --format=csv,noheader | head -n 1 # 查询 575 server 驱动和 fabricmanager 可用版本 apt update apt-cache policy nvidia-driver-575-server nvidia-fabricmanager-575 apt-cache madison nvidia-driver-575-server apt-cache madison nvidia-fabricmanager-575 # 安装匹配版本的 server driver + fabricmanager apt install -y nvidia-driver-575-server nvidia-fabricmanager-575 # 驱动升级后必须重启 reboot #恢复管理器 systemctl daemon-reload systemctl enable --now nvidia-fabricmanager systemctl start nvidia-fabricmanager systemctl status nvidia-fabricmanager nvidia-smi topo -m 这里注意装完驱动必须重启服务器 ,然后nvidia-smi 后看到 CUDA Version: 12.9,至此cuda升级完毕安装升级vllm 因为原先这台机器的vllm并不是我来安装的,所以升级的时候,直接安装一套新的conda做虚拟环境管理 wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh ./Anaconda3-2024.10-1-Linux-x86_64.sh #修改环境变量 echo 'export PATH=~/anaconda3/bin:$PATH' >> ~/.bashrc && source ~/.bashrc conda create -n vllm python=3.10 -y source ~/.bashrc && conda activate vllm #安装模型要求的vllm版本,这里替换了国内源,提高下载速度 pip install vllm==0.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple 后续就是调试vllm的启动命令了,这基本参照官方文档和问ai都能搞定,无非就是配置几个选项和上下文大小和量化指标那些 6 个帖子 - 4 位参与者阅读完整话题

基于github项目二开过程中所需要的skills疑问

LinuxDo 最新话题 · 2026-06-10 16:07:30+08:00 · tech

目前想基于一个github项目进行二开，有以下几点需求： 1、首先对项目进行全面的审计，起码要搞清楚每个文件是干嘛的，细致到系统函数最好，重点是新会话不需要重新读源码就能知道每个文件是干嘛的，因为需要改动的部分比较多，一个会话肯定搞不完。 2、能否有一个需求任务进度追踪skills，就是基于我的需求进行更细致的拆分，然后记录了这个会话完成了哪些需求，修改了哪些文件，便于新会话接着这个进度继续。 3、现在佬们都用什么记忆系统，用了一些要么觉得太重，要么占用会话上下文太多，要么触发时机，记录内容不太符合自身需求。 1 个帖子 - 1 位参与者阅读完整话题

地图里的我们——基于AI的情侣旅行记忆平台

LinuxDo 最新话题 · 2026-06-10 15:42:48+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出《我们走过的地图》是一款为情侣设计的旅行回忆微信小程序。作品以地图为核心载体，将旅行足迹、照片、时间线、行程规划与 AI 能力相结合，记录两个人共同走过的城市、留下的故事以及未来想去的地方。用户不仅可以回顾过去的旅程，还能借助 AI 自动生成旅行总结、回忆文案和个性化旅行攻略，让旅行记忆从简单记录升级为更有温度的情感表达。本作品在开发过程中使用 Unity2.ai API 进行创意构思、功能设计、代码开发与内容生成支持，探索 AI 技术在旅行记录与情感陪伴场景中的创新应用。 InfFlow/map-of-cn-mp: 微信小程序版中国足迹/情侣回忆地图，含 PHP + MySQL 后端示例 2 个帖子 - 1 位参与者阅读完整话题

/tag/基于