小红书刷到一堆昨天预测2:0的,什么基于大数据、赔率、最新消息建模的。都说自己是神医,好家伙,还真就给押对了 3 个帖子 - 3 位参与者 阅读完整话题
没什么用 佬友你们的其他模型都是你们自己的 小米就只免费MiMo Auto(限时一个月免费,基于 MiMo-V2.5,支持 100 万 token 上下文) 2 个帖子 - 2 位参与者 阅读完整话题
刚刚看到了小米发来的邮件,MIMO code横空出世 看了下源码发现是基于opencode做的 github.com GitHub - XiaomiMiMo/MiMo-Code 通过在 GitHub 上创建帐户来为 XiaomiMiMo/MiMo-Code 开发做出贡献。 1 个帖子 - 1 位参与者 阅读完整话题
https://coin.v2ex.pro/ https://coin.v2ex.pro/coin/9raUVuzeWUk53co63M4WXLWPWE4Xc6Lpn7RS9dnkpump 基于 Coin Community SDK 的一个 Web Client: https://coincommunities.org/docs Coin Community SDK 是来自 Pump.fun 的一个后端服务: 提供了 X 登录 token gate 逻辑验证 内容和图片存储 基于 Coin Community SDK ,每个在 Pump 上的 token 都可以构建一个属于自己的,类似 Twitter 体验的社区。 如果你已经持有 $V2EX ,就可以直接加入体验。
小米突发MiMo Code,基于opencode fork的,已经用上了,不用登录免费用MiMo auto github.com GitHub - XiaomiMiMo/MiMo-Code 通过在 GitHub 上创建帐户来为 XiaomiMiMo/MiMo-Code 开发做出贡献。 12 个帖子 - 8 位参与者 阅读完整话题
何意味啊,跟minimax code一样,都选择opencode这种成品套壳,而不是基于pi来做。 而且minimax code好歹做了一套自己的gui,mimo code这个我都无力吐槽了 不知道隔壁opencode害怕了吗? 忘了带上链接 https://mp.weixin.qq.com/s/WkMPz-eBK2Hz0ZTQEwtx6w 附带一下qwen分析的mimocode的优势 不过有一说一,mimo是我用过最容易死循环的LLM。真给它/GOAL,不会一晚上跑没额度吗 10 个帖子 - 8 位参与者 阅读完整话题
https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API:用你自己的浏览器登录态,把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源,再通过网页、RSS 和 JSON API 消费。 它不是多用户托管服务,也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据,不提交到仓库。 它做什么 通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。 使用你自己的登录态抓取平台推荐流: X/Twitter home timeline GraphQL 响应 知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。 将内容归一化为 Message / Author / Account 等 k8s 风格资源。 提供 React 阅读界面:按源过滤、未读追踪、登录恢复、手动刷新。 提供 RSS: /rss/<source>.xml 和 /rss/all.xml 。 图片会本地化到 data/media ,方便 RSS 阅读器稳定回源。 隐私边界 仓库只放应用代码。以下运行态路径已被 git 忽略: profiles/ :Chrome profile 、cookies 、登录态 data/ :抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* :本地部署配置 公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。 本地运行 依赖: Bun pnpm Chrome / Chromium jq 、 xmllint (用于 verify.sh ) 启动: pnpm install pnpm start 默认地址: 后端 API: http://localhost:3001 前端网页: http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录,页面会提示登录;登录过程发生在受管 Chrome profile (默认 profiles/main )里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时,会先检查本机 CDP: http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用,后端会自动拉起一个有窗口的 Chrome / Chromium: CDP 只监听本机 127.0.0.1 。 默认 CDP 端口是 19223 ,可用 RADAR_CDP_PORT 修改。 默认 profile 是 profiles/main ,可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测;找不到时用 RADAR_CHROME_BIN 指定。 启动参数包含 --remote-debugging-port 和 --user-data-dir ,因此登录态会持久化在 profile 目录里。 登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话,因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量: XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ,后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置: export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据,不依赖真实平台登录态。 部署 Refresh 运行两个进程: 后端: bun server/index.ts 前端/Vite 反代: bunx vite 公网部署时,把公网地址放进环境变量,然后用反向代理或 tunnel 暴露 Vite 端口。 示例: export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会: 在 tmux session 中启动后端和前端; 用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ,保证 RSS 里的媒体地址能回源; 从 REFRESH_PUBLIC_URL 推导 Vite allowed host ; 将进程日志写入 data/logs/ 。 公网代理或 tunnel 指向: http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问,因此通常只需要暴露 Web 端口。 常用环境变量 变量 用途 默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件 自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台,例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ,逗号分隔 未设置 REFRESH_PUBLIC_URL 公网部署 URL ,供 scripts/ start-k2-tmux.sh 使用 脚本必填 文档 文件 内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项
https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API:用你自己的浏览器登录态,把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源,再通过网页、RSS 和 JSON API 消费。 它不是多用户托管服务,也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据,不提交到仓库。 它做什么 通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。 使用你自己的登录态抓取平台推荐流: X/Twitter home timeline GraphQL 响应 知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。 将内容归一化为 Message / Author / Account 等 k8s 风格资源。 提供 React 阅读界面:按源过滤、未读追踪、登录恢复、手动刷新。 提供 RSS: /rss/<source>.xml 和 /rss/all.xml 。 图片会本地化到 data/media ,方便 RSS 阅读器稳定回源。 隐私边界 仓库只放应用代码。以下运行态路径已被 git 忽略: profiles/ :Chrome profile 、cookies 、登录态 data/ :抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* :本地部署配置 公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。 本地运行 依赖: Bun pnpm Chrome / Chromium jq 、 xmllint (用于 verify.sh ) 启动: pnpm install pnpm start 默认地址: 后端 API: http://localhost:3001 前端网页: http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录,页面会提示登录;登录过程发生在受管 Chrome profile (默认 profiles/main )里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时,会先检查本机 CDP: http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用,后端会自动拉起一个有窗口的 Chrome / Chromium: CDP 只监听本机 127.0.0.1 。 默认 CDP 端口是 19223 ,可用 RADAR_CDP_PORT 修改。 默认 profile 是 profiles/main ,可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测;找不到时用 RADAR_CHROME_BIN 指定。 启动参数包含 --remote-debugging-port 和 --user-data-dir ,因此登录态会持久化在 profile 目录里。 登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话,因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量: XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ,后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置: export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据,不依赖真实平台登录态。 部署 Refresh 运行两个进程: 后端: bun server/index.ts 前端/Vite 反代: bunx vite 公网部署时,把公网地址放进环境变量,然后用反向代理或 tunnel 暴露 Vite 端口。 示例: export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会: 在 tmux session 中启动后端和前端; 用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ,保证 RSS 里的媒体地址能回源; 从 REFRESH_PUBLIC_URL 推导 Vite allowed host ; 将进程日志写入 data/logs/ 。 公网代理或 tunnel 指向: http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问,因此通常只需要暴露 Web 端口。 常用环境变量 变量 用途 默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件 自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台,例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ,逗号分隔 未设置 REFRESH_PUBLIC_URL 公网部署 URL ,供 scripts/ start-k2-tmux.sh 使用 脚本必填 文档 文件 内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项
https://github.com/woodgear/refresh Refresh Refresh 是一个自托管的个人账号 feed API:用你自己的浏览器登录态,把 X/Twitter 、知乎、B 站推给你的内容采集成结构化资源,再通过网页、RSS 和 JSON API 消费。 它不是多用户托管服务,也不内置第三方账号凭据。登录态、抓取到的内容、媒体缓存和日志都属于本机运行态数据,不提交到仓库。 它做什么 通过 Chrome DevTools Protocol 操控一个独立的 Chrome profile 。 使用你自己的登录态抓取平台推荐流: X/Twitter home timeline GraphQL 响应 知乎 topstory / moments API B 站动态流 / 热门 API 每次抓取保存为不可变的 RefreshWindow 档案。 将内容归一化为 Message / Author / Account 等 k8s 风格资源。 提供 React 阅读界面:按源过滤、未读追踪、登录恢复、手动刷新。 提供 RSS: /rss/<source>.xml 和 /rss/all.xml 。 图片会本地化到 data/media ,方便 RSS 阅读器稳定回源。 隐私边界 仓库只放应用代码。以下运行态路径已被 git 忽略: profiles/ :Chrome profile 、cookies 、登录态 data/ :抓取内容、媒体、overlay 、调度器状态、日志 .env / .env.* :本地部署配置 公开仓库前不要把运行态目录、截图、导出的 cookie 、本地环境变量文件或真实数据样例提交进来。 本地运行 依赖: Bun pnpm Chrome / Chromium jq 、 xmllint (用于 verify.sh ) 启动: pnpm install pnpm start 默认地址: 后端 API: http://localhost:3001 前端网页: http://localhost:5173 首次使用时打开 http://localhost:5173 。如果账号未登录,页面会提示登录;登录过程发生在受管 Chrome profile (默认 profiles/main )里。 Chrome 启动与登录态 Refresh 不依赖外部浏览器自动化服务。后端需要访问平台时,会先检查本机 CDP: http://127.0.0.1:${RADAR_CDP_PORT}/json/version 如果 CDP 不可用,后端会自动拉起一个有窗口的 Chrome / Chromium: CDP 只监听本机 127.0.0.1 。 默认 CDP 端口是 19223 ,可用 RADAR_CDP_PORT 修改。 默认 profile 是 profiles/main ,可用 RADAR_PROFILE_DIR 修改。 Chrome 路径会自动探测;找不到时用 RADAR_CHROME_BIN 指定。 启动参数包含 --remote-debugging-port 和 --user-data-dir ,因此登录态会持久化在 profile 目录里。 登录、扫码和抓取都使用这个同一个 profile 。不要把 profiles/ 提交到仓库。 Linux 服务器部署时需要有可用的图形桌面会话,因为平台登录通常需要可见窗口。 scripts/ start-k2-tmux.sh 会在 tmux 进程里补齐常见桌面环境变量: XDG_RUNTIME_DIR WAYLAND_DISPLAY DISPLAY DBUS_SESSION_BUS_ADDRESS 如果检测到 WAYLAND_DISPLAY ,后端启动 Chrome 时会默认追加 --ozone-platform=wayland 。需要强制指定时可以设置: export RADAR_CHROME_OZONE_PLATFORM=wayland 验证 bunx tsc --noEmit ./verify.sh verify.sh 使用隔离的 mock 数据,不依赖真实平台登录态。 部署 Refresh 运行两个进程: 后端: bun server/index.ts 前端/Vite 反代: bunx vite 公网部署时,把公网地址放进环境变量,然后用反向代理或 tunnel 暴露 Vite 端口。 示例: export REFRESH_PUBLIC_URL="https://refresh.example.com" export SERVER_PORT=13001 export WEB_PORT=13002 scripts/start-k2-tmux.sh scripts/ start-k2-tmux.sh 会: 在 tmux session 中启动后端和前端; 用 REFRESH_PUBLIC_URL 设置 RADAR_BASE_URL ,保证 RSS 里的媒体地址能回源; 从 REFRESH_PUBLIC_URL 推导 Vite allowed host ; 将进程日志写入 data/logs/ 。 公网代理或 tunnel 指向: http://127.0.0.1:${WEB_PORT} 后端通过 Vite proxy 访问,因此通常只需要暴露 Web 端口。 常用环境变量 变量 用途 默认 PORT 后端端口 3001 RADAR_DATA_DIR 数据根目录 ./data RADAR_BASE_URL RSS 媒体绝对地址 http://localhost:$PORT RADAR_CDP_PORT 受管 Chrome CDP 端口 19223 RADAR_PROFILE_DIR 受管 Chrome profile 目录 ./profiles/main RADAR_CHROME_BIN Chrome 可执行文件 自动探测 RADAR_CHROME_OZONE_PLATFORM Chrome Ozone 平台,例如 wayland 检测到 WAYLAND_DISPLAY 时为 wayland RADAR_PROXY 媒体下载代理 http://127.0.0.1:7890 REFRESH_API_TARGET Vite 反代的后端地址 http://localhost:3001 REFRESH_ALLOWED_HOSTS Vite 允许访问的 host ,逗号分隔 未设置 REFRESH_PUBLIC_URL 公网部署 URL ,供 scripts/ start-k2-tmux.sh 使用 脚本必填 文档 文件 内容 AGENTS.md 当前架构、约定、API 速查、常见任务操作手册 docs/design.md 原始设计蓝图和设计取舍 docs/progress.md 实施日志、踩坑记录和后续候选项
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 我用 flutter 做了一个开源的语音生成 app,主要还是利用了目前小米免费的 mimo 语音生成模型并利用 ai 对需要生成的语音文字进行打标签和润色。当然需要填你自己的 MIMO 的 API,和用于润色这个文字的 AI 模型的 API。 开源官网: https://shenghui.cloudlark.net/ 开源仓库: https://github.com/FuKun0113/shenghui-ai-voice-studio 软件截图: 1 个帖子 - 1 位参与者 阅读完整话题
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
分享个自己做的东西。 问题 用 AI 写代码越来越爽,但也越来越烦。主要几个痛点: 1. 你变成了人肉 QA Claude 说"搞定了",你一跑全是 bug 。然后进入死循环:测→报→修→测→报→修…… 明明是让它帮你省时间的,结果你的时间全花在当测试员上了。 2. 完全黑盒 让它搞个复杂点的东西,跑了 20 分钟,你完全不知道它到哪了、在干什么、卡住了没有。 3. 失忆 换个 session 、compact 一下、context 太长被截断——它就忘了项目是什么、之前做了什么决定、代码为什么这么写。下次对话从零开始解释。 4. 偷工减料 你让它写个完整功能,它可能跳过测试、不做错误处理、架构随便搞。你不盯着它就不老实。 我的方案 拿 Claude Code 的 dynamic workflow 做了个强制流水线。你给一句话需求,它必须走完 9 个阶段才交付: /lightsout 用 Express + SQLite + React 做个看板应用,支持拖拽、标签、到期提醒 然后它自动跑: 需求编写 → 独立 agent 审查(不过就打回重写) 交互设计 → 独立 agent 审查 技术架构 → 独立 agent 审查 一致性检查 → 三份文档互相对不上的地方找出来修掉 测试用例设计 → 写代码之前先把测试想清楚 写代码 → 自主决定要不要拆分并行(全栈项目自动拆前后端) QA → 跑测试,没过就自己修,最多 5 轮 E2E 验证 → 真的把应用跑起来试 最终检查 → 需求文档 vs 实际代码逐条对比,有遗漏就补 全程你不需要介入。跑完之后你拿到的是: src/ # 能跑的代码 tests/ # 测试全过 docs/ spec.md # 产品需求(每个功能的场景、错误处理都写了) design.md # 交互设计 architecture.md # 技术架构( ADR 、模块划分、技术选型理由) test-cases.md # 测试设计 这些文档是项目的"记忆"——下次开新 session ,agent 读一遍 docs/ 就知道项目全貌,不用你重新解释。 核心设计 写的人和审的人必须是不同 agent 。 自己审自己肯定放水。拆开之后质量真的不一样——reviewer 会挑出 writer 自己看不到的问题。 文档先行,代码最后。 不是先写代码再补文档,而是需求、设计、架构全部写完审完了再动手。这样写出来的代码有据可依,测试有的放矢。 代码阶段自己决定策略。 简单项目(比如命令行工具)一个 agent 自己 TDD 搞定。复杂项目(全栈应用)它会自动拆分模块,先搞 shared types ,然后前后端并行开发,最后自己跑集成测试。 每个环节自带修复循环。 审查没过?打回重写。测试挂了?自己修。最多 5 轮。不需要你介入指挥。 实测数据 跑了 4 个全新项目: 项目 类型 测试数 结果 批量文件重命名工具 Python CLI 67 个测试 一次通过 实时 Markdown 编辑器 Express + React + WebSocket 66 个测试 1 轮修复后通过 个人记账 API + Dashboard FastAPI + React 50 个测试 一次通过 看板应用 Express + React + 拖拽 — 一次通过 每个项目都手动验证过——真的能跑,功能正常。 代价 本质上这东西是拿 token 换你的时间和精力。每次跑 30-50 个 agent call ,45 分钟到 2 小时不等。如果这个 token 开销让你肉疼,那可能不适合你。但如果你有公司报销,或者你觉得自己的注意力比 token 值钱——与其花一小时盯着它干活、测 bug 、来回沟通,不如让它自己跑完所有环节,你回来看成品——那这个 trade-off 就很值。 Repo GitHub: https://github.com/DreamChaserEric/claude-lights-out 一行安装: curl -fsSL https://raw.githubusercontent.com/DreamChaserEric/claude-lights-out/main/install.sh | bash 需要 Claude Code 且支持 workflow 功能。 欢迎反馈。
昨天帮甲方升级了一下本地的老模型,因为本人并不是从事运维工作,只是临时补坑,还是浪费了点时间.现在回头做个梳理,希望佬友们在用得到的时候也有个参考(感觉都比较基础,专业的大佬可以跳过不看) 模型下载: 国内环境推荐直接使用 modelscope 下载,如果是内网环境的话,可以下载完再上传到服务器.这里重点关注2个地方 模型选择 一般来说我们首先考虑显存大小,先本地使用nvidia-smi,查看本机显存 非量化模型可以有个简单的公式:显存 ≈ 参数量 × 2 ,然后基本上要留1/4以上余量提供给上下文kv cache,当然你如果已经安装完发现显存不够,可以通过量化参数–quantization降低显存要求 PS.这台服务器真让人流口水啊,也不用担心装不下的问题 模型对应的配置要求: 注意仔细阅读模型的介绍页 会有推荐的显卡,如果你的显卡等级比推荐的低,大概率就是装不了 在安装方式那里,我们会看到要求的版本,现在好像vllm部署比较多,所以我们进入模型页面对应的vllm安装方式会看到 这里就有第一个踩坑的点: 虽然他标注的vllm>=0.19.0,但是我建议你就安装对应的版本 .我昨天按文档上的安装了最新vllm版本运行后又会出现版本兼容问题,浪费了不少时间调版本(也不知道是不是vllm高版本不向下兼容的问题,反正vllm里提示transformers版本不对,然后我就问哈基米解决方案,来回升降vllm和transformers版本,最后也解决不了,这实际部署行为,大模型可信度有限) 服务器CUDA版本升级 因为服务器是N卡而且现有的服务器CUDA版本太低了,对于要求版本的vllm不兼容,所以第一步先升级cuda. 先查询你要安装的cuda版本,这里我以要装的vllm 0.19.0为例: 安装要求: OS: Linux Python: 3.10 到 3.13 NVIDIA GPU: compute capability >= 7.0 官方依据: vLLM 0.19.0 GPU 安装要求: docs.vllm.ai GPU - vLLM NVIDIA GPU compute capability 官方查询表: NVIDIA Developer NVIDIA CUDA GPU Compute Capability Find the compute capability for your GPU. 这里如果显卡不满足cap的话就只能降vllm版本,装老一点的模型了 然后开始具体安装=> 前置:停掉所有占用显卡的进程,查询指令如下 nvidia-smi --query-compute-apps=pid,name --format=csv,noheader,nounits 如果是systemd启动的话可以在列表中先找到相关的服务 systemctl list-units --type=service --state=running 然后直接kill 或者使用对应的systemctl stop xxxx停止服务和nv manager服务 # 停止 Fabric Manager systemctl unmask nvidia-fabricmanager systemctl stop nvidia-fabricmanager # 查询当前驱动和已安装的 fabricmanager dpkg -l | grep -E 'nvidia-fabricmanager|nvidia-driver' apt-mark showhold | grep -E 'nvidia|cuda' || true # 解除旧 fabricmanager 的 hold 并卸载,我本地的是nvidia-fabricmanager-550 apt-mark unhold nvidia-fabricmanager-550 nvidia-fabricmanager-580 2>/dev/null || true apt purge -y nvidia-fabricmanager-550 nvidia-fabricmanager-580 # 停止所有可能占用 GPU 的持久化服务 systemctl stop nvidia-persistenced 接着去NV官网下载对应的 CUDA Toolkit wget https://developer.download.nvidia.com/compute/cuda/12.9.0/local_installers/cuda_12.9.0_575.51.03_linux.run sh cuda_12.9.0_575.51.03_linux.run 根据提示页面输入’accept’和选择install即可,等待安装完毕 安装完再系统的全局软链接更新指向新版本的 Toolkit mv /usr/local/cuda /usr/local/cuda.bak ln -s /usr/local/cuda-12.9 /usr/local/cuda # 查询 NVIDIA 驱动版本,fabricmanager 要匹配驱动版本,不是 CUDA toolkit 版本 nvidia-smi --query-gpu=driver_version --format=csv,noheader | head -n 1 # 查询 575 server 驱动和 fabricmanager 可用版本 apt update apt-cache policy nvidia-driver-575-server nvidia-fabricmanager-575 apt-cache madison nvidia-driver-575-server apt-cache madison nvidia-fabricmanager-575 # 安装匹配版本的 server driver + fabricmanager apt install -y nvidia-driver-575-server nvidia-fabricmanager-575 # 驱动升级后必须重启 reboot #恢复管理器 systemctl daemon-reload systemctl enable --now nvidia-fabricmanager systemctl start nvidia-fabricmanager systemctl status nvidia-fabricmanager nvidia-smi topo -m 这里 注意装完驱动必须重启服务器 ,然后nvidia-smi 后看到 CUDA Version: 12.9,至此cuda升级完毕 安装升级vllm 因为原先这台机器的vllm并不是我来安装的,所以升级的时候,直接安装一套新的conda做虚拟环境管理 wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh ./Anaconda3-2024.10-1-Linux-x86_64.sh #修改环境变量 echo 'export PATH=~/anaconda3/bin:$PATH' >> ~/.bashrc && source ~/.bashrc conda create -n vllm python=3.10 -y source ~/.bashrc && conda activate vllm #安装模型要求的vllm版本,这里替换了国内源,提高下载速度 pip install vllm==0.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple 后续就是调试vllm的启动命令了,这基本参照官方文档和问ai都能搞定,无非就是配置几个选项和上下文大小和量化指标那些 6 个帖子 - 4 位参与者 阅读完整话题
目前想基于一个github项目进行二开,有以下几点需求: 1、首先对项目进行全面的审计,起码要搞清楚每个文件是干嘛的,细致到系统函数最好,重点是新会话不需要重新读源码就能知道每个文件是干嘛的,因为需要改动的部分比较多,一个会话肯定搞不完。 2、能否有一个需求任务进度追踪skills,就是基于我的需求进行更细致的拆分,然后记录了这个会话完成了哪些需求,修改了哪些文件,便于新会话接着这个进度继续。 3、现在佬们都用什么记忆系统,用了一些要么觉得太重,要么占用会话上下文太多,要么触发时机,记录内容不太符合自身需求。 1 个帖子 - 1 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 《我们走过的地图》是一款为情侣设计的旅行回忆微信小程序。作品以地图为核心载体,将旅行足迹、照片、时间线、行程规划与 AI 能力相结合,记录两个人共同走过的城市、留下的故事以及未来想去的地方。 用户不仅可以回顾过去的旅程,还能借助 AI 自动生成旅行总结、回忆文案和个性化旅行攻略,让旅行记忆从简单记录升级为更有温度的情感表达。 本作品在开发过程中使用 Unity2.ai API 进行创意构思、功能设计、代码开发与内容生成支持,探索 AI 技术在旅行记录与情感陪伴场景中的创新应用。 InfFlow/map-of-cn-mp: 微信小程序版中国足迹/情侣回忆地图,含 PHP + MySQL 后端示例 2 个帖子 - 1 位参与者 阅读完整话题