WWW.YOUINFO.SITE
标签聚合 团队

/tag/团队

LinuxDo 最新话题 · 2026-06-11 19:24:07+08:00 · tech

小弟我这边之前有部署一个内网的CPA供内部小团队使用,但因为最近上面想看下消耗、并计划给开放部分资源其他部门,于是我就部署了一个new api,来做分发。 目前遇到一个情况,因为考虑开放资源给其他部门后的一些合规的问题,我把之前CPA上的mimo、minimax等国模添加到new api后,即new api里的国模上游就是官方渠道,不是CPA,这个时候用codex cli 和 cherrystudio测试时,发现使用v1/chat/completions是可以正常工作的,但是使用v1/responses时直接报错 get request url failed: unsupported relay mode: 33 这种情况我下我是该怎么处理呢。 5 个帖子 - 3 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-11 14:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线 每阶段都做"测试"——只是测试对象不同。 我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。 不是 6 次相同动作 —— 是 6 类不同性质的验证 。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段 性质 独有验证 ① 单元 函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成 跨网络 跨服务冒烟 + DML 比对 ③ Review 设计性能 设计审查 + 性能分析 + 回滚方案 ④ 他测 用户视角 提测文档 + Test Case + 修复后再比对 ⑤ 灰度 生产数据 时间窗口 + 分工 + DML 在线比对 ⑥ 上线 业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。 阶段拆分的核心标准 我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。 举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。 但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对 他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对 合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。 第 6 阶段最贵 —— 也最被忽视 很多团队的"上线观察"=刷一下监控大盘。 我的版本: 6 项指标 + 四方确认 。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。 因为这两项指标"看起来不归技术管"。 但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标 里全是绿的,只有第 5 、6 项暴露异常 。 例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度 都看不出来 ,只有"业务大盘"能看见。 四方确认 —— 不是签字流程 四方确认 = 开发 / 测试 / 技术 TO / 产品 都同意才能"上线观察通过"。 听起来像 PPT 流程,但 反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。 四方共同确认—— 任何一方说"我看到的不对"——就回退 。 我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。 反共识在哪 主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证 主流:每阶段都做"测试"动作 我的版本:每阶段对应 该阶段性质独有 的验证手段 主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认 主流:业务大盘归运营管 我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标 主流:验收 = 测试通过 我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套 也踩过坑。 某次内部小工具改动,代码量不到 200 行。 我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。 我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走 不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用 我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高 跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来 可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质 决策慢 —— 至少 6 次评审 / 检查 最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。 所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。 写在最后 把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题 。 每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。 跟"渐进式改造"和"比对工具"一样,这是一套 关心可逆性、关心 追溯性 的工程纪律。 写到这,我也不太确定 6 阶段对所有团队都成立。 我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。 但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。 这点我自己也还在想。 下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是 纵向 (时间),17 类是 横向 (业务域)。 两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。 如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑 。)

cnBeta全文版 · 2026-06-11 14:35:06+08:00 · tech

英国剑桥大学研究团队近日宣布,利用人工智能(AI)设计的一种新型 DNA 疫苗已完成首次人体试验,旨在通过一次接种,对所有已知人类冠状病毒变异株,以及潜在由蝙蝠传播至人类的相关病毒,提供广谱防护。 这款疫苗被研究人员称为一种“根本性全新”的疫苗类型,其关键抗原成分完全由 AI 设计而成。 传统疫苗通常针对某一种特定病毒,通过训练免疫系统识别某个或少数几个病毒蛋白,但病毒不断变异,当变异幅度足够大时,原有疫苗保护力便会明显下降,这也是流感疫苗需要每年更新、以及新冠疫苗自 2021 年以来多次更新配方的原因。 研究团队指出,AI 为这一难题提供了新的解决思路:通过分析成千上万种相关病毒的基因数据,AI 可以筛选出在不同毒株之间高度保守、且在进化过程中不易发生变化的序列片段,从而为疫苗设计提供一个针对“整个病毒家族”的目标,而不是仅限于某一条已知毒株。 具体而言,剑桥团队利用 AI 扫描了包括引发非典(SARS)、新冠(COVID-19)在内的 “sarbecovirus” 亚属病毒,以及一系列动物冠状病毒,寻找在长期演化中几乎未被改动的共同特征,这些稳定区域最终被用作新疫苗的免疫靶点。 研究人员希望,通过锁定这些不易变异的“共性弱点”,可以在未来新的相关病毒出现时,仍保持一定程度的交叉保护能力,从而为应对未知疫情争取宝贵时间。 与公众更为熟悉的 mRNA 新冠疫苗不同,这款新疫苗采用 DNA 技术路线。 相比 mRNA 疫苗,DNA 疫苗在储存和运输环节一般更加稳定,对冷链条件的要求较低,这对于冷链基础设施有限的低收入国家而言尤为关键。 此外,该疫苗不需要传统针头注射,而是通过高压液流将疫苗喷射入皮肤,这种无针给药方式有望降低接种过程中的疼痛感,同时在大规模暴发时更易快速部署,提高接种效率。 从公共卫生视角看,研究者强调,如果这种技术路径被证明有效,广谱疫苗有望改变人类应对新发传染病的方式。 通过针对病毒家族中跨毒株共享的特征进行设计,广谱疫苗有望在疫情早期就为尚未见过的新病毒提供基础防护,使公共卫生部门能够在大流行形成前阻断传播链。 同样思路也被视为流感领域的潜在“游戏规则改变者”:目前科学家需要提前预测每年流感季的优势毒株,一旦预判失误,疫苗保护效果就会大打折扣,而如果能够研制针对多种流感毒株共享特征的“通用流感疫苗”,则有望结束这种年度“追赶战”。 埃博拉的最新疫情则凸显了这一方向的现实紧迫性。近期在刚果民主共和国和乌干达出现的疫情主要由 Bundibugyo 毒株推动,这一毒株可以规避现有疫苗的保护,使当地社区处于较高风险之中。 在研究人员紧急研制针对该特定毒株的新疫苗的同时,一种针对整个病毒家族的广谱疫苗,如果能够提前部署,将有可能避免类似的“毒株更替—疫苗落后”的被动局面。 在这项最新的人体试验中,研究者报告称,这是全球首个在人体中测试的 AI 设计疫苗。 结果显示,这款 DNA 疫苗能够刺激受试者免疫系统,产生可以识别多种 sarbecovirus 的抗体。 试验同时表明,该技术路线在受试者中总体安全、耐受性良好。 该团队认为,这一结果表明,AI 在设计针对未来潜在大流行病原体、并具备“变异抵抗性”的新型疫苗方面,展现出重要潜力,而无针给药系统则为全球范围内的推广接种带来额外优势。 不过,研究者也坦言,这一进展距离真正意义上的“通用疫苗”仍有相当距离。 当前研究中观察到的免疫应答虽具有广谱性,但总体水平仍然偏温和,保护效果能否维持多久、是否需要额外加强针,尚无定论。 此外,还需要通过更大规模的临床试验来验证,该疫苗在真实世界条件下是否确实能够预防或减轻不同病毒感染。 专家指出,一款可广泛应用的通用疫苗在数年内难以完全成熟,任何新疫苗仍须经过多阶段、大样本的临床试验,以证明其安全性、有效性以及长期保护能力。 尽管如此,这项研究表明,在 AI 的加持下,科学界距离这一目标正逐步逼近,而借助算法对庞大病毒谱系进行系统分析和快速设计,可能会显著缩短下一代疫苗从概念到临床应用的时间。 查看评论

V2EX - 技术 · 2026-06-11 13:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线 每阶段都做"测试"——只是测试对象不同。 我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。 不是 6 次相同动作 —— 是 6 类不同性质的验证 。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段 性质 独有验证 ① 单元 函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成 跨网络 跨服务冒烟 + DML 比对 ③ Review 设计性能 设计审查 + 性能分析 + 回滚方案 ④ 他测 用户视角 提测文档 + Test Case + 修复后再比对 ⑤ 灰度 生产数据 时间窗口 + 分工 + DML 在线比对 ⑥ 上线 业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。 阶段拆分的核心标准 我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。 举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。 但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对 他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对 合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。 第 6 阶段最贵 —— 也最被忽视 很多团队的"上线观察"=刷一下监控大盘。 我的版本: 6 项指标 + 四方确认 。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。 因为这两项指标"看起来不归技术管"。 但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标 里全是绿的,只有第 5 、6 项暴露异常 。 例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度 都看不出来 ,只有"业务大盘"能看见。 四方确认 —— 不是签字流程 四方确认 = 开发 / 测试 / 技术 TO / 产品 都同意才能"上线观察通过"。 听起来像 PPT 流程,但 反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。 四方共同确认—— 任何一方说"我看到的不对"——就回退 。 我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。 反共识在哪 主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证 主流:每阶段都做"测试"动作 我的版本:每阶段对应 该阶段性质独有 的验证手段 主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认 主流:业务大盘归运营管 我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标 主流:验收 = 测试通过 我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套 也踩过坑。 某次内部小工具改动,代码量不到 200 行。 我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。 我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走 不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用 我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高 跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来 可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质 决策慢 —— 至少 6 次评审 / 检查 最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。 所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。 写在最后 把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题 。 每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。 跟"渐进式改造"和"比对工具"一样,这是一套 关心可逆性、关心 追溯性 的工程纪律。 写到这,我也不太确定 6 阶段对所有团队都成立。 我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。 但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。 这点我自己也还在想。 下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是 纵向 (时间),17 类是 横向 (业务域)。 两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。 如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑 。)

V2EX - 技术 · 2026-06-11 13:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线 每阶段都做"测试"——只是测试对象不同。 我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。 不是 6 次相同动作 —— 是 6 类不同性质的验证 。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段 性质 独有验证 ① 单元 函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成 跨网络 跨服务冒烟 + DML 比对 ③ Review 设计性能 设计审查 + 性能分析 + 回滚方案 ④ 他测 用户视角 提测文档 + Test Case + 修复后再比对 ⑤ 灰度 生产数据 时间窗口 + 分工 + DML 在线比对 ⑥ 上线 业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。 阶段拆分的核心标准 我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。 举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。 但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对 他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对 合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。 第 6 阶段最贵 —— 也最被忽视 很多团队的"上线观察"=刷一下监控大盘。 我的版本: 6 项指标 + 四方确认 。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。 因为这两项指标"看起来不归技术管"。 但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标 里全是绿的,只有第 5 、6 项暴露异常 。 例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度 都看不出来 ,只有"业务大盘"能看见。 四方确认 —— 不是签字流程 四方确认 = 开发 / 测试 / 技术 TO / 产品 都同意才能"上线观察通过"。 听起来像 PPT 流程,但 反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。 四方共同确认—— 任何一方说"我看到的不对"——就回退 。 我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。 反共识在哪 主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证 主流:每阶段都做"测试"动作 我的版本:每阶段对应 该阶段性质独有 的验证手段 主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认 主流:业务大盘归运营管 我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标 主流:验收 = 测试通过 我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套 也踩过坑。 某次内部小工具改动,代码量不到 200 行。 我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。 我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走 不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用 我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高 跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来 可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质 决策慢 —— 至少 6 次评审 / 检查 最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。 所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。 写在最后 把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题 。 每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。 跟"渐进式改造"和"比对工具"一样,这是一套 关心可逆性、关心 追溯性 的工程纪律。 写到这,我也不太确定 6 阶段对所有团队都成立。 我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。 但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。 这点我自己也还在想。 下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是 纵向 (时间),17 类是 横向 (业务域)。 两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。 如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑 。)

V2EX - 技术 · 2026-06-11 12:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线 每阶段都做"测试"——只是测试对象不同。 我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。 不是 6 次相同动作 —— 是 6 类不同性质的验证 。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段 性质 独有验证 ① 单元 函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成 跨网络 跨服务冒烟 + DML 比对 ③ Review 设计性能 设计审查 + 性能分析 + 回滚方案 ④ 他测 用户视角 提测文档 + Test Case + 修复后再比对 ⑤ 灰度 生产数据 时间窗口 + 分工 + DML 在线比对 ⑥ 上线 业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。 阶段拆分的核心标准 我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。 举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。 但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对 他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对 合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。 第 6 阶段最贵 —— 也最被忽视 很多团队的"上线观察"=刷一下监控大盘。 我的版本: 6 项指标 + 四方确认 。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。 因为这两项指标"看起来不归技术管"。 但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标 里全是绿的,只有第 5 、6 项暴露异常 。 例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度 都看不出来 ,只有"业务大盘"能看见。 四方确认 —— 不是签字流程 四方确认 = 开发 / 测试 / 技术 TO / 产品 都同意才能"上线观察通过"。 听起来像 PPT 流程,但 反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。 四方共同确认—— 任何一方说"我看到的不对"——就回退 。 我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。 反共识在哪 主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证 主流:每阶段都做"测试"动作 我的版本:每阶段对应 该阶段性质独有 的验证手段 主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认 主流:业务大盘归运营管 我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标 主流:验收 = 测试通过 我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套 也踩过坑。 某次内部小工具改动,代码量不到 200 行。 我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。 我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走 不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用 我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高 跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来 可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质 决策慢 —— 至少 6 次评审 / 检查 最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。 所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。 写在最后 把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题 。 每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。 跟"渐进式改造"和"比对工具"一样,这是一套 关心可逆性、关心 追溯性 的工程纪律。 写到这,我也不太确定 6 阶段对所有团队都成立。 我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。 但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。 这点我自己也还在想。 下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是 纵向 (时间),17 类是 横向 (业务域)。 两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。 如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑 。)

LinuxDo 最新话题 · 2026-06-11 04:34:50+08:00 · tech

我要给我自己的账号购买网页版 ChatGPT Plus,但是想要通过自建中转给团队共享 目前团队是 GLM Coding Plan 的 Lite 就已经够用 目前在站内有看到过 sub2api, CPA, NewAPI,目前是想要给 5-6 人使用,选什么工具比较好呢? 或者除了上述工具之外,还有一些我没发现但是佬友用过觉得好的工具,也欢迎佬友补充! 如果设置每日额度的话,每人每日的额度要设置多少才能让 OpenAI 的风控最小化?因为这个账号也确实是我一直以来在自用的账号, 终究是有点感情不希望被ban 18 个帖子 - 10 位参与者 阅读完整话题

v2ex · 2026-06-10 13:43:52+08:00 · tech

🚀 Claude360 福利活动来啦! 大家好,我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台 。 为了让更多开发者和团队低成本体验 Claude / GPT 系列模型,Claude360 长期开放多项福利活动,欢迎大家体验使用! 🌐 官网地址: 👉 https://claude360.xyz 🎁 活动一:新用户首充福利 首充仅需 ¥9.9 ,到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。 支持接入: Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型: Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型 其他 Kiro 反代分组 适用于: AI 编程 代码审查 文档生成 自动化开发 Agent 工作流 团队协作开发 💰 活动二:充值阶梯赠送 除首充福利外,所有用户均可参与充值赠送活动: 充值金额 赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送,长期使用更划算。 适合: 高频开发者 AI Coding 重度用户 团队统一采购 🏢 活动三:团队试用计划 面向: 企业 工作室 创业团队 技术负责人 审核通过可获得 🎁 50 元团队测试额度 可提供以下任意一种证明 企业邮箱 团队官网 名片 工牌 职务证明 GitHub / GitLab 团队主页 敏感信息可以打码,仅用于人工审核。 🧧 活动四:跟帖留 ID 抽奖 欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖! 抽奖规则 楼层 奖励 每 50 楼 随机抽取 1 位,赠送 ¥50 额度 每 100 楼 随机抽取 1 位,赠送 ¥100 额度 回复格式 Claude360 用户 ID: 申请活动:首充 / 团队试用 / 跟帖抽奖 📌 福利汇总 活动 福利 🎁 新用户首充 充 ¥9.9 ,到账 ¥20 额度 💰 充值阶梯赠送 最高额外赠送 ¥150 额度 🏢 团队试用计划 审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖 每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ! 也欢迎大家反馈: 稳定性 模型兼容性 模型分组 API 接入体验 调用速度 价格策略 你的建议将帮助我们持续优化服务体验 ❤️

v2ex · 2026-06-10 13:43:52+08:00 · tech

🚀 Claude360 福利活动来啦! 大家好,我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台 。 为了让更多开发者和团队低成本体验 Claude / GPT 系列模型,Claude360 长期开放多项福利活动,欢迎大家体验使用! 🌐 官网地址: 👉 https://claude360.xyz 🎁 活动一:新用户首充福利 首充仅需 ¥9.9 ,到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。 支持接入: Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型: Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型 其他 Kiro 反代分组 适用于: AI 编程 代码审查 文档生成 自动化开发 Agent 工作流 团队协作开发 💰 活动二:充值阶梯赠送 除首充福利外,所有用户均可参与充值赠送活动: 充值金额 赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送,长期使用更划算。 适合: 高频开发者 AI Coding 重度用户 团队统一采购 🏢 活动三:团队试用计划 面向: 企业 工作室 创业团队 技术负责人 审核通过可获得 🎁 50 元团队测试额度 可提供以下任意一种证明 企业邮箱 团队官网 名片 工牌 职务证明 GitHub / GitLab 团队主页 敏感信息可以打码,仅用于人工审核。 🧧 活动四:跟帖留 ID 抽奖 欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖! 抽奖规则 楼层 奖励 每 50 楼 随机抽取 1 位,赠送 ¥50 额度 每 100 楼 随机抽取 1 位,赠送 ¥100 额度 回复格式 Claude360 用户 ID: 申请活动:首充 / 团队试用 / 跟帖抽奖 📌 福利汇总 活动 福利 🎁 新用户首充 充 ¥9.9 ,到账 ¥20 额度 💰 充值阶梯赠送 最高额外赠送 ¥150 额度 🏢 团队试用计划 审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖 每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ! 也欢迎大家反馈: 稳定性 模型兼容性 模型分组 API 接入体验 调用速度 价格策略 你的建议将帮助我们持续优化服务体验 ❤️

v2ex · 2026-06-10 13:30:51+08:00 · tech

🚀 Claude360 福利活动来啦! 大家好,我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台 。 为了让更多开发者和团队低成本体验 Claude / GPT 系列模型,Claude360 长期开放多项福利活动,欢迎大家体验使用! 🌐 官网地址: 👉 https://claude360.xyz 🎁 活动一:新用户首充福利 首充仅需 ¥9.9 ,到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。 支持接入: Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型: Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型 其他 Kiro 反代分组 适用于: AI 编程 代码审查 文档生成 自动化开发 Agent 工作流 团队协作开发 💰 活动二:充值阶梯赠送 除首充福利外,所有用户均可参与充值赠送活动: 充值金额 赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送,长期使用更划算。 适合: 高频开发者 AI Coding 重度用户 团队统一采购 🏢 活动三:团队试用计划 面向: 企业 工作室 创业团队 技术负责人 审核通过可获得 🎁 50 元团队测试额度 可提供以下任意一种证明 企业邮箱 团队官网 名片 工牌 职务证明 GitHub / GitLab 团队主页 敏感信息可以打码,仅用于人工审核。 🧧 活动四:跟帖留 ID 抽奖 欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖! 抽奖规则 楼层 奖励 每 50 楼 随机抽取 1 位,赠送 ¥50 额度 每 100 楼 随机抽取 1 位,赠送 ¥100 额度 回复格式 Claude360 用户 ID: 申请活动:首充 / 团队试用 / 跟帖抽奖 📌 福利汇总 活动 福利 🎁 新用户首充 充 ¥9.9 ,到账 ¥20 额度 💰 充值阶梯赠送 最高额外赠送 ¥150 额度 🏢 团队试用计划 审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖 每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ! 也欢迎大家反馈: 稳定性 模型兼容性 模型分组 API 接入体验 调用速度 价格策略 你的建议将帮助我们持续优化服务体验 ❤️

v2ex · 2026-06-10 10:46:16+08:00 · tech

周二下午两点半,你正在会议室里跟团队对齐一个紧急上线的系统。桌上的手机疯狂震动,你悄悄瞥了一眼推送通知,满屏的绿色。开完会一解锁手机:自选股瞬间崩盘,上午刚浮盈的两个点,下午不仅全吐回去了,还倒亏进去三个点。 那一瞬间,你的心跳随着分时 K 线剧烈波动,血压飙升。接下来的一下午,你脑子里全是刚刚的盘面,代码写不下去,方案看不进去。 这种画面,是不是每个上班炒股的“打工人”都无比熟悉的日常? 为了摆脱这种心力的无底线消耗,很多程序员和技术型散户把目光投向了 量化投资 。我们天然地觉得:既然我会写代码,那把交易逻辑写成自动化脚本,让机器帮我买卖,不就既能克服人性弱点,又能解放双手,实现“睡后收入”吗? 但今天,我想用我自己的血泪教训给你泼一盆冷水: 自研量化不是拯救你财务焦虑的银弹,如果你方法不对,它只会让你陷入另一种内耗。 1. 打脸量化神话:从盈利 10%到亏损 20%,我的“翻车”实录 我们技术型散户最容易犯的错误,就是对自己的逻辑和技术有着近乎迷信的自信。 其实,这已经不是我第一次被市场教育了。早在前些时候,我就在《 用 2 万起步量化投资 1 年,亏了多少,学到了什么? 》中分享过自己最初拿 2.5 万本金试水、一路加仓却最终交了近 1 万块学费的经历。当时,由于“看不得资金空仓”而强行手痒进行人工操作,最终导致了 10%+的亏损。 那时候我天真地以为,只要我管住手、解决掉代码 Bug 、优化好交易框架,自研量化就能重新帮我“印钞”。 于是 2025 年 9 月份之前,我痛定思痛,重新起跑。当时市场环境对小市值策略极度友好,我改良后的自研小市值策略一路涨,账户浮盈轻松回升到了 15% 以上。当时我甚至产生了一种幻觉:自己又行了,实现财富自由只是时间问题。 然而,A 股最擅长的事情就是专治各种不服。 进入 9 月之后,市场风格发生巨变,微盘股踩踏、风格切换到大盘红利和科技权重。我的策略由于因子过于单一,防守能力几乎为零,开始一路阴跌。每一次调仓都在割肉,每一次开盘都是折磨。直到今天,这套曾经让我骄傲的自研策略,总体收益率变成了 **-10%**。 这次翻车让我彻底清醒: 量化绝对不是稳赚不赔的银弹。它只是一种让你在统计学上具备概率优势、并且能严格执行纪律的工具。 如果你把全部身家赌在单一的自研策略上,这和盲目追涨杀跌的主观交易没有任何本质区别。 2. 技术型散户的独特雷区:别再从零手搓策略和框架了 看着自己写的代码在******中亏钱,技术型散户最本能的反应是什么? “一定是我的交易框架不够优雅,我要重构它!” “是不是我的网络延迟太高?我要换一台更贵的服务器!” “我要从零手写一个回测系统,把所有细节都掌控在自己手里!” 千万别!这是性价比最低的无底深渊。 对于散户来说,最宝贵的是 时间成本 。从零写一个完美的回测框架和交易引擎,可能要花掉你几个月甚至半年的业余时间。然而,代码写得再漂亮、框架再优雅,只要核心的 交易逻辑 不能赚钱,你在市场上依然是个“弟弟”。 在量化投资中, 逻辑永远大于代码,性价比永远大于美学 。 更聪明的做法是: 直接参考和利用社区里现有的成熟策略。 比如在聚宽( JoinQuant )等平台上,有很多前人公开的、经过市场检验的基础策略。你不需要从零去发明轮子,而是应该在此基础上做针对性的改进。 甚至,你完全可以把策略代码丢给 AI ,让 AI 帮你修改、加过滤器或优化止损逻辑。把精力花在 理解市场逻辑和风格切换 上,而不是死磕代码的细枝末节。 3. 重建防御线:技术散户投资的“黄金铁三角” 在接受了“量化不是银弹”和“自研可能吃瘪”的现实后,我把自己的投资体系进行了一次彻底的重组。我不再把鸡蛋放在一个篮子里,而是搭建了一个 “公募量化 + 自研量化 + 主观交易” 三足鼎立的“黄金铁三角”。 在这个体系中,我把资金和精力分配成了三瓣,每一瓣都承担着完全不同的使命: 第一角:30%-40% 仓位配置公募量化(稳健底仓与观察哨) 很多技术散户会不屑于买公募基金,觉得“我自己会写代码,凭什么让别人赚管理费?” 但客观来看,机构量化在数据完整度、因子储备、硬件算力和合规风控上,有着散户无法企及的系统性优势。我配置这部分仓位(例如买入 鹏华上证科创 100ETF 联接 C 和 招商量化精选股票 A ),原因有两个: 看好特定板块的贝塔收益 :比如科技赛道,通过宽基量化能获取平均超额。 作为极佳的横向对比样本 :把这部分资金作为锚,用来观察我自己的自研策略到底跑不跑得赢专业机构。它是一个天然的性能对比基准。 [!WARNING] 声明 :以上提及的基金产品(如招商量化精选 A 、鹏华科创 100 联接 C )仅作为我个人投资的过往案例与对照样本进行说明, 绝不构成任何投资建议或推荐 。市场有风险,千万别参考照抄。 第二角:30% 仓位自研量化(吃利基超额的尖刀) 既然大仓位有公募底仓兜底,那么我们自己的自研策略就可以更加锐利、更加垂直。 散户做量化有一个机构做梦都羡慕的非对称优势: 资金容量极小,所以船小好掉头。 机构百亿资金根本没办法碰的微盘股、小市值策略、或者一些高频的利基交易机会,都是散户自研策略的自留地。 如何把这 30% 玩得轻松? 放弃昂贵的门槛 :很多券商 交易需要 ****** 或 ****** 接口,动辄要求几十万的资金门槛。其实根本不需要。我直接用 JoinQuant 进行策略研究, 时配合 9db 交易助手 自动跑信号。 完全托管,杜绝盯盘 :把策略逻辑配置好后,交给 9db 交易助手完全自动执行,自动报单。白天该开会开会,该写代码写代码,把心力耗费降到最低。 第三角:30% 仓位资金主观交易(肉身感受市场的感官触角) 很多人觉得做量化就要彻底告别主观交易,但我认为, 完全脱离盘面的人,写不出好的量化策略。 主观交易是你的触角。你必须保留一小部分资金(这里指占你投资资金的一小部分,但由于它是“零钱”,你的心态完全不一样),亲自去感受市场的狂热、恐慌和风格的轮动。 为什么一定要用极小资金? 因为资金足够小,即使大跌你也不会肉疼,你开会时不会想着它,下班了也懒得看它。没有了心力占用,你的心态会极其放松,反而能更客观地观察市场的多空博弈。 反哺量化迭代 :很多优秀的量化过滤机制,比如“当指数跌破 20 日均线时强制空仓防守”,往往就诞生于你主观交易中被反复“打脸”后的顿悟。 4. 写在最后:放下对完美的执念,拒绝病急乱投医 当市场低迷或者我们自己亏钱的时候,人最容易犯的毛病就是 “病急乱投医” 。今天看推特上有人吹嘘某个策略年化 80%,你就赶紧去抄;明天看短视频说红利股永远的神,你又马上割肉追进去。结果往往就是完美地在每一个热点上接盘。 投资是一场长跑,没有哪一种方法是绝对的银弹。 搭建“公募底仓 + 自研尖刀 + 主观零花”的黄金铁三角,本质上不是为了追求一夜暴富,而是为了 在资产、精力与心态之间找到一个完美的平衡点 。 降低对自研量化的暴利期望,把它看作你资产配置中的一把小尖刀;借助前人的策略和 AI 工具,别去死磕轮子;用极轻量的工具(如 JoinQuant + 9db )自动跑起来,把你的白天还给生活和主业。 这,才是技术型散户最体面的投资姿势。 最后,想问问大家: 你目前的投资仓位是怎么配置的?是 100% 全仓主观“肉搏”,还是在死磕某个自研策略?你觉得“主观 + 自研 + 公募”这套铁三角配置适合你目前的现状吗?你在量化的路上又踩过哪些大坑? 欢迎在评论区留下你的战绩和看法,我们一起交流避坑,并肩前行!

V2EX - 技术 · 2026-06-10 05:33:36+08:00 · tech

过去半年,我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快,但随着项目规模扩大,技术债开始爆发。 Vibe Coding 的核心问题并不在于某几行代码的质量低下,而在于它完全缺乏全局观,且不遵循软件工程的规范。 没有宏观架构,没有项目长期记忆,没有自动化审计,我们意识到 Vibe Coding Is Not Engineering 。 为了使 AI 编程更符合软件工程规范,我们开发了这个项目。 AnyPal:将 Vibe Coding 带入软件工程时代 AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台,支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时,引入了软件工程的规范。 多 Agent 协同与对抗审计:内置工程经理,架构师等 11 个 AI 角色与 6 个反方审查员,支持 Coder 与 Adversary (测试/安全等)多 Agent 左右互搏,在代码交付前完成质量闭环。 成本优化:对抗审计配合 S/M/L/XL 任务规模自动切换模型,可以极大降本增效,将 Token 花在刀刃上。 项目长期记忆:基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱,设立 Postmortem 工作区,自动复盘每个 BUG ,沉淀经验随项目共同进化。 支持敏捷迭代( Plan 模式)和对抗式编程。 敏捷开发:看板工作区 切换到 Plan 模式后,系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。 和项目经理对话,将你的意图拆解为具备前后置依赖关系的树状任务流,统筹项目全局推进,多任务并行开发,不再需要打开多个 Chat 对话。 在线/离线模式: 用户在线时主动追问对齐需求,提前确认方案。用户离线后自主推进看板任务。 对抗式编程 多 Agent 共享代码库与会话,正方写代码,反方实时审计,在代码进入暂存区前置阻断与纠偏,避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销,大幅提质代码产出质量,对中小模型效果尤为明显。 实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7 这是项目早期的一个极端测试:在完全不人工干涉的情况下,让 AI 独立使用 WebDAV 协议实现一个网盘系统。 AnyPal 组:正方( Coder )使用 DeepSeek-V4-Flash ,反方(审查)使用 DeepSeek-V4-Pro 。 对照组:GitHub Copilot + Opus 4.7 。 在此案例中,资源消耗相近的情况下,AnyPal 凭借工程化闭环实现 10 倍以上的性价比。 一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/ UI 预览功能 在 AI 编程的时候 UI 也是一大痛点,回滚不仅浪费 Token ,还可能影响其他组件。 现在 AI 在开始前会先询问需求,给出数个方案和预览,您可以选择其一或者继续修改需求。 自动复盘 AI 修复 BUG 后自动生成 Markdown 复盘文档,记录严重程度、时间线、根因、修复措施,并关联可回放的 Agent 会话,随时追溯决策过程。该文档会进入项目的长期记忆,随项目共同进化。 参与内测 项目地址: https://anypal.pome.net/ 支持免登录,自行导入大模型 API 使用。 注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。 推荐使用客户端体验完整功能 加入 Q 群:497719526 领取限量 Token 补贴。 我们正在寻找视频团队和测评博主合作,如果您有意向请联系我们。

V2EX - 技术 · 2026-06-10 04:33:36+08:00 · tech

过去半年,我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快,但随着项目规模扩大,技术债开始爆发。 Vibe Coding 的核心问题并不在于某几行代码的质量低下,而在于它完全缺乏全局观,且不遵循软件工程的规范。 没有宏观架构,没有项目长期记忆,没有自动化审计,我们意识到 Vibe Coding Is Not Engineering 。 为了使 AI 编程更符合软件工程规范,我们开发了这个项目。 AnyPal:将 Vibe Coding 带入软件工程时代 AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台,支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时,引入了软件工程的规范。 多 Agent 协同与对抗审计:内置工程经理,架构师等 11 个 AI 角色与 6 个反方审查员,支持 Coder 与 Adversary (测试/安全等)多 Agent 左右互搏,在代码交付前完成质量闭环。 成本优化:对抗审计配合 S/M/L/XL 任务规模自动切换模型,可以极大降本增效,将 Token 花在刀刃上。 项目长期记忆:基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱,设立 Postmortem 工作区,自动复盘每个 BUG ,沉淀经验随项目共同进化。 支持敏捷迭代( Plan 模式)和对抗式编程。 敏捷开发:看板工作区 切换到 Plan 模式后,系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。 和项目经理对话,将你的意图拆解为具备前后置依赖关系的树状任务流,统筹项目全局推进,多任务并行开发,不再需要打开多个 Chat 对话。 在线/离线模式: 用户在线时主动追问对齐需求,提前确认方案。用户离线后自主推进看板任务。 对抗式编程 多 Agent 共享代码库与会话,正方写代码,反方实时审计,在代码进入暂存区前置阻断与纠偏,避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销,大幅提质代码产出质量,对中小模型效果尤为明显。 实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7 这是项目早期的一个极端测试:在完全不人工干涉的情况下,让 AI 独立使用 WebDAV 协议实现一个网盘系统。 AnyPal 组:正方( Coder )使用 DeepSeek-V4-Flash ,反方(审查)使用 DeepSeek-V4-Pro 。 对照组:GitHub Copilot + Opus 4.7 。 在此案例中,资源消耗相近的情况下,AnyPal 凭借工程化闭环实现 10 倍以上的性价比。 一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/ UI 预览功能 在 AI 编程的时候 UI 也是一大痛点,回滚不仅浪费 Token ,还可能影响其他组件。 现在 AI 在开始前会先询问需求,给出数个方案和预览,您可以选择其一或者继续修改需求。 自动复盘 AI 修复 BUG 后自动生成 Markdown 复盘文档,记录严重程度、时间线、根因、修复措施,并关联可回放的 Agent 会话,随时追溯决策过程。该文档会进入项目的长期记忆,随项目共同进化。 参与内测 项目地址: https://anypal.pome.net/ 支持免登录,自行导入大模型 API 使用。 注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。 推荐使用客户端体验完整功能 加入 Q 群:497719526 领取限量 Token 补贴。 我们正在寻找视频团队和测评博主合作,如果您有意向请联系我们。