团队 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 19:24:07+08:00 · tech

小弟我这边之前有部署一个内网的CPA供内部小团队使用，但因为最近上面想看下消耗、并计划给开放部分资源其他部门，于是我就部署了一个new api，来做分发。目前遇到一个情况，因为考虑开放资源给其他部门后的一些合规的问题，我把之前CPA上的mimo、minimax等国模添加到new api后，即new api里的国模上游就是官方渠道，不是CPA，这个时候用codex cli 和 cherrystudio测试时，发现使用v1/chat/completions是可以正常工作的，但是使用v1/responses时直接报错 get request url failed: unsupported relay mode: 33 这种情况我下我是该怎么处理呢。 5 个帖子 - 3 位参与者阅读完整话题

测试不是测一遍 —— 是 6 个阶段每阶段都不一样

V2EX - 技术 · 2026-06-11 14:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线每阶段都做"测试"——只是测试对象不同。我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。不是 6 次相同动作 —— 是 6 类不同性质的验证。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段性质独有验证 ① 单元函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成跨网络跨服务冒烟 + DML 比对 ③ Review 设计性能设计审查 + 性能分析 + 回滚方案 ④ 他测用户视角提测文档 + Test Case + 修复后再比对 ⑤ 灰度生产数据时间窗口 + 分工 + DML 在线比对 ⑥ 上线业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。阶段拆分的核心标准我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。第 6 阶段最贵 —— 也最被忽视很多团队的"上线观察"=刷一下监控大盘。我的版本: 6 项指标 + 四方确认。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。因为这两项指标"看起来不归技术管"。但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标里全是绿的,只有第 5 、6 项暴露异常。例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度都看不出来 ,只有"业务大盘"能看见。四方确认 —— 不是签字流程四方确认 = 开发 / 测试 / 技术 TO / 产品都同意才能"上线观察通过"。听起来像 PPT 流程,但反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。四方共同确认—— 任何一方说"我看到的不对"——就回退。我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。反共识在哪主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证主流:每阶段都做"测试"动作我的版本:每阶段对应该阶段性质独有的验证手段主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认主流:业务大盘归运营管我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标主流:验收 = 测试通过我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套也踩过坑。某次内部小工具改动,代码量不到 200 行。我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质决策慢 —— 至少 6 次评审 / 检查最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。写在最后把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题。每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。跟"渐进式改造"和"比对工具"一样,这是一套关心可逆性、关心追溯性的工程纪律。写到这,我也不太确定 6 阶段对所有团队都成立。我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。这点我自己也还在想。下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是纵向 (时间),17 类是横向 (业务域)。两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑。)

AI设计的DNA新疫苗已完成首次人体试验

cnBeta全文版 · 2026-06-11 14:35:06+08:00 · tech

英国剑桥大学研究团队近日宣布，利用人工智能（AI）设计的一种新型 DNA 疫苗已完成首次人体试验，旨在通过一次接种，对所有已知人类冠状病毒变异株，以及潜在由蝙蝠传播至人类的相关病毒，提供广谱防护。这款疫苗被研究人员称为一种“根本性全新”的疫苗类型，其关键抗原成分完全由 AI 设计而成。传统疫苗通常针对某一种特定病毒，通过训练免疫系统识别某个或少数几个病毒蛋白，但病毒不断变异，当变异幅度足够大时，原有疫苗保护力便会明显下降，这也是流感疫苗需要每年更新、以及新冠疫苗自 2021 年以来多次更新配方的原因。研究团队指出，AI 为这一难题提供了新的解决思路：通过分析成千上万种相关病毒的基因数据，AI 可以筛选出在不同毒株之间高度保守、且在进化过程中不易发生变化的序列片段，从而为疫苗设计提供一个针对“整个病毒家族”的目标，而不是仅限于某一条已知毒株。具体而言，剑桥团队利用 AI 扫描了包括引发非典（SARS）、新冠（COVID-19）在内的 “sarbecovirus” 亚属病毒，以及一系列动物冠状病毒，寻找在长期演化中几乎未被改动的共同特征，这些稳定区域最终被用作新疫苗的免疫靶点。研究人员希望，通过锁定这些不易变异的“共性弱点”，可以在未来新的相关病毒出现时，仍保持一定程度的交叉保护能力，从而为应对未知疫情争取宝贵时间。与公众更为熟悉的 mRNA 新冠疫苗不同，这款新疫苗采用 DNA 技术路线。相比 mRNA 疫苗，DNA 疫苗在储存和运输环节一般更加稳定，对冷链条件的要求较低，这对于冷链基础设施有限的低收入国家而言尤为关键。此外，该疫苗不需要传统针头注射，而是通过高压液流将疫苗喷射入皮肤，这种无针给药方式有望降低接种过程中的疼痛感，同时在大规模暴发时更易快速部署，提高接种效率。从公共卫生视角看，研究者强调，如果这种技术路径被证明有效，广谱疫苗有望改变人类应对新发传染病的方式。通过针对病毒家族中跨毒株共享的特征进行设计，广谱疫苗有望在疫情早期就为尚未见过的新病毒提供基础防护，使公共卫生部门能够在大流行形成前阻断传播链。同样思路也被视为流感领域的潜在“游戏规则改变者”：目前科学家需要提前预测每年流感季的优势毒株，一旦预判失误，疫苗保护效果就会大打折扣，而如果能够研制针对多种流感毒株共享特征的“通用流感疫苗”，则有望结束这种年度“追赶战”。埃博拉的最新疫情则凸显了这一方向的现实紧迫性。近期在刚果民主共和国和乌干达出现的疫情主要由 Bundibugyo 毒株推动，这一毒株可以规避现有疫苗的保护，使当地社区处于较高风险之中。在研究人员紧急研制针对该特定毒株的新疫苗的同时，一种针对整个病毒家族的广谱疫苗，如果能够提前部署，将有可能避免类似的“毒株更替—疫苗落后”的被动局面。在这项最新的人体试验中，研究者报告称，这是全球首个在人体中测试的 AI 设计疫苗。结果显示，这款 DNA 疫苗能够刺激受试者免疫系统，产生可以识别多种 sarbecovirus 的抗体。试验同时表明，该技术路线在受试者中总体安全、耐受性良好。该团队认为，这一结果表明，AI 在设计针对未来潜在大流行病原体、并具备“变异抵抗性”的新型疫苗方面，展现出重要潜力，而无针给药系统则为全球范围内的推广接种带来额外优势。不过，研究者也坦言，这一进展距离真正意义上的“通用疫苗”仍有相当距离。当前研究中观察到的免疫应答虽具有广谱性，但总体水平仍然偏温和，保护效果能否维持多久、是否需要额外加强针，尚无定论。此外，还需要通过更大规模的临床试验来验证，该疫苗在真实世界条件下是否确实能够预防或减轻不同病毒感染。专家指出，一款可广泛应用的通用疫苗在数年内难以完全成熟，任何新疫苗仍须经过多阶段、大样本的临床试验，以证明其安全性、有效性以及长期保护能力。尽管如此，这项研究表明，在 AI 的加持下，科学界距离这一目标正逐步逼近，而借助算法对庞大病毒谱系进行系统分析和快速设计，可能会显著缩短下一代疫苗从概念到临床应用的时间。查看评论

测试不是测一遍 —— 是 6 个阶段每阶段都不一样

V2EX - 技术 · 2026-06-11 13:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线每阶段都做"测试"——只是测试对象不同。我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。不是 6 次相同动作 —— 是 6 类不同性质的验证。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段性质独有验证 ① 单元函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成跨网络跨服务冒烟 + DML 比对 ③ Review 设计性能设计审查 + 性能分析 + 回滚方案 ④ 他测用户视角提测文档 + Test Case + 修复后再比对 ⑤ 灰度生产数据时间窗口 + 分工 + DML 在线比对 ⑥ 上线业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。阶段拆分的核心标准我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。第 6 阶段最贵 —— 也最被忽视很多团队的"上线观察"=刷一下监控大盘。我的版本: 6 项指标 + 四方确认。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。因为这两项指标"看起来不归技术管"。但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标里全是绿的,只有第 5 、6 项暴露异常。例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度都看不出来 ,只有"业务大盘"能看见。四方确认 —— 不是签字流程四方确认 = 开发 / 测试 / 技术 TO / 产品都同意才能"上线观察通过"。听起来像 PPT 流程,但反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。四方共同确认—— 任何一方说"我看到的不对"——就回退。我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。反共识在哪主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证主流:每阶段都做"测试"动作我的版本:每阶段对应该阶段性质独有的验证手段主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认主流:业务大盘归运营管我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标主流:验收 = 测试通过我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套也踩过坑。某次内部小工具改动,代码量不到 200 行。我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质决策慢 —— 至少 6 次评审 / 检查最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。写在最后把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题。每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。跟"渐进式改造"和"比对工具"一样,这是一套关心可逆性、关心追溯性的工程纪律。写到这,我也不太确定 6 阶段对所有团队都成立。我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。这点我自己也还在想。下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是纵向 (时间),17 类是横向 (业务域)。两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑。)

测试不是测一遍 —— 是 6 个阶段每阶段都不一样

V2EX - 技术 · 2026-06-11 13:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线每阶段都做"测试"——只是测试对象不同。我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。不是 6 次相同动作 —— 是 6 类不同性质的验证。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段性质独有验证 ① 单元函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成跨网络跨服务冒烟 + DML 比对 ③ Review 设计性能设计审查 + 性能分析 + 回滚方案 ④ 他测用户视角提测文档 + Test Case + 修复后再比对 ⑤ 灰度生产数据时间窗口 + 分工 + DML 在线比对 ⑥ 上线业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。阶段拆分的核心标准我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。第 6 阶段最贵 —— 也最被忽视很多团队的"上线观察"=刷一下监控大盘。我的版本: 6 项指标 + 四方确认。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。因为这两项指标"看起来不归技术管"。但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标里全是绿的,只有第 5 、6 项暴露异常。例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度都看不出来 ,只有"业务大盘"能看见。四方确认 —— 不是签字流程四方确认 = 开发 / 测试 / 技术 TO / 产品都同意才能"上线观察通过"。听起来像 PPT 流程,但反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。四方共同确认—— 任何一方说"我看到的不对"——就回退。我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。反共识在哪主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证主流:每阶段都做"测试"动作我的版本:每阶段对应该阶段性质独有的验证手段主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认主流:业务大盘归运营管我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标主流:验收 = 测试通过我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套也踩过坑。某次内部小工具改动,代码量不到 200 行。我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质决策慢 —— 至少 6 次评审 / 检查最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。写在最后把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题。每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。跟"渐进式改造"和"比对工具"一样,这是一套关心可逆性、关心追溯性的工程纪律。写到这,我也不太确定 6 阶段对所有团队都成立。我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。这点我自己也还在想。下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是纵向 (时间),17 类是横向 (业务域)。两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑。)

相关专题

测试不是测一遍 —— 是 6 个阶段每阶段都不一样

V2EX - 技术 · 2026-06-11 12:40:35+08:00 · tech

主流的"测试" vs 我的"6 阶段" 很多团队的测试流程是 3 段式: UT → 集成 → 上线每阶段都做"测试"——只是测试对象不同。我的判断不一样: ▌ 测试不是"测一遍"—— ▌ 是按 6 个阶段性质拆分, ▌ 每阶段有"该阶段独有、其他阶段无法替代"的验证内容。不是 6 次相同动作 —— 是 6 类不同性质的验证。 6 阶段是什么 ┌──────────────────────────────────────────────────────────┐ │ │ │ ① 单元测试 ── 验证"函数内部" │ │ ↓ │ │ ② 集成测试 ── 验证"跨网络" │ │ ↓ ← 比对工具进场 │ │ ③ Code Review ─ 验证"设计 + 性能" │ │ ↓ │ │ ④ 他测 ────── 验证"用户视角" │ │ ↓ ← 比对工具回访 │ │ ⑤ 灰度 ────── 验证"生产数据兼容" │ │ ↓ ← 比对工具在线 │ │ ⑥ 上线观察 ── 验证"业务大盘波动" │ │ │ └──────────────────────────────────────────────────────────┘ 每阶段独有验证内容: 阶段性质独有验证 ① 单元函数内部 UT 覆盖率 + 冒烟 + 功能埋点 ② 集成跨网络跨服务冒烟 + DML 比对 ③ Review 设计性能设计审查 + 性能分析 + 回滚方案 ④ 他测用户视角提测文档 + Test Case + 修复后再比对 ⑤ 灰度生产数据时间窗口 + 分工 + DML 在线比对 ⑥ 上线业务大盘 6 项指标 + 四方确认 → 第 ②④⑤ 阶段的"比对"动作,就是上一篇讲的"比对工具体系"。 → 第 ⑥ 阶段是大多数团队最常省的——本文重点讲它。阶段拆分的核心标准我自己的判断标准很简单: 两个阶段如果验证内容重叠 —— 说明阶段拆分错了。举个例子:很多团队把"集成测试"和"他测"混在一起做—— 都让测试同事跑一遍。但这两个阶段性质完全不同: 集成测试是 "跨网络"性质 —— 关心服务调用、数据穿透是否对他测是 "用户视角"性质 —— 关心 case 覆盖、修复后再验证是否对合在一起做的代价: 集成阶段没暴露的跨服务 bug,会被他测的"用户场景"掩盖 —— 等到灰度才发现,代价是集成阶段的 N 倍。第 6 阶段最贵 —— 也最被忽视很多团队的"上线观察"=刷一下监控大盘。我的版本: 6 项指标 + 四方确认。 6 项观测指标: 1. 产品功能有没有执行 2. 数据有没有问题 3. 系统有没有性能问题 4. 跨系统交互有没有影响 5. 财务大盘是否波动 ← 关键! 6. 业务大盘是否波动 ← 关键! ▌ 把"财务大盘 / 业务大盘波动" ▌ 作为发布观察指标 —— ▌ 这是大多数团队最常省的一步。因为这两项指标"看起来不归技术管"。但实际上 —— 80% 的"上线后才发现"的事故,在前 4 项指标里全是绿的,只有第 5 、6 项暴露异常。例子: 某次上线某个改动,前 4 项指标全绿; 3 天后才发现财务对账差异—— 这种 bug 在 UT/集成/灰度都看不出来 ,只有"业务大盘"能看见。四方确认 —— 不是签字流程四方确认 = 开发 / 测试 / 技术 TO / 产品都同意才能"上线观察通过"。听起来像 PPT 流程,但反共识在于 : ▌ 测试同意 ≠ 验收通过 —— ▌ 业务大盘没波动,不代表产品认为"功能符合预期"。 ▌ 产品同意 ≠ 验收通过 —— ▌ 数据正常,不代表开发认为"性能达标"。四方共同确认—— 任何一方说"我看到的不对"——就回退。我经历的项目里,真发生过 "3 方都过了,产品最后说不对" 的情况。如果没有四方流程,这个回退根本走不动。反共识在哪主流:测试 = UT + 集成 + 上线(3 阶段) 我的版本:6 阶段,每阶段独有验证主流:每阶段都做"测试"动作我的版本:每阶段对应该阶段性质独有的验证手段主流:上线观察看"是否有大故障" 我的版本: 6 项观测指标 + 四方确认主流:业务大盘归运营管我的版本: 把"财务大盘 / 业务大盘"作为发布观察指标主流:验收 = 测试通过我的版本: 四方确认 (开发 / 测试 / 技术 TO / 产品) 什么时候不该用这套也踩过坑。某次内部小工具改动,代码量不到 200 行。我也想搞 6 阶段——leader 直接说:"过度。" 事后是对的。我的判断: 核心业务系统改造 → 必上(尤其涉及财务 / 业务大盘) 跨多研发角色的项目 → 必上(否则四方确认走不通) 内部工具 / 后台脚本 → 别上(单人项目,4 阶段够) DDL 类无法灰度的改动 → 跳过第 5 阶段(灰度),其余照走不影响 KPI 的小项目 → 简化为 3 阶段(UT+集成+上线) 阴面 · 这套也有副作用我自己用了这套 4 年,踩过的坑: 重型流程 —— 小项目用不上,6 阶段成本太高跨公司不通用 —— 没有"四方确认 / 业务大盘"概念的公司套不进来可能流于形式 —— 团队成员把 6 阶段当 6 个 checkbox 而非 6 类性质决策慢 —— 至少 6 次评审 / 检查最后一条最关键 —— **6 阶段的代价是"决策周期变长"**。所以才有上面那句:"小项目别上 / 不影响 KPI 的项目简化为 3 阶段"。写在最后把测试拆 6 阶段,不是为了"显得专业"—— 是因为我经历过太多次: "你那阶段不是测过吗?怎么还出问题?" 仔细看,会发现: 那阶段测的不是这一类问题。每阶段性质不同 —— 验证手段就该不同。 6 阶段是"性质拆分",不是"动作拆分"。跟"渐进式改造"和"比对工具"一样,这是一套关心可逆性、关心追溯性的工程纪律。写到这,我也不太确定 6 阶段对所有团队都成立。我经历的项目都是"核心业务系统 + 跨多角色 + 业务大盘敏感"—— 这种场景 6 阶段几乎是必修。但创业团队 / 内部工具 / 没有"业务大盘"这个概念的公司—— 搞这套可能反而是负担。这点我自己也还在想。下一篇打算写 17 类业务迁移分类—— 跟 6 阶段是一对:6 阶段是纵向 (时间),17 类是横向 (业务域)。两者合起来才是完整的迁移管理体系。 (以上 SOP 都做了脱敏。如果你做过核心系统改造,欢迎评论区聊聊你们的验收流程长什么样, 特别想听 6 阶段简化为 3 阶段后,踩过的坑。)

[问与答] 搭建一个 AI 中转站给公司内部使用靠谱吗？

v2ex · 2026-06-11 11:51:55+08:00 · tech

团队规模 20 人左右，想要开通一批 gpt-pro 账号通过中转站的形式开放给大家调用，从成本和法规上有没有什么坑？

相关专题

[问与答] 搭建一个 AI 中转站给公司内部使用靠谱吗？

v2ex · 2026-06-11 11:47:15+08:00 · tech

团队规模 20 人左右，想要开通一批 gpt-pro 账号通过中转站的形式开放给大家调用，从成本和法规上有没有什么坑？

[问与答] 搭建一个 AI 中转站给公司内部使用靠谱吗？

v2ex · 2026-06-11 11:18:11+08:00 · tech

团队规模 20 人左右，想要开通一批 gpt-pro 账号通过中转站的形式开放给大家调用，从成本和法规上有没有什么坑？

[问与答] 搭建一个 AI 中转站给公司内部使用靠谱吗？

v2ex · 2026-06-11 10:59:57+08:00 · tech

团队规模 20 人左右，想要开通一批 gpt-pro 账号通过中转站的形式开放给大家调用，从成本和法规上有没有什么坑？

相关专题

这是彻底无招了么

LinuxDo 最新话题 · 2026-06-11 10:58:17+08:00 · tech

钉钉one体验真不咋样，宜搭的支持团队也都没啥人了貌似，客服也联系不上 2 个帖子 - 2 位参与者阅读完整话题

想买ChatGPT Plus给团队共享，选什么工具来做比较好呢？

LinuxDo 最新话题 · 2026-06-11 04:34:50+08:00 · tech

我要给我自己的账号购买网页版 ChatGPT Plus，但是想要通过自建中转给团队共享目前团队是 GLM Coding Plan 的 Lite 就已经够用目前在站内有看到过 sub2api, CPA, NewAPI，目前是想要给 5-6 人使用，选什么工具比较好呢？或者除了上述工具之外，还有一些我没发现但是佬友用过觉得好的工具，也欢迎佬友补充！如果设置每日额度的话，每人每日的额度要设置多少才能让 OpenAI 的风控最小化？因为这个账号也确实是我一直以来在自用的账号，终究是有点感情不希望被ban 18 个帖子 - 10 位参与者阅读完整话题

AI 时代，当机器可以代替很多人可以做的事，人成为了我们最宝贵的财富。

LinuxDo 最新话题 · 2026-06-10 21:23:28+08:00 · tech

关于阿里合伙人对钉钉团队管理回文中一句话，我终于无法正确理解，你是怎么看这句话的？？ 3 个帖子 - 3 位参与者阅读完整话题

相关专题

[推广] 🚀 Claude360 福利活动来啦！

v2ex · 2026-06-10 13:43:52+08:00 · tech

🚀 Claude360 福利活动来啦！大家好，我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台。为了让更多开发者和团队低成本体验 Claude / GPT 系列模型，Claude360 长期开放多项福利活动，欢迎大家体验使用！ 🌐 官网地址： 👉 https://claude360.xyz 🎁 活动一：新用户首充福利首充仅需 ¥9.9 ，到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。支持接入： Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型： Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型其他 Kiro 反代分组适用于： AI 编程代码审查文档生成自动化开发 Agent 工作流团队协作开发 💰 活动二：充值阶梯赠送除首充福利外，所有用户均可参与充值赠送活动：充值金额赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送，长期使用更划算。适合：高频开发者 AI Coding 重度用户团队统一采购 🏢 活动三：团队试用计划面向：企业工作室创业团队技术负责人审核通过可获得 🎁 50 元团队测试额度可提供以下任意一种证明企业邮箱团队官网名片工牌职务证明 GitHub / GitLab 团队主页敏感信息可以打码，仅用于人工审核。 🧧 活动四：跟帖留 ID 抽奖欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖！抽奖规则楼层奖励每 50 楼随机抽取 1 位，赠送 ¥50 额度每 100 楼随机抽取 1 位，赠送 ¥100 额度回复格式 Claude360 用户 ID：申请活动：首充 / 团队试用 / 跟帖抽奖 📌 福利汇总活动福利 🎁 新用户首充充 ¥9.9 ，到账 ¥20 额度 💰 充值阶梯赠送最高额外赠送 ¥150 额度 🏢 团队试用计划审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ！也欢迎大家反馈：稳定性模型兼容性模型分组 API 接入体验调用速度价格策略你的建议将帮助我们持续优化服务体验 ❤️

[推广] 🚀 Claude360 福利活动来啦！

v2ex · 2026-06-10 13:43:52+08:00 · tech

🚀 Claude360 福利活动来啦！大家好，我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台。为了让更多开发者和团队低成本体验 Claude / GPT 系列模型，Claude360 长期开放多项福利活动，欢迎大家体验使用！ 🌐 官网地址： 👉 https://claude360.xyz 🎁 活动一：新用户首充福利首充仅需 ¥9.9 ，到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。支持接入： Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型： Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型其他 Kiro 反代分组适用于： AI 编程代码审查文档生成自动化开发 Agent 工作流团队协作开发 💰 活动二：充值阶梯赠送除首充福利外，所有用户均可参与充值赠送活动：充值金额赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送，长期使用更划算。适合：高频开发者 AI Coding 重度用户团队统一采购 🏢 活动三：团队试用计划面向：企业工作室创业团队技术负责人审核通过可获得 🎁 50 元团队测试额度可提供以下任意一种证明企业邮箱团队官网名片工牌职务证明 GitHub / GitLab 团队主页敏感信息可以打码，仅用于人工审核。 🧧 活动四：跟帖留 ID 抽奖欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖！抽奖规则楼层奖励每 50 楼随机抽取 1 位，赠送 ¥50 额度每 100 楼随机抽取 1 位，赠送 ¥100 额度回复格式 Claude360 用户 ID：申请活动：首充 / 团队试用 / 跟帖抽奖 📌 福利汇总活动福利 🎁 新用户首充充 ¥9.9 ，到账 ¥20 额度 💰 充值阶梯赠送最高额外赠送 ¥150 额度 🏢 团队试用计划审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ！也欢迎大家反馈：稳定性模型兼容性模型分组 API 接入体验调用速度价格策略你的建议将帮助我们持续优化服务体验 ❤️

[推广] 🚀 Claude360 福利活动来啦！

v2ex · 2026-06-10 13:30:51+08:00 · tech

🚀 Claude360 福利活动来啦！大家好，我们是 Claude360 —— 一个面向开发者和团队的 Claude / GPT 模型中转服务平台。为了让更多开发者和团队低成本体验 Claude / GPT 系列模型，Claude360 长期开放多项福利活动，欢迎大家体验使用！ 🌐 官网地址： 👉 https://claude360.xyz 🎁 活动一：新用户首充福利首充仅需 ¥9.9 ，到账 ¥20 额度 ✅ 仅限新用户首次充值享受一次。支持接入： Claude Code Cursor Windsurf Cline 其他支持 API 配置的 AI 编程工具 🤖 已支持模型 Claude360 当前支持多种 Claude / GPT 系列模型： Claude 系列 Claude Opus 4.8 Claude Sonnet 系列 Claude Haiku 系列 GPT 系列 GPT-5.5 GPT 系列模型其他 Kiro 反代分组适用于： AI 编程代码审查文档生成自动化开发 Agent 工作流团队协作开发 💰 活动二：充值阶梯赠送除首充福利外，所有用户均可参与充值赠送活动：充值金额赠送额度 ¥100 赠送 ¥10 ¥200 赠送 ¥40 ¥500 赠送 ¥150 📈 多充多送，长期使用更划算。适合：高频开发者 AI Coding 重度用户团队统一采购 🏢 活动三：团队试用计划面向：企业工作室创业团队技术负责人审核通过可获得 🎁 50 元团队测试额度可提供以下任意一种证明企业邮箱团队官网名片工牌职务证明 GitHub / GitLab 团队主页敏感信息可以打码，仅用于人工审核。 🧧 活动四：跟帖留 ID 抽奖欢迎大家在评论区留下你的 Claude360 用户 ID 参与抽奖！抽奖规则楼层奖励每 50 楼随机抽取 1 位，赠送 ¥50 额度每 100 楼随机抽取 1 位，赠送 ¥100 额度回复格式 Claude360 用户 ID：申请活动：首充 / 团队试用 / 跟帖抽奖 📌 福利汇总活动福利 🎁 新用户首充充 ¥9.9 ，到账 ¥20 额度 💰 充值阶梯赠送最高额外赠送 ¥150 额度 🏢 团队试用计划审核通过赠送 ¥50 测试额度 🧧 跟帖抽奖每 50 楼 / 100 楼随机送额度 🌐 官网 👉 https://claude360.xyz 欢迎大家体验 Claude360 ！也欢迎大家反馈：稳定性模型兼容性模型分组 API 接入体验调用速度价格策略你的建议将帮助我们持续优化服务体验 ❤️

[量化交易] 不死磕量化，从亏损 20%的经历，我尝试投资“黄金铁三角”

v2ex · 2026-06-10 10:46:16+08:00 · tech

周二下午两点半，你正在会议室里跟团队对齐一个紧急上线的系统。桌上的手机疯狂震动，你悄悄瞥了一眼推送通知，满屏的绿色。开完会一解锁手机：自选股瞬间崩盘，上午刚浮盈的两个点，下午不仅全吐回去了，还倒亏进去三个点。那一瞬间，你的心跳随着分时 K 线剧烈波动，血压飙升。接下来的一下午，你脑子里全是刚刚的盘面，代码写不下去，方案看不进去。这种画面，是不是每个上班炒股的“打工人”都无比熟悉的日常？为了摆脱这种心力的无底线消耗，很多程序员和技术型散户把目光投向了量化投资。我们天然地觉得：既然我会写代码，那把交易逻辑写成自动化脚本，让机器帮我买卖，不就既能克服人性弱点，又能解放双手，实现“睡后收入”吗？但今天，我想用我自己的血泪教训给你泼一盆冷水：自研量化不是拯救你财务焦虑的银弹，如果你方法不对，它只会让你陷入另一种内耗。 1. 打脸量化神话：从盈利 10%到亏损 20%，我的“翻车”实录我们技术型散户最容易犯的错误，就是对自己的逻辑和技术有着近乎迷信的自信。其实，这已经不是我第一次被市场教育了。早在前些时候，我就在《用 2 万起步量化投资 1 年，亏了多少，学到了什么？》中分享过自己最初拿 2.5 万本金试水、一路加仓却最终交了近 1 万块学费的经历。当时，由于“看不得资金空仓”而强行手痒进行人工操作，最终导致了 10%+的亏损。那时候我天真地以为，只要我管住手、解决掉代码 Bug 、优化好交易框架，自研量化就能重新帮我“印钞”。于是 2025 年 9 月份之前，我痛定思痛，重新起跑。当时市场环境对小市值策略极度友好，我改良后的自研小市值策略一路涨，账户浮盈轻松回升到了 15% 以上。当时我甚至产生了一种幻觉：自己又行了，实现财富自由只是时间问题。然而，A 股最擅长的事情就是专治各种不服。进入 9 月之后，市场风格发生巨变，微盘股踩踏、风格切换到大盘红利和科技权重。我的策略由于因子过于单一，防守能力几乎为零，开始一路阴跌。每一次调仓都在割肉，每一次开盘都是折磨。直到今天，这套曾经让我骄傲的自研策略，总体收益率变成了 **-10%**。这次翻车让我彻底清醒：量化绝对不是稳赚不赔的银弹。它只是一种让你在统计学上具备概率优势、并且能严格执行纪律的工具。如果你把全部身家赌在单一的自研策略上，这和盲目追涨杀跌的主观交易没有任何本质区别。 2. 技术型散户的独特雷区：别再从零手搓策略和框架了看着自己写的代码在******中亏钱，技术型散户最本能的反应是什么？ “一定是我的交易框架不够优雅，我要重构它！” “是不是我的网络延迟太高？我要换一台更贵的服务器！” “我要从零手写一个回测系统，把所有细节都掌控在自己手里！” 千万别！这是性价比最低的无底深渊。对于散户来说，最宝贵的是时间成本。从零写一个完美的回测框架和交易引擎，可能要花掉你几个月甚至半年的业余时间。然而，代码写得再漂亮、框架再优雅，只要核心的交易逻辑不能赚钱，你在市场上依然是个“弟弟”。在量化投资中，逻辑永远大于代码，性价比永远大于美学。更聪明的做法是：直接参考和利用社区里现有的成熟策略。比如在聚宽（ JoinQuant ）等平台上，有很多前人公开的、经过市场检验的基础策略。你不需要从零去发明轮子，而是应该在此基础上做针对性的改进。甚至，你完全可以把策略代码丢给 AI ，让 AI 帮你修改、加过滤器或优化止损逻辑。把精力花在理解市场逻辑和风格切换上，而不是死磕代码的细枝末节。 3. 重建防御线：技术散户投资的“黄金铁三角” 在接受了“量化不是银弹”和“自研可能吃瘪”的现实后，我把自己的投资体系进行了一次彻底的重组。我不再把鸡蛋放在一个篮子里，而是搭建了一个 “公募量化 + 自研量化 + 主观交易” 三足鼎立的“黄金铁三角”。在这个体系中，我把资金和精力分配成了三瓣，每一瓣都承担着完全不同的使命：第一角：30%-40% 仓位配置公募量化（稳健底仓与观察哨）很多技术散户会不屑于买公募基金，觉得“我自己会写代码，凭什么让别人赚管理费？” 但客观来看，机构量化在数据完整度、因子储备、硬件算力和合规风控上，有着散户无法企及的系统性优势。我配置这部分仓位（例如买入鹏华上证科创 100ETF 联接 C 和招商量化精选股票 A ），原因有两个：看好特定板块的贝塔收益：比如科技赛道，通过宽基量化能获取平均超额。作为极佳的横向对比样本：把这部分资金作为锚，用来观察我自己的自研策略到底跑不跑得赢专业机构。它是一个天然的性能对比基准。 [!WARNING] 声明：以上提及的基金产品（如招商量化精选 A 、鹏华科创 100 联接 C ）仅作为我个人投资的过往案例与对照样本进行说明，绝不构成任何投资建议或推荐。市场有风险，千万别参考照抄。第二角：30% 仓位自研量化（吃利基超额的尖刀）既然大仓位有公募底仓兜底，那么我们自己的自研策略就可以更加锐利、更加垂直。散户做量化有一个机构做梦都羡慕的非对称优势：资金容量极小，所以船小好掉头。机构百亿资金根本没办法碰的微盘股、小市值策略、或者一些高频的利基交易机会，都是散户自研策略的自留地。如何把这 30% 玩得轻松？放弃昂贵的门槛：很多券商交易需要 ****** 或 ****** 接口，动辄要求几十万的资金门槛。其实根本不需要。我直接用 JoinQuant 进行策略研究，时配合 9db 交易助手自动跑信号。完全托管，杜绝盯盘：把策略逻辑配置好后，交给 9db 交易助手完全自动执行，自动报单。白天该开会开会，该写代码写代码，把心力耗费降到最低。第三角：30% 仓位资金主观交易（肉身感受市场的感官触角）很多人觉得做量化就要彻底告别主观交易，但我认为，完全脱离盘面的人，写不出好的量化策略。主观交易是你的触角。你必须保留一小部分资金（这里指占你投资资金的一小部分，但由于它是“零钱”，你的心态完全不一样），亲自去感受市场的狂热、恐慌和风格的轮动。为什么一定要用极小资金？因为资金足够小，即使大跌你也不会肉疼，你开会时不会想着它，下班了也懒得看它。没有了心力占用，你的心态会极其放松，反而能更客观地观察市场的多空博弈。反哺量化迭代：很多优秀的量化过滤机制，比如“当指数跌破 20 日均线时强制空仓防守”，往往就诞生于你主观交易中被反复“打脸”后的顿悟。 4. 写在最后：放下对完美的执念，拒绝病急乱投医当市场低迷或者我们自己亏钱的时候，人最容易犯的毛病就是 “病急乱投医” 。今天看推特上有人吹嘘某个策略年化 80%，你就赶紧去抄；明天看短视频说红利股永远的神，你又马上割肉追进去。结果往往就是完美地在每一个热点上接盘。投资是一场长跑，没有哪一种方法是绝对的银弹。搭建“公募底仓 + 自研尖刀 + 主观零花”的黄金铁三角，本质上不是为了追求一夜暴富，而是为了在资产、精力与心态之间找到一个完美的平衡点。降低对自研量化的暴利期望，把它看作你资产配置中的一把小尖刀；借助前人的策略和 AI 工具，别去死磕轮子；用极轻量的工具（如 JoinQuant + 9db ）自动跑起来，把你的白天还给生活和主业。这，才是技术型散户最体面的投资姿势。最后，想问问大家：你目前的投资仓位是怎么配置的？是 100% 全仓主观“肉搏”，还是在死磕某个自研策略？你觉得“主观 + 自研 + 公募”这套铁三角配置适合你目前的现状吗？你在量化的路上又踩过哪些大坑？欢迎在评论区留下你的战绩和看法，我们一起交流避坑，并肩前行！

Vibe Coding 不是软件工程？符合软件工程规范的 AI 软件工程平台来了。

V2EX - 技术 · 2026-06-10 05:33:36+08:00 · tech

过去半年，我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快，但随着项目规模扩大，技术债开始爆发。 Vibe Coding 的核心问题并不在于某几行代码的质量低下，而在于它完全缺乏全局观，且不遵循软件工程的规范。没有宏观架构，没有项目长期记忆，没有自动化审计，我们意识到 Vibe Coding Is Not Engineering 。为了使 AI 编程更符合软件工程规范，我们开发了这个项目。 AnyPal：将 Vibe Coding 带入软件工程时代 AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台，支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时，引入了软件工程的规范。多 Agent 协同与对抗审计：内置工程经理，架构师等 11 个 AI 角色与 6 个反方审查员，支持 Coder 与 Adversary （测试/安全等）多 Agent 左右互搏，在代码交付前完成质量闭环。成本优化：对抗审计配合 S/M/L/XL 任务规模自动切换模型，可以极大降本增效，将 Token 花在刀刃上。项目长期记忆：基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱，设立 Postmortem 工作区，自动复盘每个 BUG ，沉淀经验随项目共同进化。支持敏捷迭代（ Plan 模式）和对抗式编程。敏捷开发：看板工作区切换到 Plan 模式后，系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。和项目经理对话，将你的意图拆解为具备前后置依赖关系的树状任务流，统筹项目全局推进，多任务并行开发，不再需要打开多个 Chat 对话。在线/离线模式: 用户在线时主动追问对齐需求，提前确认方案。用户离线后自主推进看板任务。对抗式编程多 Agent 共享代码库与会话，正方写代码，反方实时审计，在代码进入暂存区前置阻断与纠偏，避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销，大幅提质代码产出质量，对中小模型效果尤为明显。实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7 这是项目早期的一个极端测试：在完全不人工干涉的情况下，让 AI 独立使用 WebDAV 协议实现一个网盘系统。 AnyPal 组：正方（ Coder ）使用 DeepSeek-V4-Flash ，反方（审查）使用 DeepSeek-V4-Pro 。对照组：GitHub Copilot + Opus 4.7 。在此案例中，资源消耗相近的情况下，AnyPal 凭借工程化闭环实现 10 倍以上的性价比。一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/ UI 预览功能在 AI 编程的时候 UI 也是一大痛点，回滚不仅浪费 Token ，还可能影响其他组件。现在 AI 在开始前会先询问需求，给出数个方案和预览，您可以选择其一或者继续修改需求。自动复盘 AI 修复 BUG 后自动生成 Markdown 复盘文档，记录严重程度、时间线、根因、修复措施，并关联可回放的 Agent 会话，随时追溯决策过程。该文档会进入项目的长期记忆，随项目共同进化。参与内测项目地址： https://anypal.pome.net/ 支持免登录，自行导入大模型 API 使用。注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。推荐使用客户端体验完整功能加入 Q 群：497719526 领取限量 Token 补贴。我们正在寻找视频团队和测评博主合作，如果您有意向请联系我们。

Vibe Coding 不是软件工程？符合软件工程规范的 AI 软件工程平台来了。

V2EX - 技术 · 2026-06-10 04:33:36+08:00 · tech

过去半年，我们团队尝试了全流程的 Vibe Coding 模式。刚开始用提示词生成代码的感觉非常爽快，但随着项目规模扩大，技术债开始爆发。 Vibe Coding 的核心问题并不在于某几行代码的质量低下，而在于它完全缺乏全局观，且不遵循软件工程的规范。没有宏观架构，没有项目长期记忆，没有自动化审计，我们意识到 Vibe Coding Is Not Engineering 。为了使 AI 编程更符合软件工程规范，我们开发了这个项目。 AnyPal：将 Vibe Coding 带入软件工程时代 AnyPal 是由 Pomesoft 研发的全栈 AI 编程平台，支持导入国内外主流模型 API 。它在保留 Vibe Coding 快速生成体验的同时，引入了软件工程的规范。多 Agent 协同与对抗审计：内置工程经理，架构师等 11 个 AI 角色与 6 个反方审查员，支持 Coder 与 Adversary （测试/安全等）多 Agent 左右互搏，在代码交付前完成质量闭环。成本优化：对抗审计配合 S/M/L/XL 任务规模自动切换模型，可以极大降本增效，将 Token 花在刀刃上。项目长期记忆：基于 Tree-sitter 与 DuckDB 构建 GraphRAG 代码知识图谱，设立 Postmortem 工作区，自动复盘每个 BUG ，沉淀经验随项目共同进化。支持敏捷迭代（ Plan 模式）和对抗式编程。敏捷开发：看板工作区切换到 Plan 模式后，系统会直接呈现 Sprint 列表、Kanban 看板、燃尽图、依赖图和 Issue 管理。和项目经理对话，将你的意图拆解为具备前后置依赖关系的树状任务流，统筹项目全局推进，多任务并行开发，不再需要打开多个 Chat 对话。在线/离线模式: 用户在线时主动追问对齐需求，提前确认方案。用户离线后自主推进看板任务。对抗式编程多 Agent 共享代码库与会话，正方写代码，反方实时审计，在代码进入暂存区前置阻断与纠偏，避免 BUG 与逻辑漏洞进入主干。以少量额外 Token 开销，大幅提质代码产出质量，对中小模型效果尤为明显。实战对比 AnyPal + DeepSeek VS Copilot + Opus 4.7 这是项目早期的一个极端测试：在完全不人工干涉的情况下，让 AI 独立使用 WebDAV 协议实现一个网盘系统。 AnyPal 组：正方（ Coder ）使用 DeepSeek-V4-Flash ，反方（审查）使用 DeepSeek-V4-Pro 。对照组：GitHub Copilot + Opus 4.7 。在此案例中，资源消耗相近的情况下，AnyPal 凭借工程化闭环实现 10 倍以上的性价比。一镜到底视频 https://www.bilibili.com/video/BV1JX5w61EfL/ UI 预览功能在 AI 编程的时候 UI 也是一大痛点，回滚不仅浪费 Token ，还可能影响其他组件。现在 AI 在开始前会先询问需求，给出数个方案和预览，您可以选择其一或者继续修改需求。自动复盘 AI 修复 BUG 后自动生成 Markdown 复盘文档，记录严重程度、时间线、根因、修复措施，并关联可回放的 Agent 会话，随时追溯决策过程。该文档会进入项目的长期记忆，随项目共同进化。参与内测项目地址： https://anypal.pome.net/ 支持免登录，自行导入大模型 API 使用。注册免费订阅可使用内置 DeepSeek-V4-Flash 、DeepSeek-V4-Pro 、Kimi K2.6, Token 需预充值。推荐使用客户端体验完整功能加入 Q 群：497719526 领取限量 Token 补贴。我们正在寻找视频团队和测评博主合作，如果您有意向请联系我们。

开发交给苍老师，测试全靠特朗普，管理全看三上悠亚，让日本老师们组成了个 agent 团队😂

V2EX - 技术 · 2026-06-10 02:27:43+08:00 · tech

V2EX 放不了图，大家可以去 X 看：日本老师们组成的 Hive Agent 团队 😍 Hive GitHub 仓库大家感兴趣可以搭个试试

/tag/团队