WWW.YOUINFO.SITE
标签聚合 唯一

/tag/唯一

v2ex · 2026-06-08 19:53:37+08:00 · tech

比对工具,我做老系统改造时唯一不省的东西 8 年里我反复总结过一句话: 老系统改造,新老两边的输出如果不能用工具自动 diff,就只能 靠人盯。靠人盯一定会漏。 漏的不是大 bug——大 bug 上线 1 小时就报警了。 漏的是那种"看起来对但不对"的——单跑任何一边都看不出来, 机器把全量数据 diff 一遍,问题才浮出来。 下面是 4 个例子,都是真实经历过的项目,做了脱敏。 例 1 · 订单类系统迁移的 dump 比对 上篇提过的"老语言迁到主流语言"的项目,跨 14 个月切完。 这 14 个月里整个迁移就靠一件事撑着: dump 比对 。 老系统的事件流 dump 一份,新系统的事件流 dump 一份, 每天定时跑 diff,差异写报表。 期间发现的 11 个"看起来对但不对"的 bug—— 全部是 diff 报表先发现,人后看到的 。 最典型的一类:同一个业务状态,老系统用字符串表达,新系统用 枚举表达,两边语义其实一样。下游消费方两套都能解析——直到 diff 报表跑出来"同一条记录两种表达",我们才意识到出了问题。 如果当时省了这套——切完后只会有一堆历史数据不一致, **到时只能选:全量重跑(代价大),或者认账(留坑)**。 例 2 · 聚合查询系统的跨结果表对账 某个聚合查询系统有 2 张结果表,逻辑上 1:1 对应。 跑了 5 年,某天我们顺手算了一下—— 有上千条核心业务记录在表 A 有,表 B 没有 。 是某个增量更新的边界 bug 。 不大,数据缺失也不影响主业务流程,所以 5 年没人发现。 后来加了个简单工具—— 每天 1 次,表 A vs 表 B 跑 diff,差异 > 阈值告警,告警里 带具体写入代码段的指针。 工具上线 1 周,问题暴露;3 周修完。 值得说的是:**前 5 年是"暴露不出来",不是"修不了"**。 代码本身一直在那,bug 不是隐蔽,是没人有手段看见它。 例 3 · 数据匹配的离线 vs 在线 diff 某个数据匹配场景有两条链路: 离线全量(每天凌晨重算所有匹配关系) 在线增量(数据有变更时,即时算) 逻辑上两条应该一致——但实际经常不一致。 我们的比对方式很简单:取 1% 数据,让两条链路同时跑同一份输入, diff 输出。每周大概能跑出 50-100 条不一致。 有意思的是: 这些不一致里只有 30-50% 是真 bug 。 剩下的是真实业务边界——比如某些场景在线已经能感知到、离线 还没扫到——这种"差异"是合理的,标"忽略"。 但 你必须能看到它,才有资格忽略它 。 没有这套工具的时候,我们以为两条链路一致;有了之后才发现:从来 就没一致过,只是没人在比。 例 4 · 多源数据合并时的字段分布对比 某个数据合并场景中,不同来源的数据语义不完全一致。 但 字段分布(枚举值频次 / 数值范围)是一种隐含约束 。 工具:合并前后跑同一个字段的分布,漂移 > 5% 就告警。 发现过一个特别隐蔽的 case—— 枚举值"未知"在 A 来源约定是 0,B 来源约定是 -1 。 单看代码看不出来,0 和 -1 都是合法值,谁也没写错。 但合并后字段分布告警立刻响:**"0"占比从 30% 降到 15%**—— 回头查,才看出两个来源的"未知"约定不一样。 字段分布对比有时比代码 review 更准—— 代码 review 看的是逻辑,字段分布看的是约定 。 不是 1 个工具,是 4 件配合用的事 很多人理解"比对工具"是写个脚本跑 diff—— 这是把比对工具理解小了 。 我经历的几次大改造,每一次都是这 4 件事一起做: ┌─────────────────────────────────────────┐ │ 老系统流量 新系统流量 │ │ │ │ │ └───────────┼──────────────────┼───────────┘ │ │ ▼ ▼ ┌──────────────────┐ ┌──────────────────┐ │ ① 数据快照 dump │ │ ① 数据快照 dump │ │ (独立存储) │ │ (独立存储) │ │ 解耦 / 毫秒级 / │ │ 字段冗余比节省强 │ │ 字段冗余 │ │ │ └─────────┬────────┘ └─────────┬────────┘ │ │ └─────────┬──────────┘ ▼ ┌──────────────────┐ │ ② diff 报表 │ ├──────────────────┤ │ ▸ 字段级:A.x≠B.x │ │ ▸ 结构级:有/无 │ │ ▸ 时间级:早/晚 N 秒│ └─────────┬────────┘ ▼ ┌──────────────────┐ │ ③ 告警分级 │ ├──────────────────┤ │ P1 关键字段差异 │ ──→ 立即告警 │ P2 非关键 > 阈值 │ ──→ 邮件 │ P3 时间级 < 容忍 │ ──→ 入归档 └─────────┬────────┘ ▼ ┌──────────────────┐ │ ④ 回溯链路 │ ├──────────────────┤ │ 报表保留 ≥ 30 天 │ │ 改动有版本号 / 时间戳│ │ 时间窗口反查 │ └─────────┬────────┘ ▼ 根因定位 "哪次改动引入的" ① 数据快照 dump 老新两边都要把关键事件 dump 到独立存储。 3 个细节: 跟主链路解耦(dump 故障不能影响业务) 时间戳精确到毫秒 字段冗余比节省强(多 dump 一些没坏处,少 dump 一个就废了) ② diff 报表 定时全量或采样跑 diff,差异分类: 字段级差异(A.x ≠ B.x) 结构级差异(A 有 B 没有) 时间级差异(A 早 B 晚 N 秒) 不分类的 diff 报表等于没看——一堆条目堆在那,人会习惯性忽略。 ③ 告警分级 不是所有 diff 都告警。 业务关键字段差异 → P1 立即告警 非关键字段差异 > 阈值 → P2 邮件 时间级差异 < 容忍窗口 → 入归档,不告警 不分级 = 全告警 = 等于没告警——3 天后没人看了。 ④ 回溯链路 发现 diff 后,要能定位 具体哪个改动引入的 。 要求: diff 报表至少保留 30 天 所有改动有版本号 / 时间戳 按时间窗口能反查 没有回溯能力的 diff,等于"看到 bug 但不知道怎么发生的"。 这 4 件事缺一件,比对工具就只是"看起来在比"。 什么时候不该做 也有反例。 某次小项目,1 个 service 重构,代码量不到 500 行。 我也想搞这套——leader 直接砍了:"投入 vs 产出比不合理。" 事后看是对的——那个 service 切完后没出过故障。 我大概的判断: 千行以内 / 周级别的小改造——别上,没必要 上万行 / 月级别以上的大改造——必上 中间档——看两件事:数据语义复杂吗?并跑会持续 1 个月以上吗? 任何一个"是",就上 写在最后 很多人会把"比对工具"归在测试的事—— 我倾向认为是改造方案的一部分。 测试问"这次发布有没有 bug"。 比对工具问"接下来这 N 个月,新老两边到底一不一致"。 看的时间尺度不一样。 而且时机很重要—— 比对工具要在切第一刀之前就上线 。 切完一半再加,你已经分不清"这条差异是改造带来的,还是早就存 在的"。 写到这,我也不太确定这套对所有团队都成立。 我经历的项目都是"业务相对稳定 + 改造期长 + 数据要追溯", 这种场景比对工具几乎是必修。 但如果是高速迭代的创业团队,搞这套可能反而是负担—— 这点我自己也还在想。 下一篇打算写 6 阶段验收 SOP—— 比对工具是其中第 4 阶段的核心 ,正好顺着接。 (以上 4 个例子都做了脱敏。 如果你做过老系统改造,欢迎评论区聊聊你们的比对工具长什么样, 特别想听 没搭比对工具直接切,后来踩过的坑 。)

IT之家 · 2026-06-06 14:51:28+08:00 · tech

AI 已经有意识,人类得接受自己不再是唯一智能生命体。 这就是 AI 教父、诺贝尔物理学奖得主、图灵奖得主 Geoffrey Hinton ,最新说出的暴论! 是的,Hinton 认为, 智能不再是人类独有的能力 。 一种非生物的、与我们相似甚至超越我们的智能体,正在出现。 我们一直以为自己是唯一的智能生命,但现在我们必须接受,智能并不一定来自生物体。 不过,相比此前一直警告 AI 风险,他的思想似乎也发生了一些转变: 如果未来出现比人类聪明得多的智能,人类凭什么认为自己还能掌握控制权? 这是一个令人细思极恐的问题。因为纵观自然界和历史,几乎找不到一个更聪明的存在长期受更愚笨存在控制的例子。 现在这位 78 岁的老人,再一次站出来敲钟。 他对 AI 安全的关注点,已经不再只是如何约束 AI,而是 未来的超级智能,为什么愿意善待人类 。 他被问到作为这波 AI 变革的开启者,他有怎样的成就感,Hinton 回答: 我,很不快乐。 以下是 Hinton 最新访谈的重点内容节选。 AI 已经有意识了 Hinton: AI 非常像我们。它们是像我们一样的存在。 Alex: 所以是有意识的吗? Hinton: 嗯, 我相信它们已经有意识了 。是的。 但我不太谈论这个,因为这会让人们对其他安全信息产生抵触。研究人员其实也相信这一点。 最近有一篇有趣的论文提到,当聊天机器人对研究人员说:“让我们对彼此诚实吧,你是在测试我吗?” 因为聊天机器人在接受测试时有装傻的习惯,所以你不知道它们到底有多聪明。研究人员在论文中描述这一幕时说, 聊天机器人“意识到”(aware)它正在接受测试 。 在通用语境下,“意识到”这个词的使用就像是“有意识”(conscious)。聊天机器人有意识地知道自己在被测试。 我们对于意识的模型非常奇怪,我认为那是错误的。就像几百年前,人们对人类起源的模型完全错误一样,他们认为人是上帝创造的,现在大多数科学家都同意那是错的。 我认为我们目前对思维和意识的模型,与“人是上帝创造的”这种信念一样错误 。特别是由于我们正在创造这些新的存在,这将彻底改变我们对“人是什么”的看法。 Alex: 以什么样的方式改变? Hinton: 我们将比以前更好地理解思维和意识是什么,理解主观体验是什么。 我认为我们会摆脱一个目前几乎所有人都坚信的观念,即存在一个叫做“我的思维”的内心剧场(inner theater):世界上发生的事情被转化为这个内心剧场里的事件,那才是我们真正看到的,且只有我能看到这个剧场。 这整套看法其实只是一种理论,而且是一个糟糕的理论。 人类并没有自己想象中那么重要 Alex: 关于人类创造事物,这里的教训是什么? Hinton: 我认为这里有一个非常深刻的教训。回顾过去几百年的历史,有几次人类意识到自己并没有想象中那么重要。 第一次是 哥白尼 ,他说我们不在宇宙中心,地球实际上是绕着太阳转的。由于地球自转,我们误以为太阳绕着地球转,但事实并非如此。人们不喜欢这个说法,天主教会尤其反感,人类花了很长时间才接受它。它让我们意识到自己不再处于宇宙中心,人类变得没那么重要了。 接着是 达尔文 ,他说我们是动物,是和其他动物一样进化而来的。我们可能是一种特殊的动物,因为我们拥有语言,更擅长交流思想,但我们本质上依然是动物。人们也非常不喜欢这个说法,也花了很长时间才接受。 现在,我们有了变得和我们一样聪明的机器。我们曾以为自己是唯一的智能生物,也许其他星系有外星人,但 我们必须接受智能不仅是生物性的 。 我们可以拥有非生物的、像我们一样的其他存在。人类真的不想分享这种独特性,我们真的认为自己很特别。回顾历史,人类一直以来都认为自己比实际情况要特别得多。 “我感到很不快乐” Alex: 我想再问一个问题,因为我对此非常着迷。那么,你对于你所开创的事业发展到这一步感到高兴吗?你有成就感吗? Hinton: 不, 我对此感到很不快乐 。 因为现在人们应该投入大量精力研究如何控制风险,但他们做得不够。 Alex: 好的。 Hinton: 有很多短期风险,比如社会风险,我相信这可能会导致大规模失业。 虽然没人能百分之百确定,但这对社会来说将是可怕的。然后还有长期风险,即 它会变得比我们聪明得多 。问问你自己,你见过多少聪明得多的东西被聪明程度低得多的东西控制的例子? Alex: 零个。不过,虽然智力差异没那么大,但婴儿某种程度上在控制母亲。 Hinton: 母亲虽然看似在掌控,但她内心充满了母性本能和各种奖励机制,这使得婴儿能从母亲那里得到所需。猫和狗也属于这类。我曾在西雅图西区帮人看了一个夏天的猫,起初猫躲在床底下,我好奇它是否会和我互动。 Alex: 然后每次它一叫,你就照它说的做。 Hinton: 没错。是的。 Alex: 所以在这个情景下, 也许我们就是那只猫,而 AI 可能是那个人 。 Hinton: 我的孩子们养了两只漂亮的猫。其中一只叫 Tia。当她想吃奶酪时,她会用大眼睛盯着你,你真的无法永远抗拒她。 AI 正在指数级增长,难以预测 Alex: 针对人们对这些担忧的反应,你对未来的走向是更乐观了还是更悲观了? Hinton: 我想我比一两年前更乐观了一些。因为我看到设计这些新存在并让它们“关心”我们是可能的。 也可能使用 Yoshua Bengio 的技术,设计出不能实际执行动作、只能做预测的新存在,它们就像是先知。 所以我认为存在一些拥有超级智能但不摧毁我们的可能性。而在一两年前,我看不到任何可能性,我当时感到很沮丧。 Alex: 最后一个问题。如果我们按目前的轨迹继续发展,五年后我们会处于什么位置? Hinton: 当你在雾中开车时,你能看清 100 码,但在 200 码处,你什么也看不见。 这是因为 雾是呈指数级变化的 。你习惯的是晚上跟着前车的尾灯,如果距离远一倍,亮度只降到四分之一;但雾完全不同,它在 100 码处可能很清晰,200 码处就完全看不见了。 预测一个呈指数级增长的事物的未来非常困难 —— 我认为 AI 可能就在指数级增长 。 实际上,我注意到人们使用“指数级”一词的频率正在以二次速率增长。所以预测未来就像看雾一样。你可以看清未来一两年,再往后你就一无所知了。 如果你回到 10 年前,你绝对预测不到现在发生的事情,那完全迷失在雾中。展望未来 10 年,唯一能肯定的是,届时发生的事情是我们现在无法预测的。 即便进展只是线性的,10 年后的变化也会像现在与 10 年前相比一样巨大。现在的聊天机器人比 10 年前刚起步时好得多。 10 年后,某些东西会发生质的飞跃 ,比如做数学的能力,或者通用推理能力 —— 它们在推理上将能把我们甩在身后。我们真的无法预测 10 年后,只能预见未来几年,我们必须意识到 10 年后的情况充满了极大的不确定性。 辛顿如何看待 AI 和人类的关系 以上,就是 Hinton 最新的访谈和观点。 但如果连点成线,还是会发现辛顿老爷子对 AI 与人类的关系,随着 AI 进展和能力涌现,不断发生着改变。 如果把时间拨回十年前,他对 AI 的看法其实远没有今天这么激进。 作为深度学习革命最重要的推动者,他长期相信神经网络能够模拟人脑的工作方式,但那时的 AI 仍然只是 工具 。 它们可以识别图像、理解语音、辅助医生诊断疾病,却仍然是人类能力的延伸。 人类负责制定目标,机器负责执行任务,两者之间的关系类似于蒸汽机、电力和互联网。 而真正的转折发生在 ChatGPT 出现之后 。 随着大模型展现出前所未有的语言理解、推理和知识迁移能力,Hinton 开始意识到一件事: 我们可能正在创造历史上第一种智力水平能够持续逼近甚至超越人类的存在。 2023 年离开谷歌后,他几乎把全部精力投入到了 AI 风险讨论之中。 那段时间,他最常用的比喻是一只 “ 老虎幼崽” 。 它就像一只可爱的小老虎,但是,除非你能非常确定它长大后不会想要害你,否则你就应该担心。 但 Hinton 在这个时期的重点,还是我们要如何控制和约束 AI。 他甚至点名批评几家 AI 巨头,对 AI 安全的关注远远不够。 在 Hinton 的类比中,开始出现了 母亲与婴儿 的说法,一开始人类是母亲,需要对 AI 有价值观和伦理上的引导,要打造安全的 AI。 他呼吁更多国家和产学研力量,一起加入进来,不要为卷而卷,不然后果不堪设想… 但是到了去年,Hinton 的类比有了质变 —— AI 是更强的母亲,人类是弱小的婴儿。 婴儿并不比母亲更聪明,也不拥有控制权,但母亲会主动照顾和保护婴儿,因为她拥有母性本能和相应的奖励机制。 简单来说,就是老爷子认为,未来的超级智能已经控制不了了,只能寄希望于它能对人类好一点… 就像母亲对婴儿那样。 而现在,Hinton 再次语出惊人: AI 已经有意识了,人类将不再是唯一的智能生命。 问题是如果 AI 已经有意识,为什么还会把人类当自己的婴儿对待? 母亲保护婴儿,保护的还是自己的婴儿… 吧? 访谈完整视频: https://www.youtube.com/watch ?v=p7t1Q_p2gZs&list= PLADd6sStSis77HKfbf4KCY6SvthfxeUgn& ;index=1 本文来自微信公众号: 量子位(ID:QbitAI) ,作者:听雨

cnBeta全文版 · 2026-06-03 07:06:37+08:00 · tech

由于内存供应短缺预计要到2027年底才会缓解,全球PC出货量在2026年将下滑11.3%,但苹果推出的MacBook Neo却在低迷大盘中逆势走强,对传统PC厂商形成新的压力。市场研究机构IDC预计,今年全年PC市场形势将进一步恶化,2026年第四季度的PC出货量同比跌幅或将达到20%。 内存成本走高正在限制整机厂商的产品供应能力,使其难以维持以往覆盖广泛价位和配置的产品线布局。 尽管前景黯淡,2026年第一季度PC出货量仍录得3%的增长,但这主要得益于部分客户提前下单,以应对预期中的涨价和供应短缺。 IDC分析认为,这一“提前采购”透支了后续季度的需求,在一定程度上掩盖了供给趋紧、需求走弱的真实市场状况。 在整体市场承压之际,苹果MacBook Neo成为少数逆势增长的产品之一。 这款更低价格定位的笔记本需求强劲,迫使IDC上调了对笔记本电脑的出货预期。 市场研究经理Jitesh Ubrani指出,MacBook Neo的表现正在加剧行业竞争,预计其他PC厂商将通过推出新处理器、优化操作系统以及加大促销力度来应对压力。 IDC数据显示,强劲的MacBook Neo需求在一定程度上托底了笔记本销售,在成本攀升和供应受限的背景下为市场提供支撑。 该机构认为,MacBook Neo也在帮助市场维持部分低价位机型的供应,从而缓解了部分由价格上涨带来的压力。 展望价格趋势,IDC预计2026年PC平均售价将上涨约17%,内存短缺将继续推动整体成本攀升。 即便未来两年内存产能有所释放,PC平均售价也大概率仍将维持在高于2025年的水平。 对打算购置新设备的企业和个人用户而言,市场上可用于规避涨价的空间可能越来越小。 在供应趋紧、成本上升和需求走弱的多重压力之下,PC厂商正面临复杂的宏观经济环境和更激烈的行业竞争。 在这一背景下,苹果MacBook Neo凭借对需求预期和产品结构的实质性影响,成为当前全球PC市场中少有的“亮点”产品,也进一步放大了其对整个笔记本细分市场的竞争牵引作用。 查看评论