IT之家 5 月 26 日消息,乔治 · 霍茨(George Hotz)于 5 月 24 日发布博文,指出在当代软件开发过程中, AI 编程智能体可能是代价最高的错误之一。 IT之家注:霍茨于 1989 年 10 月出生,人称“神奇小子”(geohot),是世界著名的黑客、安全研究员和创业者。 乔治 · 霍茨,图源:WikiMedia 他以早期破解 iPhone 和 PlayStation 3 闻名,是自动驾驶技术公司 Comma.ai 的创始人,以技术极客形象在编程和人工智能领域备受关注。 霍茨称,自己用 6 个月测试了多种模型和工具,还结合 tinygrad 相关工作,结论是它们适合快速原型,却不擅长处理决定质量的细节。 霍茨在博文中担忧大组织过度依赖 AI 工具,他指出 AI 模型可以快速产生代码,但是生成的代码表面越来越像样,问题却更难识别。 霍茨认为,能力较弱的开发者很难看穿这些缺陷,最终可能把有问题的代码带入正式系统,累积出高昂维护成本和隐蔽故障风险。 在技术判断上,霍茨已从早期乐观转向怀疑。他现在更接近杨立昆(Yann LeCun)和加里 · 马库斯的观点,大语言模型并不真正具备智能。 他认为这类模型本质上是复杂的统计系统,主要任务是模仿编程分布,而不是真正理解问题。正因如此,它们能模仿代码外形,却未必能稳定完成陌生情境下的推理与修正。 与霍茨相反,安德烈 · 卡帕西近来的态度明显转向积极。他曾在 2025 年秋天认为智能体系统不可靠,但在 GPT-5.4 和 Opus 4.6 发布后改口,称 AI 智能体已经永久改变编程方式。 参考 The Eternal Sloptember
美国乔治亚州费耶特县近日披露,一处大型数据中心园区在数月时间里使用了超过2900万加仑自来水,却一直没有收到水费账单,而同一时期附近高档社区的居民则频频投诉家中水压明显下降。 事件起因于费耶特维尔市安妮丽丝公园(Annelise Park)高档住宅区居民的举报。去年,居民注意到自来水水压持续偏低,向县水务部门反映后引发调查。调查结果显示,问题源自附近由 Quality Technology Services(QTS)运营的一处数据中心开发项目,该园区内两条大容量供水管线未被水务系统正确监控,其中一条甚至在水务部门不知情的情况下就已接入,另一条则没有关联到任何计费账户。 进一步核算发现,超过2900万加仑的用水量在账目中“失踪”。根据2025年5月15日县方向 QTS 发出的函件,水务部门最终对这一时期的用水开出了一张追补账单,金额为14.7474万美元。关于这段“漏计”期的长度,官方与企业说法并不一致:县水务系统负责人 Vanessa Tigert 对媒体表示,大约持续了4个月,而 QTS 发言人则称可能长达9到15个月。相关欠款目前已经结清。 这次失误发生在费耶特县推进云端智能水表系统的更换过程中。当地正借此升级公共事业基础设施,但新旧系统交接也暴露出在大型工业用户管理上的制度漏洞。Tigert 将此描述为流程问题而非蓄意行为,称费耶特县以住宅用户为主,商业用水表本就不多,因此没有及时意识到高容量连接点没有在系统中正常运作。 QTS 表示,未计量用水的时间段恰好与县里更换计量系统重叠,如今其用水计量已全面接入新系统。公司强调,目前高用水量主要与施工阶段有关,而非未来日常运营需求。该园区规模巨大,占地约615英亩,规划建设最多16座建筑,是全美规模最大的 数据中心园区之一。施工阶段大量用水主要用于混凝土作业、抑制扬尘以及场地基础准备,这些短期需求在强度上往往远超设施投入运营后的日常水平。 从技术方案上看,QTS 表示园区建成后将采用闭环冷却系统进行散热,不会以消耗水资源的方式来实现冷却。对于以往大规模依赖冷却塔、蒸发式冷却等方式的大型数据中心而言,这是一个重要差异,因为传统散热方案为密集服务器“降温”需要持续消耗大量水资源。QTS 宣称,园区正式运营后,其用水需求将主要是生活用水,约相当于“四户美国普通家庭一个月的用水量”。 然而,技术承诺并未完全缓解当地舆论的不安。乔治亚州正面临持续干旱,多地处于中度至重度干旱状态,州长布赖恩·坎普(Brian Kemp)近期因野火蔓延而宣布进入紧急状态。在此背景下,巨量用水未计费的消息经由一份公开记录请求曝光后在网络上流传,引发居民对水资源分配与监管公平性的质疑。一些居民认为,政府对家庭用水管控和对大型用水户的管理存在明显落差。 当地律师兼产权倡导者 James Clifton 指出,居民经常收到费耶特县水务系统发来的节水通知,被要求减少浇灌草坪等日常用水,以配合节水号召,而与此同时,像 QTS 这样的“大户”却被指“疯狂抽水”。他表示,在许多月份里,QTS 已经是全县排名第一的用水大户,这种对比让普通居民感到不公。Clifton 目前正竞选费耶特县委员会议员,该事件也顺势成为当地反对数据中心扩张舆论的一部分。 在公众压力之下,费耶特维尔市议会近期投票通过,在所有分区类型中全面禁止新增数据中心项目,即便此类项目往往能带来可观税收。县府官员曾估算,仅 QTS 园区一项就可能为当地每年贡献数千万美元税收。另一方面,水务部门选择只追补水费、不追加罚金的做法,也加剧了社会不满。Tigert 为此辩解称,QTS 是他们“最大的客户”,双方需要保持合作关系,这也是一种“客户服务”。 加州大学洛杉矶分校水资源研究小组负责人 Gregory Pierce 则指出,这样的“宽容”在行业中并不常见。他认为,当地政府很可能不愿与这个新近落户、且体量庞大的客户闹翻,因此在追责和处罚力度上格外谨慎。Pierce 的看法进一步印证了外界对政企关系与监管尺度之间微妙平衡的担忧。 目前,费耶特县方面称技术问题已经得到修复,计量和账务流程也已调整。但这一事件折射出的矛盾远不止于一次技术疏漏。随着大型数据中心不断向郊区扩张,原本为居民需求设计的公共基础设施正被迫向新的用水、用电和土地需求“试错式”适应,而每一次失误都可能以水压下降、干旱加剧、乃至政治风向转变的形式,直接影响到普通居民的日常生活。 在这个意义上,费耶特县的数据中心“漏计水费”事件,既是一次地方行政管理和技术升级的教训,也是全球范围内数字基础设施继续扩张时难以回避的一面镜子。 查看评论
美国海军近日在核动力航母“乔治·H·W·布什”号(CVN-77)上完成了AeroVironment公司研制的LOCUST激光武器系统(Laser Weapon System,LWS)海上测试,实现了对多架空中无人机目标的100%击落率,标志着舰载定向能武器发展取得重要里程碑。 这次LOCUST激光武器的海试于2025年10月5日进行,被视为海军作战理念向激光等定向能武器转型的关键一步。与以往固定安装在舰体、功率达到数兆瓦级的大型激光系统不同,LOCUST走的是“模块化”和“可移动”路线。它以“托盘化高能激光”(P-HEL)形式出现,可装载在相对小型的陆基车辆上,也可以通过叉车以类似普通集装箱的形态直接放置在舰艇甲板上。 LOCUST采用光谱合束(SBC)技术,输出功率超过35千瓦,从接通电源到完成战备只需约15分钟,可直接利用舰艇电网供电,也可依靠内部电池运行。AeroVironment方面称,该系统在设计上强调操作直观性,水兵只需不到一小时的专项训练,即可掌握从目标探测、跟踪到开火的完整流程。 在打击能力方面,这套重约3400磅(约1,542千克)的激光武器可对付1至3类无人航空系统(UAS)以及无人水面艇(USV),适用于多个方向的低慢小威胁。由于系统为托盘化模块结构,当不再需要时,可以迅速从甲板上撤离,为航母恢复常规飞行作业腾出空间。在本次“布什”号测试中,LOCUST就是以临时部署方式上舰,完成演示后迅速拆除。 这种可快速装卸的特性意味着,当航母停靠港口或在限制水域内无法展开飞行行动时,舰艇仍可通过部署LOCUST获得有效的无人机防护能力,而在恢复飞行任务前又能快速将系统撤除,保持航母的完整起降能力。 海试结果中最引人关注的是,LOCUST成功实现了对所有来袭无人机目标的发现、跟踪与摧毁,达成100%命中率。在海上环境下,利用激光武器稳定锁定并摧毁高速、小型空中目标本身就极具挑战,这一表现被认为对各类武器系统而言都难度极高。 除战斗性能外,本次在“布什”号上的试验还验证了LOCUST在多种严苛海上环境条件下的可靠性。测试内容包括电子设备在盐雾、湿度和振动环境中的耐受表现,平台稳定系统对舰艇摇摆的补偿能力,以及系统防护设计在保障快速部署和撤收过程中的有效性。试验同样评估了其高精度指向与打击能力,以确保在作战使用中尽可能减少附带损伤,并避免对友方航空器造成干扰。 AeroVironment公司定向能系统副总裁约翰·加里蒂(John Garrity)表示,LOCUST能够“以光速为各个领域提供针对新兴无人机威胁的有效防护,可部署在任何平台、任何域、执行任何任务”。他强调,将LOCUST以“模块托盘”的形式滚装上舰并快速投入运行,有望在无需对舰艇进行昂贵且耗时的结构改装的前提下,在更大范围内推广高能激光在舰队中的应用,“这对海军和国家安全而言都是一项‘游戏规则改变者’”。 据介绍,本次海试是AeroVironment在与美海军合作推进LOCUST项目过程中的关键节点,厂方认为,LOCUST的模块化、可运输、高度自动化以及相对较低的使用成本,将为舰艇提供一种新的“弹药不限量”防御选项,用以应对日益增加的无人机和无人艇威胁。 查看评论
在医疗剧中,从《急诊室的故事》里的乔治·克鲁尼到《急诊室风云》中的诺亚·怀尔,急诊科医生长期被塑造为拯救生命的英雄形象。 但一项来自哈佛的最新研究显示,在高压的急诊分诊情境中,人工智能系统在诊断准确性上已经超越了人类医生,这一结果被研究者形容为将“重塑医学”的技术性转折点。 这项发表在《科学》期刊上的研究,由哈佛医学院团队主导,独立专家认为,它标志着人工智能在临床推理能力上的“真正进步”,不仅仅是通过考试或解决人工构造的测试题。 研究采用了大规模试验设计,将数百名医生与一套大型语言模型(LLM)进行对比,重点评估在急诊分诊和长期诊疗规划等关键场景中的表现差异。 在其中一项核心实验中,研究团队选取了波士顿一所医院急诊室的76名真实就诊患者案例。 AI 系统和一组由两名人类医生组成的团队,被提供完全相同的标准电子病历记录,包括生命体征数据、人口学信息以及护士对就诊原因的几句简要描述。 在仅凭这些有限信息进行初始诊断的情境下,AI 在 67% 的病例中给出了准确或非常接近的诊断,而人类医生的正确率仅在 50%–55% 之间。 研究指出,AI 的优势在信息极度有限、需要迅速作出判断的分诊场景中表现得尤为突出。 当为 AI 和医生提供更为详尽的临床信息后,AI(使用的是 OpenAI 的 o1 推理模型)的诊断准确率进一步提升至 82%,而人类专家的准确率则在 70%–79% 之间,不过这一差异在统计学上并不显著。 除了急诊分诊外,AI 在制定长期治疗方案方面同样展现出优于医生的表现。 在另一项试验中,研究团队让 AI 与 46 名医生共同审阅五个临床案例,任务包括设计抗生素使用方案以及规划临终关怀流程等长期管理计划。 结果显示,AI 所给出的治疗方案得分显著更高,评分为 89%,而依赖传统资源(如搜索引擎)的医生得分仅为 34%。 尽管如此,研究者强调,现在还远未到“宣布急诊医生下岗”的时候。 这项研究仅比较了在可被文本化的病历数据层面,AI 与人类的诊断能力,并未纳入许多在真实临床情境中至关重要的信号,例如患者的痛苦表情、情绪状态、肢体语言乃至与家属互动等非文本信息。 换言之,这项研究中,AI 更接近一名基于纸面资料给出第二意见的“幕后台前医生”。 “我不认为我们的发现意味着 AI 会取代医生。”研究的第一作者之一、哈佛医学院 AI 实验室负责人阿琼·曼赖(Arjun Manrai)表示。 “我认为它意味着,我们正在见证一种极具深远影响的技术变革,而这种变革将重塑整个医疗体系。” 同为主要作者的亚当·罗德曼(Adam Rodman)则是波士顿贝斯以色列女执事医学中心的一名临床医生,他称大型语言模型是“近几十年来最具影响力的技术之一”。 他预言,在未来十年,AI 不会取代医生,而是将与医生、患者共同构成一种新的“三方照护模式”——“医生、患者与人工智能系统”。 研究中还呈现出一个颇具代表性的临床案例:一名患者因肺部血栓和症状恶化来到医院。 人类医生最初判断是抗凝药物治疗失败,导致病情进展;但 AI 在阅读病史后注意到一个关键点——患者罹患红斑狼疮,这种自身免疫疾病也可能引发肺部炎症。 经过进一步检查,AI 的推断被证明是正确的。 AI 在临床中的应用并非停留在实验室阶段,已有大量医生在实践中使用。 根据美国医学会最近发布的研究,近五分之一的美国医生已经在诊断过程中引入 AI 辅助工具。 在英国,皇家内科医师学会的一项最新调查显示,16% 的医生每天使用此类技术,另有 15% 每周使用一次或多次,其中“临床决策支持”是最常见的使用场景之一。 不过,英国医生在接受调查时也表达了对 AI 的高度警惕,尤其是对 AI 误诊风险和责任归属问题的担忧。 尽管全球范围内已有数十亿美元涌入医疗 AI 创业公司,但一旦 AI 出错,责任如何界定、由谁承担后果,仍是亟待解决的制度空白。 “目前并不存在一个正式的问责框架。”罗德曼指出,同时他强调,患者在面对生死抉择或复杂治疗方案时,“终究还是希望由人类来引导、陪伴和解释”。 来自爱丁堡大学医学信息学中心的联合主任尤恩·哈里森(Ewen Harrison)教授认为,这项研究具有重要意义,因为它表明“这些系统不再只是通过医学考试或应对人工构造的测试题”。 在他看来,AI 正逐步成为临床医生的有用“第二意见工具”,尤其适用于需要全面梳理潜在诊断、避免漏诊重要病因的场景。 同时,英国谢菲尔德大学数学与物理科学学院助理教授邢炜(Wei Xing)也提醒,研究中的部分结果显示,医生在与 AI 协作时,可能会在不自觉中对 AI 结论产生依赖,弱化独立思考。 “随着 AI 在临床环境中的常规使用,这种倾向可能会进一步增强。”他指出。 邢炜还强调,研究并未充分披露 AI 在哪些类型患者中表现更差,例如是否对老年患者或非英语母语患者的诊断更为吃力,这些都是评估安全性时不可忽视的问题。 因此,尽管哈佛试验结果令人振奋,但它并未证明 AI 已经安全到可以常规独立用于临床诊疗,更不意味着公众应转向免费 AI 工具以替代专业医疗建议。 在可预见的未来,AI 更可能作为一种高性能“智能听诊器”和“第二大脑”,嵌入由人类主导的医疗体系之中,推动诊疗更加精准、高效,同时也把关于责任、伦理与信任的新问题摆到了社会面前。 查看评论
据央视新闻报道,今天上午10时50分,我国自主设计建造的首艘18万立方米LNG运输船“乔治敦”号在江苏南通招商重工码头完成交付,从长江南通段缓缓离泊,驶往新加坡。 该船由招商船舶海门基地建造,总长298.8米,型宽48米,设计航速19.5节,续航力22000海里。 采用双燃料低速推进系统,具备低蒸发率、高环保性能等优势,是目前我国建造完工的最大舱容液化天然气运输船,标志着我国在高端清洁能源船舶制造领域实现重大突破。 液货舱采用GTT MARK III FLEX薄膜技术,4个舱总舱容18万立方米,最大装载率99.4%、货物蒸发率<0.085%/天,能耗与损耗达世界先进水平。 该船不限水域航行,兼容全球主流LNG码头,可跨洋长途运输。 液化天然气运输船是运输-163℃超低温液化天然气的专用船舶,因设计、建造难度极高,与航空母舰、豪华邮轮并称“造船业皇冠上的明珠”。 随着该船交付,我国现拥有5家具备LNG运输船交付能力的船厂,整体建造水平跻身世界一流梯队。 查看评论