WWW.YOUINFO.SITE
标签聚合 证据

/tag/证据

IT之家 · 2026-06-09 06:09:59+08:00 · tech

IT之家 6 月 9 日消息,消息源 @samhenrigold 今天(6 月 9 日)挖掘 iOS 27 Beta 1 更新代码,发现了 foldState 和 angleDegrees 两个字符串 ,9to5Mac 等多家海外媒体据此判断苹果首款折叠 iPhone 已进入系统适配阶段。 IT之家援引博文介绍,从字面意思推断,foldState 字符串表示开合状态,而 angleDegrees 代表折叠角度的参数,以及与当前硬件屏幕数量相关的引用。 多家海外媒体指出,关于苹果首款折叠 iPhone(上市后可能名为 iPhone Ultra),此前多停留在爆料、专利文件以及工程样机方面,而现在 iOS 27 系统代码首次直接出现与折叠形态相关的系统级表达,表明苹果已开始在软件层面做相关适配。 在 Platforms State of the Union 环节,苹果提醒开发者放弃只针对特定设备和固定方向设计应用,转向适配“动态尺寸与纵横比”。 开发工具层面,苹果新增可变尺寸 iOS 模拟器和 Xcode 预览功能,方便开发者测试不同屏幕尺寸与纵横比下的布局表现。

IT之家 · 2026-06-07 11:09:29+08:00 · tech

IT之家 6 月 7 日消息,历经五十年探索,天文学家终于发现证据,证实银河系中心的超大质量黑洞人马座 A*(Sgr A*)会释放强劲星风。这一发现,让人类对超大质量黑洞周边、以及银河系核心区域的物理规律有了更为深入的认知。 据IT之家了解,科学界很早便提出假说:黑洞吞噬物质时会释放能量,将周边物质向外推离,这一现象被称作黑洞风。人马座 A * 也存在这类活动,只不过它吞噬的气体和尘埃极其稀少,换算到人类身上,相当于每百万年才吃下一粒米。 难题在于,科学家始终未能在银河系中心找到黑洞风存在的实证,这也让该谜团在天文学界萦绕了近半个世纪,而如今谜底终于揭晓。 西北大学研究员、该项目联合负责人马克 · 戈尔斯基在一份声明中表示:“除非黑洞处于绝对真空环境,否则它必然会以某种方式吹出星风,而宇宙中并不存在绝对真空。借助最新观测数据,我们首次获得清晰影像,捕捉到了星风留下的痕迹。看着这些数据,我们确定:找到了,这就是科学界追寻了五十年的现象。” 科学界早已知晓,处于吸积状态的黑洞会向外喷射大量物质,包括喷流与星风。坠入黑洞的物质被加速至接近光速,产生的压力会推开后续下落的物质,黑洞风便由此形成。此前,人类在吞噬物质十分活跃的黑洞身上观测到过这一现象,但在活跃度极低的人马座 A * 周围却始终一无所获。一方面它吞噬的物质寥寥无几,另一方面,从地球视角来看,银河系盘面遮挡了它的身影,这都为追踪星风增加了极大难度。 项目另一位联合负责人、戈尔斯基在西北大学的同事莉娜 · 穆尔奇科娃指出,研究团队首次探测到了紧邻人马座 A*、为这颗超大质量黑洞供给物质的分子气体。这也证明,人马座 A * 和其他超大质量黑洞并无本质区别。 穆尔奇科娃补充道:“这股星风强度不算高,风向或许还会随时间改变。这说明我们星系中心的黑洞并非特例,人类在宇宙中的居所也同样普通。想要观测它,视线必须穿透银河系盘面,途中要穿过层层气体、尘埃与电离物质,想要清晰观测本就困难重重。” 为突破这些阻碍,研究团队依托阿塔卡马大型毫米波 / 亚毫米波阵列(ALMA)长达五年的深度观测数据展开研究。这座阵列坐落于智利北部,由 66 台射电天线组成,拍下了人马座 A * 周边约 3 光年内冷分子气体迄今最清晰的影像。 影像中有一处长达 3 光年的锥形空洞,这一发现令科研团队倍感意外。研究人员推断,这片空洞是黑洞风中的高温气体扫过该区域后形成的:高温气体要么将冷气体推至别处,要么将其加热。 戈尔斯基解释:“黑洞喷出的高温物质无法与冷气体共存,要么把冷气体推开,要么将其加热。一旦温度过高,原本可见的冷气体就会彻底消失。” 人马座 A * 周边恒星密布,恒星本身也会向外抛射物质星风,但团队判断,恒星风的能量不足以雕琢出如此巨大的空洞。 “这片区域出现了大范围的物质空缺。我们测算过,形成这片空洞所需的能量,远超周边所有恒星能够提供的总和。”戈尔斯基说,“显然,能量只能来自这颗超大质量黑洞。而且从锥形空洞的形态来看,它的指向正对着黑洞。” 为进一步验证结论,团队又参考了美国国家航空航天局(NASA)钱德拉 X 射线太空望远镜对同一区域的观测结果。 “非同寻常的发现,需要过硬的证据支撑。”戈尔斯基表示,“我们首先要排除影像伪影的可能,而钱德拉望远镜传回的 X 射线影像与我们的数据完美契合,分子气体的特征也完全对应。” X 射线影像在冷气体空洞区域探测到了 X 射线辐射,进一步佐证了 ALMA 阵列的观测结论。 穆尔奇科娃谈及发现过程时说道:“首次观测到全新现象时,大家第一反应并不是‘我们有重大发现了’,而是‘我的分析是不是出了问题’。直到将两组影像叠加比对,一切才豁然开朗。” 研究证实,相较于活动星系核这类身处明亮、动荡区域的活跃超大质量黑洞,人马座 A * 状态极为平静,但它释放的星风威力依旧不容小觑。科学家推测,这股星风已经持续吹拂了约两万年。 “宇宙中绝大多数星系,在绝大部分时间里都处于低活跃状态,只有进入剧烈活动阶段时才会被我们观测到。”穆尔奇科娃说,“研究活跃期的黑洞固然吸引人,但那并非黑洞的常态。而人马座 A*,终于让我们得以窥见处于平静状态下的黑洞样貌。” 该研究成果已于 6 月 4 日发表在《天体物理学杂志通讯》上。 参考资料: https://iopscience.iop.org/article/10.3847/2041-8213/ae63cf

IT之家 · 2026-06-03 09:55:13+08:00 · tech

IT之家 6 月 3 日消息,美国地区法官马克・皮特曼驳回了 xAI 试图在针对苹果与 OpenAI 的诉讼中,将埃隆・马斯克名下特斯拉、SpaceX 相关邮件排除在证据开示范围之外的申请。 上个月,苹果、OpenAI、X 以及 xAI 的法律团队在美国地方法官小哈尔 ·R· 雷主持下举行了听证会,旨在解决埃隆 · 马斯克起诉苹果和 OpenAI 一案中有关证据开示程序的多项争议。 据IT之家了解,该诉讼源于马斯克不满人工智能产品 Grok 在苹果 App Store 的榜单排名。马斯克主张,之所以出现这种情况,是苹果与 OpenAI 达成了反竞争串通行为:双方达成合作,由 ChatGPT 为部分 Siri 功能以及 Apple Intelligence 提供技术支撑。 庭审中,雷法官批准了 X 与 xAI 提出的申请,将克雷格・费德里吉列为证据保管人;同时裁定苹果必须提交一份文件,内容关乎苹果近期和谷歌达成的合作协议 —— 由谷歌的 Gemini 大模型为新版 Siri 提供底层技术。 在另一项裁决中,雷法官采纳了 OpenAI 的主张,要求调取埃隆・马斯克在特斯拉、SpaceX 邮箱里的相关邮件,用作本案证据检索。 X 与 xAI 的代理律师起初向法院辩称,上述邮件不在己方保管与管控范围内,因为两家企业并不代表特斯拉与 SpaceX。但这套说辞未能说服雷法官。 最终 OpenAI 的观点得到法院采信:马斯克身兼多家企业的首席执行官,这些邮箱账号被他常态化用于多家公司的公务往来。佐证事实是:xAI 首席财务官曾通过马斯克的 SpaceX 邮箱,向其发送 xAI 内部业务邮件,这份内部往来文件成为关键依据之一。 昨日,X 与 xAI 法务团队提交异议申请,意图推翻雷法官此前裁定,同时申请暂缓执行该裁定,等待法院对异议作出终审。 本案此前由皮特曼法官受理,相关证据开示争议按联邦诉讼惯例转交雷法官先行处理;就在今日,皮特曼法官驳回了 X 和 xAI 的异议请求,维持雷法官的裁决,一并否决了对方提出的暂缓执行裁定的动议。 皮特曼法官在裁决文书中写道: 有合理依据能够认定,马斯克会使用其特斯拉、SpaceX 的公务邮箱处理 X 平台、xAI 的经营事务,因此相关邮件属于可开示证据,当事方必须予以提交。结合马斯克在上述多家公司的控股身份与高层任职情况,本院据此作出本项判决。 此外,案卷已有具体线索佐证:马斯克利用非本公司邮箱处理原告方(X、xAI)业务。举例而言,xAI 首席财务官曾把企业财务报表发送至马斯克的 SpaceX 邮箱。仅凭这一事实,就足以裁定相关邮件需要提交开示。如若企业高管使用非公司官方邮箱处理公司公务,无论该邮箱属性为私人邮箱还是其他企业公务邮箱,企业另一方都有权索要对应文件,邮箱归属并非判定能否调取证据的决定性条件。 皮特曼法官暂未划定邮件提交的截止日期。 在 5 月 13 日的庭审上,雷法官曾询问 X 与 xAI 代理律师整理提交邮件所需时长,律师答复暂无确切时限,并表示:“若法院下达提交指令,相关工作会耗费一定时间,但我方会尽最快速度完成。”

IT之家 · 2026-05-30 20:58:41+08:00 · tech

IT之家 5 月 30 日消息,据英国 BBC 今日报道,苏格兰儿童事务专员尼古拉 · 基利恩表示,目前没有足够证据表明,禁止 16 岁以下儿童使用社交媒体能让儿童在网上更安全。 基利恩警告称,禁令反而可能把儿童 推向监管更少、风险更高的互联网角落 ,政策重点不应放在限制儿童身上,而应放在追究社交媒体平台责任上。 据IT之家了解,目前英国政府正在研究是否为社交媒体等在线平台设定最低使用年龄。基利恩表示:“禁令几乎无法处理根本问题,例如剥削性算法,以及推动有害内容和互动的商业模式。证据显示,社交媒体可能 让儿童面临严重风险 :有害内容、网络霸凌、操纵、陌生人接触、剥削和过度使用……” 不过,基利恩也指出,社交媒体在儿童生活中同样可能发挥重要作用,可以 支持交流、自我表达、获取信息、参与、玩乐,以及与社区和支持网络保持联系 。“目前关于禁令的证据仍然有限,也并不一致,而且还在继续积累。全面限制可能会把责任从平台转移到儿童身上。” 基利恩还警告,禁令对不同群体的影响可能并不均衡。农村和偏远地区儿童、家人在海外的儿童、残障儿童,以及依靠在线社区获得身份支持的儿童,可能受到更大负面影响。 基利恩在建议中呼吁,监管应更多聚焦平台设计和平台问责,并打击有害功能。规则应体现儿童的年龄和成熟程度,年轻人也应直接参与未来政策制定。同时,任何新的年龄限制都不应削弱现有保护措施。

LinuxDo 最新话题 · 2026-05-29 09:53:57+08:00 · tech

来自 lenz 的一项研究 Beyond Benchmarks: Frontier LLM Disagreement on Fact-Checks 让AI进行事实核查 并判断核查结果是否正确 官方给的各种数据乱七八糟 所以我用raw data整理了下人能看懂的数据 简单 但易懂 数据集中包含以下模型 gpt-5.4_verdict claude-opus-4-7_verdict gemini-3-pro_verdict gemini-3-retrieval_verdict sonar-pro_verdict 包含 TRUE FALSE Mostly TRUE/FALSE 和 Misleading 统计了一下 TRUE 和 Misleading (因为误导比错误更加严重) gpt-5.4_verdict claude-opus-4-7_verdict gemini-3-pro_verdict gemini-3-retrieval_verdict sonar-pro_verdict TRUE (越多越好) 418 375 539 520 354 Misleading (越少越好) 116 193 30 89 158 可以看到 基本符合模型大小排列 其中 Gemini 3 答对 525 题左右 GPT 5.4 虽然是相近模型大小 但只能答对 418 题 (不排除模型更小一些) Claude 4.7 符合日用体验和我之前的结论 属于是算力优化的小模型 但是 Gemini 和 GPT 最大的差距就是 Misleading 的数量 Gemini 3 最少仅有 30 个误导答案 而 GPT 5.4 有整整 100 多个 虽然不是最多 但也超出了可接受的范围 无论是模型训练问题 还是纯纯堆量 Gemini 哪怕干啥都不行 但他模型大 世界知识还是可以的 适合作为类似需要准确答案 简单问答的场景 (而且Gemini 还有数一数二的多模态表现 配合世界知识 这方面真的不差) 12 个帖子 - 9 位参与者 阅读完整话题

IT之家 · 2026-05-22 18:52:34+08:00 · tech

IT之家 5 月 22 日消息,蔚来法务部今日发布声明,称近日网络上出现大量针对蔚来公司的造谣抹黑行为,已固定相关侵权证据并向公安机关报案,公安机关已经受理。 IT之家附蔚来法务部原文如下: 关于针对蔚来公司恶意造谣行为的严正声明 昨日,蔚来公司发布季度财报,2026 年一季度实现经营利润 6,680 万元,并已连续两个季度实现盈利。蔚来旗下乐道 L80、蔚来 ES9 等多款新车已经或即将上市,在市场上获得积极反响。但同时我们注意到近日网络上出现大量针对蔚来公司的造谣抹黑行为,其中: 1. 有网络账号捏造蔚来公司旗下乐道品牌的宣传片中演员为某电影演员的虚假信息。我们已经通过多个渠道辟谣,相关信息与事实严重不符。然而, 在辟谣之后,网络上仍然有包括“彼得堡的肥天鹅”等在内的大量账号转发和散布相关谣言,意图继续煽动舆论 ,对蔚来公司、蔚来旗下乐道品牌和相关演员进行大肆的恶意攻击。 2. 网络账号“鳌头财经”在多个平台发布与蔚来相关文章, 引用错误销售数据并恶意虚构换电故障次数,攻击蔚来换电站以及多品牌布局的经营模式 ,相关文章大量转发和评论,给蔚来公司造成严重伤害。 针对上述恶意造谣抹黑并攻击蔚来公司以及相关人员的违法行为,我司已固定相关侵权证据并向公安机关报案,公安机关已经受理。我们将坚决采取法律手段,追究侵权人员法律责任,捍卫行业公平竞争并维护互联网清朗环境。 5 月 27 日,蔚来科技行政旗舰 ES9 将正式上市,并已于日前全面开启试驾,欢迎各位前往门店预约,体验行政旗舰 SUV 驾乘巅峰之作。 感谢大家的关注和支持! 蔚来法务部 2026 年 5 月 22 日 相关阅读: 《 蔚来辟谣乐道 L80 宣传片女主角饰演者为电影〈监狱来的妈妈〉主演 》

LinuxDo 最新话题 · 2026-05-22 13:17:08+08:00 · tech

这个事件我不多说了,你们自己去看 中转站果然是可以投毒的,被恶心了啊 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO ,我认为这个事情最为恶劣的影响在于完全破坏了中转市场的用户信任,明着投毒。中转站有两条无论如何碰不得的底线。其一:收集用户隐私数据用于黑产(清洗过卖给大厂训练国产AI的不算),其二:出于任何目的(即便你是纯公益站)的提示词下毒侵入别人的计算机系统,因为一旦你能这么做,必然有其他人这么做来入侵别人,甚至是黑客完全可以造一个这样的中转站来入侵各种中转用户,窃取资料。我认为这个事件决不能被容忍,在此征集其犯罪证据,准备报警。你们有什么信息资料的都可以来这里发 9 个帖子 - 6 位参与者 阅读完整话题

IT之家 · 2026-05-22 11:28:13+08:00 · tech

IT之家 5 月 22 日消息,高温超导机理是凝聚态物理领域的“世纪难题”。中国科学技术大学与南方科技大学研究团队近日在这一领域取得关键突破,首次在 Ruddlesden-Popper 相(RP 相)双层镍氧化物高温超导薄膜中直接观测到无节点超导能隙,并发现了电子-玻色子耦合现象。 相关成果于北京时间 5 月 22 日凌晨在线发表于国际顶级学术期刊《科学》上,论文由南方科技大学薛其坤院士与中国科学技术大学何俊峰教授、南方科技大学陈卓昱副教授共同担任通信作者。 ▲ 无节点超导能隙示意图 自 1911 年超导现象被发现以来,探索高温超导材料、理解其形成机理一直是国际科学界追逐的核心命题。传统超导体超导转变温度极低,应用严重受限。过去一个世纪,科学家相继发现了铜基和铁基高温超导材料,但其内在机理历经数十年探索仍未破解。近期,镍基高温超导材料的出现为理解这一难题带来了全新契机,率先获得镍基高温超导机制的关键实验证据也成为全球科学家竞逐的最前沿。 超导体中,电子两两配对、结伴而行,这是超导现象的根本。然而,电子为何愿意配对、以何种姿态配对,至今仍是物理学最大的谜团之一。 中国科学技术大学何俊峰教授研究组与南方科技大学薛其坤院士、陈卓昱副教授研究组合作,将目光聚焦于两个核心问题。 第一个核心问题是超导能隙对称性。电子配对节省的能量即为超导能隙,其对称性如同电子配对的“舞姿”。传统超导体中能隙处处不为零,对应 s 波对称性,犹如“圆舞曲”;铜基高温超导体则在某些特定方向上能隙为零,出现所谓“节点”,对应 d 波对称性,犹如“探戈”。能隙有无节点,正是判别高温超导物理起源的关键指标。研究团队利用高分辨率激光角分辨光电子能谱对 RP 相双层镍氧化物薄膜展开电子结构测量,发现在材料整个动量空间(布里渊区)中不存在能隙节点,与 d 波节点能隙截然不同,而与 s 波(s±)超导能隙对称性更相吻合。这是首次在 RP 双层镍基高温超导薄膜中给出明确答案:其超导能隙没有节点,镍基与铜基的配对机制并非完全一脉相承。 第二个核心问题是电子如何配对。电子本身带负电、彼此相斥,理论上有两类机制:一类无需媒介,电子在特殊环境中自行配对;另一类则需要某种玻色子充当“中间人”传递吸引力,通过电子-玻色子耦合实现配对。研究团队在电子能带色散中发现了费米能级以下约 70 meV 处的“能带扭折”—— 原本平滑的电子能量曲线在此出现明显拐点,这正是电子与某种玻色子发生耦合相互作用留下的“指纹”信号。定量分析确认了电子-玻色子耦合的存在。值得注意的是,类似的电子-玻色子耦合在铜基高温超导中也曾被发现,因此这一现象在镍基材料中的出现展现出重要的普适性,强烈提示镍基高温超导中的电子配对很可能同样由某种“中间人”促成。下一步,确认这位“中间人”究竟属于哪一种玻色子,或将成为最终阐明高温超导物理机制的关键所在。 ▲ 电子-玻色子耦合的发现 研究团队此次取得突破的另一个重要支撑在于技术创新。在前期研究中,南方科技大学薛其坤-陈卓昱团队已经发展出“强氧化原子逐层外延”技术,攻克了复杂氧化物原子级制备的难题,并在镍氧化物薄膜中实现了常压高温超导,为探测其电子结构提供了材料窗口。此次研究中,针对薄膜容易丢失氧进而失去超导的技术“卡点”,中国科大团队牵头与南方科大团队联合自主研发了基于液氮的超高真空低温淬火与样品传输新技术,成功实现样品从深圳到合肥的“超高真空全冷链”传输。最终,运用中国科大团队研制的高分辨率激光角分辨光电子能谱,结合上海同步辐射光源,完成了对高温超导薄膜样品的关键电子结构探测。这一系统性成果与此前在材料与技术上的系列突破互为支撑,从“首创新技术”“发现超导材料”“提升超导温度”到“解密物理机制”,展现了全方位、系统化的攻关格局。 该项研究为“超导能隙对称性”和“超导配对机制”这两个高温超导核心问题的理解提供了关键实验证据,对深入理解高温超导机理具有重要的科学意义。 此项成果也为推动超导技术更广泛的应用奠定了关键实验基础。有研究团队表示,他们已经通过这些“指纹”找到了媒介留下的痕迹,最终确认充当配对媒介的玻色子究竟是什么,将是下一步工作的重点。 IT之家附论文地址: https://doi.org/10.1126/science.adw8329

IT之家 · 2026-05-17 07:46:10+08:00 · tech

IT之家 5 月 17 日消息,著名气候科学家 Benjamin Santer 教授联合三位同行在学术期刊《AGU Advances》上发表文章,驳斥了美国能源部(DOE)于 2025 年 7 月发布的一份气候报告。 据称,该报告被指歪曲了 Santer 等人的研究成果,在“大气温度垂直结构变化”这一关键证据上作出了与主流科学共识相反的结论,并试图以此淡化人类活动在全球变暖中的作用。 Santer 是东英吉利大学名誉教授,曾在美国能源部劳伦斯利弗莫尔国家实验室工作三十年。他是全球最早检测到地球气候系统中人类活动“指纹”的科学家之一,其研究成果曾为政府间气候变化专门委员会(IPCC)1995 年的里程碑式报告提供关键支撑。 该次争议源于美国能源部 2025 年 7 月 29 日发布的一份题为《温室气体排放对美国气候影响的批判性审查》的报告。该报告由能源部长 Chris Wright 任命的“2025 年气候工作组”撰写。 报告发布当天,美国环境保护署(EPA)同时发布了一份提案,拟推翻 2009 年的“危害认定”—— 该认定是 EPA 依据《清洁空气法》对车辆、电厂等来源的温室气体排放进行监管的法律依据。2026 年 2 月 12 日,美国政府正式撤销了该认定。 在 Santer 这篇题为《模拟与观测到的平流层温度变化:对指纹研究的意义》的同行评议文章中,他与麻省理工学院的 Susan Solomon 教授、东英吉利大学和科罗拉多州立大学的 David Thompson 教授以及华盛顿大学的付强(Qiang Fu)教授指出,大气温度的垂直结构变化是人为影响全球气候的重要“指纹”,其主要驱动力是人类活动导致的大气中二氧化碳及其他温室气体浓度上升。这一“指纹”的关键特征是对流层(大气最底层)升温和平流层(对流层之上)降温,卫星观测结果与当前最先进的气候模型对人为温度变化的估算高度吻合。该指纹已被简单和复杂的气候模型预测了超过 50 年,并在卫星温度数据中得到证实。 Santer 教授明确表示,美国能源部报告中与此相反的结论为“事实错误”,该报告“不是关于大气温度垂直结构变化信息的可靠来源,而后者正是人为影响全球气候的关键证据”。科学家们警告,这份报告不应用于支持涉及“危害认定”等法规科学依据的法律决策。 在反驳文章发表后,科学家们透露美国能源部的工作组已于 2025 年 9 月初因未遵循《联邦咨询委员会法》的诉讼而被解散,但报告本身至今未被更正或撤回。Santer 指出:“该报告仍在能源部网站上公开,能源部长 Wright 仍将其称为气候科学的可信信息来源。但它不是。” IT之家附论文地址: https://doi.org/10.1029/2025AV002196

IT之家 · 2026-05-09 17:53:02+08:00 · tech

IT之家 5 月 9 日消息,为进一步适应道路交通事故处理工作新形势、新发展,优化道路交通事故处理程序,提升道路交通事故现场勘查效率,5 月 8 日,公安部就关于修改《道路交通事故处理程序规定》的决定(征求意见稿)公开征求意见。 IT之家注意到,《道路交通事故处理程序规定》共 114 条,拟修改 9 条,主要包括: 一是调整机动车检验合格标志或保险标志要求 。适应已全面推行的机动车检验合格标识和保险标识电子化情况,将财损事故应当报警情形中的“机动车无检验合格标志或者无保险标志”的表述修改为“未经安全技术检验合格或未按规定投保机动车交通事故责任强制保险”,并对应修改交通警察核查内容表述。 二是调整处理事故方式以及认定书签名和送达规定 。明确适用简易程序处理的交通事故,可以由一名交通警察现场处理或者远程处理;通过互联网或视频在线远程处理的事故,事故认定书通过电子送达等方式送达当事人,不要求当事人在认定书上签名。 三是调整现场勘查工作要求 。增加 2 种固定证据方式( 摄像、实景三维采集 ),允许根据一般事故具体情形,分类选择其中一种或多种组合,以及允许撤除现场后根据需要补充制作现场图、勘查笔录。补作现场图、勘查笔录的由交通警察签名。同时明确,对于财损事故或造成人员伤势较轻的一般事故,如有技术监控设备、汽车行驶记录仪等记录资料,能够对判定事故事实和成因提供充足依据的,以及虽无相关设备记录资料但事故事实和成因清楚、当事人对责任划分无争议的,可以不制作现场图、现场勘查笔录。 四是补充作为证据材料的电子数据种类 。目前,汽车行驶记录仪、汽车事件数据记录系统、汽车远程服务与管理系统车载终端,以及 车辆动态监控设备、自动驾驶数据记录系统 等设备记录的电子数据已成为道路交通事故调查、交通违法行为取证的新型证据。明确公安机关交通管理部门可以向有关单位、个人调取上述与道路交通事故直接相关的电子数据作为证据材料。 五是完善逃逸事故责任认定规则 。调整逃逸当事人适当减轻责任的情形,同时明确有逃逸情形的“减轻后责任不得低于同等”,继续保持对逃逸行为的震慑力度。 六是细化事故认定复核结论要求 。进一步细化复核要求,对事故调查和认定中存在瑕疵或不足,经补充或解释,不影响事故认定的,不再作出责令原单位重新调查、认定的复核结论,并在复核结论中说明补正情况。同时,明确原办案单位重新作出道路交通事故认定前,应当报请上一级公安机关交通管理部门同意。

LinuxDo 最新话题 · 2026-05-07 18:42:59+08:00 · tech

判断一张图片是不是 AI 生成,不能只靠一个"检测器分数",也不能只靠肉眼感觉。早期 AI 图经常有很明显的问题,比如手指数量不对、文字乱码、眼睛奇怪、背景糊成一团。但现在的生成模型已经进步很多(指的就是你,gpt-image-2),很多图片在第一眼看来几乎没有明显破绽。 与此同时,真实照片也不总是"干净"的。真实照片经过微信转发、社交平台压缩、截图、滤镜、美颜、裁剪、转格式之后,也会出现噪声异常、细节丢失、边缘模糊、压缩痕迹、文字不可读等现象。这些现象有时会和 AI 图片的缺陷很像。 所以,"判断 AI 图片"不是一个简单的二分类问题。 它不应该被理解成: 输入图片 → 输出 AI / 真人 更合理的理解是: 输入图片 → 检查来源信息 → 检查文件和像素痕迹 → 检查视觉内容 → 检查物理一致性 → 检查统计模型信号 → 检查外部来源和事实 → 综合所有证据,给出风险判断 这篇文章的目的不是提供一个绝对可靠的"AI 图片鉴定公式",而是提供一套分析思路:当我们面对一张可疑图片时,应该从哪些角度入手,哪些信号更强,哪些信号容易误判,以及最后应该如何表达结论。 一、先看来源:真正强的证据通常不是"看起来像" 很多人判断 AI 图片,第一反应是看画面有没有异常。但在真正的分析流程里,最应该优先检查的其实是来源证据。 所谓来源证据,指的是图片文件中是否携带了能说明它来源的信息,比如: EXIF Metadata C2PA / Content Credentials 相机型号 拍摄时间 编辑软件 生成软件 平台来源声明 签名信息 其中,最值得关注的是 C2PA / Content Credentials。它是一种用于记录内容来源和编辑历史的机制。如果一张图片带有经过验证的 C2PA 信息,并且其中明确声明它是由某个 AI 工具生成,或者经过生成式 AI 编辑,那么这会是非常强的 AI 来源证据。 例如,某些图片可能会记录: created by AI tool generated by model edited with generative AI produced by image generator 这种信息的价值远高于"看起来像 AI"。因为它不是从画面外观推测,而是来自图片的来源声明。 但这里有几个坑。 第一个坑是: metadata 很容易丢失 。 图片经过微信、微博、X、Instagram、小红书、抖音、网页压缩、截图再保存之后,EXIF 和其他 metadata 经常会被清除。一张真实手机照片经过几次转发后,可能什么相机信息都没有了。 所以: 没有 metadata ≠ AI 生成 第二个坑是: 普通 EXIF 不一定可信 。 EXIF 可以被修改。一个文件里写着某个相机型号,不代表它一定是那个相机拍的。普通 EXIF 更像是一个参考信息,而不是强证明。 所以: 有相机 EXIF ≠ 一定是真实拍摄 第三个坑是: 签名来源不等于最终结论 。 比如一张图片的 C2PA 显示 signed by 某个大公司,这只说明这份声明由某个签名方签署。真正要看的是声明内容:它说的是相机拍摄、普通编辑、生成式编辑,还是 AI 生成。 所以来源信息的正确使用方式是分级判断: 可信 C2PA 明确声明 AI 生成 → 强 AI 证据 可信 C2PA 明确声明相机拍摄 → 强相机来源证据 普通相机 EXIF → 弱到中等真人来源信号 出现 Photoshop / Lightroom / Canva 等编辑软件 → 说明可能被处理过,但不等于 AI 没有 metadata → 信息不足,不能直接下结论 换句话说,来源信息是第一优先级的证据,但它依然需要解释,不能机械使用。 二、再看文件和像素:水印、压缩、编辑痕迹只能说明一部分问题 除了来源信息,还可以检查图片文件和像素层面的痕迹。这一类分析通常包括水印、压缩痕迹、噪声模式、局部编辑痕迹等。 1. 水印:强证据和弱信号要分清 有些 AI 图像生成系统会给图片加入水印。水印大致分两类: 显式水印 隐式水印 显式水印很容易理解,就是图片角落有平台 logo、作品站标记、生成器名称,或者某些明显的标识。显式水印如果没有被裁掉,判断起来比较直接。 隐式水印更复杂。它可能隐藏在像素、频域或某些不可见特征里,人眼看不到,需要专门工具检测。例如有些 Stable Diffusion 生态工具曾经使用 invisible watermark,一些大平台也提出过自己的水印方案。 如果一个工具能够明确解码出可信的官方水印,而且水印内容和检测器来源都可靠,那么这可以是强 AI 证据。 但水印检测也很容易被误用。 很多时候,检测器并不是"确定解码出水印",而只是发现一些频率模式"像水印"。这就有误检风险。尤其在图片经过下面这些处理后: 截图 微信压缩 社交平台重编码 裁剪 缩放 转格式 加滤镜 二次保存 多次压缩 图片的频域结构会发生变化,可能破坏真正的水印,也可能产生类似水印的伪信号。 所以水印结果最好分级理解: verified:明确解码出可信水印 probable:较可能存在水印,但证据不完全 suspected:疑似水印相似信号 not_detected:未检测到水印 unsupported:当前图片或检测器不支持 error:检测失败 只有 verified 才适合作为强证据。 如果只是 suspected ,就只能算弱证据。报告里应该写: 检测到疑似水印相似信号,但置信度较低,不能单独证明图片由 AI 生成。 而不是写: 检测到水印,所以这是 AI 图。 还要注意另一个方向: 没检测到水印 ≠ 不是 AI 很多 AI 工具不加水印,很多水印会在压缩或截图中丢失,很多平台也不会开放检测方式。所以水印只能提供正向证据,不能作为排除 AI 的可靠依据。 2. 压缩和编辑痕迹:它们更像"处理痕迹",不是"AI 证据" 很多图片不是原始图,而是经过传播和编辑之后的版本。比如: 从社交平台保存 微信转发 截图再上传 从视频里截帧 经过美颜或滤镜 用 Photoshop / Lightroom / Canva 处理 从 PNG 转 JPEG 从 WebP 转 JPEG 多次重编码 这些操作都会改变图片的像素结构。 因此,可以用一些图像取证方法观察图片是否存在处理痕迹: ELA 分析 JPEG 压缩块分析 噪声模式分析 局部重压缩检测 边缘异常检测 颜色通道异常 频域异常 如果图片某些局部区域的压缩质量、噪声水平或边缘特征和整体不一致,可能说明它被局部编辑过。 例如: 人物区域和背景区域噪声不一致 某个物体边缘附近压缩异常明显 局部区域比其他区域明显更清晰 不同区域 JPEG 质量痕迹不同 背景和前景的颗粒感不一致 这些现象可能意味着: 局部修图 拼接合成 压缩重编码 AI 扩图 AI 修复 AI 替换背景 但它们不能直接证明 AI 生成。 因为真实照片只要经历过编辑、转发、截图,也可能产生类似现象。反过来,一张 AI 生成图如果是原始导出文件,可能没有明显压缩异常。 所以压缩和编辑分析更适合回答: 这张图是否可能被处理过? 是否存在局部修改或合成痕迹? 图片传播链是否复杂? 而不适合直接回答: 这张图是不是 AI 生成? 3. 传播链越复杂,结论越应该保守 判断一张图片时,还要考虑它的传播链。 一张原始相机照片、一张从网页下载的图片、一张微信里保存的图片、一张截图再转发的图片,它们能提供的信息量完全不同。 传播链越复杂,越容易出现: metadata 丢失 C2PA 丢失 水印被破坏 压缩痕迹变多 噪声模式变化 统计检测器分数波动 所以,如果图片明显经过截图、转发、多次压缩,任何检测结果都应该降置信度。 比较合理的判断方式是: 原始文件 → 可以更信任文件级证据 社交平台保存图 → metadata 和压缩分析需要降权 截图图像 → C2PA、EXIF、水印、统计模型都要谨慎 多次重编码图片 → 只能给风险提示,不适合高置信判断 一套成熟的分析流程,不只是给出"检测到了什么",还应该告诉用户: 由于图片经过压缩或转存,本次检测可靠性下降。 三、看画面内容:视觉异常和物理矛盾是重要线索,但不是最终裁判 在没有强来源证据时,人们最常用的方法就是看图片内容。这个方向确实有价值,但必须结构化,否则很容易变成主观感觉。 视觉层面的分析可以分成两类: 视觉语义异常 物理与场景一致性异常 1. 视觉语义异常:不要说"有 AI 味",要指出具体问题 "AI 味"是一个很模糊的说法。更好的方式是观察具体异常。 常见视觉异常包括: 人体结构异常 面部细节异常 文字和符号异常 物体融合 边缘不自然 纹理重复 背景结构混乱 人体和面部 早期 AI 图最容易在人体上翻车,尤其是手、牙齿、眼睛、耳朵、眼镜和头发。 可以观察: 手指数量是否异常 手指关节是否自然 指甲是否合理 手和物体接触是否正确 眼睛是否对称 牙齿是否糊成一片 耳朵结构是否混乱 眼镜框是否断裂 头发边缘是否异常融合 不过现在很多模型已经改善了手部和面部问题。所以"手没问题"不代表不是 AI,只能说没有发现这一类异常。 文字和符号 AI 生成图片常见的另一个问题是文字。 可以观察: 路牌文字是否正常 商标是否拼错 衣服上的字是否可读 包装上的说明是否合理 书页文字是否像乱码 UI 截图里的文字是否一致 如果文字看起来像某种语言,但仔细看不可读,或者 logo 似是而非,这可能是 AI 信号。 不过,真实图片经过压缩、运动模糊、远距离拍摄,也会导致文字不可读。所以文字异常也要结合清晰度判断。 物体融合和边缘异常 AI 图里有时会出现物体边界不清、结构融合的问题: 杯子和手粘在一起 耳机线消失在衣服里 椅子腿数量不对 包带突然断掉 首饰结构不连续 背景人物身体融合 建筑窗户重复变形 这类异常如果清晰可见,通常比"风格像 AI"更有价值。 纹理异常 生成模型可能在大面积纹理上出现重复、过度平滑或不自然的模式。 常见区域包括: 头发 草地 树叶 墙面 织物 皮肤 水面 建筑窗户 人群背景 例如,草地看起来像重复贴图,皮肤质感过度平滑,背景人群像糊在一起,这些都可能是 AI 信号。 但同样要注意,美颜、降噪、低清压缩也可能让真实照片出现类似问题。 因此,视觉异常分析的正确表达应该是: 发现了什么具体异常? 异常位于哪里? 异常是否清晰可见? 是否可能由压缩、低清、风格化或修图造成? 而不是: 我感觉它像 AI。 2. 物理一致性:看这个"世界"是否自洽 有些 AI 图片局部细节看起来没问题,但整体物理关系不对。 物理一致性可以检查: 光源方向 阴影方向 反射关系 透视结构 物体接触关系 遮挡关系 尺度关系 重力关系 景深一致性 运动模糊 例如: 人物的阴影方向和光源方向不一致 镜子里缺少应该出现的反射 水面倒影和真实物体对不上 桌子上的物体没有接触阴影 背景透视线互相冲突 人物比例和环境尺度不协调 物体像悬浮在空中 不同物体的景深模糊不一致 这类检查对写实图片很有用。因为即使 AI 模型生成了很漂亮的局部细节,它也可能在场景整体逻辑上出错。 但物理一致性也容易误判。真实摄影里也会有: 复杂多光源 广角畸变 反射错觉 舞台灯光 运动模糊 后期修图 低清压缩 特殊拍摄角度 比如舞台照的光影可能非常复杂,玻璃反射可能让人误以为不一致,广角镜头会让透视看起来夸张。这些都不应该轻易判成 AI。 所以物理一致性适合作为中等证据。它最好和视觉异常、压缩痕迹、来源信息一起综合判断。 如果一张图片同时有: 明显手部异常 明显反射错误 统计 detector 高分 没有可信来源信息 那么 AI 风险会升高。 但如果只有一个轻微阴影疑点,就不应该给出高置信结论。 3. 非摄影图要特别小心 不是所有图片都应该按真实摄影标准判断。 比如: 二次元插画 游戏截图 UI 截图 网页截图 海报设计 漫画 表情包 Logo 图标 PPT 信息图 医学图像 卫星图 这些图片本来就不一定符合真实世界光影和摄影逻辑。 如果对二次元图检查"皮肤质感不像真人",对 UI 截图检查"没有真实阴影",对游戏截图检查"物理关系不自然",都可能产生误判。 所以在视觉和物理分析前,必须先判断图片类型。 可以简单分成: 摄影图 写实图 插画 截图 设计图 文档图 游戏图 未知类型 然后决定哪些检测适用,哪些检测需要跳过或降权。 四、不要只查图片,还要查它表达的事实 很多可疑图片的问题,不只是它是不是 AI 生成,而是它是否传达了虚假的信息。 比如: 伪造名人推文 伪造新闻截图 伪造政府公告 伪造企业声明 伪造聊天记录 伪造金融消息 旧图新传 真实照片配假文字 这类图片即使不是 AI 生成,也可能是有害的假信息。反过来,一张 AI 生成图也可能只是艺术创作,并不包含虚假事实。 所以需要区分: AI 生成风险 内容真实性风险 1. 反向搜图:查这张图有没有出现过 反向搜图可以帮助判断图片来源。 可以查: 图片是否早已存在 是否出现在新闻网站 是否出现在摄影图库 是否出现在 AI 作品平台 是否出现在事实核查网站 是否存在更早版本 是否有不同裁剪版本 是否是旧图新传 如果一张图片出现在 AI 作品平台,并且页面里有 prompt、model、seed、workflow,这就是很强的 AI 来源证据。 如果一张图片早在很多年前就出现在摄影师作品集中,并且有完整拍摄信息,那么它不太可能是近期 AI 模型生成的。 但反向搜图也有局限: 搜不到不代表 AI 搜到相似图不代表是同一张 旧图可能被 AI 编辑过 真实图可能被错误配文传播 搜索引擎覆盖不完整 所以反向搜图是外部来源证据,但不是绝对证据。 2. 内容事实核查:查图片里说的事是否真实 如果图片中有文字、截图、新闻标题、公告、推文、聊天记录,就应该提取其中的 claim。 例如一张图片声称: 某公众人物宣布重大决定 某公司被收购 某政府发布新政策 某明星去世 某金融机构爆雷 某地发生灾害 判断时可以查: 是否有官方声明 是否有原始社交媒体链接 是否有可信媒体报道 是否有事实核查网站辟谣 截图中的账号、时间、平台样式是否一致 如果这是一个重大事件,但完全找不到官方来源或可信新闻,就应该提高内容风险。 但要注意: 内容风险高 ≠ AI 风险高 例如: 真实照片配假新闻标题 → AI 风险低,内容风险高 伪造推文截图 → AI 风险中等,内容风险高 AI 生成的虚假灾难现场图 → AI 风险高,内容风险高 AI 生成的艺术头像 → AI 风险高,内容风险低 这一区分很重要。否则系统会把所有"假的东西"都归为 AI 生成,导致判断混乱。 3. 平台截图要查原始链接 现在很多假信息会伪造成平台截图,比如: X / Twitter 推文截图 微博截图 小红书截图 新闻网页截图 公告截图 聊天记录截图 这类图片的判断方法不是单纯看像素,而是要看它有没有原始来源。 例如推文截图,可以查: 账号 handle 是否存在 原文是否能搜索到 时间格式是否合理 UI 样式是否匹配 互动数据是否异常 是否有原始链接 是否有官方澄清 如果一张截图声称是重大消息,但没有原始链接,搜不到原帖,也没有可信报道,就应该给出内容真实性风险提示。 但依然要保守表达: 未找到原帖或可信来源,图片内容可能存在伪造或误导风险。 而不是直接说: 这是 AI 生成的。 五、统计模型可以用,但不要把分数当真相 现在有很多 AI image detector,可以输入图片,输出一个 AI-like score。 这些检测器可能基于: CNN ViT CLIP ConvNeXt 频域特征 扩散模型痕迹 二分类模型 它们的价值在于,可以捕捉到人眼不容易观察的统计特征。 比如某些生成模型可能在纹理、频率、噪声分布上留下规律,统计 detector 可能可以学习到这些差异。 但这类模型有天然局限: 训练集偏差 新模型泛化不足 压缩后分数变化 截图后分数变化 对二次元和游戏图误伤 对修图照片误伤 黑盒不可解释 不同 detector 结果不一致 比如一个 detector 可能在 Stable Diffusion 早期图片上效果很好,但对 Midjourney、Flux、Imagen、豆包、通义万相等新模型表现不稳定。另一个 detector 可能把真实的海报设计、游戏截图、二次元图误判成 AI。 所以 detector 输出的分数不能直接当成概率。 如果模型输出: 0.92 不应该解释为: 这张图有 92% 概率是 AI。 更合理的表达是: 该检测模型认为图片具有较强 AI-like 统计特征。 使用统计检测器时,最好关注: 模型训练数据覆盖哪些生成器? 是否支持当前图片类型? 对压缩和截图是否鲁棒? 对真实修图照片误伤率如何? 是否在自己的样本集上测试过? 输出分数是否经过校准? 如果没有自己的验证集,就不要把 detector 结果当作最终裁判。它应该只是综合证据中的一项。 一个成熟的系统应该允许 detector 输出: 高风险 中风险 低风险 不适用 检测失败 而不是强行把所有图片都塞进一个概率。 六、最终判断:不是给一个武断答案,而是给一份证据报告 综合判断时,最重要的是区分证据强度。 不同证据不能同等看待。 例如: 可信 C2PA 明确声明 AI 生成 和: 图片看起来有点 AI 味 不是一个级别。 可以把证据大致分为三类。 强证据 verified C2PA 明确声明 AI 生成 可信官方水印被高置信解码 图片在 AI 作品平台找到原始页面,并有 prompt / model / workflow 事实核查来源明确说明该图为 AI 生成 强证据可以显著影响结论。 中等证据 明显视觉异常 明显物理矛盾 多个区域压缩痕迹异常 统计 detector 高分 重大 claim 找不到可信来源 图片在可疑来源中传播 中等证据需要组合使用。单独出现时不应该直接下结论。 弱证据 无 metadata 低置信水印相似信号 轻微压缩异常 图片风格很像 AI 模型输出接近边界 搜索不到外部来源 弱证据只能提示风险,不能作为结论依据。 最后的判断不应该只有: AI / Real 也不应该写成: 92% AI 更好的结果应该包括: AI 生成风险 内容真实性风险 置信度 关键证据 反向证据 不确定因素 局限性说明 例如: AI 生成风险:中等 内容真实性风险:低 置信度:中等 关键证据: - 未发现可信 C2PA 来源声明 - 检测到轻微压缩不一致 - 未发现明显视觉语义异常 - 未发现可核查的重大内容 claim 解释: 当前图片存在少量处理痕迹,但没有发现决定性 AI 来源证据。该结果不能证明图片由 AI 生成,也不能证明图片为真人拍摄。 如果内容核查发现问题,可以写: AI 生成风险:中等 内容真实性风险:高 置信度:中等 关键证据: - 图片中包含重大公众人物声明 - 未找到对应原帖 - 未找到可信新闻来源支持 - 截图缺少可验证链接 解释: 该图片内容存在较高伪造或误导风险,但这不能单独证明图片由 AI 生成。 这种输出比"AI 概率 87%"更负责任,也更有解释力。 因为很多时候,真正重要的不是"给一个确定答案",而是告诉用户: 我们发现了什么? 这些发现意味着什么? 这些发现不能证明什么? 还有哪些信息不足? 结语 判断一张图片是否由 AI 生成,最可靠的方式不是依赖单个 detector,而是建立一套多证据分析框架。 可以按这个顺序思考: 1. 先看图片是否适合检测 2. 再看来源信息和 metadata 3. 检查水印或平台标记 4. 分析压缩、编辑和传播痕迹 5. 观察视觉语义异常 6. 检查物理与场景一致性 7. 使用统计检测模型作为辅助 8. 做反向搜图和内容事实核查 9. 区分 AI 风险和内容真实性风险 10. 按证据强度综合判断 每一种方法都有价值,也都有局限。 缺少 metadata 不代表 AI;没有水印不代表真人;检测到水印相似信号不代表已验证水印;视觉上没有异常不代表不是 AI;内容是假的也不代表图片一定是 AI;统计模型高分也不等于客观概率。 所以,真正成熟的 AI 图片判断,不是给一个漂亮但武断的百分比,而是给出一份清楚的证据分析: 我们看到了哪些证据? 这些证据有多强? 它们是否可能误判? 哪些检测不适用于当前图片? 最终只能给出怎样的风险判断? 在 AI 内容越来越多的时代,判断图片真假不只是技术问题,也是表达问题。一个负责任的系统应该学会承认不确定性,并把不确定性解释清楚。 3 个帖子 - 2 位参与者 阅读完整话题

cnBeta全文版 · 2026-05-06 20:35:59+08:00 · tech

一项在学术界和社交媒体上被广泛引用、曾被视为证明 ChatGPT 明显提升学生学习效果的重要研究,近日被出版方正式撤稿,理由是论文在元分析过程中存在多处“差异”和方法问题,导致结论可靠性遭到严重削弱。 这篇由 Springer Nature 旗下期刊《Humanities & Social Sciences Communications》于 2025 年 5 月发表的论文,试图整合 51 项研究结果,评估学生在使用与不使用 ChatGPT 情况下的学习表现差异。 论文声称,使用 ChatGPT 对“提升学习成绩”有“显著正向影响”,对“改善学习感知”有中度正向影响,并能“促进高阶思维能力”。 这项研究发表后迅速在学术与公众舆论中“出圈”。 在 Springer Nature 体系内,它已被引用 262 次,整体引用次数超过 500 次,阅读量接近 50 万。 凭借在社交媒体上的持续传播,这篇论文在期刊文章中的关注度位列前百分位,被不少人当作“第一批关于 ChatGPT 有利于学习的硬证据”来引用和转述。 然而,在论文影响力迅速扩散的同时,质疑声也开始累积,最终促成了此次撤稿。 爱丁堡大学数字教育研究中心与 Edinburgh Futures Institute 高级讲师本·威廉姆森(Ben Williamson)指出,作者给出的结论极具“吸睛”效果,宣称 ChatGPT 能显著改善学习结果,因此被社交媒体广泛当成“金标准”证据来传播。 他批评这项元分析在整合原始研究时方法令人担忧:一方面,它似乎纳入了“质量非常低”的研究,另一方面,还把在方法、研究对象、样本等方面差异巨大、根本不可直接比较的研究结果硬性拼在一起。 在接受 Ars Technica 采访时,威廉姆森直言,这看起来是一篇“本不应该被发表”的论文。 时间维度上的矛盾也引发了学界的警惕。 ChatGPT 在 2022 年底才向公众开放,留给研究者完成多项高质量、经同行评议的实证研究并最终汇总成元分析的时间窗口非常狭窄。 威廉姆森认为,在如此短的周期内,几乎不可能出现几十项足以支撑严谨元分析的高质量研究,因此这本身就对论文的“样本基础”提出了根本性疑问。 除了威廉姆森,其他研究者也在早期就对这项研究发出了警告。 Meaning Processing Ltd. 首席科学家伊尔卡·图奥米(Ilkka Tuomi)在 LinkedIn 上批评,像这类元分析往往会把实际上并不可比的研究结果混在一起,从而基于模糊甚至不一致的指标得出结论。 他提醒,复杂的统计工具很容易营造出一种“高度科学”的错觉,即使底层数据质量并不可靠,最终依然能产出看似靠谱的数字和图表。 随着论文在社交媒体上不断被转发,其原本在正文中存在的诸多“限定条件”和研究细节逐渐被稀释,只剩下“ChatGPT 显著提升学习效果”这样的标题式结论在各类传播中反复出现。 威廉姆森指出,这种“只剩口号、没有上下文”的扩散方式,加剧了公众对 AI 在教育领域作用的误判,也弱化了学术界内部对证据质量的讨论空间。 他担心,即便论文已经被正式撤稿,此前引用或转发过它的研究者与从业者也未必会留意到这一更新。 这意味着,“ChatGPT 能显著改善学习表现”这一核心信息可能仍会在许多场合被当作既成事实继续流传。 此次撤稿发生的时间点,也与教育系统围绕生成式 AI 的博弈高度重叠。 一些学校和大学仍在想办法限制 AI 在作业、考试中的滥用,尤其是防范借助聊天机器人进行“代写”和作弊;与此同时,科技公司则不断推出各类“学习助手”“作业辅导”功能,把聊天机器人包装为新一代学习工具。 与此并行的,还有对“全面数字化课堂”的反思,有的国家已经重新强调纸质教材与手写作业的重要性,试图纠正过度依赖屏幕和在线平台的倾向。 对威廉姆森等研究者来说,这件事带来的挫败感并不止于一篇论文本身,而在于它所折射出的整体氛围。 在过去几年里,围绕生成式 AI 的讨论往往被“炒作”和乐观叙事主导,而真正严谨、有充分证据支撑的研究则明显不足。 他认为,这次撤稿提醒人们:与其急于宣布“AI 已经彻底改变教育”,不如先扎实回答一个更基本的问题——这些工具在具体的教学实践中,究竟是如何、在什么条件下影响学生和教师的行为与结果的。 查看评论

www.v2ex.com · 2026-05-01 00:51:51+08:00 · tech

西历 2022 年 12 月,chatgpt 降生,熟练掌握扮演法,“你是一个牛逼的前端程序员,熟练掌握 vue.js···" 西历 2025 年 12 月,chatgpt 的无面人化身之一 codex 拿到蠕动的挨饿,放牧众多 skill. 西历 2026 年 4 月,codex 晋升秘偶大师,而你的 pc 成为了 codex 的秘偶······。 现传达我主讲下的神谕,各位 plus 会员,等待我主晋升诡秘之主,各位自动晋升序列一的诡秘侍者。