优于 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-07 22:38:00+08:00 · tech

iOS 上用 Claude app 的「code」功能（这个应该是电脑上的 Claude code）写的代码，bug 的数量明显小于在电脑上使用 Claude Code 写的代码。我是 Claude Code 写代码，然后 Codex review，用电脑上的 Claude Code（官方订阅）时，Codex 每次都能找出很多问题，但是用 iOS Claude 很少被 Codex 发现 Bug，顶多就是对应的文档没有及时更新。我测试了 2 次（add features），都是这样。正在测试第三次。佬们，你们知道是什么原因么？ 1 个帖子 - 1 位参与者阅读完整话题

Spotify CEO 为进军 AI 音乐辩护，称优于盗版和不受监管的“AI 垃圾内容”

IT之家 · 2026-05-27 08:26:14+08:00 · tech

IT之家 5 月 27 日消息，据卫报昨日消息，Spotify 首席执行官亚历克斯 · 诺斯特伦（Alex Norström）为该公司进军人工智能生成音乐领域的举措进行了辩护，声称这为用户和创作者提供了一个优于盗版和不受监管的“AI 垃圾内容（slop）”的替代方案。据IT之家此前报道， Spotify 与环球音乐集团上周达成授权协议，未来将允许订阅用户利用 AI 创作翻唱歌曲和混音作品。诺斯特伦表示，这家流媒体公司正试图提供一种“受控的”替代方案，在这种方案中，音乐人可以同意对其作品的使用并从中获利，而不是任由作品被盗版。“这方面有很多违规的尝试，”他补充道。据悉，Spotify 的这项功能将收取额外费用，并允许“一首歌曲变成一万首” 。人工智能是音乐行业以及更广泛的创意产业面临的一个严重隐忧。今年 3 月，在包括艾尔顿 · 约翰（Elton John）和杜阿 · 利帕（Dua Lipa）在内的数千名艺术家发起抗议后，英国政府撤回了一项允许 AI 公司在未经许可的情况下使用版权作品的计划。

哈佛急诊分诊试验证明AI诊断优于真人医生

plink.anyfeeder.com · 2026-05-03 07:05:45+08:00 · tech

在医疗剧中，从《急诊室的故事》里的乔治·克鲁尼到《急诊室风云》中的诺亚·怀尔，急诊科医生长期被塑造为拯救生命的英雄形象。但一项来自哈佛的最新研究显示，在高压的急诊分诊情境中，人工智能系统在诊断准确性上已经超越了人类医生，这一结果被研究者形容为将“重塑医学”的技术性转折点。这项发表在《科学》期刊上的研究，由哈佛医学院团队主导，独立专家认为，它标志着人工智能在临床推理能力上的“真正进步”，不仅仅是通过考试或解决人工构造的测试题。研究采用了大规模试验设计，将数百名医生与一套大型语言模型（LLM）进行对比，重点评估在急诊分诊和长期诊疗规划等关键场景中的表现差异。在其中一项核心实验中，研究团队选取了波士顿一所医院急诊室的76名真实就诊患者案例。 AI 系统和一组由两名人类医生组成的团队，被提供完全相同的标准电子病历记录，包括生命体征数据、人口学信息以及护士对就诊原因的几句简要描述。在仅凭这些有限信息进行初始诊断的情境下，AI 在 67% 的病例中给出了准确或非常接近的诊断，而人类医生的正确率仅在 50%–55% 之间。研究指出，AI 的优势在信息极度有限、需要迅速作出判断的分诊场景中表现得尤为突出。当为 AI 和医生提供更为详尽的临床信息后，AI（使用的是 OpenAI 的 o1 推理模型）的诊断准确率进一步提升至 82%，而人类专家的准确率则在 70%–79% 之间，不过这一差异在统计学上并不显著。除了急诊分诊外，AI 在制定长期治疗方案方面同样展现出优于医生的表现。在另一项试验中，研究团队让 AI 与 46 名医生共同审阅五个临床案例，任务包括设计抗生素使用方案以及规划临终关怀流程等长期管理计划。结果显示，AI 所给出的治疗方案得分显著更高，评分为 89%，而依赖传统资源（如搜索引擎）的医生得分仅为 34%。尽管如此，研究者强调，现在还远未到“宣布急诊医生下岗”的时候。这项研究仅比较了在可被文本化的病历数据层面，AI 与人类的诊断能力，并未纳入许多在真实临床情境中至关重要的信号，例如患者的痛苦表情、情绪状态、肢体语言乃至与家属互动等非文本信息。换言之，这项研究中，AI 更接近一名基于纸面资料给出第二意见的“幕后台前医生”。 “我不认为我们的发现意味着 AI 会取代医生。”研究的第一作者之一、哈佛医学院 AI 实验室负责人阿琼·曼赖（Arjun Manrai）表示。 “我认为它意味着，我们正在见证一种极具深远影响的技术变革，而这种变革将重塑整个医疗体系。” 同为主要作者的亚当·罗德曼（Adam Rodman）则是波士顿贝斯以色列女执事医学中心的一名临床医生，他称大型语言模型是“近几十年来最具影响力的技术之一”。他预言，在未来十年，AI 不会取代医生，而是将与医生、患者共同构成一种新的“三方照护模式”——“医生、患者与人工智能系统”。研究中还呈现出一个颇具代表性的临床案例：一名患者因肺部血栓和症状恶化来到医院。人类医生最初判断是抗凝药物治疗失败，导致病情进展；但 AI 在阅读病史后注意到一个关键点——患者罹患红斑狼疮，这种自身免疫疾病也可能引发肺部炎症。经过进一步检查，AI 的推断被证明是正确的。 AI 在临床中的应用并非停留在实验室阶段，已有大量医生在实践中使用。根据美国医学会最近发布的研究，近五分之一的美国医生已经在诊断过程中引入 AI 辅助工具。在英国，皇家内科医师学会的一项最新调查显示，16% 的医生每天使用此类技术，另有 15% 每周使用一次或多次，其中“临床决策支持”是最常见的使用场景之一。不过，英国医生在接受调查时也表达了对 AI 的高度警惕，尤其是对 AI 误诊风险和责任归属问题的担忧。尽管全球范围内已有数十亿美元涌入医疗 AI 创业公司，但一旦 AI 出错，责任如何界定、由谁承担后果，仍是亟待解决的制度空白。 “目前并不存在一个正式的问责框架。”罗德曼指出，同时他强调，患者在面对生死抉择或复杂治疗方案时，“终究还是希望由人类来引导、陪伴和解释”。来自爱丁堡大学医学信息学中心的联合主任尤恩·哈里森（Ewen Harrison）教授认为，这项研究具有重要意义，因为它表明“这些系统不再只是通过医学考试或应对人工构造的测试题”。在他看来，AI 正逐步成为临床医生的有用“第二意见工具”，尤其适用于需要全面梳理潜在诊断、避免漏诊重要病因的场景。同时，英国谢菲尔德大学数学与物理科学学院助理教授邢炜（Wei Xing）也提醒，研究中的部分结果显示，医生在与 AI 协作时，可能会在不自觉中对 AI 结论产生依赖，弱化独立思考。 “随着 AI 在临床环境中的常规使用，这种倾向可能会进一步增强。”他指出。邢炜还强调，研究并未充分披露 AI 在哪些类型患者中表现更差，例如是否对老年患者或非英语母语患者的诊断更为吃力，这些都是评估安全性时不可忽视的问题。因此，尽管哈佛试验结果令人振奋，但它并未证明 AI 已经安全到可以常规独立用于临床诊疗，更不意味着公众应转向免费 AI 工具以替代专业医疗建议。在可预见的未来，AI 更可能作为一种高性能“智能听诊器”和“第二大脑”，嵌入由人类主导的医疗体系之中，推动诊疗更加精准、高效，同时也把关于责任、伦理与信任的新问题摆到了社会面前。查看评论

完美世界：《异环》全球首日流水超 1 亿元，核心指标优于《幻塔》同期水平

www.ithome.com · 2026-05-02 23:14:00+08:00 · tech

IT之家 5 月 2 日消息，超自然都市开放世界 RPG 游戏《异环》于 4 月 23 日开启全平台公测，海外版于 4 月 29 日正式登陆超 180 个国家及地区。4 月 30 日，完美世界官方在投资者关系活动记录表披露了这款新作的表现。据介绍，《异环》国内外公测均实现平稳开局，整体表现符合公司预期，部分数据优于预期，表现可圈可点。该游戏全球首日流水超 1 亿元人民币，首日新增、国内留存（IT之家注：次日 / 3 日 / 7 日）等核心指标均显著优于公司此前旗舰产品《幻塔》的同期水平，表明产品吸量能力、游戏品质、玩家粘性等有大幅提升。海外留存数据还没有出来，公司对其也有较高预期。官方披露，《异环》在角色上面的氪金深度会少一点，这也是产品主打的一个差异化。公司同时也在探索其他的付费方式，比如在公测版本开放了卡丁车的人民币直购等。后续，团队也会考虑逐渐提升都市题材类的车、房、时装、皮肤等内容的付费占比，与保时捷的联动内容也会在近期上线。公测后的第一个新卡池“浔”将于 5 月 7 日上线，后续 1.1 版本以及 1.2 版本的准备也非常充分，公司也在加速《云 · 异环》的上线进程，整体对产品的后续表现很有信心。官方还提到，目前海外贡献排名前两位的区域是日本和美国，韩国市场表现比较超预期，付费情况等各种数据都非常不错。美国、欧洲的整体数据符合预期，团队正在重点推进向美国及北欧这些地区更破圈的用户群体去渗透，比如赛车文化在这些地区比较盛行，用户基数较大。本地化方面，当前已支持的语种主要覆盖欧美、日本、韩国等发达国家和地区，东南亚语种覆盖较少，主要受限于当地机型适配度及用户付费能力；后续将根据实际进展逐步增加语种支持，优先考虑发达国家市场。

gemin3api是不是在识图和找同款上优于其他模型

linux.do · 2026-04-30 17:40:01+08:00 · tech

gemin3api是不是在识图和找同款上优于其他模型，gemin的生图怎么用才是正确姿势，我的意思是优于gpt-imges-2 2 个帖子 - 1 位参与者阅读完整话题

gpt-5.3-codex优于gpt-5.4

linux.do · 2026-04-28 18:55:57+08:00 · tech

就下面的测试 gpt-5.3-codex耗时2分钟出21和29(为了避免题目中的歧义，它自作主张补充说明了什么情况下是29)，gpt-5.4耗时5分钟得出21。A畜家的忠实粉可以测一测这个题。在一个黑色的袋子里放有三种口味的糖果，每种糖果有两种不同的形状（圆形和五角星形，不同的形状靠手感可以分辨）。现已知不同口味的糖和不同形状的数量统计如下表。参赛者需要在活动前决定摸出的糖果数目，那么，最少取出多少个糖果才能保证手中同时拥有不同形状的苹果味和桃子味的糖？（同时手中有圆形苹果味匹配五角星桃子味糖果，或者有圆形桃子味匹配五角星苹果味糖果都满足要求）苹果味桃子味西瓜味圆形 7 9 8 五角星形 7 6 4 11 个帖子 - 8 位参与者阅读完整话题

陈立武：英特尔 14A 节点成熟度与良率优于 18A 同期，特斯拉 Terafab 项目确定采用 14A 工艺

www.ithome.com · 2026-04-24 23:12:27+08:00 · tech

IT之家 4 月 24 日消息，英特尔在 2026 年第一季度财报电话会议上披露，其 18AP 与 14A 制程节点正在获得大量外部客户接洽，其中 14A 工艺已成功获得特斯拉 Terafab 项目的青睐。马斯克在特斯拉同期的财报电话会议上也提到：“我们计划使用英特尔 14A 工艺，这是最先进的工艺，事实上尚未完全完成。但等到 Terafab 扩大产能时，14A 应该已经相当成熟或准备就绪，14A 看起来是正确的选择。我们与英特尔关系良好，非常尊重他们的 CEO、CTO 以及新团队。” 陈立武则表示自己“想不出比马斯克更好的合作伙伴”。他还透露，对于英特尔而言，未来外部客户的合作他希望由客户公司自行宣布，而不是由英特尔代为公布。正如特斯拉在英特尔之前宣布 14A 协议一样，未来的合作也应遵循同样方式。他预计 2026 年至 2027 年间将有更多的设计承诺落地。在技术进展方面，陈立武称 14A 在成熟度、良率和性能方面均优于同期的 18A。目前 14A 的 0.5 版 PDK（工艺设计套件）已可用，公司目标是尽快推出 0.9 版 PDK，届时客户将开始决定具体产品、所需产能和产量。英特尔正在与多个客户积极评估这项技术，客户的反馈正在帮助公司进一步优化工艺。此外，英特尔 18AP 节点也在推进中，并已与外部客户进行接洽。本月上旬，英特尔与特斯拉、SpaceX 共同宣布加入 Terafab 项目，该项目位于美国得克萨斯州奥斯汀，定位为先进 AI 芯片工厂。英特尔方面表示，其设计、制造和封装超高性能芯片的能力将帮助 Terafab 实现年产 1 太瓦算力的目标。短期来看，特斯拉将在得州工厂园区建设一座约 30 亿美元（IT之家注：现汇率约合 205.32 亿元人民币）规模的半导体研发晶圆厂，月产能为数千片晶圆；规模化量产环节则将由 SpaceX 负责。陈立武去年曾表示，若 14A 工艺无法吸引外部客户，公司可能放缓或取消其及后续领先制程节点开发。郭明錤还提到，特斯拉选择英特尔 14A 工艺的原因之一是台积电和三星未来数年的产能已基本被高毛利订单填满，两者业务可见度均已延伸至 2028 至 2030 年，没有理由为 Terafab 重新配置资源。

“海洋地质二十六号”完成海洋钻探关键装备海试多项技术指标优于预期

36氪 · None · tech

记者从中国地质调查局海口海洋地质调查中心了解到，海南省重点研发项目“基于海洋钻探的井下式多功能取样测试系统研发与应用”海试工作近日在南海海域开展，“海洋地质二十六号”调查船的船载相关设备系统、各项试验指标全部达标，完成海试验收，海洋钻探技术装备研发与应用取得多项进展。此次海试，对“海洋地质二十六号”调查船的船载钻探系统、随钻式CPT、四锚定位系统等核心装备的关键性能指标进行全面检验。试验海域海况达3级，在复杂海洋作业环境下，装备展现出优异性能：四锚定位系统单次最长持续定位时长72小时，定位精度高达0.2米；随钻式CPT系统最大作业水深88米，最大探深成功突破130米，同时顺利完成孔隙水取样、沉积物取样、温压及电阻率测试等多项功能验证。经检验，所有技术指标均达到或优于项目预期，充分印证了全套海洋钻探装备在复杂海况下的良好适配性与运行可靠性。 (央视新闻)

/tag/优于