迄今为止 - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-10 11:08:21+08:00 · tech

迄今为止，用了三个电动的飞利浦三头的用坏俩，一个电池不行了，彻底歇菜；另一个在冲洗过程中被水冲走了俩刀头松下小锤子往复式用起来挺不错，但前几天也壮烈了。刀头似乎卡住了，不往复了，想着拔下来洗洗，结果一哆嗦其中一个刀头掉进脸盆里顺着水被冲走一个(没错，同样的错误又犯了一次！干！)，只剩下一个刀头，卡胡子给我揪的那叫一个疼现在在用酒店那种一次性的手动凑合，这不是要618了，看看大家都在用什么系列，我参考参考看看继续买电动还是换手动 16 个帖子 - 11 位参与者阅读完整话题

Claude Fable 5 / Mythos 5 迄今为止最强大的模型，性能大幅跃升暴打GPT

LinuxDo 最新话题 · 2026-06-10 01:12:34+08:00 · tech

Anthropic 发布 Claude Fable 5 与 Mythos 5，性能大幅跃升 Anthropic 推出面向普通用户的 Claude Fable 5，这是迄今能力最强的 Mythos 级模型。它在软件工程、知识工作、视觉和科研等基准上均达顶尖，价格比前代 Mythos Preview 低一半以上。为防滥用，内建分类器在涉及网络安全、生物化学等话题时改用 Opus 4.8 回复，约 95% 的会话不受影响。同步发布的 Claude Mythos 5 对网络防御伙伴解除部分限制，号称拥有全球最强的网络安全能力。生物医学研究者也可通过信任计划在解除防护后使用。两款模型定价均为每百万输入 token 10 美元、输出 token 50 美元，不到 Mythos Preview 的一半。 via zaihuapd 16 个帖子 - 15 位参与者阅读完整话题

小米 17T 系列搭载 7000mAh 金沙江电池，迄今为止小米最高含硅量 16%

IT之家 · 2026-06-05 10:25:00+08:00 · tech

IT之家 6 月 5 日消息，小米今日官宣小米 17T 系列搭载 7000mAh 小米金沙江电池，1600 次循环后，容量仍能≥80%。官方海报显示，该金沙江电池拥有迄今为止小米最高的 16% 含硅量。 IT之家注意到，小米 17T 系列已经于 5 月 28 日在海外发布。作为参考，小米 17T 海外版搭载 6500mAh 电池，17T Pro 电池容量进一步增加到 7000mAh。据官方预热，小米 17T 系列国行版将于 6 月 8 日发布，全系四曲包裹式中框、2D 直屏、一体化金属镜头 Deco，超大 R 角设计全系，配备超窄边框。全新小米 17T Pro 手机搭载天玑 9500 旗舰芯片，3nm 工艺制程，对比上一代 GPU 性能大幅提升 33%，功耗降低 42%，光追渲染性能提升 199%。此外，小米 17T Pro 搭载徕卡光学专业三摄、徕卡光学 Summilux 镜头，提供徕卡高动态主摄（光影猎人 950、13.5EV 动态范围）、徕卡 5X 潜望长焦、徕卡 120° 超广角。小米 17T 系列全系搭载徕卡 5X 潜望长焦，支持 5X 光学变焦、10X 无损变焦，还有 120X UltraZoom、30cm 长焦微距。

Google搜索史上最大升级 AI重塑搜索框与结果页

cnBeta全文版 · 2026-05-20 02:35:24+08:00 · tech

在 2026 年的Google I/O 开发者大会上，Google宣布对其核心产品 Google 搜索进行迄今为止幅度最大的一次改版，全面引入新一代 Gemini 3.5 Flash 模型，重塑搜索框形态与搜索结果呈现方式。新版本在桌面端和移动端全球同步推送，用户依然可以通过选择“Web”标签，仅查看传统网页结果。 Google搜索此次升级的核心，是围绕“AI 概览”（AI Overviews）和“AI 模式”（AI Mode）这两种基于人工智能的交互形式，重新设计搜索框及其工作流程。在此前一年的迭代中，Google已经开始为部分查询展示由 AI 生成的摘要内容，并测试类似聊天机器人的搜索体验，而这次更新则试图将两者打通，减少用户在不同界面之间来回切换的摩擦。根据Google搜索产品副总裁 Robby Stein 的介绍，新版搜索框由 Gemini 3.5 Flash 模型提供支持，可以在用户输入较长问题时自动扩展输入区域，并通过 AI 驱动的自动补全功能帮助用户继续细化或延展提问。只要使用自然语言提问，用户“可靠地”都会看到 AI 概览出现在搜索结果顶部，这一概览将以生成式摘要的形式给出初步答案，并附带后续可追问的上下文。当用户在 AI 概览界面中继续追问时，系统会自动将交互切换到 AI 模式，让搜索体验从传统的一问一答，转变为更持续的对话式检索流程。如果用户希望直接进入这种聊天式搜索，可以绕过传统输入路径，将文档、照片、视频甚至 Chrome 标签页直接附加到搜索框，再配合自然语言提问，由 AI 模式统一进行理解和回答。 Google搜索副总裁 Liz Reid 在会前沟通中表示，此次改版目标之一，就是消除 AI 概览与 AI 模式之间的“摩擦”，让用户不必思考该进入哪个模式、点击哪个入口。她强调，用户只需使用自己熟悉的那一个搜索框，系统会在后台自动决定是呈现 AI 概览、切换到 AI 模式，还是展示更传统的网页列表结果，从而“在感觉上获得最佳的整体体验”。新版搜索框的上线标志着Google进一步朝“自己替你完成Google搜索”的愿景迈进：用户输入的问题可以越来越模糊、越来越接近日常语言，而系统负责解析需求、整理信息，并用 AI 整合出更为直接的答案。对于依然偏好传统结果的用户，Google保留了单独的“Web”标签，允许他们避开 AI 生成内容，仅浏览常规的网页链接与蓝色标题列表。总体来看，这一轮更新将搜索框从单纯的关键词输入栏，转变为一个可以接收多模态信息、支持长文本提问、并承载多种 AI 交互形态的入口。随着 Gemini 系列模型持续迭代，Google也在尝试把传统搜索和对话式 AI 体验合并到同一界面下，重新定义用户与互联网信息之间的连接方式。查看评论

GPT-5.5实测：更聪明，也更爱“说谎”

plink.anyfeeder.com · 2026-04-25 15:05:12+08:00 · tech

4月23日，OpenAI发布新一代旗舰模型GPT-5.5，并在其官网写道，是其迄今为止最智能、最直观易用的模型，也是在计算机上完成工作的新方式的下一步。这一发布迅速引发行业关注，不仅因为它号称在智能体任务上实现突破，更因其在多项基准测试中展现出的“统治力”。根据第三方评测机构Artificial Analysis公布的综合智能指数榜单，OpenAI凭借GPT-5.5系列在前六名中独占四席，该机构认为，“GPT-5.5让OpenAI重回AI领域的第一位，打破了与Anthropic和Google的三方平局。” 但与高性能一同被曝光的，还有高幻觉率。在Artificial Analysis的私有基准测试AA-Omniscience中，GPT-5.5的幻觉率高达86%，远高于Claude Opus 4.7的36%。这意味着，当这个目前“最聪明”的AI大脑面对不确定或未知的问题时，选择“坦言不知”的概率极低，反而更倾向于“自信地虚构”一个答案。而这种高幻觉率一旦放在需要高可靠性的工作场景中，很可能导致分析偏差、决策失误甚至财务损失。最强的AI也是最危险的“说谎者”？面对高幻觉率，GPT-5.5究竟能否在实际应用中可靠地完成复杂的知识任务？为了回答这些关键问题，我们对GPT-5.5进行了实测，从处理家庭账本到编写实时对战游戏，测试其应对长上下文、复杂逻辑的知识工作与编程实战能力。此次测试不仅关乎一个模型的性能，更关乎AI技术进入深水区后，我们如何在拥抱其强大能力的同时，应对其潜在风险。 01. 知识能力：它真的像职场人一样会干活根据官方发布的基准测试结果，GPT-5.5在几乎所有核心指标上都超越了前代GPT-5.4，在知识工作领域表现尤为突出。在一项覆盖44个职业的GDPval测试中，GPT-5.5取得了84.9%的得分，不仅超过了83.0%的真实职场人员水平，也高于Claude Opus 4.7的80.3%和Gemini 3.1 Pro的67.3%。该测试模拟了金融分析师、市场经理、软件工程师等多种白领职业的日常工作，要求模型完成信息整合、分析推理、决策建议与报告生成等综合性任务。此外，GPT-5.5在其他多个实用场景的测试中也表现不错。在模拟复杂客服对话的测试中，无需特别指导就能达到98.0%的准确率；在让AI像真人一样操作电脑完成任务的测试中，得分78.7%；在需要结合图像、文字理解并调用工具解决问题的测试中，分别拿到83.2%和75.3%的分数。这些成绩说明，GPT-5.5正在逐步打通“看、说、做”等一系列能力。 OpenAI还用内部的实际案例证明了它的生产力价值。其财务团队用它审核了24771份K-1税表、总计71637页文件，并称这套流程比上一年提前了两周完成。这说明GPT-5.5是能够直接融入工作流程、切实提升效率的生产力工具。这些能力在真实生活中用起来怎么样？我们设计了一个贴近家庭的测试来验证。我们给GPT-5.5多条格式凌乱的单月开支数据，让其扮演家庭数据分析师，完成整理数据、计算总支出、分析各支付方式占比、分类统计开销等任务，并最终生成一份给家人看的建议报告。这个测试场景设计得虽然简单，却很能看出AI是否真的“好用”。因为家庭记账是很多人的日常，但记录常常是随手写、格式乱，“乱七八糟”的记账数据要求AI不能只会处理整齐的表格，还得能“看懂”手写式的记录、理解每笔钱是什么意思，并把相似项目归到一起。而算总账、分析钱花在哪儿、给出节省建议，其实对应着一套完整的思考过程，GPT-5.5需要先把信息理清楚，再从里面看出门道、提出可行的办法，最终让它“写报告”，则是要求它会用人能听懂、能接受的方式来汇报工作。测试结果显示，它准确合并了“外卖-午餐”和“外卖-晚餐”，而且主动提示“支付宝自动扣”应统一计入“支付宝”统计，展现出了理解混乱账目和用户真实意图的能力。 GPT-5.5自主梳理表格并给出分析在分析中，它通过计算占比，指出“网购”（衣物、书籍）类目支出较高，且多为非急需品，因此建议为这类消费设置预算，给出的建议具体可行。最后生成的报告也充满人情味，那句“稍微管住网购的小冲动，咱们家的开支就能更轻松一些”，符合“给家人看”的沟通要求，语气亲切，建议接地气。这个简单的测试，相当于在生活场景中还原了上述GDPval测试所考察的核心能力，目前的结果也说明它的专业能力能用到实际生活中。 02. 编程能力：从初级到复杂，它没添乱除了在日常知识任务中表现可靠，在编程这类对精准性要求更高的“硬功夫”上，GPT-5.5同样展现了不错的进步。在一项考验“智能体”的基准测试（Terminal-Bench 2.0）中，它拿到了82.7%的高分。这个测试模拟了在命令行里执行一连串复杂操作，就像让AI自己完成一个多步骤的运维任务。它的成绩不仅比自家上一代（GPT-5.4的75.1%）高，也明显超过了竞争对手Claude Opus 4.7（69.4%）。这说明它在需要记住步骤、自己调试、坚持完成长时间任务时，表现更好。其次，在处理超长内容方面也有进步。在一项针对50万到100万字符超长文本的检索测试中，它的得分达到74.0%，是上一代（36.6%）的两倍还多。这意味着让它分析一本厚书、浏览庞大的代码仓库时，它更不容易“看漏”或“记混”，找信息更准、思路也更连贯。而且多项测试结果显示，在执行相同的编程任务时，GPT-5.5消耗的token数量显著少于GPT-5.4。就连代码编辑器Cursor的联合创始人Michael Truell也评价说，它比上一代更聪明、更有韧性，调用工具更可靠，面对复杂长期任务时能坚持更久。简单来说，在编程这类复杂操作场景下，上述数据说明，GPT-5.5不仅更强，而且更稳、更省资源，适合处理那些步骤多、耗时长的实际开发任务。为了验证它真实的编程能力，我们用一个具体的开发任务进行了测试，从零开始构建并逐步升级一款连连看游戏，并硬性规定其必须使用给到的12种不同的emoji表情。首先，我们让GPT-5.5生成一个完整可运行的连连看游戏。这需要它理解开发者的文字需求、设计界面、管理游戏状态，并自主实现核心的路径搜索算法。结果它在几分钟之内便顺利完成了。 GPT-5.5生成的连连看小游戏接着，我们提高难度，要求它在游戏中加入一个“重绘”道具。这个道具的功能是：玩家使用时，能消耗“连击”能量，把棋盘上与最后一次消除相同类型的图标全部随机刷新一次。要实现这一点，GPT-5.5必须做两件事，一是修改游戏背后的数据规则来支持这个新功能；二是确保刷新后的棋盘布局仍然是“有解”的，不会让玩家卡关。最终，GPT-5.5成功写好了这部分代码。之后，我们继续让其为游戏加入完整的用户系统，包括登录、积分记录和排行榜展示。这一步主要考验的是，GPT-5.5能否将新功能平滑地接入现有框架，同时保持游戏原有的核心玩法和逻辑不被破坏。它再一次顺利完成了任务，并且在代码迭代过程中表现得相当克制，没有进行过度重构，也没有引入不必要的变化。 GPT-5.5执行对游戏细节的调整指令最后，我们将难度推至更高阶的实时对战模式，让两名玩家能在不同浏览器中实时竞争消除。这其中涉及棋盘状态同步、操作冲突裁决和网络延迟处理等一系列典型的多人在线难题。面对这样一个集成度高、实时性强的复杂挑战，GPT-5.5依然做到了准确交付。这个从简到繁的测试表明，GPT-5.5在真实编程任务中，既能处理复杂逻辑与架构设计，也能精准响应开发者需求，且不随意重构或引入其他代码，甚至当我们要求回退到上一版本时，它也能稳定恢复到之前的状态。 03. 高幻觉率：能用，但不敢放手尽管在实测中表现惊艳，但结合公开数据来看，GPT-5.5依然没有超过市场太大预期，而且存在不可忽视的风险。来看一组对比数据。在Artificial Analysis的私有基准测试AA-Omniscience中，GPT-5.5的幻觉率高达86%，而Claude Opus 4.7仅为36%。这意味着在该测试所设定的、专门探测模型知识边界的场景下，当GPT-5.5面对不确定的答案时，其“坦言不知”的概率远低于对手，更倾向于生成一个可能错误的回答。需要注意的是，这86%并不意味着模型在大多数日常问答中都会产生幻觉，而是其在触及知识盲区时的特定行为倾向。一位从业者解释，这可能是因为GPT-5.5的事实知识覆盖面更强，但不确定性也更偏激进，对于不确定的问题会猜答案。但在将其用于需要高可靠性的任务时，这一指标仍需引起高度警惕。当GPT-5.5被部署到“自主工作”场景中时，这种高幻觉倾向可能会引发风险。比如在数据分析与报告生成任务中，它可能自信地引用不存在的数据、编造统计趋势，或基于错误事实提出决策建议，导致用户做出偏离实际的商业判断。而在编程与调试环节，它提供的代码方案也许看起来合理，却可能无法运行，甚至暗藏安全漏洞，大幅增加后期排查与修复的成本。而且，这类幻觉往往以高度自信、逻辑自洽的形式呈现。对于缺乏相关专业背景的用户而言，这种“确定性”输出极具欺骗性，需要提高警惕。除了技术层面的隐忧，OpenAI此次的商业策略也显露出明确的意图：先用生态锁定用户，再用涨价收割市场。一方面，GPT-5.5首发时并未同步开放API，仅限自家ChatGPT和Codex使用，初步将用户锁定在其应用生态内。另一方面，GPT-5.5的定价相比上一代有了明显上涨。根据官方公布的数据，GPT-5.5每处理100万tokens，输入收费5美元，输出收费30美元。而上一代的GPT-5.4，输入和输出价格分别为2.5美元和15美元，这意味着新一代的价格直接翻了一倍。如果与当前的主要竞争对手对比，Anthropic最强的模型Opus 4.7定价为每百万tokens输入5美元、输出25美元。可以看出，GPT-5.5在输入价格上与对手持平，但在输出价格上则高出20%。尽管OpenAI解释称，token使用效率的提升可对冲价格上涨，使用户实际成本无明显增加，但具体性价比仍需业界进一步验证。对于这一模型，资深Agent从业者赵江杰评价道，这次GPT-5.5的发布并未形成断档领先，不如对社区热传的“Spud”模型预期的大幅提升期望那么大，但在agentic和coding能力上仍然继续保持头部顶尖位置，agentic能力提升的同时也在推动基模厂商提升模型迭代效率，OpenAI的下一代突破模型（GPT-6）很可能也在路上了。总之，对普通用户而言，GPT-5.5或许值得尝鲜，但不应视其为绝对可靠的工具，对企业用户来说，在将其接入核心工作流前，则必须慎重，一旦出现那86%的“自信错误”，该由谁来兜底？查看评论

意大利制药公司Chiesi同意以约19亿美元收购美国上市公司KalVista制药

36kr.com · None · tech

意大利制药公司Chiesi同意以约19亿美元收购美国上市公司KalVista制药，这是该公司迄今为止最大的一次收购，扩大了这家意大利公司的稀有免疫学产品组合。（财联社）

/tag/迄今为止