WWW.YOUINFO.SITE
标签聚合 Beyond

/tag/Beyond

LinuxDo 最新话题 · 2026-05-29 09:53:57+08:00 · tech

来自 lenz 的一项研究 Beyond Benchmarks: Frontier LLM Disagreement on Fact-Checks 让AI进行事实核查 并判断核查结果是否正确 官方给的各种数据乱七八糟 所以我用raw data整理了下人能看懂的数据 简单 但易懂 数据集中包含以下模型 gpt-5.4_verdict claude-opus-4-7_verdict gemini-3-pro_verdict gemini-3-retrieval_verdict sonar-pro_verdict 包含 TRUE FALSE Mostly TRUE/FALSE 和 Misleading 统计了一下 TRUE 和 Misleading (因为误导比错误更加严重) gpt-5.4_verdict claude-opus-4-7_verdict gemini-3-pro_verdict gemini-3-retrieval_verdict sonar-pro_verdict TRUE (越多越好) 418 375 539 520 354 Misleading (越少越好) 116 193 30 89 158 可以看到 基本符合模型大小排列 其中 Gemini 3 答对 525 题左右 GPT 5.4 虽然是相近模型大小 但只能答对 418 题 (不排除模型更小一些) Claude 4.7 符合日用体验和我之前的结论 属于是算力优化的小模型 但是 Gemini 和 GPT 最大的差距就是 Misleading 的数量 Gemini 3 最少仅有 30 个误导答案 而 GPT 5.4 有整整 100 多个 虽然不是最多 但也超出了可接受的范围 无论是模型训练问题 还是纯纯堆量 Gemini 哪怕干啥都不行 但他模型大 世界知识还是可以的 适合作为类似需要准确答案 简单问答的场景 (而且Gemini 还有数一数二的多模态表现 配合世界知识 这方面真的不差) 12 个帖子 - 9 位参与者 阅读完整话题

IT之家 · 2026-05-28 17:53:46+08:00 · tech

IT之家 5 月 28 日消息,科大讯飞在澳门 BEYOND Expo 2026 上正式推出了讯飞 AI 眼镜,产品定位“眼前的超级 AI 助理”,将大模型能力深度融入日常佩戴场景。新品售价 4299 元,产品已于 3 月 4 日开启预约,抢先预约用户可享购镜抵 299 元,6 月 15 日正式开启预售。 IT之家注意到,讯飞 AI 眼镜采用经典眼镜形态设计,重量仅 40 克。产品基于万张头模数据打磨佩戴结构,获得 SGS 舒适度专业认证,确保不同脸型、头型用户均可获得贴合舒适的佩戴体验。镜片采用全贴合树脂材质,意外跌落不易产生碎片。 作为核心卖点,讯飞 AI 眼镜搭载讯飞端到端语音同传大模型,支持 122 种语言(含方言、口音)翻译,覆盖全球 200 多个国家和地区。 产品提供六大翻译场景: 通话翻译:支持 SIM 卡通话、视频电话、网络会议全程双向同传翻译,智能调用骨传导技术,拾音更清晰、人声更纯净 线上同传:支持线上讲座、商务会议、线上实时课程,双语转译随听随看 同声传译:8 米内全向拾音,支持线下讲座、会议、培训等场景,无需靠近即可清晰翻译 面对面翻译:智能定向收音,减轻交流压力;支持 18 个语种离线翻译,海外无网络环境下仍可准确翻译;显示贴合用眼距离,面对面交流观感更自然 视觉翻译:看菜单、看路牌、看文件,眼镜直接显示翻译内容," 看哪翻译哪 " 附赠讯飞翻译 App 同传权益:眼镜用户可畅享音视频翻译功能,支持外语视频、音频等翻译需求 针对演讲、汇报场景,讯飞 AI 眼镜支持实时提词功能,发言重点实时显示并跟随语速自动滚动,用户无需低头看稿,有效避免临场忘词。同时支持蓝牙遥控翻页。 产品内置 GlassClaw AI 助理,支持部署多家“龙虾”,一句话即可交代复杂任务,手机、电脑多端接力完成。会议场景下,AI 自动总结图文纪要。 京东 科大讯飞 AI 眼镜 4299 元 直达链接 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包

IT之家 · 2026-05-20 10:13:59+08:00 · tech

IT之家 5 月 20 日消息,网络安全公司 BeyondTrust 昨日(5 月 19 日)发布《2026 微软漏洞报告》,指出微软在 2025 年共披露 1273 个漏洞,低于 2024 年的 1360 个,同比下降 6.4%。 不过报告指出高危漏洞数据从 78 个增至 157 个,同比增长 101.28%。报告认为,企业更该关注“影响强度”而不是总量。 Azure、Dynamics 365 和 Office 的高危漏洞增幅尤其明显,其中 Office 漏洞同比增 234%。 从类型看,权限提升漏洞占全部 CVE 的 40%,信息泄露漏洞也同比增长 73%。报告认为,这说明攻击者的重点正从“高噪声入侵”转向更隐蔽的侦察、提权和横向移动。 这类变化在云和业务平台上更敏感。Azure 和 Dynamics 365 的漏洞总数虽略有下降,但高危漏洞却从 4 个猛增至 37 个。 报告强调,云平台已不只是基础设施,还承担身份管理、业务自动化和企业控制平面等角色。因此一旦高危漏洞落在这些环境里,影响往往不只是数据泄露,而是整条业务链条被拖垮。 文中还举了一个案例。2025 年 7 月修复的 Entra ID 高危漏洞 CVE-2025-55241,据称可让攻击者伪造能被任意租户接受的 token,且不会在受害者日志中留下痕迹。 在终端和服务器侧,情况同样不轻松。Windows 漏洞总数有所下降,但高危数量依旧偏高。Windows Server 漏洞增至 780 个,其中 50 个被列为高危;Windows 漏洞为 612 个,其中 36 个为高危漏洞。 Office 成为报告里最突出的变化点,其漏洞数量从 47 个升至 157 个,同比大增 234%;高危漏洞则从 3 个跳升到 31 个。 IT之家附上参考地址 2026 Microsoft Vulnerabilities Report

www.ithome.com · 2026-04-14 09:13:35+08:00 · tech

IT之家 4 月 14 日消息,BeingBeyond 智在无界今日发布第三代旗舰模型 Being-H0.7, 该模型将数据规模扩展至 20 万小时人类视频 ,并提出一种全新的范式 —— 基于潜空间推理的世界模型。 北京智在无界科技有限公司 BeingBeyond 成立于 2025 年 5 月,由北京大学计算机学院长聘副教授卢宗青创立,在过去半年中相继发布了全球首个基于 1000 小时与 1 万小时人类视频预训练的具身模型 —— Being-H0 与 H0.5。 智在无界官方表示,在 6 项国际性权威评测中,H0.7 综合排名全球第一(其中 4 项登顶),同时也是首个覆盖跨本体、跨场景、连续动态、流体、柔性物体、物理规律与上下文推理等七大关键维度的通用世界模型。 Being-H0.7 借助世界模型架构,做到了更精准的空间感知、物理理解和运动推理能力,能够完成高速运动物体的追踪和接取、精细流体控制、柔性物体交互等任务: 动态轨迹预测 :在高速动态场景下,Being-H0.7 借助物理世界知识和快速推理,能够预测物体轨迹并精准完成物理世界交互 物理规律理解 :Being-H0.7 通过大规模预训练构建了丰富的世界知识,能够准确理解流体物理规律并完成复杂任务指令 运动推理能力 :Being-H0.7 具备物理世界下的动力学推理能力,能够准确推理物体交互后的空间方位并规划好动作 IT之家附相关论文链接: https://research.beingbeyond.com/projects/being-h07/being-h07.pdf