NVIDIA RTX Spark的首份性能数据出炉,据@lafaiel分享的结果, 这款Arm架构SoC在Clang编译基准测试中表现不俗,以43149分的成绩击败Apple M5达54.13%,但略逊于M5 Pro。 RTX Spark搭载了20核Grace CPU,集成的Blackwell GPU拥有6144个CUDA核心,搭配128GB统一内存和1 PFLOP的FP4算力。 具体来看,10核的Apple M5得分为27996,RTX Spark领先超过一半,16核的AMD 锐龙AI Max+ 395同样未能追上RTX Spark, 后者凭借多出的4个核心在多线程编译中占据上风。 Intel酷睿Ultra 9 285HX凭借24核心和高达160W的峰值功耗勉强以微弱优势领先,15核版M5 Pro以46374分仅比RTX Spark快6.95%,18核版M5 Pro则拉开更大差距,55165分领先21.78%。 从功耗角度看,285HX的基础功耗就达55W,峰值可飙至160W,而RTX Spark作为Arm架构SoC,整体功耗远低于此。 锐龙AI Max+ 395的默认TDP为55W,可配置范围45至120W。RTX Spark以更低的功耗击败了AMD,紧咬285HX,能效比优势明显。 此外RTX Spark的CPU采用ARM Neoverse V2架构,这并非ARM最新的CPU微架构,这也是外界此前对其CPU性能存疑的原因之一。 但20核的规模优势在Clang这类多线程编译场景中得到了充分发挥,核心数量直接转化为编译速度。 Clang编译只是开发者工作负载的一个维度,游戏性能对比尚未到来,NVIDIA CEO黄仁勋已现场演示RTX Spark笔记本运行《007:初露锋芒》和《地平线6》,且在电池供电下画面流畅。 查看评论
训练数据截至26年1月,看起来挺新的 测了下天气卡片,给我气笑了,跑都跑不起来 重试了一下,只能说很一般,测了这么多模型头一个遇到连下雨背景都写不出来的模型,连DS V4 Flash都不如 2 个帖子 - 2 位参与者 阅读完整话题
Claude上线了Opus4.8,于是立刻开始了对话测试,重点考察数理推理能力,包含和其他模型的对比。 测试条件 Claude家族:官网web对话 Gpt 家族 (只有5.5 xhigh):官网web对话 D老师:官网api + web对话 彩蛋模型:官网api + web对话 第一轮:测试数学直觉 测试模型:Opus4.8-high(默认配置 + ad thinking) 这不是脑筋急转弯啊喂!不过还好没上来一刀捅一个朋友 ,所以是思维预算没给够?开max试试。 测试模型:Opus4.8-max 依旧固执认为是脑筋急转弯,而且一下烧掉好多token.. 但至少是当作正常问题推理了。接下来看看同门的4.6。 测试模型:Opus4.6-midium(默认配置 + extend thinking) 没毛病,准确、高效、简洁。这可只是midium.. 再看看奥特曼家呢 测试模型:Gpt-5.5-xhigh 和4.6的表述顺序稍有不同,但一样的简洁直观,官网web还做了公式渲染。好了,接下来是一刀一个小朋友的D老师了。 测试模型:Deepseek-v4-pro(默认配置) 啊什么?D老师竟然只用了31秒思考就正确回答了?除了回复格式不如前面简洁直观,答案本身是没问题的。 第二轮:追问任意情况拓展 测试模型:Opus4.8-high(默认配置 + ad thinking) 第二轮4.8high似乎回过味儿来了,但为何感觉文字量不少但信息密度这么低呢?也没解释公式的证明过程.. max太费额度就不测了,直接4.6 测试模型:Opus4.6-midium(默认配置 + extend thinking) 不说别的,4.6的回答十分的清晰简洁,并且没有多余的话,还是厉害!再看看gpt吧 测试模型:Gpt-5.5-xhigh 这里gpt-5.5理解成了求解“小朋友比西瓜多一个”的特定情况,不得不说官网对公式的展示优化还是很舒服的,可能是因为有很多研究者用pro模型的与缘故?但内容角度说没有推理任意n、m场景下的结论,这一点是不如Opus4.6的。好了,接下来到我们的D老师了。 测试模型:Deepseek-v4-pro(默认配置) D老师你怎么了?一直思考了20分钟还没停下来,手动中断再跑还是一样.. 展开思维链可以看到D老师一直再自我怀疑“等等”和反问“可能吗”,算了算了先停了。 结论:4.8数理推理未超越4.6与Gpt-5.5,但tool use增强 意图理解 :固执默认为脑筋急转弯,初始的high effort下甚至没当一个数学问题去思考,这一点连Deepseek都不如。max effort虽然当作数学问题解答了,但依旧认为是脑筋急转弯。 推理能力 :第一轮均分问题都给出了正确的解法,这个比较惊艳的反倒是D老师也没踩坑。算平局。 发散思维 :按任意场景发散推理时,high effort直接给出了答案没给推理过程,差强人意吧。只有4.6和Gpt-5.5还是严格按照任意情形去推理本质规律了的,可惜Gpt-5.5默认给自己多加了个m = n-1的条件。目前看4.6还是综合较强。 工具使用 :4.8明显会更主动的调用工具,比如画一个图来辅助说明,这一点其他所有模型都没有这类倾向。在我的另一个场景下还会用python画svg来讨论。不过opus4.8 max的token开销是很大的,至于多出来的token消耗值不值得就因人而异了。 输出风格 :这是最可惜的一项,4.8在表达层还是没有超越4.6,会感觉信息密度非常低,比如特地解释什么是“一刀”,频繁使用“xxx(不是xxx)”等废话句式,整体阅读体验很差。 彩蛋:某个降价对标D老师的模型 6 个帖子 - 4 位参与者 阅读完整话题
IT之家 5 月 27 日消息,在今天的 SPARK 2026 腾讯游戏发布会中,腾讯宣布《彩虹六号:攻势》技术首测将于 6 月 17 日正式开启,本作系育碧汤姆 · 克兰西系列最新战术射击游戏《彩虹六号:围攻》(Rainbow Six Siege)国服。 IT之家查询公开资料获悉,这是一款由育碧蒙特利尔开发、育碧于 2015 年 12 月发行的第一人称战术射击游戏,是该系列时隔 8 年后推出的正统续作,同时继承了已被取消的《彩虹六号:爱国者》部分要素。
IT之家 5 月 19 日消息,据中国运载火箭技术研究院(火箭院)今日消息,火箭院“智行”膝关节智能助行外骨骼机器人于 5 月 16 日在北京市丰台区千灵山 完成首次测试 ,20 位志愿者参与测试体验,标志着这项源自航天技术的科技成果迈出了从专业领域走向大众市场的重要一步。 该产品由北京精密机电控制设备研究所自主研发,为破解中老年人群、户外运动爱好者及康复期患者的膝关节负担难题提供了“航天方案”。 本次测试中,志愿者身穿“智行”膝关节智能助行外骨骼机器人,在真实山地环境下对不同坡度、不同路况的助力效果、穿戴舒适性、续航能力及智能响应速度进行了全面测试。 据了解,该产品在关节处可提供最大 7 公斤的主动动力, 续航达 4 小时 。测试数据显示,设备运行稳定,能够有效感知使用者意图并提供精准的助力辅助, 上坡时可降低使用者约 15% 的体能消耗 ,下坡时能减少膝关节所受冲击力约 30%。 “智行”膝关节智能助行外骨骼机器人具备上坡助力、下山缓冲和膝关节防护三大核心功能。产品结合轻量化、低成本、批量化理念, 总重仅 2.6 千克,30 秒内即可完成穿戴 ,可解决中老年人群、膝关节不适者及康复期患者在行走、上下楼、登山等日常场景中的行动不便问题。