最近天天拿我老婆的京东号(她有vip)看迪神性价比神车 NCR APEX 我老婆看我天天刷,冷不丁就下单了,周末找一天提车去 再见我的小黄,打入冷宫 9 个帖子 - 8 位参与者 阅读完整话题
IT之家 5 月 26 日消息,酷冷至尊 Hyper 612 APEX Pro ARGB 版 CPU 风冷散热器现已开售,有黑白两种颜色可选, 售价 429 元起 : ARGB 版黑色:429 元 ARGB 版白色:459 元 京东 酷冷至尊(CoolerMaster)Hyper612 Pro ARGB 版 CPU 风冷散热器 429 元 直达链接 官方宣称,这款 CPU 风冷散热器搭载自研第三代超导复合热管,导热效率远优于传统热管;升级一体化金属拉丝磁吸顶盖,支持无工具快速拆装风扇,前风扇配置莫比乌斯 120U ARGB 风扇。 这款散热器前风扇转速 0-2700RPM±10%,后风扇转速 0-2400RPM±10%;采用内存避让设计,主动避让显卡和内存,确保兼容性;支持市面上主流 CPU,官方推荐搭配以下处理器: IT之家附这款散热器主要参数如下: 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包
去年 MathArena 发布了 MathArena Apex 和 Apex Shortlist 测试集,如今 GPT 5.5 已经解决了 Apex 测试集的最后一题。 Apex 和 Apex Shortlist 模型得分率随时间的变化 但是该测试集发布至今已有近一年的时间了,MathArena 怀疑可能存在数据污染,于是准备构建 Apex 测试集的第二代。MathArena 选取了 176 道符合条件的最终答案题目,并对每道题目运行了四次 Gemini 3.1 Pro。结果显示:162 道题目在四次尝试中均被求解,其余 14 道题目至少被求解了一次。因此,没有题目符合 Apex 最初的收录标准,而 Apex Shortlist v2 的候选题目数量太少,不足以单独发布。MathArena 现在认为竞赛题仍然有助于追踪小型模型的进展,并评估学术研究中的新方法。 MathArena 建议未来的基准测试应侧重于其他形式,例如证明评估、研究数学以及正确性之外的性质。 原文 Farewell to Final-Answer Competition Problems as Frontier Benchmarks 3 个帖子 - 2 位参与者 阅读完整话题
IT之家 4 月 27 日消息,一加官方今天宣布 Nord CE6 Lite 手机将于 5 月 7 日在印度发售,新机定位中低端,主打 7000mAh 大电池设计 + 天玑 7400Apex 芯片。 据介绍,这款手机配备 144Hz 高刷屏幕,8GB+256GB 版本安兔兔 V11 跑分超 1030000 分。 可在《BGMI》(印度版本《和平精英》)和《使命召唤:Mobile》游戏中开启 90 帧模式 。《地铁跑酷》等游戏则可以开启 144 帧模式。 同时,这款手机内置 7000mAh 大电池,充放电循环 1600 次后仍可保持 80% 初始容量。 搭载 5000 万像素后置主摄 ,支持 4K 视频录制。 此外,这款手机出厂预装基于 Android 16 的氧 OS 16 操作系统,售价预计低于 25000 印度卢比(IT之家注:现汇率约合 1816 元人民币)。
是在hermes中生成的,提示词如下: 你是 Apple Inc 的顶级 UI 设计师,以 iOS 18 的设计风格(毛玻璃效果、高斯模糊、动态渐变、细腻阴影)创建一个单个HTML文件(包含完整CSS和JavaScript)。实现横板天气页面,包含4个并排的动画天气卡片: 晴天(太阳光线、动态光晕) 大风(飘动云朵、摇曳树木、风线) 暴雨(下落雨滴、形成水洼、闪电) 暴雪(下落雪花、堆积效果) 卡片需深色背景,支持按钮切换天气状态,实现流畅交互和微动效。代码必须可直接运行,美观度优先。 感觉还不错啊(是我审美有问题吗? 2 个帖子 - 2 位参与者 阅读完整话题
llama.cpp 支持的APEX量化效果挺好的, https://huggingface.co/mudler/Qwen3.6-35B-A3B-APEX-GGUF 根据该量化库的作者的表述 , 消费级显卡可用的 Qwen3.6-35B-A3B-APEX-I-Compact.gguf 效能要优于UD-Q3_K_M 量化。 我基于 docker-compose 方式搭了个简易llama.cpp部署, 写了个简易的python测试程序 ,就我比较关心的信息抽取场景做了测试。 项目地址: GitHub - WackyGem/Burrito: 这个仓库是一个本地 `llama.cpp` 部署与测试示例。 · GitHub 下面是简易的测试评估结论 一、显存占用 组件 大小 CUDA 模型权重 16,209 MiB KV Cache 640 MiB (f16, 16384 cells) Recurrent State 126 MiB 计算缓冲区 493 MiB (CUDA) + 40 MiB (Host) Vision Encoder (CLIP) 858 MiB + 248 MiB compute GPU 总占用 ~18,614 MiB / 22,000 MiB 剩余显存 ~4,247 MiB 二、生成性能(缓存命中场景) 指标 数值 缓存 token 数 4,223 新增 prompt token 4 Prompt 处理速度 61.67 tok/s (64.86 ms) 生成 token 数 3,827 生成速度 83.68 tok/s (45.73 s) 单 token 延迟 11.95 ms 总耗时 45.80 s 三、首次请求性能(无缓存,含图像) 请求 Prompt 速度 生成速度 生成 token 数 Slot 0 148.80 tok/s 71.77 tok/s 1,833 Slot 1 44.54 tok/s 63.51 tok/s 2,804 两个请求并发,Prompt 总吞吐 148.80 + 44.54 = 193.34 tok/s ;生成总吞吐 71.77 + 63.51 = 135.28 tok/s ,并发显著提升了 GPU 整体利用率。 四、缓存命中性能 请求 缓存恢复 Prompt 速度 生成速度 生成 token 数 Slot 0 4,205 tokens 81.79 tok/s 71.63 tok/s 1,792 Slot 1 4,223 tokens 61.67 tok/s 83.68 tok/s 3,827 缓存命中后 prompt 处理仅 4 个 token,延迟从 ~28-95s 降至 ~49-65ms 。 五、图像处理耗时 阶段 请求 1 请求 2 图像编码 9,104 ms 4,771 ms 解码 Batch 1/2 1,218 ms 1,224 ms 解码 Batch 2/2 1,357 ms 1,351 ms 总计 11,679 ms 7,347 ms 结论总评 主模型+视觉投影模型占用不到20G,消费级GPU可部署。 在SM_75算力架构的2080ti中推理速度峰值 135.28 tok/s 达到可用水平。 在图像识别方面表现优秀。 Burrito仓库中提供了该测试例子,感兴趣可以尝试 5 个帖子 - 3 位参与者 阅读完整话题
IT之家 4 月 21 日消息,一加今天在印度市场公布了 Nord CE6/CE6 Lite 手机的详细参数,5 月 7 日发布。 据介绍,一加 Nord CE6 采用方形相机模组设计,风格类似 Nord 6 标准版。配备 1.5K 144Hz 高刷 OLED 屏幕,峰值亮度可达 1800 尼特, 支持 3840Hz PWM 调光 。 性能方面, 一加 Nord CE6 搭载骁龙 7s Gen 4 芯片 ,配有 Touch Reflex 自研芯片,内置 8000mAh 大电池,支持 27W 有线反向充电。具备 IP66/IP68/IP69/IP69K 防尘防水。 而一加 Nord CE6 Lite 则定位亲民,配备 144Hz 屏幕、 天玑 7400 Apex 芯片 ,安兔兔跑分超 103 万分。拥有 7000mAh 电池,其他参数还没有公开。 此外,我们目前还无法得知这两台手机的价格,作为参考,上代机型 Nord CE5 在印度的起售价是 24999 印度卢比(IT之家注:现汇率约合 1842 元人民币)。
IT之家 4 月 21 日消息,据美国消费品安全委员会 (CPSC) 官网公告,Apex Gaming PCs 在北美市场对旗下 Apex 和 Manik 品牌电源发起召回, 涉及 2021 年 12 月至 2026 年 2 月期间销售的合计约 18230 件产品 ,覆盖 450W / 750W / 1000W / 1200W 型号。 IT之家注意到,此次召回并非硬件层面的缺陷,而是 这些电源缺乏永久性安全警示标签 。此类标签向用户提示了打开或拆解电源有潜在触电风险,可能导致严重伤害甚至死亡。 CPSC 表示消费者应立即停止使用被召回的电脑电源,并联系 Apex Gaming PCs 以免费获得一个永久性的 UL 认证耐热粘贴安全标签;不愿按此方式处理的消费者可以申请免费更换设备。 Apex Gaming PCs 还将为所有受影响的产品提供 1 年延保 。
概述 感谢各位上次发帖很多佬的交流, 上次是豪华配置,这次测了弱一点的配置 首先期望不要太高,其实这个水平的模型OpenCode还有厉害一点的Minimax M2.5免费用( 虽然刚才出现的Bug Minimax也没修好 能玩,但是上下文看自己的操作,如果有核显则可以拉到100K上下文,没有的话可能20-50K上下文了。( 所以我特别喜欢有核显的电脑 )显存比较紧急的话可以划分1层给CPU,可以拉高20K上下文应该 体感可以编程,没有什么问题 写了个时钟,还有个贪食蛇 相关说明 Apex量化的I-MINI GGUF表现真的很亮眼,损失感觉很小? Qwen3.6 35B A3B的上下文真的好便宜 模型在这里,I-MINI版本就13.3G(这里不加载视觉模块了,显存不够): Qwen3.6-35B-A3B-APEX-GGUF · 模型库 如果有Intel 358H, 338H 32G+1T, 或者AMD 890M, 780M 的用户也可以试试看,内存大可以选I-Compact的17G版本 部署环境 硬件 CPU 12450H 显卡 RTX 5060 Ti 16G 内存 单根 16G DDR4 3200 注意:显卡上没有接任何输出,BIOS设置的核显优先,界面渲染都交给了核显,如果开个渲染个界面可能就剩下13-14G显存,上下文只能开比较少或者拿一层给CPU,decode速度会降低25% 软件 后端 LM Studio 部署模型:Qwen3.6-35B-A3B-APEX-I-Mini.gguf Decode速度: 80tps 层数:全部放在GPU上 上下文:100K 关闭MMAP, 不保持模型在内存中 打开快速注意力,K缓存 V缓存量化均为Q8, Q4好像有BUG → 会导致Prefill非常慢 建议: 用来编程时,如果第一步没能做好,建议直接从第一步重开多试一次,应该会比修bug要好点,改代码bug能力没有写代码能力强的感觉 本地还能玩玩Heretic(虽然这个模型好像没什么感觉,RP不是很好,总之玩玩也不赖) 这个量化确实损失感觉没多少的样子,因为同样概率发生的bug我跑Q6量化的版本也有概率发生 对于天才编程佬们来说,模型的能力还是远远不够的,这篇文章没什么帮助,虽然如此,但是还是想要分享一下 如果发生长时间卡住,可能是模型跑出循环思考bug了,可以中断一下重新跑 题外话 话说L站没有本地部署模型的标签吗(逃 附加截图 2 个帖子 - 2 位参与者 阅读完整话题