如图,在nao佬的私人榜单上,qwen3.7max甚至仅次于5.5,而且这一骑绝尘的token消耗最终时间才300s,说明tps无敌。绝对是用了自己试的新注意力或者别的什么了。另外这opus4.8中位分数十分拉胯,证明这个模型稳定性不行啊,甚至不如4.6。 8 个帖子 - 6 位参与者 阅读完整话题
动态: 刚刚,全球权威编程榜单 Code Arena正式放榜,千问最新旗舰模型 Qwen3.7-Max得分 1541,超越GPT-5.5、Gemini-3.5-Flash、GLM-5.1、Kimi-K2.6等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。 全球权威编程榜单 Code Arena 这是由知名第三方大模型盲测平台 LMArena 推出的最具影响力的编程能力榜单之一。与传统的代码基准测试不同,Code Arena 由开发者出题,要求模型从零生成完整的、可交互的 Web 应用程序,并交由用户对匿名模型进行两两 PK 盲测投票,根据投票综合生成最终榜单。因此,Code Arena 也被视为目前 全球最具公信力的 AI 编程能力评测 之一。 编程突出的 Qwen3.7-Max Qwen3.7-Max 在 Code Arena 榜单中斩获 1541 分,次于最强模型Claude-opus-4.7,可媲美Claude-opus-4.6,是目前榜单中唯一突破 1540 分大关的国产大模型。 在真实项目交付能力上,Qwen3.7-Max 同样表现出色:能在数小时内独立完成专业团队耗时 2 周的复杂项目端到端交付;可持续运行 35 小时,累计完成超 1000 次工具调用的复杂长程任务,甚至能自我编程优化芯片内核。 感谢全球开发者的每一次投票和反馈,我们将继续努力,打磨更好的模型给大家。 链接: 千问大模型的动态 - 哔哩哔哩 24 个帖子 - 24 位参与者 阅读完整话题
这次 composer2.5 官方给的参数说仅次于 claude opus4.7 是吹牛逼还是真的? 反正使用方面感觉没啥变化。 但对于用户来说更新是好事情,毕竟算在 Auto 比 API 耐用。
这次 composer2.5 官方给的参数说仅次于 claude opus4.7 是吹牛逼还是真的? 反正使用方面感觉没啥变化。 但对于用户来说更新是好事情,毕竟算在 Auto 比 API 耐用。
这次 composer2.5 官方给的参数说仅次于 claude opus4.7 是吹牛逼还是真的? 反正使用方面感觉没啥变化。 但对于用户来说更新是好事情,毕竟算在 Auto 比 API 耐用。
IT之家 4 月 30 日消息,调研公司 Counterpoint Research 当地时间 29 日发布简介,认为联发科技 (Mediatek) 有望凭借与 Google(谷歌)的合作 在 2 年内实现 AI 服务器计算 ASIC 出货规模的数量级增长 。 联发科 2028 年有望合计交付 500 万颗谷歌 TPU 芯片, 以 26% 的市占成为 AI ASIC 设计服务领域仅次于 Broadcom(博通)的参与者 。 ▲ 图源:Counterpoint Research 在谷歌近期推出 TPU v8t (Zebrafish) 上,谷歌负责核心计算芯片的设计并协调 HBM 供应,联发科则提供 I/O 芯片。而在传统的博通“交钥匙”解决方案中,博通负责 HBM 采购并有 15~20% 的加价。 谷歌在部分芯片上转向新的合作方式, 这一方面能节省计算芯片设计成本 , 另一方面也能避免 HBM 上的加价 ,实现更有利的成本结构。 展望未来, 联发科正与谷歌携手推进 TPU v8e (Zebrafish) 。该项目当前处于设计导入和验证阶段,预计 2027 年底启动量产并在 2028 年放量,并有望至少部分导入 Intel(英特尔)的 EMIB-T 2.5D 异构集成先进封装技术。 参考 MediaTek to Contribute 1 in 4 AI ASIC Server Compute Shipments in 2028
看到最新的D牢师竟然拥有仅次于gemini3.1Pro的世界知识,不禁感慨这些LLM是怎么存下这么多东西的 20 个帖子 - 15 位参与者 阅读完整话题
36氪获悉,5月27日,港交所信息显示,段永平及其全资控股的H&H International Investment触发邀约收购,共买入泡泡玛特982.32万股,持有股份5.69%,已成为仅次于王宁的第二大股东。今年4月9日,段永平曾通过卖出看跌期权的方式布局泡泡玛特,自称“泡泡玛特保险公司正式开张”。而本次增持,则是段永平对泡泡玛特股权的直接买入。
36氪获悉,5月26日凌晨,全球三方编程榜单Code Arena放榜,阿里最新旗舰模型Qwen3.7-Max得分1541,超越GPT-5.5、Gemini-3.5-Flash等一众模型,仅次于Claude系列,在大模型厂商中排名全球第二。