WWW.YOUINFO.SITE
标签聚合 今日

/tag/今日

LinuxDo 最新话题 · 2026-06-10 19:29:20+08:00 · tech

今日,摩尔线程宣布正式发布并开源MusaCoder,这是面向GPU底层算子生成的专用代码大模型。 摩尔线程表示,MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型,其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。 据介绍,MusaCoder包含9B和27B两个参数规模,主要面向GPU底层算子生成任务设计,重点支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。 这一能力可降低开发者手写底层GPU算子的门槛,提升GPU高性能计算场景下的代码生成、验证和优化效率。 性能方面,在KernelBench评测中,MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg. @8 88.60%的成绩,超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模型,达到当前行业领先水平。 摩尔线程称,MusaCoder的SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步rollout、在线编译执行验证及reward计算等全栈训练与验证流程,均依托MTT S5000构建的夸娥智算集群完成。 这也意味着,国产GPU不仅能够支撑大模型推理和常规微调任务,也能够稳定承载代码大模型后训练全周期算力需求。 尤其是在GPU Kernel生成这类任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。 huggingface.co MooreThreads/MusaCoder-27B · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. arXiv.org MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore... Native GPU kernel generation turns high-level tensor programs into executable, efficient low-level code. Existing Large Language Models (LLMs) struggle with this task, while execution-based reinforcement learning suffers from sparse rewards, reward... 5 个帖子 - 5 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 10:24:07+08:00 · tech

RawChat公益站,今日免费发放10000份60刀的订阅,公益站现在每天发放的订阅数量是有限的,先到先得 站点列表: 1.codex公益站: https://new.sharedchat.cc/ (关t子或者用非us节点访问) 2.rawchat付费站: https://rawchat.cn/ 包含镜像站和包月codex 3.codex按量站: https://newapi.sharedchat.top/ 新上的按量计费站 ccstwich配置: 如遇到429可能是超并发了或到达窗口限速了,不要频繁换节点会触发风控 领取不了订阅尝试更换浏览器,关闭广告插件,尝试隐私窗口 请不要倒卖该公益站,我们都是投入了巨大的精力和真金白银维护的 qq群:758607042(有问题群内反馈回复会快点,群内有技术支持) 50 个帖子 - 46 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-09 20:36:03+08:00 · tech

挪威浏览器厂商 Opera 今日宣布,将在其 Android 版本中上线全新设计的浏览器首页,并在其中集成 2026 年 FIFA 世界杯足球赛事追踪功能,方便用户在手机上实时关注比赛动态。 本届世界杯将于本周晚些时候在美国开赛,Opera 表示,希望通过此次改版为球迷提供更便捷的一站式观赛信息入口。 根据官方介绍,新的首页设计更具沉浸感,同时强化了常用功能的直达入口。 用户可以自定义“快速拨号”图标外观,在圆形、方形和圆角方形(squircle)之间进行选择。 新版首页还加入了实时天气组件,能够显示当前天气情况,并支持一键进入 AI 模式或开启隐私浏览会话,减少层级操作。 与此同时,Opera 在 Android 浏览器中内置了一套足球赛事追踪工具,无需另行安装专门的赛事 App。 该功能通过独立的足球专区为用户呈现实时比分、赛事通知和关键统计数据,并支持查看首发阵容、比赛事件等详细信息,方便在无法看直播时及时掌握赛况。 Opera 此前对用户进行了问卷调查,其中 38% 的受访者表示计划在浏览器中关注 2026 年世界杯赛事,这也成为此次功能整合的重要参考依据。 据悉,本届世界杯将于 2026 年 6 月 11 日开幕,7 月 19 日结束。 Opera 移动产品经理 Tim Lesnik 表示,通过在浏览器中为球迷提供即时比分以及更加考量使用场景的界面设计,能够确保用户即便无法观看直播,也始终只需轻触一下就能紧跟赛场节奏。 除赛事追踪功能外,Opera 还在美国地区推出配套活动,为当地用户提供赢取世界杯迈阿密赛程门票及多种数码产品的机会。 奖品包括 7 月在迈阿密进行的比赛门票、Android 智能手机、PlayStation 5 游戏主机、智能电视以及亚马逊购物礼券等。 用户可自 6 月 12 日起,通过在社交媒体上使用话题标签 #OperaFandom 发帖,或在 Opera 官方网站活动页面完成注册参与抽奖,获奖名单将于 7 月 3 日公布。 目前,用户已经可以通过 Google Play 商店下载或更新 Android 版 Opera 浏览器,以体验新版首页和相关功能。 查看评论

LinuxDo 最新话题 · 2026-06-09 13:28:35+08:00 · tech

今日,SILX AI 宣布推出其 Quasar 基础模型系列的首个公开版本—— Quasar-Preview 。 Quasar-Preview 并非旨在与当前顶尖模型“刷榜”竞争,而是一个用于验证和探索前沿架构的奠基之作。它的主要技术规格包括:采用约 18B 总参数的混合专家(MoE)架构,其中激活参数(Active Parameters)仅为 2B 级别,保持了极高的推理效率。配置了实验性的 500万(5M)Token 上下文窗口,采用 Safe NoPE / DrOPE 风格的阶段性长上下文扩展方法,专为未来的基于内存的系统而设计。模型基于 Loop Transformer 和 Quasar 混合注意力构建,内部包含了 Quasar、Raven 和 GLA 混合层,并结合了稀疏 MoE 路由技术。 目前训练所用的 Token 数量在 1T 到 1.5T 之间(其中长上下文扩展路径目前接收了不到 1B 的 Token)。 官方强调, Quasar-Preview 并非最终形态的 Quasar 模型 ,也不能代表该架构的最终质量。它采用 MIT 协议开源发布,旨在将架构公之于众,方便研究人员进行测试与开发。 该模型依托 Bittensor(SN24)去中心化基础设施进行训练。SILX AI 计划在未来通过以下方式持续提升模型性能: 迭代式的子网训练与知识蒸馏 更长的训练周期与更强的后训练 进一步的长上下文扩展训练以及架构更新 huggingface.co silx-ai/Quasar-Preview · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. 1 个帖子 - 1 位参与者 阅读完整话题