WWW.YOUINFO.SITE
标签聚合 今日

/tag/今日

LinuxDo 最新话题 · 2026-06-10 19:29:20+08:00 · tech

今日,摩尔线程宣布正式发布并开源MusaCoder,这是面向GPU底层算子生成的专用代码大模型。 摩尔线程表示,MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型,其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。 据介绍,MusaCoder包含9B和27B两个参数规模,主要面向GPU底层算子生成任务设计,重点支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。 这一能力可降低开发者手写底层GPU算子的门槛,提升GPU高性能计算场景下的代码生成、验证和优化效率。 性能方面,在KernelBench评测中,MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg. @8 88.60%的成绩,超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模型,达到当前行业领先水平。 摩尔线程称,MusaCoder的SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步rollout、在线编译执行验证及reward计算等全栈训练与验证流程,均依托MTT S5000构建的夸娥智算集群完成。 这也意味着,国产GPU不仅能够支撑大模型推理和常规微调任务,也能够稳定承载代码大模型后训练全周期算力需求。 尤其是在GPU Kernel生成这类任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。 huggingface.co MooreThreads/MusaCoder-27B · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. arXiv.org MusaCoder: Native GPU Kernel Generation with Full-Stack Training on Moore... Native GPU kernel generation turns high-level tensor programs into executable, efficient low-level code. Existing Large Language Models (LLMs) struggle with this task, while execution-based reinforcement learning suffers from sparse rewards, reward... 5 个帖子 - 5 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 10:24:07+08:00 · tech

RawChat公益站,今日免费发放10000份60刀的订阅,公益站现在每天发放的订阅数量是有限的,先到先得 站点列表: 1.codex公益站: https://new.sharedchat.cc/ (关t子或者用非us节点访问) 2.rawchat付费站: https://rawchat.cn/ 包含镜像站和包月codex 3.codex按量站: https://newapi.sharedchat.top/ 新上的按量计费站 ccstwich配置: 如遇到429可能是超并发了或到达窗口限速了,不要频繁换节点会触发风控 领取不了订阅尝试更换浏览器,关闭广告插件,尝试隐私窗口 请不要倒卖该公益站,我们都是投入了巨大的精力和真金白银维护的 qq群:758607042(有问题群内反馈回复会快点,群内有技术支持) 50 个帖子 - 46 位参与者 阅读完整话题