Blazing fast inference: By shifting the decode bottleneck from memory-bandwidth to compute, DiffusionGemma generates up to 4x faster token output on dedicated GPUs. (1000+ tokens per second on a single NVIDIA H100, 700+ tokens per second on NVIDIA GeForce RTX 5090). 一些补充 Diffusion是一种不同于主流文本大模型Next Token Predict的模型架构,常用于图片生成领域中。NTP是从左向右逐个token生成的,而Diffusion则是给定一块空白区域,模型预测这片区域的每个位置可能的内容,并一次次进行纠错,最终生成完整内容。 14 个帖子 - 9 位参与者 阅读完整话题
IT之家 5 月 27 日消息,B&O(铂傲、Bang & Olufsen)联名藤原浩 Fragment Design,推出四款 B&O 音频产品的联名版, 售价 3198 元起 : 便携式音箱 Beosound A1:3198 元 头戴式耳机 Beoplay H100:15480 元 壁挂扬声器 Beosound Shape:国行价格暂未公布,售价 1,066,300 日元,现汇率约合 45519 元人民币 音响系统 Beosystem 9000c:仅在日本销售,售价 10,662,900 日元,现汇率约合 45.5 万元人民币 据介绍,该系列中的每一件作品, 都饰有 Fragment 标志性的双闪电标识和品牌字样 。品牌首次将高度专业化的阳极氧化与手工抛光工艺,应用于部分便携作品。 IT之家附联名产品图片如下: 便携式音箱 Beosound A1 京东 B&O【藤原浩联名】Beosound A1 3 代可通话无线蓝牙音箱 3198 元 直达链接 头戴式耳机 Beoplay H100 京东 B&O【藤原浩联名】Beoplay H100 无线蓝牙耳机 15480 元 直达链接 壁挂扬声器 Beosound Shape 音响系统 Beosystem 9000c 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包
MTT S5000 AI 训推一体智算卡基于 PH100 芯片打造,单卡 AI 算力(稠密)可达 1000 TFLOPS,具备 80GB 显存(带宽 1.6TB/s),卡间互联带宽为 784GB/s,满足多精度算力需求。国产显卡也越来越好了! 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 5 月 26 日消息,中国信息安全测评中心、国家保密科技测评中心今天公布《安全可靠测评结果公告(2026 年第 2 号)》, 摩尔线程 MTT S5000(PH100 芯片)人工智能训练推理芯片在列 。 IT之家注意到,摩尔线程刚刚也在公众号平台发布了这则喜讯。官方表示,这是安全可靠测评体系建立以来, 首次将 AI 训练推理芯片纳入评测结果 。 据悉,MTT S5000 AI 训推一体智算卡基于 PH100 芯片打造,单卡 AI 算力(稠密)可达 1000 TFLOPS,具备 80GB 显存(带宽 1.6TB/s),卡间互联带宽为 784GB/s,满足多精度算力需求。
用SpaceXAI的Colossus2提供的百万级H100算力,搭配Moonshot 的 Kimi K2.5为训练底座,整出来了这个↓:(看上去挺强的啊,那以后要主推自家模型了吗)。 不知道实际水平到底怎么样,长程任务稳不稳定 7 个帖子 - 5 位参与者 阅读完整话题
果然做LLM还是要去企业做,学校还是太穷了,五一期间趁大家下班卡多,跑两篇neurips 11 个帖子 - 5 位参与者 阅读完整话题