30B - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-05-27 14:00:22+08:00 · tech

再无话说 CLAWB30BF20D5182 CLAWDE61D74CEEEB CLAW4CD4F58F5030 CLAW4EC0D12169F9 CLAW6B1AB1A67EA4 4 个帖子 - 4 位参与者阅读完整话题

相关专题

LinuxDo 最新话题 · 2026-05-26 18:57:13+08:00 · tech

Keye-VL-2.0-30B-A3B在底层架构上完成了关键跨越——首次在多模态理解场景中成功应用了 DSA （DeepSeek Sparse Attention）。通过结合稀疏注意力与极具针对性的特征聚合，模型在处理长达小时级的视频序列时，能够有效进行高噪环境下的信息提纯，精准捕捉关键帧并理清动态规律。 https://mp.weixin.qq.com/s/gomgqFAZrdbJFQlOfSJxpQ 1 个帖子 - 1 位参与者阅读完整话题

腾讯混元全新翻译模型Hy-MT2开源

LinuxDo 最新话题 · 2026-05-21 16:54:30+08:00 · tech

Hy-MT2包含3个尺寸的模型Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B，三个模型均支持33个语种互译，5种民汉/方言。HF官网在 https://huggingface.co/collections/tencent/hy-mt2 官方给的跑分图：还搞了一个小程序说是，不知道手机端推理能不能比之前快一些，上次部署了个MT-1.5-2bit量化版本在手机上跑一个几十词小翻译都得七八分钟 3 个帖子 - 3 位参与者阅读完整话题

目前产学研界开源多模态模型什么是主流呢

LinuxDo 最新话题 · 2026-05-11 17:00:14+08:00 · tech

如题，模型尺寸在3B-30B左右，楼主本人还停留在qwen2.5VL系列（qwen3/3.5在当前业务提升不明显） 5 个帖子 - 4 位参与者阅读完整话题

[问与答] 突然有点好奇，什么时候桌面级 AI（30B 以下）可以一字不差地把滕王阁序默写下来

v2ex · 2026-05-05 14:06:18+08:00 · tech

截至目前号称最聪明的 Gemma4(26B)依然大翻车

openrouter 新增3个模型一个nvidia的多模态两个poolside

linux.do · 2026-04-29 16:03:31+08:00 · tech

nvidia/nemotron-3-nano-omni-30b-a3b-reasoning:free poolside是下面公司出的 laguna-m.1 应该这个效果会好点 Poolside Introducing Laguna XS.2 and Laguna M.1 We’re releasing two foundation models and two products into preview today. openrouter.ai Laguna XS.2 (free) - API Pricing & Providers Laguna XS.2 is the second-generation model in the XS size class from [Poolside](https://poolside.ai), their efficient coding agent series. $0 per million input tokens, $0 per million output tokens. 131,072 token context window, maximum output of... openrouter.ai Laguna M.1 (free) - API Pricing & Providers Laguna M.1 is the flagship coding agent model from [Poolside](https://poolside.ai), optimized for complex software engineering tasks. $0 per million input tokens, $0 per million output tokens. 131,072 token context window, maximum output of 8,192... 3 个帖子 - 2 位参与者阅读完整话题

英伟达推出 Nemotron 3 Nano Omni 模型：采用 30B‑A3B 混合 MoE 架构，吞吐量最高提升 9.2 倍

www.ithome.com · 2026-04-29 07:35:02+08:00 · tech

IT之家 4 月 29 日消息，当地时间 4 月 28 日，英伟达宣布推出名为 Nemotron 3 Nano Omni 的开源全模态推理模型，旨在为企业级 AI Agent 提供一体化基础模型底座。据介绍，这是一款将视频、音频、图像和文本的统一多模态推理集成于单个高效开放模型中的产品。该模型旨在替代智能体系统中常见的碎片化视觉-语音-语言模型链，从而减少推理跳数与编排复杂度，降低推理成本，同时增强跨模态上下文一致性。 Nemotron 3 Nano Omni 可在智能体系统中充当多模态感知与上下文子 Agent，使智能体能够在单个共享的“感知-行动”循环中处理视觉、音频和文本输入，提升收敛速度，降低编排复杂度和推理成本。在文档智能榜单（如 MMlongbench-Doc 和 OCRBenchV2）上，该模型取得了同类领先的准确率；同时在视频与音频理解基准（WorldSense、DailyOmni、VoiceBench）中也表现优异。行业基准 MediaPerf（基于真实媒体数据和生成任务评估视频理解模型的性能、成本和吞吐量）显示，Nemotron 3 Nano Omni 在所有任务上实现了最高吞吐量，且视频级标注的推理成本最低。 ▲ 在固定的用户交互阈值下，各模型所能维持的总系统吞吐量该模型基于 30B‑A3B 混合专家（MoE）架构，可根据任务和模态进行激活，实现高吞吐量与可扩展的多模态性能。IT之家注意到，其模型权重、数据集和训练配方完全开放，开发者可在本地、云端或企业环境中定制、部署和集成多模态子 Agent。英伟达表示，在固定交互延迟阈值下，Nemotron 3 Nano Omni 在视频推理任务中可持续提供更高的聚合吞吐量，相比其他开放式全模态模型有效系统容量最高提升约 9.2 倍；在多文档推理任务中，有效系统容量最高提升约 7.4 倍。在 Blackwell GPU 上采用 NVFP4 量化时，该模型在处理复杂文档、长时推理和大批量视频的企业级工作负载中，吞吐量在开放式全模态模型中居于领先。架构设计方面，Nemotron 3 Nano Omni 核心为混合 MoE，结合 Mamba 层（提升序列与内存效率）和 Transformer 层（实现精准推理），内存和计算效率最高可提升 4 倍。视觉处理方面，它采用 3D 卷积捕捉帧间运动，推理时通过高效视频采样层将高密度视觉 token 压缩为 LLM 可处理的精简集合；音频部分则基于 NVIDIA Parakeet 编码器与专用数据集；文本部分以强大的文本模型作为中心解码器，保留基础模型的语言能力；视觉编码采用 C-RADIOv4-H，支持高分辨率图像与 OCR 精度。其训练方法涵盖适配器与编码器训练（约 1270 亿跨模态 token）、多阶段监督微调及后监督强化学习（超过 230 万次环境 rollout）。该模型权重已在 Hugging Face 上提供，并即将作为 NVIDIA NIM 微服务上线。英伟达还开放了完整的端到端训练与评估配方、部署指南、微调食谱以及开放数据集。

[分享发现] 快连停止了中国大陆地区的业务运营

v2ex.com · 2026-04-28 10:21:12+08:00 · tech