WWW.YOUINFO.SITE
标签聚合 面壁

/tag/面壁

IT之家 · 2026-05-27 11:51:33+08:00 · tech

IT之家 5 月 27 日消息,面壁智能今日联合清华大学、OpenBMB 开源社区正式发布 ForgeTrain—— 全球首个完全由 AI 编写、零人类代码介入的生产级大模型训练框架 。 面壁智能使用 ForgeTrain 在 华为昇腾 芯片上成功完成了面壁智能新一代「小钢炮」 MiniCPM5-1B 模型的预训练。评测结果显示,MiniCPM5-1B 的综合性能在全球同尺寸模型中处于领先水平,在 AA 榜单上位列 2B 规模以下 Top 1。 官方表示,这标志着「AI 写的框架 → 在国产芯片上运行 → 训出领先的 AI 模型」这一完整闭环被成功打通。 ForgeTrain 完全开源,同步发布 ForgeTrain 框架代码(完整的预训练框架)和 Agent Harness(制造 ForgeTrain 的完整工具链,包含评测标准、测试规约和智能体编排方案。任何团队都可以用它复现从逐比特对齐到性能反超的全过程)。 IT之家附开源链接如下: Github : https://github.com/OpenBMB/ForgeTrain

IT之家 · 2026-05-26 13:13:08+08:00 · tech

IT之家 5 月 26 日消息,面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 —— MiniCPM5-1B 。 官方表示,MiniCPM5-1B 仅以 1B 参数规模,在国际知名榜单 AA-Index(Artificial Analysis Intelligence Index)上 超越了所有 2B 参数以下模型 ;相比 3 个月前发布的 Qwen3.5-2B,MiniCPM5-1B 不仅效果更优,参数量还减少了一半。 该模型 INT4 量化后权重仅 0.5GB,能跑在手机上、跑在浏览器里。它的 Base Model 版本由面壁智能自主研发的 AI 训练框架 ForgeTrain 预训练完成 。 MiniCPM5-1B 现已全面开源,包括模型权重、训练数据集与部署方案。IT之家附相关链接如下: HuggingFace: https://huggingface.openbmb.com/model/openbmb/MiniCPM5-1B GitHub: https://github.com/OpenBMB/MiniCPM ModelScope: https://modelscope.cn/models/OpenBMB/MiniCPM5-1B GitCode: https://ai.gitcode.com/OpenBMB/MiniCPM5-1B 魔乐社区: https://modelers.cn/models/OpenBMB/MiniCPM5-1B

IT之家 · 2026-05-25 11:48:30+08:00 · tech

IT之家 5 月 25 日消息,面壁智能联合清华大学、OpenBMB 开源社区,今天正式发布并开源其在低比特大模型训练方向的最新成果 ——BitCPM-CANN。 官方表示,这是中国首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成 ,包含 0.5B、1B、3B、8B 四个模型尺寸,与同尺寸 MiniCPM4 全精度家族逐项对照评测,性能表现优异。 相比传统 BF16 精度,BitCPM-CANN 在推理阶段 释放约 6 倍显存红利 ,同时将模型能力保留率维持在 90%– 97.2 % 。 官方表示,对手机产业来说,6 倍的显存红利意味着, 一个 8B 参数的 BitCPM-CANN 大模型,可以轻松运行在当前主流旗舰手机之上 。 此外,面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座,包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此, 所有面向昇腾的低比特训练工作,都可建立在同一套公共基础设施之上 。 BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型权重现已开源,IT之家附链接如下: HuggingFace : https://huggingface.co/collections/openbmb/bitcpm-cann ModelScope : https://modelscope.cn/collections/OpenBMB/BitCPM-CANN

IT之家 · 2026-05-13 12:55:59+08:00 · tech

IT之家 5 月 13 日消息,5 月 11 日,面壁智能联合清华大学及 OpenBMB 开源社区正式发布并开源了新一代端侧多模态大模型 MiniCPM-V 4.6。 该模型参数规模为 1.3B,在端侧设备上仅需约 6GB 内存即可流畅运行,大幅降低了多模态 AI 在各类智能终端的落地门槛。 目前,MiniCPM-V 4.6 已在 GitHub 和 Hugging Face 等平台全面开源,并提供 Testflight 测试版本,可在 iOS、Android 和 HarmonyOS 等主流操作系统的手机上使用。 在性能表现方面,MiniCPM-V 4.6 在多个权威基准评测中展现出优于同尺寸主流模型的能力。 据介绍,它的 Instruct 和 Thinking 两个版本均在通用图文理解、STEM 数理推理、文档 OCR 及视频时序理解等任务上超越了 Qwen3.5-0.8B 和 Gemma4-E2B-it 等模型。 在最新的 Artificial Analysis 评测中,MiniCPM-V 4.6 以 13 分的成绩超越了 Ministral 3 3B 等更大尺寸的模型,整体能力接近 Qwen3.5-2B 级别。 在效率方面,MiniCPM-V 4.6 实现了“参数更大、效率更高”的反超。尽管参数规模比 Qwen3.5-0.8B 更大,但在基于 vLLM 框架的推理测试中,它的 Token 吞吐量达到前者的 1.5 倍,而计算 Token 消耗仅为后者的 2.5% 左右。 在 Artificial Analysis 评测中,1.3B 非推理版本仅消耗约 540 万 Token,仅为 Qwen3.5-0.8B 非推理版本的 1/19。这意味着开发者可以用同样的硬件承载更多的线上流量,或者在端侧实现更快的响应速度。 性能与效率的提升主要得益于两项技术创新:一是与清华大学联合研发的 LLaVA-UHD v4 架构,通过 ViT 内部视觉 Token“早压缩”技术,在保持性能的前提下将图像编码计算量降低了 55.8%;二是提供 4 倍和 16 倍混合视觉 Token 压缩模式,开发者可以根据应用场景在性能优先与速度优先之间灵活选择,兼顾高精度文档解析和低算力环境下的实时交互需求。 在高分辨率图像处理方面,MiniCPM-V 4.6 表现突出。处理 3132×3132 分辨率高清大图时,首字响应延迟仅约 75.7 毫秒,较同基座规模的 Qwen3.5-0.8B 快 2.2 倍。在高并发场景下,单张 RTX 4090 显卡每秒可处理 54.79 张 1344×1344 分辨率图片,处理吞吐量约为 Qwen3.5-0.8B 的 1.5 倍。 在开源生态支持方面,MiniCPM-V 4.6 提供了从微调到部署的完整工具链,已适配 ms-swift 和 LLaMA-Factory 等主流微调框架,并支持 vLLM、SGLang、 llama.cpp 和 Ollama 等多个高性能推理框架。开发者只需一张 RTX 4090 等消费级显卡即可完成全流程微调。 IT之家注意到,MiniCPM-V 系列此前已在汽车、PC、手机和智能家居等多个终端场景实现规模化落地,合作伙伴涵盖联想、吉利、上汽大众等数十家行业头部企业。此次 MiniCPM-V 4.6 的开源,将进一步推动多模态大模型在端侧设备的应用效率。 参考资料: Hugging Face: https://huggingface.co/openbmb/MiniCPM-V-4.6 GitHub: https://github.com/OpenBMB/MiniCPM-V ModelScope: https://modelscope.cn/models/OpenBMB/MiniCPM-V-4.6 GitCode: https://ai.gitcode.com/OpenBMB/MiniCPM-V-4.6 Web Demo: https://huggingface.co/spaces/openbmb/MiniCPM-V-4.6-Demo APP Demo: https://github.com/OpenBMB/MiniCPM-V-Apps