WWW.YOUINFO.SITE
标签聚合 日前

/tag/日前

LinuxDo 最新话题 · 2026-06-10 11:15:07+08:00 · tech

日前,老马同志在xAI全员大会指出,到2026年底,人类可能不再需要手写代码,AI将直接生成二进制程序。老马同志表示说,xAI正在研发一款名为Grok Code的编程模型,目标是让AI直接与计算机硬件对话,绕过代码编译环节,从而提高效率,直接生成的机器代码。老马同志强调,这并不是要淘汰码农,而是让重复性、低技术含量的编码工作将由AI接管,而码农将转向更高阶的工作。 佬们,古法编程,手搓代码时代是不是要结束了? 8 个帖子 - 8 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-09 14:36:26+08:00 · tech

被称为电子图书馆的 Z-Library 日前宣布对其镜像网站基础设施进行升级,现在任何人都可以基于 Z-Library 创建自定义品牌、仅限登录访问的镜像站,镜像站托管的数据仍然从主站获取并最新书籍数据库,作为回报,如果用户通过镜像站捐赠加密货币,Z-Library 会向镜像站提供 20% 的捐赠报酬。 应对域名和服务器查封问题: Z-Library 目前托管着千万级别的图书和学术文章可以免费下载,很显然这些内容大部分都存在版权风险,因此在过去 10 年该网站被查封多个域名和服务器,甚至其两名核心运营者都被逮捕 (但在引渡期间跑路从此销声匿迹),但该网站剩余的团队仍然在全球各地匿名运营着 Z-Library。 只不过频繁被扣押域名和查封服务器对 Z-Library 来说也非常困难,所以现在 Z-Library 准备发动社区的力量呼吁大家建立镜像站,镜像站可以选择开启登录访问,只有登录的用户才能访问网站并获取内容,镜像站运营者还可以自定义品牌商标不再使用 Z-Library 图标,也就是内容仍然是 Z-Library 的,但网站从外表看起来似乎与 Z-Library 没有关系。 这种做法可以在短时间内增加大量的 Z-Library 镜像站并确保更多用户可以免费获取图书和学术文章,从 Z-Library 免费精神角度来说这可以继续促进知识共享,而未来版权机构的维权难度将会大幅度增加,毕竟海量镜像站域名既不容易被发现,对版权机构而言法律流程太长成本也非常高。 20% 的报酬与镜像站法律风险: 为激励社区用户搭建白标镜像站,Z-Library 将向镜像站运营者提供 20% 的捐赠报酬,即用户访问镜像站并向镜像站提供的加密货币捐赠链接支付加密货币捐赠时,Z-Library 将会向对应镜像站运营者提供 20% 的捐赠报酬 (当然对白标镜像站而言除非用户量足够大否则捐赠收益非常低)。 然而搭建白标镜像站将存在明确的法律风险,用户使用自己的身份信息注册域名和购买服务器搭建白标镜像站,都意味着网站上的任何内容都由运营者负责,因此产生的任何法律风险都由运营者负责,因此对于大部分用户来说搭建这种白标镜像站都是不合适的。 查看评论

cnBeta全文版 · 2026-06-08 13:05:40+08:00 · tech

微软日前表示,在完成一项针对以色列军方使用其云技术的内部调查后,公司将收紧与国家安全机构合作时的人权管控。该公司4日宣布,已完成上述调查,并将推出一系列新措施,其中包括调整对持有外国政府安全许可员工的内部监督与管理方式。 微软于去年启动这项调查,背景是《卫报》联合以巴媒体“+972 Magazine”和希伯来语媒体“Local Call”披露,以色列军方情报机构8200部队利用微软云平台存储大量被截获的巴勒斯坦电话通话内容。 在调查启动不久后,微软就终止了以色列军方访问其云和人工智能服务,用于支持相关监控项目的权限,初步调查显示8200部队的做法已违反微软的服务条款。 微软在最新公布的调查结果概要中表示,其“事实认定保持不变”,公司将采纳多项建议,以提升“人权治理的有效性”。 这一被称为“最终更新”的公告,被视为微软试图为这段艰难时期画上句号,此前外界高度关注其技术在以色列对加沙的轰炸以及在被占领约旦河西岸行动中的作用。 此前的调查报道指出,8200部队使用微软Azure云平台运行一套高度泛化的监听系统,使情报人员能够每天收集、回放和分析数以百万计巴勒斯坦手机通话内容。 这一情况引发微软高层担忧:公司在以色列子公司的部分员工,可能并未就自身对8200部队使用微软技术情况的了解,向总部保持充分透明。 知情人士透露,内部调查亦审视了微软特拉维夫办公室部分员工在去年10月7日哈马斯袭击以南部地区之后,如何在对公司忠诚与对以色列军方支持之间产生内心冲突。 上月,微软宣布其以色列业务负责人将离职,当地媒体报道,这一人事变动与子公司内部涉及违反微软道德守则的争议有关,另有多名管理层人士也被指已经离开公司。 不过,这些人事变动并未写入微软发布的调查总结文本中。 在这份五页文件中,微软重点列出了多项将落实的制度性措施,包括调整在签署合同前对“国家安全相关”业务的审查方式。 文件还指出,微软将检视其在“特定国家”如何管理员工安全许可,并“进行相应调整,以确保员工理解如何在为微软工作的前提下,处理安全许可所带来的各类要求”。 《卫报》此前报道,参与管理与8200部队项目的多名员工,曾在这一精英监控部队服役或以预备役身份供职,该部队在职能上被普遍视作以色列版的美国国家安全局(NSA)。 除员工管理外,微软还承诺将定期审查敏感客户是否遵守其可接受使用政策,尤其是在出现“新的政治环境或项目敏感性变化”时。 公司同时表示,将在“受冲突影响及高风险地区”强化人权尽职调查流程,以降低技术被用于侵犯人权的风险。 微软方面一再强调,包括首席执行官萨提亚·纳德拉在内的最高管理层,此前并不知晓8200部队使用Azure存储截获的巴勒斯坦通信内容。 公司同时重申,不会向任何一方提供用于对平民进行大规模监控的技术。 然而,相关披露已经在微软内部及外部引发连锁反应。 去年,《卫报》报道曝光后,微软位于美国总部和一家欧洲数据中心先后遭遇抗议活动,要求公司停止向以色列军方提供技术支持。 股东、非政府组织以及由员工发起的“No Azure for Apartheid”行动团体,随后也不断施压,要求微软在与以色列军方客户的业务往来上提高透明度。 本周,该团体又在微软于旧金山举办的年度大会期间发起新一轮抗议。 在会场外,示威者打出“微软为种族灭绝提供动力”“立即切断与以色列关系”等标语,以此谴责公司在以色列军事行动中的角色。 在外界目光聚焦之下,微软此次通过完善内部管控和人权治理机制,试图平衡商业利益、国家安全合作与人权责任之间的紧张关系,但其具体执行效果和外界反应仍有待进一步观察。 查看评论

cnBeta全文版 · 2026-06-07 23:35:08+08:00 · tech

Firefox 浏览器日前在开发分支中正式合并了对 Vulkan Video 的初步支持,为这一主流开源浏览器引入了新的 GPU 视频硬件解码路径,被视为 Mozilla 在加速视频播放体验方面的一项重要进展。 长期以来,Linux 平台上的 Firefox 主要依赖 Video Acceleration API(VA-API)进行硬件解码,但 VA-API 并未在所有图形驱动上得到广泛、一致的支持,这不仅给 NVIDIA 用户带来额外适配成本,也使许多基于 Arm 的嵌入式设备在视频加速方面被边缘化。 在此背景下,社区此前不得不通过诸如 NVIDIA-VAAPI-Driver 之类的方案,将 NVIDIA 的 NVDEC 接口通过一层适配暴露为 VA-API,以便在 Firefox 中启用 GPU 加速播放,这类间接方案在稳定性和维护成本方面都存在一定局限。 随着 Khronos 推动的 Vulkan Video 规范逐步成熟并获得更多驱动实现支持,它开始以更跨平台的方式进入 Linux 图形生态,为浏览器等应用提供了一条绕过 VA-API 限制的新路径。 今年 3 月,针对 Firefox 缺乏 Vulkan Video 支持的问题,社区在 Mozilla Bugzilla 上提交了相关缺陷报告,并在随后的数月里推动实现落地。 近期,随着相关补丁在 Firefox 代码库中完成合并,这一 Bug 报告已正式标记为关闭,意味着 Vulkan Video 解码支持已进入主干代码并具备进入正式版本的条件。 按 Mozilla 目前的发布节奏,计划于 7 月发布的 Firefox 153 将成为首个默认提供 Vulkan Video 解码能力的版本。来自 NVIDIA 的工程师 Tymur Boiko 和 Red Hat 的 Martin Stransky 是该功能合入过程中的主要贡献者,他们在 Firefox Git 仓库中持续推进 Vulkan Video 相关代码,最终在本周完成关键合并。 按规划,Firefox 153.0 预计将于 7 月 21 日正式发布,如无最后时刻的重大问题,这一版本将面向用户开放 Vulkan Video 硬件解码支持。 对于 Linux 用户而言,Vulkan Video 的加入意味着 Firefox 在硬件加速视频播放方面将更具通用性和可移植性,有望减少依赖特定 API 或第三方适配层带来的兼容性不确定性。 尤其是在小型 Arm 设备和嵌入式平台上,随着 Vulkan Video 的进一步普及,Firefox 将有机会在更多类型的 GPU 驱动上实现高效的视频解码,为流媒体播放、网页多媒体内容等场景提供更流畅的体验。 查看评论

cnBeta全文版 · 2026-06-07 16:35:36+08:00 · tech

日前,Intel发布了一款特殊的至强6377P,属于Raptor Lake 13代酷睿家族,配备12核心、36MB缓存,睿频高达5.7GHz,TDP仅为95W。如今,Intel产品库内又多了两款同属13代酷睿家族的新品,也都是二代酷睿系列的一份子,分别叫做——酷睿7 230H、酷睿5 205H。 对比此前已有的酷睿7 240H、酷睿5 210H,二者唯一的变化就是取(ping)消(bi)了核显,因此必须搭配独立显卡。 酷睿7 230H 6P+4E 10核心16线程,三级缓存24MB,最高睿频5.2GHz。 酷睿5 205H 4P+4E 8核心12线程,三级缓存12MB,最高睿频4.8GHz。 二者均支持双通道DDR5-5200、DDR4-3200、LPDDR5/5X-2500、LPDDR4X-4267内存,最大容量96GB,基础功耗45W,可调范围35-115W。 说起来,Intel这个时候发布这么两款特殊的产品,想来一是处理核显不合格的瑕疵品,二是方便厂商重新做DDR4笔记本。 但是,二代酷睿200H系列本来就是面向低端笔记本的,它们又必须配个独显,成本不菲,有违初衷。 更何况,现在已经有了更先进、同样低端的三代酷睿(Wildcat Lake)。 所以,实在搞不懂。 查看评论

cnBeta全文版 · 2026-06-07 14:35:07+08:00 · tech

据宝马官方日前宣布,比利时物流巨头Katoen Natie与宝马集团Belux签署了一项大规模采购协议, 一次性订购1000台纯电动车,创下比利时历史上最大的纯电企业车队订单纪录。 此次订单涵盖宝马及MINI品牌的纯电车型,包括基于新世代平台打造的全新iX3和i3。 Katoen Natie表示,这批纯电车辆将用于替换公司现有燃油车队, 预计每年可减少3350吨CO 2 排放,同时大幅降低燃油消耗成本。 据了解,Katoen Natie成立于1854年,总部位于比利时安特卫普,是全球领先的港口运营和物流仓储服务商,业务遍及多个国家和地区。此次大手笔采购纯电车队,是该公司脱碳战略的重要一步。 对宝马而言,这笔订单的象征意义同样不小。回看2025年全年,宝马集团纯电动车型交付量达442072辆,同比增长3.6%,占集团总交付量的17.9%; 若算上插电式混合动力车型,电动化车型总交付量达642071辆,相当于每四辆宝马集团售出的新车中就有一辆是电动化车型。 截至2025年6月,宝马累计纯电交付已突破150万辆,并预计于2026年突破200万辆大关。 进入2026年,在欧洲七大汽车制造商中,宝马集团2026年1至4月的纯电车型注册占比高达26%,位居首位。 全新iX3作为新世代平台的首款车型,今年一季度在欧洲斩获超过5万辆订单,带动宝马纯电订单同比增长40%。 此次拿下比利时史上最大纯电企业订单,也印证了宝马在纯电2B市场的竞争力。 值得注意的是,Katoen Natie此次订购的全新iX3和i3均基于宝马新世代平台打造。其中iX3搭载双电机四驱系统,最大功率463马力,续航里程超过600公里(WLTP工况),支持400kW超快充; i3作为新世代平台第二款纯电车型,同样在续航和智能化方面有大幅提升。新世代车型在产品力上的跃升,也是企业客户愿意下大单的底气所在。 查看评论

IT之家 · 2026-06-06 11:47:48+08:00 · tech

IT之家 6 月 6 日消息,据《每日经济新闻》报道,日前,比亚迪自研人形机器人的消息引发广泛关注。网传其自研人形机器人代号“尧舜禹”,计划于 2026 年在内部部署 2 万台。 对此,该记者向比亚迪方面求证,对方表示:“‘比亚迪人形机器人代号尧舜禹’‘第七代原型机在深圳和长沙工厂实地测试’‘约 150 台上岗,目标年内自用 2 万台’等消息均不属实。” IT之家注意到,比亚迪集团执行副总裁李柯此前在一档访谈节目中明确表示:“ 比亚迪也在开发人形机器人 。机器人的竞争在于谁有最强的制造能力、软件和硬件,而汽车相关 AI 能力与机器人有同源性,如果有一天我们认为机器人可以走向家庭,就可以通过经销商网络售卖比亚迪的机器人。” 李柯提到,比亚迪可以做一个开放的平台,既可以是比亚迪自己做机器人,也可以是跟其他企业合作的机器人。 综合IT之家此前报道,李柯还表示,从现在的机器人市场来看, 中国的机器人就是缺一个大脑 ,那美国的机器人大脑很发达但四肢不发达,所以未来要实现大脑和四肢都发达的真正可用的机器人。

cnBeta全文版 · 2026-06-05 18:05:06+08:00 · tech

OpenAI方面表示,将遵守美国总统唐纳德·特朗普日前签署的有关人工智能模型发布前审查的行政命令,并同意在模型正式对外推出前接受联邦政府的能力评估。 OpenAI负责各国事务的负责人乔治·奥斯本在接受美国财经媒体采访时证实,公司将签署这一带有自愿性质的行政命令,并参与相关评估流程。他表示,“民主政府在这种技术如何被使用和部署方面理应发挥重要作用”。 奥斯本是在伦敦举办的西南偏南(SXSW)活动期间接受采访时作出上述表态的。他强调,OpenAI对自身责任“非常严肃”,并称:“作为一家掌握非常强大、前沿人工智能模型的领先实验室,我们不会被动等待要求。”他补充说,公司正“主动向各国政府提出建议,帮助其持续跟踪安全与安保相关问题,这不仅限于美国,还包括更广泛的国际范围”。 根据特朗普周二签署的这份行政命令,联邦政府可以在人工智能模型正式发布前30天获取相关访问权限。命令要求企业参与一项基准测试流程,以评估模型在网络能力等方面的“先进程度”,并据此确定何时应将某一模型界定为“受监管的前沿模型”。 这份命令被视为特朗普政府推动前沿人工智能发展与国家安全之间平衡的一项举措,意在在不完全扼杀创新的前提下,为大模型的能力设定最低监管门槛。鉴于大模型在网络攻防、情报分析、自动化攻击等场景中潜在的军事与安全用途,如何界定“前沿模型”的监管边界正成为各国政策制定者的共同议题。 曾在2010年至2016年担任英国财政大臣的奥斯本指出,各国政府在监管人工智能时“必须足够聪明”。他表示,OpenAI向各国政府提出的建议之一,是建立“强有力但具备高度灵活性”的监管机构,以便这些机构可以随着技术发展调整监管方式和标准。 奥斯本的表态显示,在美国联邦层面强化审查压力的背景下,OpenAI选择以合作姿态回应监管,而非与政府对抗。在人工智能快速演进、各国争相制定AI规则的阶段,如何在安全、创新与国家利益之间取得平衡,仍将是OpenAI与各国政府互动的核心议题。 查看评论

cnBeta全文版 · 2026-06-05 14:06:14+08:00 · tech

游戏开发商 Epic Games 日前向美国联邦最高法院提交文件,要求法院驳回苹果就双方反垄断诉讼所提起的两项上诉请求,认为苹果的法律主张“完全错误”,如果被采纳将推翻此前案件中对苹果不利的关键部分。 这起缠斗多年的“苹果诉 Epic”案件再起波澜。苹果此前向最高法院提出请求,称下级法院在两个重要方面“搞错了”:一是针对其 App Store “反引流(anti‑steering)”规则所作出的禁令超出了案件本身的范围;二是下级法院以违反法律“精神”而非“文字”为由认定苹果违规,这种做法不符合法律适用方式。苹果主张,法院不应以所谓“立法精神”来判断禁令是否被违反,而应以禁令的具体文字为准。 Epic 在最新提交的 35 页意见书中逐条反驳苹果观点,试图说服最高法院不予受理苹果的请求。针对“精神 vs. 文字”的争议,Epic 引用第九巡回上诉法院的裁定指出,该法院从未在“禁令文字允许苹果抽佣,但禁令精神禁止抽佣”的前提下认定苹果藐视法庭,而是根据禁令本身的表述及苹果后续的实施方式作出判断。 在原案中,法院对苹果的反引流行为发布禁令,要求其不得阻止开发者在应用内引导用户使用其他支付方式。苹果随后按要求拆除了原有的反引流规则,但又通过新的权限与审核机制,对开发者引导用户跳转外部支付的方式施加限制,并引入新的佣金安排。法院此前认定,苹果虽在形式上履行了禁令,但在实质效果上仍对引流行为形成阻碍,因此构成对禁令“精神”的违反。Epic 则在本次意见中否认这种认定属于“仅依据精神”的裁判路径,而强调这是对禁令完整效力的正常适用。 第二个争议焦点是所谓 CASA 判例所确立的例外问题。苹果辩称,本案并非集体诉讼,因此依据 CASA 判例,原先对其作出的禁令应当仅限于对 Epic 生效,不应扩展至更广泛的开发者群体;据此,苹果认为第九巡回法院实际上为 CASA 创设了一个例外。Epic 在文件中则直指苹果这一说法“难以理解”,并引用第九巡回法院的原文称,该院在判断禁令范围时仍然适用的是 CASA 确立的标准,即“关键在于禁令能否为当前在法院面前的原告提供完整救济”。Epic 认为,这一标准并未被突破,也谈不上出现所谓“CASA 例外”。 围绕禁令是否应仅保护 Epic 还是应产生更广泛市场影响的争议,直接关系到苹果在 App Store 生态中未来可以维持的规则边界,因此也成为双方在最高法院阶段争夺的重点。如果最高法院接受苹果关于禁令范围和适用标准的主张,可能会削弱甚至推翻现有对苹果不利的关键限制条款;这也是 Epic 急于通过强硬措辞说服最高法院拒绝受理的原因。 在最新报道中,作者也强调自己并非法律专业人士,并指出最终如何处理苹果的上诉,将由最高法院决定。按照目前进度估计,最高法院最早可能在今年 6 月就是否受理及相关程序作出决定,这也将为这场旷日持久的“苹果 vs. Epic”之战的下一阶段定下基调。 查看评论

cnBeta全文版 · 2026-06-05 02:05:10+08:00 · tech

日前,中国移动国际漫游公众号发布《关于中国移动香港(CMHK)将实施网络调整的公告》。公告显示, 因中国移动香港将于2026年6月23日起实施网络调整,届时将不再支持2G/3G业务。 中国移动提醒,若用户手机注册在CMHK网络,请确保上网功能及VoLTE功能均处于正常开通状态。 同时,中国香港出访一卡多号、周套餐、日套餐用户,也需确保国际及中国港澳台漫游功能已申请开通,以保证通话、短信及上网功能正常使用。 据了解,早在2025年6月30日,中国移动香港就已终止提供3G服务,以便将资源集中投入5G及更先进网络技术发展。 同年12月,中国移动香港宣布,将于2026年6月23日终止提供2G服务。 中国移动香港表示, 随着市场对2G服务需求持续下降,截至2025年11月,其2G用户占整体移动客户总数已不足2.3%。 值得一提的是,2023年11月,工信部在答复网友关于保障老旧手机用户基础通信功能的建议时曾表示,2G/3G退网是移动通信网更新换代的必然选择,也是当前国际上的主要做法。 不过,工信部同时强调, 移动通信退网并不是简单地“说退就退”,需要完善用户保障措施,在充分保障用户权益的前提下,才能实施退网。 查看评论

IT之家 · 2026-06-04 18:00:54+08:00 · tech

IT之家 6 月 4 日消息,亚马逊日前发布完全自主仓储机器人 Proteus 的新版本,可以 通过自然语言接受指令 ,不再需要员工用代码或专门软件进行操作。随着自动化转型加速,亚马逊正在把更多仓库工作交给机器人完成。亚马逊表示,AI 升级后,员工可以 像安排同事工作一样 ,直接给 Proteus 分配任务。过去,员工需要通过专门软件控制 Proteus。 Proteus 贴近地面,外形像乌龟, 主要负责重物搬运 ,并在亚马逊仓库内移动大型推车。亚马逊机器人 VP 斯科特 · 德雷瑟表示:“你告诉 Proteus 需要做什么。Proteus 会 自己判断优先级、路线和时间安排 。” 下一代 Proteus 的活动范围也会大幅扩大。亚马逊表示,现有 Proteus 只在装卸区运行,而新系统“ 可以在任何需要移动物品的地方工作 ”。Proteus 未来可负责运输刚抵达站点的容器,在不同工位之间转移容器,并在履约中心和配送站点协助员工。 据IT之家了解,新系统目前仍在亚马逊实验室试点,亚马逊计划在 2027 年上半年把新一代 Proteus 部署到欧洲。 Proteus 只是亚马逊机器人路线图的一部分。亚马逊还计划在未来一年把具备触觉能力的机器人 Vulcan,以及最早在巴塞罗那试点的协作式周转箱处理系统,推广到欧洲更多站点。 亚马逊强调,自动化技术也在“创造新岗位”,并称自从在运营中引入机器人以来,亚马逊已在全球 招聘数十万名员工 。机器人是为了支持员工、提高运营效率, 而不是去取代这数十万名员工的 。

LinuxDo 最新话题 · 2026-06-04 17:36:59+08:00 · tech

OpenAI CEO Sam Altman 在日前的企业活动中透露,目前公司内部消耗token最多的用户,每月的使用量高达约 1000 亿。 有趣的是,Altman 发现外部竟然还有人比内部记录用得更多,这让他个人感到有些“尴尬”。他指出,大约六年半前,OpenAI 月消耗量最高的用户也仅使用 10 万个 token,这在当时已是全球领先水平,而如今它已退化为全球的人均平均水平。 尽管 OpenAI 内部流行着一种积极使用和消耗 token 的文化,但 AI 运行的账单正在急剧膨胀。Altman 坦言,在 2026 年初,成本问题还很少被客户提起,但现在它已骤然演变成一个“巨大问题”。为此,公司正致力于优化和改进模型,希望能找到用更低支出为用户提供更多价值的有效方法。 Source: Sam Altman Says OpenAI's Top Token Spender Burns 100 Billion a Month - Business Insider 9 个帖子 - 7 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-04 16:41:55+08:00 · tech

高考即将来临,“高考期间AI工具将禁用”的话题日前引发网络热议。豆包、腾讯元宝、科大讯飞等平台纷纷作出回应:考试期间暂停拍题识图、试题解答、试卷解析等功能,全力维护高考公平公正。 《 教育新观察丨高考期间禁用AI工具,守住公平底线,引导独立思考》,解放日报,20260602 之前也看到有许多讨论禁止未成年人使用AI玩角色扮演的相关新闻。 感觉如何引导未成年人使用AI这个问题还真是挺复杂,一方面要鼓励青少年多使用AI,培养提升他们与AI协作的能力,但盲目的使用确实也会带来许多问题 7 个帖子 - 6 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-04 13:36:35+08:00 · tech

Google日前发布并开源 Gemma 4 12B 版多模态模型,该模型的开发目标是让消费级设备也可以在本地运行 AI 模型,根据Google的测试,该模型可以在 16GB 内存 / 显存的笔记本电脑和台式机上运行,这得益于 12B 的小规模参数,但该模型的智能化程度比肩 Gemma 26B 版模型。 模型优势包括: 全新统一架构:无需多模态编码器,直接支持文本、图片、视频和音频输入。 高级推理功能:基准性能接近 Gemma 26B 版混合专家架构模型,可以在本地提供多步骤推理。 内存要求较低:只需要 16GB 的内存或显存即可在本地运行,当然内存越大性能也会更好。 模型开源发布:该模型采用 Apache 2.0 许可证发布,Google和社区也提供完善的开发者生态系统支持。 预测选型器:Gemma 4 12B 版配备多种 Token 预测选型器,可以有效减少延迟。 有关模型的更多介绍: Gemma 4 12B 在标注基准测试中的智能化程度接近Google此前开源发布的 26B MoE 混合架构模型,但 12B 版内存要求非常低,可以直接在配备 16GB 内存或显存的消费级笔记本电脑和台式机上运行,让用户可以在本地体验强大的多模态和智能体交互体验。 该模型的突出优势还包括简化图片、视频、音频输入处理方式,传统的多模态模型通常依赖独立的编码器来转换图像和音频,然后再将转换后的表示传递给语言模型,由于这些分离式编码器会增加延迟和内存占用,所以Google使用无编码器架构训练 Gemma 4 12B 模型,让模型可以直接整合音频和视觉输入。 视觉方面:使用轻量级的嵌入模块替换 Gemma 4 视觉编码器,该模块仅包含 1 次矩阵乘法、位置嵌入和归一化操作,这让模型主干网络可以直接接管视觉处理。 音频方面:Google完全移除了音频编码器,将原始音频信号投射到与文本标记相同的维度空间中。 体验和下载模型: 目前 Gemma 4 12B 版已经在多个平台提供,有兴趣的开发者可以在 Ollama 等中直接体验,也可以前往 HuggingFace 或 Kaggle 下载模型权重文件,开发者还可以使用 Unsloth 进行高效微调定制自己需要的版本。 Ollama: https://ollama.com/library/gemma4 HuggingFace: https://huggingface.co/collections/google/gemma-4 Unsloth: https://unsloth.ai/docs/models/gemma-4 查看评论

V2EX - 技术 · 2026-06-03 18:57:20+08:00 · tech

MiMo-V2.5-Pro 是什么? MiMo-V2.5-Pro 是一个拥有 1.02 万亿参数的混合专家模型,其中包含 420 亿个激活参数,基于混合注意力架构构建,上下文窗口长度达 100 万 token 。其通用智能体能力、复杂软件工程能力和长周期任务处理能力均显著提升。此外,其模糊指令理解能力也实现了重大飞跃。 在内部测试中,V2.5-Pro 展现出了全新的智能水平,这反过来促使我们的研究人员重新思考与它的协作方式。当搭配适当的框架时,V2.5-Pro 能够处理跨越上千次工具调用的复杂、长周期任务。 我们还观察到在代理场景中指令跟随能力的显著提升。它能够可靠地遵循上下文中隐含的细微要求,并在超长上下文中保持强大的连贯性。 Mimo 2.5 是一系列先进的 MoE 模型,其特点包括 1M 上下文窗口、多模态功能以及极高的缓存命中率等诸多优势。总体上用户体验还挺好的。 如何免费使用此模型? 要免费体验/使用 MiMo-V2.5-pro ,有一个方法是申请 mimo 100T Orbit 活动的资格,但这个申请不一定能审核通过,而且申请过程有些麻烦。 Langcli 于 6 月 3 日成功加入了 Xiaomi MiMo Agent Ecosystem Program 。Xiaomi MiMo 给 Langcli 的用户提供为期 2 周的免费试用体验,包括 Mimo-2.5 和 MiMo-2.5-pro 模型;截止免费体验时间是北京时间 6 月 17 日 。 备注: Langcli 是一个开源的 AI 编程助手,支持在终端下使用 以及 ACP 协议(可在 zed 、vscode 、obsidian 等应用下使用)。特点包括:100%兼容 claude code; 支持主流的 LLM 模型(包括 Claude OPUS 4.6, Deepseek v4 flash, Deepseek v4 pro, GLM 5.1, Kimi K2.6, Minimax M2.5, Mimo 2.5 pro 等) 创业不易,恳请轻拍。

V2EX - 技术 · 2026-06-03 17:57:20+08:00 · tech

MiMo-V2.5-Pro 是什么? MiMo-V2.5-Pro 是一个拥有 1.02 万亿参数的混合专家模型,其中包含 420 亿个激活参数,基于混合注意力架构构建,上下文窗口长度达 100 万 token 。其通用智能体能力、复杂软件工程能力和长周期任务处理能力均显著提升。此外,其模糊指令理解能力也实现了重大飞跃。 在内部测试中,V2.5-Pro 展现出了全新的智能水平,这反过来促使我们的研究人员重新思考与它的协作方式。当搭配适当的框架时,V2.5-Pro 能够处理跨越上千次工具调用的复杂、长周期任务。 我们还观察到在代理场景中指令跟随能力的显著提升。它能够可靠地遵循上下文中隐含的细微要求,并在超长上下文中保持强大的连贯性。 Mimo 2.5 是一系列先进的 MoE 模型,其特点包括 1M 上下文窗口、多模态功能以及极高的缓存命中率等诸多优势。总体上用户体验还挺好的。 如何免费使用此模型? 要免费体验/使用 MiMo-V2.5-pro ,有一个方法是申请 mimo 100T Orbit 活动的资格,但这个申请不一定能审核通过,而且申请过程有些麻烦。 Langcli 于 6 月 3 日成功加入了 Xiaomi MiMo Agent Ecosystem Program 。Xiaomi MiMo 给 Langcli 的用户提供为期 2 周的免费试用体验,包括 Mimo-2.5 和 MiMo-2.5-pro 模型;截止免费体验时间是北京时间 6 月 17 日 。 备注: Langcli 是一个开源的 AI 编程助手,支持在终端下使用 以及 ACP 协议(可在 zed 、vscode 、obsidian 等应用下使用)。特点包括:100%兼容 claude code; 支持主流的 LLM 模型(包括 Claude OPUS 4.6, Deepseek v4 flash, Deepseek v4 pro, GLM 5.1, Kimi K2.6, Minimax M2.5, Mimo 2.5 pro 等) 创业不易,恳请轻拍。

V2EX - 技术 · 2026-06-03 16:57:20+08:00 · tech

MiMo-V2.5-Pro 是什么? MiMo-V2.5-Pro 是一个拥有 1.02 万亿参数的混合专家模型,其中包含 420 亿个激活参数,基于混合注意力架构构建,上下文窗口长度达 100 万 token 。其通用智能体能力、复杂软件工程能力和长周期任务处理能力均显著提升。此外,其模糊指令理解能力也实现了重大飞跃。 在内部测试中,V2.5-Pro 展现出了全新的智能水平,这反过来促使我们的研究人员重新思考与它的协作方式。当搭配适当的框架时,V2.5-Pro 能够处理跨越上千次工具调用的复杂、长周期任务。 我们还观察到在代理场景中指令跟随能力的显著提升。它能够可靠地遵循上下文中隐含的细微要求,并在超长上下文中保持强大的连贯性。 Mimo 2.5 是一系列先进的 MoE 模型,其特点包括 1M 上下文窗口、多模态功能以及极高的缓存命中率等诸多优势。总体上用户体验还挺好的。 如何免费使用此模型? 要免费体验/使用 MiMo-V2.5-pro ,有一个方法是申请 mimo 100T Orbit 活动的资格,但这个申请不一定能审核通过,而且申请过程有些麻烦。 Langcli 于 6 月 3 日成功加入了 Xiaomi MiMo Agent Ecosystem Program 。Xiaomi MiMo 给 Langcli 的用户提供为期 2 周的免费试用体验,包括 Mimo-2.5 和 MiMo-2.5-pro 模型;截止免费体验时间是北京时间 6 月 17 日 。 备注: Langcli 是一个开源的 AI 编程助手,支持在终端下使用 以及 ACP 协议(可在 zed 、vscode 、obsidian 等应用下使用)。特点包括:100%兼容 claude code; 支持主流的 LLM 模型(包括 Claude OPUS 4.6, Deepseek v4 flash, Deepseek v4 pro, GLM 5.1, Kimi K2.6, Minimax M2.5, Mimo 2.5 pro 等) 创业不易,恳请轻拍。

V2EX - 技术 · 2026-06-03 16:57:20+08:00 · tech

MiMo-V2.5-Pro 是什么? MiMo-V2.5-Pro 是一个拥有 1.02 万亿参数的混合专家模型,其中包含 420 亿个激活参数,基于混合注意力架构构建,上下文窗口长度达 100 万 token 。其通用智能体能力、复杂软件工程能力和长周期任务处理能力均显著提升。此外,其模糊指令理解能力也实现了重大飞跃。 在内部测试中,V2.5-Pro 展现出了全新的智能水平,这反过来促使我们的研究人员重新思考与它的协作方式。当搭配适当的框架时,V2.5-Pro 能够处理跨越上千次工具调用的复杂、长周期任务。 我们还观察到在代理场景中指令跟随能力的显著提升。它能够可靠地遵循上下文中隐含的细微要求,并在超长上下文中保持强大的连贯性。 Mimo 2.5 是一系列先进的 MoE 模型,其特点包括 1M 上下文窗口、多模态功能以及极高的缓存命中率等诸多优势。总体上用户体验还挺好的。 如何免费使用此模型? 要免费体验/使用 MiMo-V2.5-pro ,有一个方法是申请 mimo 100T Orbit 活动的资格,但这个申请不一定能审核通过,而且申请过程有些麻烦。 Langcli 于 6 月 3 日成功加入了 Xiaomi MiMo Agent Ecosystem Program 。Xiaomi MiMo 给 Langcli 的用户提供为期 2 周的免费试用体验,包括 Mimo-2.5 和 MiMo-2.5-pro 模型;截止免费体验时间是北京时间 6 月 17 日 。 备注: Langcli 是一个开源的 AI 编程助手,支持在终端下使用 以及 ACP 协议(可在 zed 、vscode 、obsidian 等应用下使用)。特点包括:100%兼容 claude code; 支持主流的 LLM 模型(包括 Claude OPUS 4.6, Deepseek v4 flash, Deepseek v4 pro, GLM 5.1, Kimi K2.6, Minimax M2.5, Mimo 2.5 pro 等) 创业不易,恳请轻拍。