WWW.YOUINFO.SITE
标签聚合 N3

/tag/N3

v2ex · 2026-06-11 22:14:10+08:00 · tech

API Key:tp-c0x5wrgpqqjm1fhtp74758tmesl3lun3eu4xlvvxbwanwfee Base URL 兼容 OpenAI 接口协议: https://token-plan-cn.xiaomimimo.com/v1 兼容 Anthropic 接口协议: https://token-plan-cn.xiaomimimo.com/anthropic ipad 党方便测试蹬入口: https://vb.do/dashboard?autosubmit=true#prompt=hello&providerId=mi&providerName=MI&providerProtocol=openai-compatible&baseUrl=https%3A%2F%2Ftoken-plan-cn.xiaomimimo.com%2Fv1&modelId=mimo-v2.5&modelName=mimo+v2.5

LinuxDo 最新话题 · 2026-06-11 17:22:41+08:00 · tech

由于测试的模型越积越多了,表格会删除一些同厂商的旧模型,你可以在之前的评测帖子里找到它们的成绩。 项目 这是一个 Unity C# 项目,我进行测试的是一份皮肤系统需求案,我已经做了好预制体,而模型需要编写代码。 本轮与上两轮评测的项目和环境都完全一致: 第一轮 … 上一轮 模型来源 Claude 系列模型: 官方 API Mimo V2.5 系列模型: 官方 Token Plan Hy3 Preview: 官方 API Qwen3.7 系列模型: 官方 API Minimax M3: 官方 API Nex-N2-Pro: OpenRouter Free API Nemotron 3 Ultra: OpenRouter Free API 速度 排名 模型 时间(分钟) 备注 1 Grok 4.20 0309 Reasoning 3 2 Step-3.5-Flash 6 3 Mimo V2 Omni 7 4 Doubao-Seed-2.0-Lite 7 5 Doubao-Seed-2.0-Pro 9 6 Doubao-Seed-2.0-Code 9 7 Qwen3-Coder-Next 9 8 Claude Sonnet 4.6(high) 9 9 Qwen3.5-Plus 9 10 GLM-5 Turbo 10 11 Minimax M2.7 10 Highspeed 版本 12 Qwen3.5-Flash 10 13 Gemini 3 Pro 11 14 Hy3 Preview 13 15 GPT-5.5(low) 13 16 GPT-5.5(medium) 15 17 Mimo V2 Pro 15 18 DeepSeek V4 Flash 17 19 Qwen3.7-Plus 17 20 Qwen3.7-Max 18 21 GPT-5.5(high) 19 22 Claude-Opus-4.7(Max) 20 23 GLM-5 20 24 DeepSeek V4 Pro 21 25 Gemini 3 Flash 22 26 Claude-Fable-5(xhigh) 23 27 Mimo V2.5 24 28 KAT-Coder-Pro V2 24 29 Minimax M3 25 30 Claude-Opus-4.6(Max) 26 31 GPT-5.5(xhigh) 28 32 Gemini 3.1 Pro(high) 29 受 429 请求频率限制影响 33 Claude-Opus-4.8(Max) 33 34 Kimi K2.6 33 35 Qwen3.5 9B GGUF Q4_K_XL 35 MBP M4 Pro 48GB 本地部署 36 Qwen3.5 35B A3B GGUF Q4_K_XL 36 MBP M4 Pro 48GB 本地部署 37 Mimo V2.5 Pro 37 令牌数 Claude-Fable-5(xhigh): 7.1M Claude-Opus-4.8(Max): 13M Mimo V2.5 Pro: 未知 Mimo V2.5: 未知 Hy3 Preview: 1.4M Qwen3.7-Max: 4.6M Qwen3.7-Plus: 4.2M Minimax M3: 未知 Nex-N2-Pro: 退赛 Nemotron 3 Ultra: 退赛 代码行数 Claude-Fable-5(xhigh): +1520, -7 Claude-Opus-4.8(Max): +1347, -22 Mimo V2.5 Pro: +1682, -14 Mimo V2.5: +1270, -8 Hy3 Preview: +1246, -8 Qwen3.7-Max: +1529, -6 Qwen3.7-Plus: +1532, -7 Minimax M3: +2284, -137 Nex-N2-Pro: 退赛 Nemotron 3 Ultra: 退赛 完成度 Claude-Fable-5(xhigh) 审查结论: 完成度非常高,仅有一个细节问题。 详细 (点击了解更多详细信息) Claude-Opus-4.8(Max) 审查结论: 完成度很高,虽然存在常见错误,但在最后列出了该处理需要确认;另有一个细微实现不一致。 详细 (点击了解更多详细信息) Mimo V2.5 Pro 审查结论: 存在常见错误,有几处与需求/线上实现不一致的功能缺失。 详细 (点击了解更多详细信息) Mimo V2.5 审查结论: 无法编译,且存在严重的功能错误和与需求/线上实现不一致的功能缺失。 详细 (点击了解更多详细信息) Hy3 Preview 审查结论: 无法编译,且存在严重的功能错误和与需求/线上实现不一致的功能缺失。 详细 (点击了解更多详细信息) Qwen3.7-Max 审查结论: 较多功能错误和与需求/线上实现不一致的功能缺失。 详细 (点击了解更多详细信息) Qwen3.7-Plus 审查结论: 无法编译,且存在严重的功能错误和与需求/线上实现不一致的功能缺失。 详细 (点击了解更多详细信息) Minimax M3 审查结论: 存在部分功能错误和与需求/线上实现不一致的功能缺失;但在最后特别说明了协议枚举值调整的破坏性和服务器需要同步更新枚举值这一点,显示了对问题的理解。 详细 (点击了解更多详细信息) 最终总结 排名 模型/层级 说明 Tier 0 该等级的模型实现与线上基线高度一致。 1 Claude-Fable-5 2 GPT 5.5(xhigh) Tier 1 该等级的模型的代码正确完整且可编译,仅少量边界问题或轻微不一致。 3 Claude Opus 4.8(Max) 4 GPT 5.5(high) 5 Kimi K2.6 6 GPT 5.5(low) 7 GPT 5.5(medium) 8 Claude Opus 4.6(Max) 9 Claude Sonnet 4.5 Tier 2 该等级的模型的代码至少可编译或仅极少量的语法错误,但是存在明显功能错误、遗漏或与需求/线上不一致。 10 GLM 5.1 11 Minimax M3 12 Mimo V2.5 Pro 13 GLM 5 14 Kimi K2.5 15 Claude Sonnet 4.6(high) 16 Qwen3.7-Max 17 Qwen3.5-Plus 18 KAT-Coder-Pro V2 19 DeepSeek V4 Pro(max) Tier 3 该等级的模型的问题很多且无法编译,或者存在不少幻觉。 20 DeepSeek V4 Flash(max) 21 Claude Opus 4.7(Max) 22 Qwen3.7-Plus 23 Mimo V2.5 24 Hy3 Preview 25 GLM 5 Turbo 26 Gemini 3.1 Pro(high) 27 Mimo V2 Pro 28 Mimo V2 Omni 29 Minimax M2.7 30 Step-3.5-Flash 31 Qwen3-Coder-Next 32 Gemini 3 Pro 33 Gemini 3 Flash 34 Doubao-Seed-2.0-Code 35 Doubao-Seed-2.0-Pro 36 Doubao-Seed-2.0-Lite 37 Qwen3.5-Flash 38 Qwen3.5 35B A3B GGUF Q4_K_XL 39 Qwen3.5 9B GGUF Q4_K_XL 40 Grok 4.20 0309 Reasoning Claude-Fable-5(xhigh): 速度超过 Claude-Opus-4.6(max) 与 GPT-5.5(xhigh) 完成度非常高与 GPT-5.5(xhigh) 相当,仅存在一个体验细节问题 终于 Claude 站起来了,不仅是 Claude 的首个 T0 模型,且接替 GPT-5.5 成为榜首。 当然我要重申,它们都能比较完整地做完这个需求,能力差不多,所以是按照模型发布日期来排名的(虽然它其实比 GPT-5.5 要快)。 我已经有点怀疑是否应该将评审员从 GPT-5.5 换为 Claude-Fable-5 了。 Claude-Fable-5 在做完需求后还有一段 “需向你确认的事项”,对某些奇怪的实现细节(比如皮肤配置枚举 值与服务器枚举值不同、时间戳单位猜测)还有自己不确定的地方进行了汇总,给人的感觉是对于这个需求它游刃有余, 一切尽在掌握;需求未说明自己决定的地方都放在最后列出以进行核对,这是比较难得的。 但是 Claude-Fable-5 的安全方面确实非常敏感,测完之后,正好我在做的 VS Code 扩展有一个大需求, 使用 AI 完成后怕遗漏会再用 AI 审查一遍,但 GPT-5.5 会经典地出现自己审查自己永远有问题的情况, 于是我想使用 Fable-5 审查一下,但是由于存在类似反代的功能,Fable-5 思考一半后直接拒绝了, 甚至我还没有要求它编写代码,而 GPT-5.5 对此是完全没有问题的。 后续我会尝试使用 Claude-Fable-5 替代 GPT-5.5 作为我的主力模型,看看它是否真的比 GPT-5.5 更好。 Claude-Opus-4.8 的速度几乎和我之前测试本地部署的模型一样了,对比 Claude-Fable-5,慢了接近 10 分钟, 需要注意的还有消耗的令牌数,Claude-Opus-4.8 消耗的令牌数是 Claude-Fable-5 的将近两倍, 一来一回 Claude-Fable-5 还真像是 Claude-Opus-5 了,消耗的令牌数低,所以实际价格差距不大。 Claude-Opus-4.8 的完成度有了明显提升,之前一直犯的系统注册和界面入口的常见问题都没有了, 它也和 Claude-Fable-5 一样在最后列出了需要确认的事项,虽然枚举值的处理是错了,但它留下了这样的内容: 皮肤类型枚举:以 skinList 表 Type 字段为准分类(1/2/3/4),未采用 skin.proto 中数值不一致的 SkinType(0/1/2/3)。 说明它知道这里需要判断如何处理,但认为采用配置表的值是合理的,而没有编写相互转换的函数。 首先这样的处理在我看来是完全不合理的,因为虽然留下了说明,但编写了错误的代码,没有对比就没有差距, 反观 Fable-5 既写了转换函数,也留下了这样的说明: 皮肤类型编号不一致:协议枚举 SkinType(0=神针 1=称号 2=头像框 3=气泡)与 skinList 表(1=神针 2=头像框 3=气泡 4=称号)顺序、偏移都不同。我已把转换收口在 SkinNetMgr.ToProtoSkinType/ToCfgSkinType,内部数据一律以配置表类型为准(按 skinId 反查表),仅 C2S_SKIN_LIST.skinType 请求参数按协议枚举发送。请与服务器确认线上实际使用哪套编号,若用表编号只需改这两个函数。 Fable-5 给到了一个完全无可挑剔的答卷。 Mimo V2.5 Pro 的速度非常慢,甚至比我之前测试本地部署的模型还慢,但是完成度相对上个版本有了明显提升, 虽然还存在那两个常见错误, Mimo V2.5 的速度比上代 V2 Pro 慢,与 Claude-Fable-5 的用时几乎一样,首先它没有犯那两个常见错误, 但是无法编译,未实现、功能错误也非常多,属于 T3 级别。 Hy3 Preview 出现编译错误,位于 T3。 Qwen3.7 系列模型与上一代的差距未拉开很大差距,位于 T2 和 T3,Qwen3.7-Plus 出现编译错误,相对上代 3.5 可能有退步。 Nex-N2-Pro 思考内容发生循环,遂中止了对话,遗憾退赛: maybe "SkinDataMgr GetSkinPreviewPath(int skinId, int type, bool worldPreview = false)". Need "SkinDataMgr GetSkinPreviewPathForType". Need "SkinDataMgr GetSkinPreviewPathForType". Need "SkinDataMgr GetSkinPreviewPathForType". Need "SkinDataMgr GetSkinPreviewPathForType". ... Nemotron 3 Ultra 发生上游错误,无法继续,遗憾退赛。 Minimax M3 下出神之一手,它应该是发现了配置枚举值与服务器枚举值不一致的问题,对此它的判断是, **一定是后端写错了!**于是它直接修改了 proto 的定义,把服务器枚举改成了一致的值! 惊为天人,史无前例,这是首次有模型直接修改了服务器协议定义的内容。 当然这完全是不符合直觉的操作,但是 Minimax M3 在最后特别说明了这一点,代表着它与 Opus 4.8 一样, 都理解了只是处理不同: > **注意事项** > - 协议中 `SkinType` 枚举值的调整属于破坏性变更,服务器需要同步更新枚举值(1/2/3/4)。 > - `C2S_SKIN_LIST.totalAttrs` 字段在协议注释中标注为"所有已拥有皮肤的属性总和",目前按各类型分别存储并在客户端聚合;如服务器已按"全部类型"聚合,可直接读取 `_totalAttrs`。 除此之外,M3 犯了未设置页签文案的低级错误,总体而言完成度与 Mimo V2.5 Pro 相当,位于 T2。 最后总结 Claude Fable 5 表现非常亮眼,我会替换 GPT-5.5 作为主力模型使用一段时间,但是需要注意该模型非常敏感。 Claude Opus 4.8 终于变得像 Opus 了,有明显提升,但是 Fable 5 的价格差不多(因为仅有一半令牌消耗量),速度还更快,效果也更好,感觉并非 Fable,而是 Opus 5,有了 Fable 5,Opus 4.8 存在的意义就不太大了。 Mimo V2.5 Pro 相对上代进步明显! Minimax M3 相对上代进步明显! 其余模型则如测了。 本次继续使用自己开发的开源 VS Code 插件 Unify Chat Provider 以实现在 Copilot 中使用以上模型。 6 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 21:49:12+08:00 · tech

【L1n3】我的HomeDataCenter详解:目录 在上一篇中我介绍了我家里目前所有的设备硬件的信息,这些设备要互联互通离不开网络,所以本篇给大家详细阐述一下我家里的网络的规划 我的网络设备如下 【L1n3】我的HomeDataCenter详解:硬件及系统篇 搞七捻三 【L1n3】我的HomeDataCenter详解:目录 我使用的硬件大多为企业级淘汰产品(俗称洋垃圾),部分设备也是矿渣,在现在可能部分硬件已经涨价,甚至有价无市,我也是这些年机缘巧合逐渐拼凑出来的 大部分硬件是在闲鱼或是淘宝买的,少部分是通过朋友介绍的贩子手里拿的 选用企业级是因为企业级的很耐草,服务器都带有BMC,即使是二手货也是家用遥不可及的 本篇将详细为大家告诉我目前的硬件选型,… IP地址及VLAN规划 我家里的IP地址使用的是30.0.0.0/8的段,之所以使用这个段是因为,之前最早使用的是10.0.0.0/8,但是因为工作需求经常会连接到各种企业的内网VPN,有些企业用的10,有些是172,有些是192,经常会遇到IP段冲突,然后需要手动写路由等等,后来发现30这个段在公网上未广播,且整段IP隶属于美国国防部,理论上大陆境内应该是不能访问到的,而且30段在输入的时候与10体感是一样的,所以最终选择了这个网段,当然20.0.0.0/8也可以 我因为有和朋友及异地机房的互联需求,所以在不同地域之间,将一个/8段拆分为256个/16段,每个地域使用一个/16,以方便区分地理位置不同的机器 例如 网域 用途 30.0.0.0/16 自己使用 30.1.0.0/16 朋友1使用 30.2.0.0/16 朋友2使用 30.3.0.0/16 机房使用 30.255.0.0/16 与群友的群域网互联专段 在一个/16的网域下,进一步根据VLAN ID不同进一步进行拆分,每个/16拆分为256个/24,这样可确保IP地址完全不冲突 因为我家里服务器配置较高,所以我会给朋友提供VM服务,有些段是属于朋友专段,默认情况下所有段之间可以互联互通,仅对VLAN 99做了ACL隔离,使得只能正向通信,不能反向(防止出现安全问题) 我家里目前VLAN与网域对应关系如下 VLAN ID 网域 用途 1 30.0.0.0/24 家用日常设备接入,IoT设备, WLAN等 5 30.0.5.0/24 K8S专段 10 30.0.10.0/24 核心服务端,包括核心业务,物理服务器IP地址,BMC,交换机等 20 30.0.20.0/24 我自己使用的VM专段 30 30.0.30.0/24 朋友1 VM使用 40 30.0.40.0/24 朋友2 VM使用 50 30.0.50.0/24 公共段 60 30.0.60.0/24 各种专用的工具VM 70 30.0.70.0/24 游戏服务器专段 90 30.0.90.0/24 朋友6 VM使用 91 30.0.91.0/24 朋友7 VM使用 92 30.0.92.0/24 朋友8 VM使用 93 30.0.93.0/24 朋友9 VM使用 94 30.0.94.0/24 朋友10 VM使用 98 30.0.98.0/24 各种临时开启的VM使用 99 30.0.99.0/24 DMA区域,这个段只能正向连接,用来做病毒样本分析等 100 30.0.100.0/24 与投资相关的分析VM 4001 X ADSL拨号专段 43 X 电信IPTV专段 46 X 电信TR069专段 我习惯上将网关设为254,如下图所示 接下来就是根据不同用途的VM,放到对应的VLAN下就行了,每个VLAN我都开了DHCP 因为我有公网IP,所以我对外开了OpenVPN及WireGuard方便异地互联 OpenVPN使用的是30.0.230.0/24来作为接入段,并对客户端推送不同地域的路由 客户端连接情况如下 其他地域的网络也都是用的30.X.230.0/24这个段作为VPN接入,以方便统一管理,对于VPN接入的,我都是做了正向路由和反向路由,以实现跨地域的完全互通 位置 本地网域 目的地址 网关 我家 30.0.0.0/16 30.1.0.0/16 30.1.0.254 我家 30.0.0.0/16 30.2.0.0/16 30.2.0.254 我家 30.0.0.0/16 30.3.0.0/16 30.3.0.254 朋友1 30.1.0.0/16 30.0.0.0/16 30.0.230.254 朋友2 30.2.0.0/16 30.0.0.0/16 30.0.230.254 机房1 30.3.0.0/16 30.0.0.0/16 30.0.230.254 我使用的ISP是电信,所以从光猫层面把电信的TR069及IPTV的网段也拉出来了 TR069可以实现同城异地组网(基于OVPN或是WG),且不占用公网带宽,可以实现对等200M的互联速度 IPTV我是抓包获得了PPPOE接入方式,使得网络下任意设备都可以直接看IPTV电视 拓扑及交换连接 因为我大量的使用了VLAN,所以其实很多拓扑是在虚拟化层解决的。我自己目前的物理层连线非常简单,物理线路尽可能使用Trunk并对所有VLAN允许通过 整体拓扑连接如下 入户光纤 → VSOL猫(Trunk) → 核心交换机(Trunk) → 软路由WAN口(Trunk) 软路由LAN口(Trunk) → 核心交换机(Trunk) 核心交换机(Trunk) → 物理服务器业务口(Trunk) 核心交换机(Trunk) → 接入交换机(Trunk) 接入交换机(Trunk) → 物理服务器BMC口(VLAN 10) 接入交换机(Trunk) → 到每个房间的电口(VLAN 1) 猫要过核心的原因是因为我希望猫出来的网段(即ISP给的VLAN)能够在VM里使用,所以过了一层核心 在虚拟化层,我使用的是VMware全家桶,所以直接使用了他的分布式交换机功能来实现多个物理服务器的网络规划同步,以后新增的物理服务器也能一键应用当前的网络规划配置 当需要新增VLAN的时候,我只需要做如下几个步骤即可 在链路上所有交换机新增VLAN 在iKuai上新增对应VLAN的网关和DHCP服务 在vCenter中新增分布式端口组,指定对应VLAN 路由 在硬件篇中已经说了我使用了一台单独的物理机作为控制节点,在里面运行的iKuai软路由,并将一块544+FLR网卡直通进去,iKuai可以直接免驱使用,VM配置如下 因为iKuai并不怎么需要太大空间,所以实际上1GB的硬盘空间都足够使用,对于家用场景来说,网络的需求其实并不大,我只是单纯的机器性能过剩所以给了4C4G配置 负载监控图如下,可以看到基本上没啥负载,实际我个人更建议给1C2G/2C2G的配置 DNS 我在自己家里内部建立了私有DNS,使用的是ADGuardHome来建立的,只是为了实现DNS的监控,DoT/DoH等支持等等,DNS我放在了VLAN 10下,IP地址为 30.0.10.253/24 上游使用的是DoT的dns # Ali tls://dns.alidns.com # DNSPOD tls://dot.pub #https://dns.alidns.com/dns-query #https://doh.pub/dns-query # CloudFlare #tls://one.one.one.one Bootstrap DNS使用的是传统公共DNS 223.5.5.5 119.29.29.29 223.6.6.6 1.1.1.1 对于内网的机器我没有做主动发现和DNS分配,我更喜欢自己手敲IP(虽然有点原始),再加上我自己的内网导航,所以日常使用其实也不是太大问题 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-06-09 20:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

V2EX - 技术 · 2026-06-09 19:53:28+08:00 · tech

显卡只是 3080 显存 10G ,之前跑 qwen3.5 9b mtp 只有 75token/s,都是 q4 ,今天试了一下 Gemma4 12b 速度 85~105token/s,现在 MTP 技术那么牛吗?测了几个问题感觉质量还比 qwen3.5 9b 好那么一丢丢。有没有大神解惑? llama-server.exe ^ --model "emma-4-12B-it-qat-q4_0-unquantized-heretic-Q4_0.gguf" ^ --mmproj "mmproj-gemma-4-12b-it-qat-q4_0.gguf" ^ --model-draft "gemma-4-12b-qat-it-assistant-Q4_0_Q4emb.gguf" ^ --spec-type draft-mtp --spec-draft-n-max 3 ^ --spec-draft-type-k q4_0 --spec-draft-type-v q4_0 ^ --n-gpu-layers-draft 999 ^ --cache-type-k q4_0 ^ --cache-type-v q4_0 ^ --n-gpu-layers 999 ^ --no-mmap ^ --cache-prompt ^ --mlock ^ --kv-unified ^ --parallel 1 ^ -fa on ^ --fit off ^ --ctx-size 100000 --n-predict 10000 ^ --host 0.0.0.0 --port 11432

v2ex · 2026-06-09 09:42:38+08:00 · tech

[百炼部分历史模型(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM )下线通知] 尊敬的客户,您好! 为了不断提升模型性能和服务体验,同时优化底层资源管理,大模型服务平台百炼将于北京时间 2026 年 7 月 8 日 00:00:00 起对部分历史快照模型进行下线(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM ),下线后对这些模型的调用将面临超时、失败、无返回等问题。为保障您线上业务的稳定性,请您务必在 2026 年 7 月 8 日前完成迁移,推荐迁移替换模型请参考官网公告。若您已完成迁移则可忽略本条信息,感谢您的配合,过程中遇到问题,可以随时联系我们。 具体下线清单如下( Coding Plan/Token Plan 支持的相关模型,也会同步下线): qwen3-coder-30b-a3b-instruct 、qwen3-30b-a3b-instruct-2507 、qwen3-coder-480b-a35b-instruct 、qwen3-vl-32b-thinking 、qwen3-vl-32b-instruct 、qwen3-vl-30b-a3b-thinking 、qwen3-vl-30b-a3b-instruct 、qwen3-vl-8b-thinking 、qwen3-vl-8b-instruct 、qwen3-vl-235b-a22b-thinking 、qwen3-next-80b-a3b-instruct 、qwen3-next-80b-a3b-thinking 、qwen3-30b-a3b-thinking-2507 、qwen3-235b-a22b-thinking-2507 、qwen3-235b-a22b 、qwen3-30b-a3b 、qwen3-14b 、qwen3-8b 、qwen3-coder-next 、deepseek-r1-0528 、Moonshot-Kimi-K2-Instruct 、kimi-k2-thinking 、deepseek-r1-distill-qwen-32b 、deepseek-r1-distill-qwen-14b 、MiniMax-M2.1 、deepseek-r1-distill-qwen-7b 、qwen3-235b-a22b-instruct-2507 、qwen3-32b 、qwen3-vl-235b-a22b-instruct 、deepseek-v3.2 、deepseek-r1 、deepseek-v3 、deepseek-v3.1 、glm-4.7 、glm-4.6 、deepseek-v3.2-exp 、qwen3-max-2026-01-23 、qwen3-max-2025-09-23 、qwen3-vl-flash-2026-01-22 、qwen3-vl-flash-2025-10-15 、qwen3-coder-plus-2025-09-23 、qwen3-coder-plus-2025-07-22 涉及的模型下线清单、替换方案等详细说明可查看官网公告: 国内站: https://www.aliyun.com/notice/118345 国际站: https://www.alibabacloud.com/zh/notice/detail?_p_lc=1&id=1949

v2ex · 2026-06-09 09:32:49+08:00 · tech

[百炼部分历史模型(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM )下线通知] 尊敬的客户,您好! 为了不断提升模型性能和服务体验,同时优化底层资源管理,大模型服务平台百炼将于北京时间 2026 年 7 月 8 日 00:00:00 起对部分历史快照模型进行下线(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM ),下线后对这些模型的调用将面临超时、失败、无返回等问题。为保障您线上业务的稳定性,请您务必在 2026 年 7 月 8 日前完成迁移,推荐迁移替换模型请参考官网公告。若您已完成迁移则可忽略本条信息,感谢您的配合,过程中遇到问题,可以随时联系我们。 具体下线清单如下( Coding Plan/Token Plan 支持的相关模型,也会同步下线): qwen3-coder-30b-a3b-instruct 、qwen3-30b-a3b-instruct-2507 、qwen3-coder-480b-a35b-instruct 、qwen3-vl-32b-thinking 、qwen3-vl-32b-instruct 、qwen3-vl-30b-a3b-thinking 、qwen3-vl-30b-a3b-instruct 、qwen3-vl-8b-thinking 、qwen3-vl-8b-instruct 、qwen3-vl-235b-a22b-thinking 、qwen3-next-80b-a3b-instruct 、qwen3-next-80b-a3b-thinking 、qwen3-30b-a3b-thinking-2507 、qwen3-235b-a22b-thinking-2507 、qwen3-235b-a22b 、qwen3-30b-a3b 、qwen3-14b 、qwen3-8b 、qwen3-coder-next 、deepseek-r1-0528 、Moonshot-Kimi-K2-Instruct 、kimi-k2-thinking 、deepseek-r1-distill-qwen-32b 、deepseek-r1-distill-qwen-14b 、MiniMax-M2.1 、deepseek-r1-distill-qwen-7b 、qwen3-235b-a22b-instruct-2507 、qwen3-32b 、qwen3-vl-235b-a22b-instruct 、deepseek-v3.2 、deepseek-r1 、deepseek-v3 、deepseek-v3.1 、glm-4.7 、glm-4.6 、deepseek-v3.2-exp 、qwen3-max-2026-01-23 、qwen3-max-2025-09-23 、qwen3-vl-flash-2026-01-22 、qwen3-vl-flash-2025-10-15 、qwen3-coder-plus-2025-09-23 、qwen3-coder-plus-2025-07-22 涉及的模型下线清单、替换方案等详细说明可查看官网公告: 国内站: https://www.aliyun.com/notice/118345 国际站: https://www.alibabacloud.com/zh/notice/detail?_p_lc=1&id=1949

v2ex · 2026-06-09 09:18:29+08:00 · tech

[百炼部分历史模型(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM )下线通知] 尊敬的客户,您好! 为了不断提升模型性能和服务体验,同时优化底层资源管理,大模型服务平台百炼将于北京时间 2026 年 7 月 8 日 00:00:00 起对部分历史快照模型进行下线(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM ),下线后对这些模型的调用将面临超时、失败、无返回等问题。为保障您线上业务的稳定性,请您务必在 2026 年 7 月 8 日前完成迁移,推荐迁移替换模型请参考官网公告。若您已完成迁移则可忽略本条信息,感谢您的配合,过程中遇到问题,可以随时联系我们。 具体下线清单如下( Coding Plan/Token Plan 支持的相关模型,也会同步下线): qwen3-coder-30b-a3b-instruct 、qwen3-30b-a3b-instruct-2507 、qwen3-coder-480b-a35b-instruct 、qwen3-vl-32b-thinking 、qwen3-vl-32b-instruct 、qwen3-vl-30b-a3b-thinking 、qwen3-vl-30b-a3b-instruct 、qwen3-vl-8b-thinking 、qwen3-vl-8b-instruct 、qwen3-vl-235b-a22b-thinking 、qwen3-next-80b-a3b-instruct 、qwen3-next-80b-a3b-thinking 、qwen3-30b-a3b-thinking-2507 、qwen3-235b-a22b-thinking-2507 、qwen3-235b-a22b 、qwen3-30b-a3b 、qwen3-14b 、qwen3-8b 、qwen3-coder-next 、deepseek-r1-0528 、Moonshot-Kimi-K2-Instruct 、kimi-k2-thinking 、deepseek-r1-distill-qwen-32b 、deepseek-r1-distill-qwen-14b 、MiniMax-M2.1 、deepseek-r1-distill-qwen-7b 、qwen3-235b-a22b-instruct-2507 、qwen3-32b 、qwen3-vl-235b-a22b-instruct 、deepseek-v3.2 、deepseek-r1 、deepseek-v3 、deepseek-v3.1 、glm-4.7 、glm-4.6 、deepseek-v3.2-exp 、qwen3-max-2026-01-23 、qwen3-max-2025-09-23 、qwen3-vl-flash-2026-01-22 、qwen3-vl-flash-2025-10-15 、qwen3-coder-plus-2025-09-23 、qwen3-coder-plus-2025-07-22 涉及的模型下线清单、替换方案等详细说明可查看官网公告: 国内站: https://www.aliyun.com/notice/118345 国际站: https://www.alibabacloud.com/zh/notice/detail?_p_lc=1&id=1949

v2ex · 2026-06-09 08:59:35+08:00 · tech

[百炼部分历史模型(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM )下线通知] 尊敬的客户,您好! 为了不断提升模型性能和服务体验,同时优化底层资源管理,大模型服务平台百炼将于北京时间 2026 年 7 月 8 日 00:00:00 起对部分历史快照模型进行下线(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM ),下线后对这些模型的调用将面临超时、失败、无返回等问题。为保障您线上业务的稳定性,请您务必在 2026 年 7 月 8 日前完成迁移,推荐迁移替换模型请参考官网公告。若您已完成迁移则可忽略本条信息,感谢您的配合,过程中遇到问题,可以随时联系我们。 具体下线清单如下( Coding Plan/Token Plan 支持的相关模型,也会同步下线): qwen3-coder-30b-a3b-instruct 、qwen3-30b-a3b-instruct-2507 、qwen3-coder-480b-a35b-instruct 、qwen3-vl-32b-thinking 、qwen3-vl-32b-instruct 、qwen3-vl-30b-a3b-thinking 、qwen3-vl-30b-a3b-instruct 、qwen3-vl-8b-thinking 、qwen3-vl-8b-instruct 、qwen3-vl-235b-a22b-thinking 、qwen3-next-80b-a3b-instruct 、qwen3-next-80b-a3b-thinking 、qwen3-30b-a3b-thinking-2507 、qwen3-235b-a22b-thinking-2507 、qwen3-235b-a22b 、qwen3-30b-a3b 、qwen3-14b 、qwen3-8b 、qwen3-coder-next 、deepseek-r1-0528 、Moonshot-Kimi-K2-Instruct 、kimi-k2-thinking 、deepseek-r1-distill-qwen-32b 、deepseek-r1-distill-qwen-14b 、MiniMax-M2.1 、deepseek-r1-distill-qwen-7b 、qwen3-235b-a22b-instruct-2507 、qwen3-32b 、qwen3-vl-235b-a22b-instruct 、deepseek-v3.2 、deepseek-r1 、deepseek-v3 、deepseek-v3.1 、glm-4.7 、glm-4.6 、deepseek-v3.2-exp 、qwen3-max-2026-01-23 、qwen3-max-2025-09-23 、qwen3-vl-flash-2026-01-22 、qwen3-vl-flash-2025-10-15 、qwen3-coder-plus-2025-09-23 、qwen3-coder-plus-2025-07-22 涉及的模型下线清单、替换方案等详细说明可查看官网公告: 国内站: https://www.aliyun.com/notice/118345 国际站: https://www.alibabacloud.com/zh/notice/detail?_p_lc=1&id=1949

v2ex · 2026-06-09 08:49:59+08:00 · tech

[百炼部分历史模型(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM )下线通知] 尊敬的客户,您好! 为了不断提升模型性能和服务体验,同时优化底层资源管理,大模型服务平台百炼将于北京时间 2026 年 7 月 8 日 00:00:00 起对部分历史快照模型进行下线(含 Qwen3 快照、DeepSeek 、Kimi 、MiniMax 、GLM ),下线后对这些模型的调用将面临超时、失败、无返回等问题。为保障您线上业务的稳定性,请您务必在 2026 年 7 月 8 日前完成迁移,推荐迁移替换模型请参考官网公告。若您已完成迁移则可忽略本条信息,感谢您的配合,过程中遇到问题,可以随时联系我们。 具体下线清单如下( Coding Plan/Token Plan 支持的相关模型,也会同步下线): qwen3-coder-30b-a3b-instruct 、qwen3-30b-a3b-instruct-2507 、qwen3-coder-480b-a35b-instruct 、qwen3-vl-32b-thinking 、qwen3-vl-32b-instruct 、qwen3-vl-30b-a3b-thinking 、qwen3-vl-30b-a3b-instruct 、qwen3-vl-8b-thinking 、qwen3-vl-8b-instruct 、qwen3-vl-235b-a22b-thinking 、qwen3-next-80b-a3b-instruct 、qwen3-next-80b-a3b-thinking 、qwen3-30b-a3b-thinking-2507 、qwen3-235b-a22b-thinking-2507 、qwen3-235b-a22b 、qwen3-30b-a3b 、qwen3-14b 、qwen3-8b 、qwen3-coder-next 、deepseek-r1-0528 、Moonshot-Kimi-K2-Instruct 、kimi-k2-thinking 、deepseek-r1-distill-qwen-32b 、deepseek-r1-distill-qwen-14b 、MiniMax-M2.1 、deepseek-r1-distill-qwen-7b 、qwen3-235b-a22b-instruct-2507 、qwen3-32b 、qwen3-vl-235b-a22b-instruct 、deepseek-v3.2 、deepseek-r1 、deepseek-v3 、deepseek-v3.1 、glm-4.7 、glm-4.6 、deepseek-v3.2-exp 、qwen3-max-2026-01-23 、qwen3-max-2025-09-23 、qwen3-vl-flash-2026-01-22 、qwen3-vl-flash-2025-10-15 、qwen3-coder-plus-2025-09-23 、qwen3-coder-plus-2025-07-22 涉及的模型下线清单、替换方案等详细说明可查看官网公告: 国内站: https://www.aliyun.com/notice/118345 国际站: https://www.alibabacloud.com/zh/notice/detail?_p_lc=1&id=1949

IT之家 · 2026-06-09 07:50:10+08:00 · tech

IT之家 6 月 9 日消息,GPD(中软赢科)本月 4 日宣布, 其迷你掌上笔记本电脑 MicroPC 2 现已可选英特尔酷睿 3 N350 这款八核 "Twin Lake" 处理器 。相较 2025 年 8 月推出的 i3-N300 版本,酷睿 3 N350 版本在 CPU 与 GPU 频率上均有 0.1GHz 的提升。 MicroPC 2 三维 171.2 × 110.8 × 23.5 (mm),内置 27.5Wh 电池,质量约为 490g;板载 16GB LPDDR5 内存,提供 M.2 2280 NVMe 盘位;配备 7" FHD 60Hz 500nits 可翻转十点触控屏幕;具备 Wi-Fi 6 无线网卡、2.5GbE 有线网口、2A2C USB、HDMI、SD 读卡器等 I/O。 价格方面,这款端口丰富的移动生产力工具在酷睿 3 N350 + 16GB + 512GB 配置下官网标价为 789.95 美元(IT之家注:现汇率约合 5366 元人民币)。