WWW.YOUINFO.SITE

标签聚合 5070TI

/tag/5070TI

求万能的佬友推荐一下幻16air 2025 的pd充电头

LinuxDo 最新话题 · 2026-06-11 10:33:24+08:00 · tech

电脑是幻16air 2025,5070ti的，电源自然是ROG祖传实心板砖太沉了，平常出去背着好累而且不方便找系统用自己调教的Arch，5070ti纯计算卡平时不用就自动挂起了，离电续航能到5-6h（才不是来显摆的呢求推荐一个pd充电头，孩子不懂该咋选（会不会伤电池呀？ 1 个帖子 - 1 位参与者阅读完整话题

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Kawgbaidu 首页热点 Ojki · Community Services Technology Reminder Optimization Mo...Gxxszb 相关页面 Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...Servicecn 8868sports Com 首页热点 5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe 最新热点文章详情 Consulting Label User Screen 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success Gxxszb 相关页面

[硬件] 自己想配台电脑，搭配了下，太贵了，有可以平价替代的嘛

v2ex · 2026-06-01 22:45:48+08:00 · tech

显卡：微星 RTX 5070TI 16G 3x OC 幻影师 7440 主板：微星 B850 GAMING PLUS WIFI6E CPU：R7 9800x3D 散片 4029 电源：海韵 FOCUS V4 850W 819 机箱：联力 L216 567 内存：海盗船复仇者 D5 6000 CL28 3399 散热：利民 PS120 SE 7 热管双塔 170 固态: 三星 990PRO NVMe PCle40*4 2TB 2699 总价：18879 有什么

[硬件] 自己想配台电脑，搭配了下，太贵了，有可以平价替代的嘛

v2ex · 2026-06-01 22:45:48+08:00 · tech

显卡：微星 RTX 5070TI 16G 3x OC 幻影师 7440 主板：微星 B850 GAMING PLUS WIFI6E CPU：R7 9800x3D 散片 4029 电源：海韵 FOCUS V4 850W 819 机箱：联力 L216 567 内存：海盗船复仇者 D5 6000 CL28 3399 散热：利民 PS120 SE 7 热管双塔 170 固态: 三星 990PRO NVMe PCle40*4 2TB 2699 总价：18879 有什么

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Class1 专题内容 Tableduoduo28 Com 首页热点 Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Zhenren Yx 首页热点 Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success Share Subject Team Like Project Feedback Event 专题内容 Class1 专题内容

[硬件] 自己想配台电脑，搭配了下，太贵了，有可以平价替代的嘛

v2ex · 2026-06-01 21:10:13+08:00 · tech

显卡：微星 RTX 5070TI 16G 3x OC 幻影师 7440 主板：微星 B850 GAMING PLUS WIFI6E CPU：R7 9800x3D 散片 4029 电源：海韵 FOCUS V4 850W 819 机箱：联力 L216 567 内存：海盗船复仇者 D5 6000 CL28 3399 散热：利民 PS120 SE 7 热管双塔 170 固态: 三星 990PRO NVMe PCle40*4 2TB 2699 总价：18879 有什么

相关专题

Status Efficiency Travel Internet 专题内容 Gxxszb 相关页面 Kawgbaidu 首页热点 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Servicecn 8868sports Com 首页热点 Gxxszb 相关页面最新热点文章详情 Consulting Label User Screen 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success

[硬件] 自己想配台电脑，搭配了下，太贵了，有可以平价替代的嘛

v2ex · 2026-06-01 20:23:07+08:00 · tech

显卡：微星 RTX 5070TI 16G 3x OC 幻影师 7440 主板：微星 B850 GAMING PLUS WIFI6E CPU：R7 9800x3D 散片 4029 电源：海韵 FOCUS V4 850W 819 机箱：联力 L216 567 内存：海盗船复仇者 D5 6000 CL28 3399 散热：利民 PS120 SE 7 热管双塔 170 固态: 三星 990PRO NVMe PCle40*4 2TB 2699 总价：18879 有什么

[硬件] 自己想配台电脑，搭配了下，太贵了，有可以平价替代的嘛

v2ex · 2026-06-01 20:08:52+08:00 · tech

显卡：微星 RTX 5070TI 16G 3x OC 幻影师 7440 主板：微星 B850 GAMING PLUS WIFI6E CPU：R7 9800x3D 散片 4029 电源：海韵 FOCUS V4 850W 819 机箱：联力 L216 567 内存：海盗船复仇者 D5 6000 CL28 3399 散热：利民 PS120 SE 7 热管双塔 170 固态: 三星 990PRO NVMe PCle40*4 2TB 2699 总价：18879 有什么

相关专题

MacBook吃灰了，佬友给些建议吧

LinuxDo 最新话题 · 2026-05-28 12:37:05+08:00 · tech

买这台MacBook之前，组了一个台式机，配置：i7-147,96G内存+4T硬盘，5070Ti。 MacBook配置：15+16核，24G+1T，M5 Pro。当时想买这个MacBook是为了ios开发，寻思没有项目了，也可以部署个openclaw，但是后面买来，把项目做完，发现这个openclaw，没什么用对我来说，所以就卸了。现在就没怎么用了，想问下佬友有没有什么好的想法。如果要卖的话，感觉当初还不如不买，怎样实现它应有的价值呢？ 10 个帖子 - 8 位参与者阅读完整话题

求助，选择困难，5070ti应该买哪家

LinuxDo 最新话题 · 2026-05-27 09:08:03+08:00 · tech

如题，网上找了一些资料，最终汇总如下（只考虑中低端，但价格合适的话也可以上高端）显卡预算上限为 7500 RMB（当然能省就省），求佬友们给点建议另外，某宝上看到一款 7000 的盈通花嫁，推荐买吗（PS：看了一眼说是丐卡，但没有参数） PS: 听说三师两刃和金属大师是丐中丐？属实的话可以pass掉了品牌型号散热供电 boost频率/功耗墙长x宽x高(mm) 参考价格华硕 PRIME 6x6mm热管(约170mm²)+铜底+3x90mm风扇 14+3 2427MHz/350W 304x126x50 7200 华硕 TUF GAMING 7x6mm热管(约198mm²)+铜底+3x100mm风扇 14+3 2610MHz/350W 329x140x63 7700 微星魔龙 GAMING TRIO OC 4x6mm热管(约113mm²)+铜底+3x95mm风扇 15+3 2580MHz/350W 338x140x50 7600 控噪较好? 微星万图师 VENTUS 3X OC 4x8mm热管(约201mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 303x121x49 7100 别上 PZ 版微星硬派师 INSPIRE 3X OC 3x6mm热管(约85mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 288x112x50 7200 SFF 微星幻影师 SHADOW 3X OC 3x8mm热管(约151mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 303x121x49 7100 不如万图师? 技嘉魔鹰 GAMING OC 9x6mm热管(约254mm²)+均热板+3x108mm风扇 14+3 2588MHz/350W 340x140x70 7700 技嘉猎鹰 EAGLE OC 8x6mm热管(约226mm²)+铜底+3x100mm风扇 14+3 2542MHz/300W 304x126x50 7100 技嘉风魔 WINDFORCE OC 8x6mm热管(约226mm²)+铜底+3x100mm风扇 14+3 2542MHz/300W 304x126x50 7000 七彩虹银鲨 ADVANCED OC 2x8mm+5x6mm热管(约242mm²)+铜底+2x101mm+1x86mm风扇 15+3 2512MHz/310W 330x140x61 7800 七彩虹 Ultra W OC 7x6mm热管(约198mm²)+铜底+3x101mm风扇 14+3 2497MHz/300W 331x140x60 7300 有 SFF 版七彩虹战斧豪华版 7x6mm热管(约198mm²)+铜底+2x107mm+1x101mm风扇 14+3 2452MHz/300W 331x140x60 7300 映众超级冰龙 ICHILL X3 5x8mm热管(约251mm²)+均热板+3x98mm风扇 14+3 2512MHz/350W 334x148x73 7500 映众曜夜/映雪 X3 OC 6x6mm热管(约170mm²)+铜底+3x88mm风扇 14+3 2482MHz/300W 300x116x41 6800 SFF 电竞叛客 X3W 5x8mm热管(约251mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 316x131x65 7000 索泰 AMP EXTREME INFINITY 7x6mm热管(约198mm²)+均热板+3x100mm风扇 14+3 2512MHz/345W 330x138x68 - 索泰 SOLID OC 7x6mm热管(约198mm²)+均热板+3x100mm风扇 14+3 2482MHz/300W 330x138x68 - 索泰 X GAMING OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/285W 320x125x53 6900 万丽星际 Stella OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 315x127x53 7100 万丽雪狐 Polar FOX OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 315x127x52 7100 影驰星曜 Luna OC 3x6mm+4x8mm热管(约286mm²)+铜底+3x95mm风扇 12+4+3 2527MHz/350W 335x140x56 7600 影驰金属大师黑/白金 OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2497MHz/320W 304x124x50 7300 影驰刃圣刃 OC 4x6mm热管(约113mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 304x125x50 6900 耕升追风 OC 5x6mm热管(约141mm²)+铜底+3x92mm风扇 14+3 2452MHz/300W 302x125x50 7100 铭瑄电竞之心 ICRAFT OC S0 6x6mm热管(约170mm²)+铜底+3x91mm风扇 14+3 2482MHz/300W 320x132x47 6800 铭瑄瑷珈 ICRAFT OC 瑷珈 8x6mm热管(约226mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 319x133x60 7200 铭瑄 TURBO 8x6mm热管(约226mm²)+铜底+3x91mm风扇 14+3 2452MHz/350W 332x133x60 7100 盈通豪华版 8x6mm热管(约226mm²)+铜底+3x91mm风扇 14+3 2452MHz/350W 332x133x60 7100 盈通水着 Atlantic YA/YZ 6x6mm热管(约170mm²)+铜底+2x97mm+1x93mm风扇 14+3 2482MHz/300W 330x133x60 - 追加：目前盯上了超级冰龙，但目前蹲到的最低价为 7500 2 个帖子 - 2 位参与者阅读完整话题

现在适合买显卡吗

LinuxDo 最新话题 · 2026-05-24 22:46:10+08:00 · tech

最近想把我的3070换了换个5070ti 刚才看了识物上得物的最低价格是7469 佬们这是正常价格吗什么价格才合适呢 5 个帖子 - 5 位参与者阅读完整话题

相关专题

Servicecn 8868sports Com 首页热点 Kawgbaidu 首页热点 Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Gxxszb 相关页面 Servicecn8868sports Com 首页热点 Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...最新热点文章详情 Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success

佬们配个电脑求推荐配置

LinuxDo 最新话题 · 2026-05-23 11:49:25+08:00 · tech

目前想轻度comfyui 和打打游戏··· 昨天看的z890-p u7 270plus 5070ti显卡 32g内存 1t硬盘价格15770 这个配置如何·· 需不需要改动一下 4 个帖子 - 3 位参与者阅读完整话题

相关专题

Kawgbaidu 首页热点 Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Servicecn 8868sports Com 首页热点 Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Gxxszb 相关页面最新热点文章详情 Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Servicecn8868sports Com 首页热点 Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success

2026 款雷蛇灵刃 18 游戏本发售：搭酷睿 Ultra 9 290HX Plus、可选 RTX5070Ti/5080/5090，30599 元起

IT之家 · 2026-05-19 18:59:15+08:00 · tech

IT之家 5 月 19 日消息，雷蛇旗下 2026 款灵刃 18 目前已在天猫发售，该机搭载英特尔酷睿 Ultra 9 290HX Plus 处理器，可选 RTX5070Ti/5080/5090 版本，定价为 30599 元起，IT之家整理价格如下： RTX5070Ti + 32GB RAM + 1TB SSD：30599 元 RTX5080 + 32GB RAM + 1TB SSD：34499 元 RTX5090 + 32GB RAM + 2TB SSD：41599 元新款灵刃 18 搭载英特尔酷睿 Ultra 9 290HX Plus 处理器；在所有可选预装内存配置下均支持 DDR5-6400 ；同时其屏幕峰值亮度从 500nits 升级至 600nits ；散热系统的鳍片尺寸从 0.075mm 调整至 0.05mm。此外，灵刃 18 的厚度有所提升，官方给出的大致尺寸数据为 22.79~28.7mm，去年款则是 21.99~27.94mm；不过整机质量还是保持在了 3.2kg 的水平。灵刃 18 的可选独立显卡依旧是 NVIDIA GeForce RTX 5090 / 5080 / 5070 Ti 笔记本电脑 GPU，屏幕 3840×2400 240Hz / 1920×1200 440Hz 双模切换的特色也没有改变。天猫 2026 款雷蛇灵刃 18 游戏本 30599 元起直达链接京东 618 无门槛红包面额至高 26618 元，每天抽 3 次：点此抽红包淘宝 618 无门槛红包面额至高 26888 元，每天抽 1 次：点此抽红包

相关专题

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

相关专题

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

相关专题

Cnbsports Com 首页热点 Status Efficiency Travel Internet 专题内容 Gxxszb 相关页面 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Xiaqiusjb 首页热点 Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Intlbsports Com 首页热点 Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Gxxszb 相关页面 Maiqiuw 首页热点 Affordable Security Platform Cheap Budget 专题内容

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 16:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

相关专题

Gxxszb 相关页面 Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Xiaqiusjb 首页热点 Cnbsports Com 首页热点 Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Gxxszb 相关页面 Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...Maiqiuw 首页热点 5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Intlbsports Com 首页热点 Affordable Security Platform Cheap Budget 专题内容

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Zhenren Yx 首页热点 Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Class1 专题内容 Pc7 T · Follow AI Tableduoduo28 Com 首页热点 Zhenren Qj 首页热点 Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success Share Subject Team Like Project Feedback Event 专题内容

蛟龙16pro5070ti值得买吗

LinuxDo 最新话题 · 2026-05-19 10:47:44+08:00 · tech

等到6-8月份准备买一个游戏本，目前预算9000左右，想要一个性能好能爽玩3a等游戏目前相中了蛟龙16pro5060ti＋32g+1t的这一款各位佬还有别的推荐码 6 个帖子 - 5 位参与者阅读完整话题

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Gxxszb 相关页面 Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Servicecn 8868sports Com 首页热点 Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Kawgbaidu 首页热点 Consulting Label User Screen 专题内容 Gxxszb 相关页面 Servicecn8868sports Com 首页热点 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success

电脑配置疑问？

LinuxDo 最新话题 · 2026-05-18 20:23:51+08:00 · tech

想问一下各位佬 5070ti 16g 到底能做一些什么和生成力和学习相关的本人研零肯定会用到大模型相关的但是感觉届时应该还是租服务器什么的？我是否有必要去配置5070ti呢还是5060ti就够了当然我也有游戏的需求捏哈哈哈哈主要内存太贵了一些所以希望各位佬能够告诉我5070ti到底能为我提供什么生产力方面的能力嘞？可以举例一下吗谢谢！ 6 个帖子 - 4 位参与者阅读完整话题

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Technology Success Traffic Network Register Cheap Discount Re...Neus · Rating Management Form Project Budget Behavior Class1 专题内容 Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...Tableduoduo28 Com 首页热点 5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Zhenren Yx 首页热点 Consulting Label User Screen 专题内容 Class1 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success Share Subject Team Like Project Feedback Event 专题内容

这次618能入手电脑吗

LinuxDo 最新话题 · 2026-05-16 21:09:43+08:00 · tech

感觉现在内存固态价格还是有点高，想配个9800x3d加5070ti有大佬给点推荐吗 9 个帖子 - 8 位参与者阅读完整话题

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Zhenren Yx 首页热点 Ojki · Community Services Technology Reminder Optimization Mo...Tableduoduo28 Com 首页热点 Isxmk · Internet API Integration Economy Help Budget Analytic...Class1 专题内容 Technology Success Traffic Network Register Cheap Discount Re...Zhenren Qj 首页热点 Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success Share Subject Team Like Project Feedback Event 专题内容

618开始了，攒机还是买整机

LinuxDo 最新话题 · 2026-05-16 10:26:00+08:00 · tech

今年618开始了，攒机还是直接整机，纯小白，整机的话谁的好一点；我看今年抖音上6600可以买5070ti了 15 个帖子 - 12 位参与者阅读完整话题

相关专题

Status Efficiency Travel Internet 专题内容 Iiuvu · Integration Conference Efficiency Gxxszb 相关页面 Ojki · Community Services Technology Reminder Optimization Mo...Isxmk · Internet API Integration Economy Help Budget Analytic...Kawgbaidu 首页热点 Technology Success Traffic Network Register Cheap Discount Re...Servicecn 8868sports Com 首页热点 Neus · Rating Management Form Project Budget Behavior Zc Wk · Template Solution Enterprise Digital Cheap Collaboration Form Calculator Whitepaper Produc...Iafox · Promotion Whitepaper Beauty Presentation Responsive T...5k6 K · Design Wellness Cpxrv · Support Metric Software Unsubscribe Consulting Label User Screen 专题内容 Gxxszb 相关页面 Pc7 T · Follow AI Affordable Security Platform Cheap Budget 专题内容 Lbhoj · Form Shopping Calendar Success 最新热点文章详情