WWW.YOUINFO.SITE
标签聚合 5070TI

/tag/5070TI

LinuxDo 最新话题 · 2026-05-28 12:37:05+08:00 · tech

买这台MacBook之前,组了一个台式机,配置:i7-147,96G内存+4T硬盘,5070Ti。 MacBook配置:15+16核,24G+1T,M5 Pro。 当时想买这个MacBook是为了ios开发,寻思没有项目了,也可以部署个openclaw,但是后面买来,把项目做完,发现这个openclaw,没什么用对我来说,所以就卸了。 现在就没怎么用了,想问下佬友有没有什么好的想法。 如果要卖的话,感觉当初还不如不买,怎样实现它应有的价值呢? 10 个帖子 - 8 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-27 09:08:03+08:00 · tech

如题,网上找了一些资料,最终汇总如下(只考虑中低端,但价格合适的话也可以上高端) 显卡预算上限为 7500 RMB(当然能省就省),求佬友们给点建议 另外,某宝上看到一款 7000 的 盈通花嫁,推荐买吗(PS:看了一眼说是丐卡,但没有参数) PS: 听说三师两刃和金属大师是丐中丐?属实的话可以pass掉了 品牌 型号 散热 供电 boost频率/功耗墙 长x宽x高(mm) 参考价格 华硕 PRIME 6x6mm热管(约170mm²)+铜底+3x90mm风扇 14+3 2427MHz/350W 304x126x50 7200 华硕 TUF GAMING 7x6mm热管(约198mm²)+铜底+3x100mm风扇 14+3 2610MHz/350W 329x140x63 7700 微星 魔龙 GAMING TRIO OC 4x6mm热管(约113mm²)+铜底+3x95mm风扇 15+3 2580MHz/350W 338x140x50 7600 控噪较好? 微星 万图师 VENTUS 3X OC 4x8mm热管(约201mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 303x121x49 7100 别上 PZ 版 微星 硬派师 INSPIRE 3X OC 3x6mm热管(约85mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 288x112x50 7200 SFF 微星 幻影师 SHADOW 3X OC 3x8mm热管(约151mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 303x121x49 7100 不如万图师? 技嘉 魔鹰 GAMING OC 9x6mm热管(约254mm²)+均热板+3x108mm风扇 14+3 2588MHz/350W 340x140x70 7700 技嘉 猎鹰 EAGLE OC 8x6mm热管(约226mm²)+铜底+3x100mm风扇 14+3 2542MHz/300W 304x126x50 7100 技嘉 风魔 WINDFORCE OC 8x6mm热管(约226mm²)+铜底+3x100mm风扇 14+3 2542MHz/300W 304x126x50 7000 七彩虹 银鲨 ADVANCED OC 2x8mm+5x6mm热管(约242mm²)+铜底+2x101mm+1x86mm风扇 15+3 2512MHz/310W 330x140x61 7800 七彩虹 Ultra W OC 7x6mm热管(约198mm²)+铜底+3x101mm风扇 14+3 2497MHz/300W 331x140x60 7300 有 SFF 版 七彩虹 战斧豪华版 7x6mm热管(约198mm²)+铜底+2x107mm+1x101mm风扇 14+3 2452MHz/300W 331x140x60 7300 映众 超级冰龙 ICHILL X3 5x8mm热管(约251mm²)+均热板+3x98mm风扇 14+3 2512MHz/350W 334x148x73 7500 映众 曜夜/映雪 X3 OC 6x6mm热管(约170mm²)+铜底+3x88mm风扇 14+3 2482MHz/300W 300x116x41 6800 SFF 电竞叛客 X3W 5x8mm热管(约251mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 316x131x65 7000 索泰 AMP EXTREME INFINITY 7x6mm热管(约198mm²)+均热板+3x100mm风扇 14+3 2512MHz/345W 330x138x68 - 索泰 SOLID OC 7x6mm热管(约198mm²)+均热板+3x100mm风扇 14+3 2482MHz/300W 330x138x68 - 索泰 X GAMING OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/285W 320x125x53 6900 万丽 星际 Stella OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 315x127x53 7100 万丽 雪狐 Polar FOX OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 315x127x52 7100 影驰 星曜 Luna OC 3x6mm+4x8mm热管(约286mm²)+铜底+3x95mm风扇 12+4+3 2527MHz/350W 335x140x56 7600 影驰 金属大师 黑/白金 OC 5x6mm热管(约141mm²)+铜底+3x90mm风扇 14+3 2497MHz/320W 304x124x50 7300 影驰 刃 圣刃 OC 4x6mm热管(约113mm²)+铜底+3x90mm风扇 14+3 2497MHz/300W 304x125x50 6900 耕升 追风 OC 5x6mm热管(约141mm²)+铜底+3x92mm风扇 14+3 2452MHz/300W 302x125x50 7100 铭瑄 电竞之心 ICRAFT OC S0 6x6mm热管(约170mm²)+铜底+3x91mm风扇 14+3 2482MHz/300W 320x132x47 6800 铭瑄 瑷珈 ICRAFT OC 瑷珈 8x6mm热管(约226mm²)+铜底+3x90mm风扇 14+3 2482MHz/300W 319x133x60 7200 铭瑄 TURBO 8x6mm热管(约226mm²)+铜底+3x91mm风扇 14+3 2452MHz/350W 332x133x60 7100 盈通 豪华版 8x6mm热管(约226mm²)+铜底+3x91mm风扇 14+3 2452MHz/350W 332x133x60 7100 盈通 水着 Atlantic YA/YZ 6x6mm热管(约170mm²)+铜底+2x97mm+1x93mm风扇 14+3 2482MHz/300W 330x133x60 - 追加:目前盯上了超级冰龙,但目前蹲到的最低价为 7500 2 个帖子 - 2 位参与者 阅读完整话题

IT之家 · 2026-05-19 18:59:15+08:00 · tech

IT之家 5 月 19 日消息,雷蛇旗下 2026 款灵刃 18 目前已在天猫发售,该机搭载英特尔酷睿 Ultra 9 290HX Plus 处理器,可选 RTX5070Ti/5080/5090 版本,定价为 30599 元起,IT之家整理价格如下: RTX5070Ti + 32GB RAM + 1TB SSD:30599 元 RTX5080 + 32GB RAM + 1TB SSD:34499 元 RTX5090 + 32GB RAM + 2TB SSD:41599 元 新款灵刃 18 搭载英特尔酷睿 Ultra 9 290HX Plus 处理器;在所有可选预装内存配置下 均支持 DDR5-6400 ;同时其 屏幕峰值亮度从 500nits 升级至 600nits ;散热系统的鳍片尺寸从 0.075mm 调整至 0.05mm。 此外,灵刃 18 的厚度有所提升,官方给出的大致尺寸数据为 22.79~28.7mm,去年款则是 21.99~27.94mm;不过整机质量还是保持在了 3.2kg 的水平。 灵刃 18 的可选独立显卡依旧是 NVIDIA GeForce RTX 5090 / 5080 / 5070 Ti 笔记本电脑 GPU,屏幕 3840×2400 240Hz / 1920×1200 440Hz 双模切换的特色也没有改变。 天猫 2026 款雷蛇灵刃 18 游戏本 30599 元起 直达链接 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。

V2EX - 技术 · 2026-05-19 16:50:13+08:00 · tech

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。