前置条件 - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-03 13:50:24+08:00 · tech

前置条件：要挂梯子，不然可能页面刷不出来注册登录 https://www.oyunfor.com/ 选App Store Card，选你要的面额，点击添加购物车进入结算页，点击右侧付款按钮选第一个信用卡Credit Card 选最后一个类型，然后点击付款选择或输入国内的外币信用卡或借记卡的信息进行付款进入银行结算页，可能会打不开页面，将isbank.com.tr加入梯子直连，或者关闭梯子，刷新该页面跳转回oyunfor订单页面, situation栏显示刚才的订单状态是 accepted 或 confirmed 说明支付成功挂上梯子，点击订单 detail 下的箭头，可以看到卡密去apple store 登录土区apple id，点右上角头像，然后在 redeem gift card or code 里输入卡密即可充值 2 个帖子 - 2 位参与者阅读完整话题

跳蚤市场要解锁需要什么前置条件吗？

LinuxDo 最新话题 · 2026-06-02 10:33:51+08:00 · tech

加入社区之后也是终于升到2级了，但是为什么还是没有解锁跳蚤市场呢？跳蚤市场要怎么才能解锁呢各位佬友。 2 个帖子 - 2 位参与者阅读完整话题

佬们，想玩一下全自动gptplus注册，前置条件有没有好的推荐

LinuxDo 最新话题 · 2026-05-23 16:54:10+08:00 · tech

1 个带 API、且能连续正常接收 PayPal 验证码的 US +1 接码手机号 1 个或 N 个支持 IMAP 和 Graph 的 Outlook 邮箱或者自建Cloudflare Temp Email (edu前缀，如edu.openai.com才有试用资格) 1 个相对干净、支持 PayPal 注册的 US 代理 (干净就不会跳PAYPAL的注册滑块，账单页面的Captcha扩展已经设置了自动屏蔽) 这里如果是换成荷兰节点行不行？手机号号商有推荐吗？ 4 个帖子 - 2 位参与者阅读完整话题

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 17:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 16:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

相关专题

关于 5070ti 模型推理的速度和本地部署思考

V2EX - 技术 · 2026-05-19 15:50:13+08:00 · tech

前置条件：5070ti 16g ，llama.cpp ，全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化（ MoE 结构）速度大概是 120t/s-150t/s ，首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化（稠密结构）速度大概是 8t/s-10t/s ，首 token 可能很慢，整体输出都慢得多。思考：现在的模型有两种结构：稠密（ Dense ）和 MoE （混合专家模型）。以上述两种模型举例稠密模型是所有层（ dev 这个有 40 层）都参与计算，消耗 24b 的完整算力，也就是单 token 2x24b=48gflops （不算量化），算力消耗大，推理成本高。 moe 是总共 26b 参数，每次推理只激活 4b 参数，只消耗激活参数 4b 的算力，单 token 算力消耗 2x4=8gflops ，算力消耗小很多，但有 26b 的参数（知识）。gemma 这个有 128 个专家，每次激活 8 个专家和 1 个共享专家（所有 token 必须首先经过共享专家），moe 模型是通过动态路由判断选择专家的。可以看出算力需求差异巨大。常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少，但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少，但显存需求没变。可以大概推测，顶级大模型以后可能只有 moe 结构了，参数小的可能有稠密架构，因为算力成本还尚可接受，参数量很大的稠密结构，恐怕算力成本高到厂商也难以商用吧。本地部署，我看来推理速度有 40-50token/s ，基本可以自用了，这是一个及格线。我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡，pro6000 96g 咸鱼 6w 多，pro6000d 84g （显存没 ecc ，整体比 6000 略差）咸鱼 4w ，pro5000 84g 这种。 2. 用同等价钱稍微低点，等 m5 pro 的 mac mini/studio 发布后购买。改显存，矿卡，二手的很久的专业卡等就不讨论了，不懂这部分。 mac 跑推理，olmx 官网我看了模型推理速度排行榜，还是差了点，不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。还有就是比如双 5070ti 跑模型推理，不知道速度怎么样，价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板，双显卡要 pcie 拆分 8x8 ，pcie5.0 肯定更好，我得换主板换内存，成本太高，没法测试，如果内存没这么贵，就换主板买内存搞个 5060ti 16g 来测试了，这个可能也是一种方案吧。

OSS报SignatureDoesNotMatch错误的解决

LinuxDo 最新话题 · 2026-05-16 11:33:42+08:00 · tech

我们的oss是部署在内网的，下面讲一下解决过程。首先前置条件要具备： 1.endpoint通不通 2.确保你的AK（AccessKeyId）是对的 3.确保你的AS（AccessKeySecret）是正确的 4.objectKey真实存在 5.URL正确格式: http://bucketName .{endpoint}/{test/fileName.pdf}?AccessKeyId=xxxxxx&Expired=xxxxx&Signature=fwerurttiasixzcfsadfsaf 下载SDKcom.aliyun.oss aliyun-sdk-oss 3.15.0 用SDK生成签名URL 结果在浏览器里打开报SignatureDoesNotMatch错误分析：如果AK、AS、bucketName、objectKey、服务器时间任何一个出错都会报SignatureDoesNotMatch错误，但我们这里这个四个都没有问题，剩下的就是加密方式了。 oss默认签名算法是HMAC-SHA1，这个也没有问题。试了十几次还是报同样的错误，实在没辙。第二天突然想到用oss工具生成url签名看看行不行？打开了oss工具填了AK、SK等信息后登录进去了，再次证明AK、AS、bucketName、endpoint没有问题，然后随便找了一个文件，生成url签名，用浏览器打开是没有问题的，并且比对了工具与SDK生成的URL，没有什么差别，这时突然发现域名选择了自定义，而不是CNAME. 所以果断改了一下代码： ClientBuilderConfiguration conf = new ClientBuilderConfiguration(); // 私有云要关闭CNAME conf.setSupportCname(false); OSS ossClient = new OSSClientBuilder().build(endPoint, accessKeyId, accessKeySecret, conf); 问题成功解决。【重点提示】私有云一定要关闭 CNAME，才能正常认证通过！！！ 1 个帖子 - 1 位参与者阅读完整话题

求解关于项目node版本与ai agent 插件的兼容问题

linux.do · 2026-04-27 16:55:00+08:00 · tech

有没有佬们遇到过这个问题：前置条件：公司绝大多数项目都是老项目用的node<14的版本(一旦>14项目就跑不起来)，而当下的ai agent工具(比如cc，codex等插件)的安装环境要求至少是node版本>=20。（ps：node版本管理工具是用的nvm进行版本管理）问题：出现跑了(node<14)项目就无法跑(node版本>=20)ai agent的问题。反之运行了ai agent再跑项目就跑不起来。相互打架二者不可得兼。请问佬们有没遇到过的且有好的解决方案的 1 个帖子 - 1 位参与者阅读完整话题

【apple->gpt plus】零基础从创建账号到gpt plus

linux.do · 2026-04-22 10:43:20+08:00 · tech

0前置条件： 0.1一部支持ios17的手机（gpt最低标准） 0.2土耳其节点 0.3使用节点商给的美区id登陆app store（不要登录到设置里的apple 账户）下载shadowrocket 1.注册账号 1.1切换土耳其节点 1.2在 www.apple.com 中拖到最下方，account-manage your apple account,跳转页面右上角创建apple 账户注册账号，地区选择土耳其，验证方式选择短信 1.3手机端切到土耳其节点，登陆这个apple账户，在app store上登陆账户，右上角头像，账户-country，切换到turkiye 1.4（无需魔法）在中 www.seagm.com 注册账号 2.购买 2.1在seagm上搜索apple，跳转之后礼品卡地区选择土耳其，数量500，使用支付宝，实时付款78.22元，我的订单-获取卡-显示卡片-（卡密） 2.2手机端连上土耳其节点，app store -右上角头像-redeem giftcard or code-输入卡密 2.3app store中搜索gpt，登陆gpt，升级，直接支付即可备注：原则上只要是ios17及以上的设备都可以。我之前从未淘过非国行苹果设备，所以把需求发给豆包，然后在闲鱼找，然后全程使用豆包和卖家聊，最终想着以新手无后续麻烦的方式，选择了无锁可任意还原升级且没有隐藏ID 没有运营商锁的se2（这个是我的最低要求），京东拍拍国行64参考价520左右，有需要的自行选择 4 个帖子 - 2 位参与者阅读完整话题

/tag/前置条件