前置条件:要挂梯子,不然可能页面刷不出来 注册登录 https://www.oyunfor.com/ 选App Store Card,选你要的面额,点击添加购物车 进入结算页,点击右侧付款按钮 选第一个信用卡Credit Card 选最后一个类型,然后点击付款 选择或输入国内的外币信用卡或借记卡的信息进行付款 进入银行结算页,可能会打不开页面,将isbank.com.tr加入梯子直连,或者关闭梯子,刷新该页面 跳转回oyunfor订单页面, situation栏显示刚才的订单状态是 accepted 或 confirmed 说明支付成功 挂上梯子,点击订单 detail 下的箭头,可以看到卡密 去apple store 登录土区apple id,点右上角头像,然后在 redeem gift card or code 里输入卡密即可充值 2 个帖子 - 2 位参与者 阅读完整话题
加入社区之后也是终于升到2级了,但是为什么还是没有解锁跳蚤市场呢?跳蚤市场要怎么才能解锁呢各位佬友。 2 个帖子 - 2 位参与者 阅读完整话题
1 个带 API、且能连续正常接收 PayPal 验证码的 US +1 接码手机号 1 个或 N 个支持 IMAP 和 Graph 的 Outlook 邮箱 或者 自建Cloudflare Temp Email (edu前缀,如edu.openai.com才有试用资格) 1 个相对干净、支持 PayPal 注册的 US 代理 (干净就不会跳PAYPAL的注册滑块,账单页面的Captcha扩展已经设置了自动屏蔽) 这里如果是换成荷兰节点行不行?手机号号商有推荐吗? 4 个帖子 - 2 位参与者 阅读完整话题
前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。
前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。
前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。
前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。
前置条件:5070ti 16g ,llama.cpp ,全跑在显存。 1. 跑 gemma4 26b a4b iq4_xs 量化( MoE 结构) 速度大概是 120t/s-150t/s ,首 token 和后续输出都很快 2. 跑 devstral small2 24b q4_k_m 量化 (稠密结构) 速度大概是 8t/s-10t/s ,首 token 可能很慢,整体输出都慢得多。 思考: 现在的模型有两种结构:稠密( Dense )和 MoE (混合专家模型)。 以上述两种模型举例 稠密模型是所有层( dev 这个有 40 层)都参与计算,消耗 24b 的完整算力,也就是单 token 2x24b=48gflops (不算量化),算力消耗大,推理成本高。 moe 是总共 26b 参数,每次推理只激活 4b 参数,只消耗激活参数 4b 的算力,单 token 算力消耗 2x4=8gflops ,算力消耗小很多,但有 26b 的参数(知识)。gemma 这个有 128 个专家,每次激活 8 个专家和 1 个共享专家(所有 token 必须首先经过共享专家),moe 模型是通过动态路由判断选择专家的。 可以看出算力需求差异巨大。 常见的几个顶级开源模型 glm5.1 参数 754b 激活 40b deepseek-v4 pro 参数 1.6t 激活 49b v4 flash 参数 284b 激活 13b minimax2.5 参数 229b 激活 10b moe 模型虽然每次激活的参数少,但必须把完整参数都全量加载到显存中。也就是说算力消耗大大减少,但显存需求没变。 可以大概推测,顶级大模型以后可能只有 moe 结构了,参数小的可能有稠密架构,因为算力成本还尚可接受,参数量很大的稠密结构,恐怕算力成本高到厂商也难以商用吧。 本地部署,我看来推理速度有 40-50token/s ,基本可以自用了,这是一个及格线。 我看来有两种比较好的本地部署方案 1. 买 nv 工作站显卡,pro6000 96g 咸鱼 6w 多,pro6000d 84g (显存没 ecc ,整体比 6000 略差)咸鱼 4w ,pro5000 84g 这种。 2. 用同等价钱稍微低点,等 m5 pro 的 mac mini/studio 发布后购买。 改显存,矿卡,二手的很久的专业卡等就不讨论了,不懂这部分。 mac 跑推理,olmx 官网我看了模型推理速度排行榜,还是差了点,不知道 4w 价钱的 m5 pro 的 mac mini/studio 会不会明显提高。 还有就是比如双 5070ti 跑模型推理,不知道速度怎么样,价钱相对不贵。我用的是 ddr4 pcie 4.0 的主板,双显卡要 pcie 拆分 8x8 ,pcie5.0 肯定更好,我得换主板换内存,成本太高,没法测试,如果内存没这么贵,就换主板买内存搞个 5060ti 16g 来测试了,这个可能也是一种方案吧。
我们的oss是部署在内网的,下面讲一下解决过程。 首先前置条件要具备: 1.endpoint通不通 2.确保你的AK(AccessKeyId)是对的 3.确保你的AS(AccessKeySecret)是正确的 4.objectKey真实存在 5.URL正确格式: http://bucketName .{endpoint}/{test/fileName.pdf}?AccessKeyId=xxxxxx&Expired=xxxxx&Signature=fwerurttiasixzcfsadfsaf 下载SDKcom.aliyun.oss aliyun-sdk-oss 3.15.0 用SDK生成签名URL 结果在浏览器里打开报SignatureDoesNotMatch错误 分析: 如果AK、AS、bucketName、objectKey、服务器时间任何一个出错都会报SignatureDoesNotMatch错误,但我们这里这个四个都没有问题,剩下的就是加密方式了。 oss默认签名算法是HMAC-SHA1,这个也没有问题。试了十几次还是报同样的错误,实在没辙。 第二天突然想到用oss工具生成url签名看看行不行?打开了oss工具填了AK、SK等信息后登录进去了,再次证明AK、AS、bucketName、endpoint没有问题, 然后随便找了一个文件,生成url签名,用浏览器打开是没有问题的,并且比对了工具与SDK生成的URL,没有什么差别,这时突然发现域名选择了自定义,而不是CNAME. 所以果断改了一下代码: ClientBuilderConfiguration conf = new ClientBuilderConfiguration(); // 私有云要关闭CNAME conf.setSupportCname(false); OSS ossClient = new OSSClientBuilder().build(endPoint, accessKeyId, accessKeySecret, conf); 问题成功解决。【重点提示】私有云一定要关闭 CNAME,才能正常认证通过!!! 1 个帖子 - 1 位参与者 阅读完整话题
有没有佬们遇到过这个问题: 前置条件:公司绝大多数项目都是老项目用的node<14的版本(一旦>14项目就跑不起来),而当下的ai agent工具(比如cc,codex等插件)的安装环境要求至少是node版本>=20。 (ps:node版本管理工具是用的nvm进行版本管理) 问题:出现跑了(node<14)项目就无法跑(node版本>=20)ai agent的问题。反之运行了ai agent再跑项目就跑不起来。相互打架二者不可得兼。 请问佬们有没遇到过的且有好的解决方案的 1 个帖子 - 1 位参与者 阅读完整话题
0前置条件: 0.1一部支持ios17的手机(gpt最低标准) 0.2土耳其节点 0.3使用节点商给的美区id登陆app store(不要登录到设置里的apple 账户)下载shadowrocket 1.注册账号 1.1切换土耳其节点 1.2在 www.apple.com 中拖到最下方,account-manage your apple account,跳转页面右上角创建apple 账户注册账号,地区选择土耳其,验证方式选择短信 1.3手机端切到土耳其节点,登陆这个apple账户,在app store上登陆账户,右上角头像,账户-country,切换到turkiye 1.4(无需魔法)在中 www.seagm.com 注册账号 2.购买 2.1在seagm上搜索apple,跳转之后礼品卡地区选择土耳其,数量500,使用支付宝,实时付款78.22元,我的订单-获取卡-显示卡片-(卡密) 2.2手机端连上土耳其节点,app store -右上角头像-redeem giftcard or code-输入卡密 2.3app store中搜索gpt,登陆gpt,升级,直接支付即可 备注:原则上只要是ios17及以上的设备都可以。 我之前从未淘过非国行苹果设备,所以把需求发给豆包,然后在闲鱼找,然后全程使用豆包和卖家聊,最终想着以新手无后续麻烦的方式,选择了无锁可任意还原升级且没有隐藏ID 没有运营商锁的se2(这个是我的最低要求),京东拍拍国行64参考价520左右,有需要的自行选择 4 个帖子 - 2 位参与者 阅读完整话题