非专业 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-05-23 17:50:03+08:00 · tech

说明：本人非专业程序员，只是目前刚开始使用AI并利用优化自己工作，从中记录了一些使用心得及踩的坑，分享给相关类似的佬友。适用范围：不知道如何使用AI、纠结使用哪种AI，想利用AI平时制作PPT、维护公司简单小程序/网页的人。一、AI工具选择与上网环境配置 1.1 主流AI模型选择目前市面上有很多AI模型，经过多轮对比和长期感受，目前适配制作PPT、维护已经开发好的简单小程序/网页，开发简单的工作需求、支持自然语言交互、能高效完成的主流AI模型为 Claude 和 OpenAI（ChatGPT）。这两个AI，目前最大的难点并非如何操作，而是如何解决账号封禁、实现稳定使用，这也是我前期花费大量时间摸索的核心问题，如果能稳定使用这两者，我相信，各位相关佬友通过一点点尝试，总能找到适合自己的使用方式。下面就分享下我个人目前使用的小白使用方案。 1.2 上网环境对于平时未深入接触上网环境的佬友，自建节点、拼家庭宽带无疑还要花费更多时间成本及学习成本。经这一两个月逛站及个人体验，目前发现：OpenAI风控宽松，极少封号；Claude封号无固定规律，哪怕使用个人家用宽带，也存在随机封号风险。因此，个人建议不爱折腾的佬友，直接购买购买稳定、自带家庭宽带属性的优质机场，可能是最优方案（个人经过站内搜索，现长期使用 TAG，暂未遇到问题）。 1.3 会员充值此前为使用Claude和ChatGPT，尝试过使用中转站与第三方代充会员。但使用中也发现中转站会存在掺假模型、缓冲低、甚至跑路等问题；第三方代充存在差价，部分可能使用黑卡导致账号封禁/掉会员。最终在逛站及个人对比下，认为日常中等使用量场景下使用苹果礼品卡进行官方充值是最优的方式，即保证是官方模型，也能最大程度在充值这块防止被封号。各区低价会员参考： Claude Pro：尼日利亚区价格最低 GPT Plus：土耳其区价格最低实时全球各区价格查询： https://appstoreprice.org/zh 二、详细充值实操介绍（以土区为例）步骤1：准备Apple ID账号使用全新注册的非国区Apple ID，或自己闲置的非国区旧账号，最好是老一点的账号。步骤2：切换地区开启对应地区节点（土耳其区），进入Apple ID设置，手动修改商店地区为土耳其。步骤3：设置付款方式修改地区后，付款方式显示为 None 。若未出现该选项，可切换节点尝试，或通过手机UU加速器加速苹果商店后重试（本人亲测有效）。步骤4：填写合规地区地址使用专用地址生成器，随机生成土耳其地址：地址生成器1： Real Address Generator 地址生成器2： https://cn.americaaddress.com/turkey-address/ 步骤5：校验账号转区成功退出当前Apple ID，打开Safari浏览器，复制下面对应地区跳转链接，登录账号，查看是否转去成功。尼日利亚区跳转链接： itms-apps://itunes.apple.com/WebObjects/MZStore.woa/wa/resetAndRedirect?dsf=143561&cc=ng 土耳其区跳转链接： tms-apps://itunes.apple.com/WebObjects/MZStore.woa/wa/resetAndRedirect?dsf=143480&cc=tr 步骤6：养号规避风控转区成功后，建议先随意下载几款免费App，模拟正常用户使用行为，降低苹果系统风控判定，并不要一上来就开通会员，建议多放几天，或提前准备苹果账号。步骤7：礼品卡购买土耳其区：通过 Oyunfor 网站，使用可外币支付的卡进行支付（个人使用国内万事达卡）；尼日利亚区：尼区无土区类似礼品卡购买网站，个人是在闲鱼上选择销量高的商家进行购买，主要也是以防黑卡，导致账号被封。重要提示：购买礼品卡充值到相应账号后，建议不要立即开通AI会员，以防是黑卡，黑卡会先封苹果账号。步骤8：AI会员开通与使用登录尼区苹果账号，下载Claude客户端，登录后开通Claude Pro会员登录土区苹果账号：下载ChatGPT客户端，登录后开通GPT Plus会员注意：下载、登录、开会员全过程建议开启代理模式；后续非必要不使用移动端登录、别乱切节点，最大程度避免封号。更多注册苹果账号教程可参考其他佬友的详细教程： https://linux.do/t/topic/2198779 国区Apple ID转区指南（土区为例）成功开通尼区Claude Code 5x Max！三、个人AI辅助工作实测使用感受 3.1 PPT制作极其推荐使用 Claude 进行整体制作，其成品更符合我个人审美且更能达到我预想的预期，远超其他AI，个人觉得是遥遥领先。PPT图片有条件的佬友可以使用Gemini 进行生成。 3.2 小工具/简易代码开发 Claude、GPT均可满足日常需求。个人常用 Codex桌面端，目前对我工作中外包开发好的简单小程序，通过自然语言就能优化达到我想要的新需求，遇到问题直接截图让他解决即可。 3.3 简易工具开发针对个性化工作需求，目前发现使用开源的脚手架进行二次开发，可能更适合我这样没有编程基础的，让AI先熟悉脚手架，再让根据你的需求改就好，个人仅尝试并完成了简单的需求开发。以上均为个人新手实操经验，仅作交流分享，如有错误，欢迎各位佬友们批评指正！ 2 个帖子 - 2 位参与者阅读完整话题

DeepSeek V4 非专业解读

linux.do · 2026-04-26 16:07:33+08:00 · tech

从 DeepSeek V4 个人技术前瞻继续讨论：终于经过望眼欲穿的等待，DeepSeek-V4千呼万唤始出来，发布以后，回看此前的前瞻，还是有些出入，最期待的也最需要修正的部分是对Engram的预期。从V4技术报告来看，也许笔者的预期过于乐观，在这一代中暂时没有条件落地应用。不过条件记忆、知识检索解耦、模型内部稀疏访问等问题仍然值得长期跟踪，也许在DeepSeek V4.5出现也未可知。回到正题，本次V4的主线围绕百万Context，并降低了训练和推理的综合成本，实实在在的体现了报告标题 Towards Highly Efficient Million-Token Context Intelligence 。具体参数不再赘述，报告的开篇图片就提到了在 1M context 下，V4-Pro 相比 V3.2 只需要 27% 的单Token推理FLOPs和10%的KV cache；V4-Flash 则降至 10% FLOPs 和 7% KV cache。在笔者看来，推理性价比比窗口长度本身更重要。长上下文能力的价值不只取决于最大输入长度，还取决于长输入下的单位任务成本。如此一来，交给Agent做的低难度长历程任务例如代码仓库理解、跨文档分析、多轮搜索、工具调用等，V4使得这些场景在经济上可承受。值得一提的是，本次的发布仍然体现了DeepSeek在模型架构方面的探索和实践，V4的核心架构升级中值得一提的就是CSA/HCA混合注意力。与V3时代以来，业界祖宗之法不可变的DSA（NSA)相比，V4设计了这两种注意力机制交错使用，并加入滑窗注意力保留近期局部依赖。基本思路是把长上下文的信息访问拆开处理。远距离信息通过 HCA 的极致压缩保留全局视野，可能相关的信息通过 CSA 的稀疏选取召回，近期信息通过滑窗保持更高分辨率。这样的混合架构相比于DSA等稀疏注意力机制，等于在模型里嵌入了一个微型多级搜索引擎，对Tokens 的压缩/分块/语义化/分层检索/共享缓存做得非常精细，虽然代价是精度上的取舍。至于架构方面，DeepSeek的看家绝活mHC已经在前瞻中提到不再赘述。尽管本次V4-Pro的预训练规模达到33T tokens、和1.6T总参数，mHC的工程开销仅为overlapped 1F1B pipeline stage 的 6.7%。另外不出意外地是 Muon 优化器在多数模块上取代了 AdamW，作为目前业界的主流趋势的优化器倒也合理。但是由于使用了新的混合注意力机制，并且巨大的参数量，在这次训练过程中V4也遇到了 loss spike 问题，DeepSeek报告中说用了两个奇技淫巧但其理论机制尚未完全理解，选择公开分享以供社区研究。（笔者看不懂这俩技巧没法分析）在Agent时代，模型的后训练变得越来越重要，而本次的V4在后训练方面笔者认为也是非常精彩的，他们把后训练也分为多个阶段，首先是专家训练，这个和V3时代是一致的，但是没有使用GRPO而是跟进了业界的OPD策略；其次是对难验证任务使用了生成式的奖励模型来评估策略；工具调用方面，V4使用了自构建的DSL格式，减少了逃逸风险和工具调用报错，但是也导致首发后出现Skill不调用以及tool call表现差的问题，换用其对应的parser是可以解决的不知道后续会不会在后训练中加上这一部分的映射纠正。此外，本次报告用了相当篇幅描述Agent所需的工程基础设施，为后训练和评估建立了一个数十万并发的沙盒平台以至于被夸赞是业界最强的infra团队。至于硬件方面，很可惜本次还是没有使用国产平台进行训练，希望推理阶段能够加大国产卡应用进一步降低API价格。评测方面社区已经有大量的帖子，基本上是在开源模型中的第一梯队但是离闭源的Opus4.7/GPT5.4 还是有一定距离。在报告中，DeepSeek的内部问卷调查“你愿不愿意把V4当成你日常的首选编程模型”，85人的回答是52%愿意/39%倾向于愿意/9%不愿意。这个反馈也是比较真诚的。不过目前体验下来，Pro 在推理模式下速度偏慢，且开销为同类模型的两到三倍，其实这一点在之前的V3时代已经有体现了，尤其是昙花一现的exp试验版本就是力大砖飞的思路；至于创意写作和非推理任务上笔者认为是略有不足的，虽然有人提到V4-Pro破限任务表现出色，但是笔者认为其创意性受推理能力训练的影响有所失色。相较而言，笔者认为v4-flash是一个不错的干活模型。回看前瞻中的各项判断。mHC确实不出意外, 且长上下文与 Agent系统栈的方向判断基本成立，多模态方面未来可期（打脸了笔者的前瞻，也许是作为一家更偏研究性机构不可避免的训练数据量问题），而最为期待的Engram仍在路上。总的来说，作为一款大家期待已久的国产之光，DeepSeek这次的表现可圈可点，虽然性能还做不到脚踢A 拳打奥特曼，但是成本上确实是非常出色。毕竟百万上下文输入1块钱要什么自行车（PRO也只要3块钱了，恐怖最后笔者非常喜欢DeepSeek的态度，「不诱于誉，不恐于诽，率道而行，端然正己。」作为一个在L站从V2时期折腾Cocopilot + DeepSeek FIM替代copilot的老用户，真心希望他们可以向实现 AGI 的目标不断靠近。 3 个帖子 - 2 位参与者阅读完整话题