本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 赛博风格的个人影像站,几乎零成本部署使用,页面效果如图: 首页 公开图片展示 图片详情 相册足迹 边界地球 管理员上传页 管理员控制台 仓库地址 : GitHub - Space3044/Pixel-Space · GitHub 技术栈如图: 功能概览如图: 部署方式 1.在 cloudflare 中创建 D1 数据库,命名为 pixel-space,将 Pixel-Space/db/schema.sql at main · Space3044/Pixel-Space · GitHub 填入 D1 控制台并运行。 2.在 cloudflare 中创建 R2 桶,命名为 pixel-space。 3.fork 本仓库,将 Pixel-Space/wrangler.toml at main · Space3044/Pixel-Space · GitHub 文件中的 database_id 填写自己真实创建的 D1 数据库的 id。 4.在 cloudflare pages 创建项目,连接 github 仓库。 pnpm build 构建命令 dist 输出目录 生产环境变量如下: # Telegram 原始图片存档 # 创建 tg 机器人,创建 tg 频道,将机器人添加为频道管理员 TG_BOT_TOKEN= TG_CHAT_ID= # 兼容 OpenAI 的 AI 代理认证密钥 # 推荐自部署 CPA,这样就可以长久只使用一个 Key PROXY_KEY= # 高德地图前端 JS API 配置(国内地图) # 高德开发者平台新建项目,添加 Key,选择 Web 端,设置域名白名单 AMAP_JS_KEY= AMAP_SECURITY_JS_CODE= # 高德地图 Web 服务密钥(服务端国内静态地图) # 高德开发者平台添加 Key,选择 Web 服务 AMAP_WEB_KEY= # Mapbox 公共令牌(全球地图及静态地图生成) # Mapbox 注册我使用的是 Proton Mail,虚拟 0 刀卡,设置域名白名单 MAPBOX_PUBLIC_TOKEN= # MapTiler 密钥(全球地理编码) # 直接邮箱注册 MAPTILER_KEY= # Cloudflare Turnstile 访客验证,使用验证码获取原图时使用 # cloudflare 创建 turnstile 组件 TURNSTILE_SECRET_KEY= VITE_TURNSTILE_SITE_KEY= # Cloudflare Access 生产环境管理员认证 # cloudflare zero trust 下访问控制新建一个应用程序,保护 /upload*,/library*,/api/admin/* 三个路径,策略选电子邮件,填入管理员邮箱 CF_ACCESS_AUD= CF_ACCESS_TEAM_DOMAIN= 变量具体说明: 仓库内提示词可以借鉴优化: Pixel-Space/db/ai-prompt.example.md at main · Space3044/Pixel-Space · GitHub 本项目通过 https://linux.do/t/topic/1179841 获得灵感,更偏向于个人使用。 本项目的边界地球交互参考并改写自 @lsy 佬的 https://github.com/lsy2246/newechoes/blob/master/src/components/WorldHeatmap.tsx tips: 如果图片的exif自带经纬度信息可以自动逆位置名称,不带经纬度信息只能手动锚点或搜索定位。 尼康相机如果机身没带 GPS 模块,可通过 SnapBridge 连接相机,拍摄时通过手机获取位置信息传到相机写入 exif(我最近才知道,我目前上传图片都是手动凭记忆定位 ) 1 个帖子 - 1 位参与者 阅读完整话题
如果别人在我的帖子上加了boost,后面我帖子进行修改,那么加上boost的佬友会收到通知吗? 我似乎从来没收到过这种通知? 我感觉是否有这种通知会好一点?这样也可以看boost提出的问题,也可以修改帖子的内容来回复一下? 这个通知功能会在始皇曾经说不修改boost特性的范围之外吗 3 个帖子 - 3 位参与者 阅读完整话题
我都没有Prompt,AI自己生成的技术方案,要实现一个游戏技能,结果就违反政策了,要求改Prompt,这咋办? A/这操作让我没法继续啊 11 个帖子 - 7 位参与者 阅读完整话题
分享一次自己的踩坑经历,给大家提个醒。 我明天的 Business 套餐就要进行第二次续费了,目前用的是泰区优惠订阅。因为明天就是下个月套餐的更新时间,我想着提前看一下是不是需要手动充值,于是打开了结算界面。 结果看到里面有一个“额度余额”之类的入口,我当时误以为这是后续自动续费用的钱包或者账本,于是就往里面充了 1300 THB(折合快300 RMB)。充完之后越想越不对劲,去网上一查才发现,这个余额并不是会员套餐续费用的,而是当前套餐调用超额之后,类似 Codex 等额外用量产生费用时才会扣的额度。 当场泪目 。 更难受的是,这个余额好像还有 12 个月有效期,过期就没了。也就是说,如果后面不用到这些额外额度,这笔钱基本就亏麻了,呜呜。 所以提醒大家,以后一定要注意:Business 套餐续费只要绑定的信用卡里有足够支付下个月扣款的金额就行,不要看到“额度余额”就以为是续费账户,更不要随便往里面充值。 看到这里的陌生人,可以留下一个赞 安慰一下我吗?帮我飞升一下 3 级,感激不尽 。 3 个帖子 - 2 位参与者 阅读完整话题
agent 是智能体的意思,什么是智能体呢,为啥不叫AI了啊,也不叫大模型了,其实这并不是孤立的概念,AI中文就是人工智能,英文全称:Artificial Intelligence,其实就是计算机科学的一个分支,用来研究开发模拟,延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品,大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节,比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议,用来,调用外部的服务器,返回固定内容信息的一个规则,大家都用这个规则,不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思,这里和mcp紧密相连,tools泛指一类工具,遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思,就是个扩展包,这不是ai独有的概念,浏览器有插件,任何应用都可能有插件,一个插件里面东西就多了,可以包含skill,agents,hooks,mcp severs等内容。 prompt是提示词的意思,大模型学的东西多了,大模型要在知识汪洋中预测你想要的下一个词,简直不要太难,那么就帮她缩小范围降低幻觉,那就是定人物,定任务范围,定目标,这样将结合以上的信息,进行数据处理,就大大降低了,大模型胡说八道的可能性。大模型本身就是个统计学问题,根本不具备任何智慧,和反思能力,并非动态进化的,而是提前通过人类社会无数的现有文档,向量化,然后通过多维向量的训练出来的,一个具备无数维度的数学矩阵,通过通过上下文的切割成token又称词元,一个词元就是一个数字,多个词元就组成了一个数学矩阵,将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢,会影响回应呢? workflow就是工作流,针对一项工作设计的工作流程,使其完成特定的任务,取代繁重的工作。 hook钩子的意思,什么是钩子啊就是,当执行到特定情况或者涉及特殊判断的时候就会触发的程序,相当于一个钩子,勾住了你的工作流,在特定情况下触发,进而保证进程的稳定和顺利。 skill技能的意思,技能可以是一个md说明的工作文档,也可以是md说明文档加一些小程序、或者一些模板的综合体,目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台,工作台上啥也有,自由搭配,想用啥就用啥,比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt:给模型的指令 ├── Context:当前任务上下文 ├── Memory:可长期保存或检索的历史信息 ├── Tools:模型可调用的外部能力 │ └── MCP:连接 tools / resources / prompts 的标准协议之一 ├── Workflow:预设流程 ├── Hook:生命周期触发器 ├── Skill:可复用能力包 ├── Plugin:可安装扩展包 └── Harness:运行框架 / 执行外壳 agent 是配置了 instructions、tools,以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool:一个具体能力 MCP Tool:通过 MCP 协议暴露出来的 tool MCP Server:把一组 tools / resources / prompts 提供给 AI 应用 Agent:根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说,plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围,降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令,让模型更稳定地产生符合要求的内容。 大模型本质上是通过大量数据训练出来的神经网络,它没有人类意义上的主观意识,也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数,以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”,更多是模型在特定提示、上下文或工具流程下表现出来的能力,而不是人类式的自我意识。 Token:文本被切分后的处理单位。 Token ID:token 被映射成的数字编号。 Embedding:token ID 进入模型后对应的向量表示。 Parameter:模型训练出来的权重和偏置。 Context window:一次输入/输出能处理的 token 上限。 Training tokens:训练时看过的数据 token 数量。 Vocabulary size:分词器支持的 token 种类数量。 文本会先被 tokenizer 切成 token,再映射成 token ID。模型会把 token ID 转成向量表示,也就是 embedding,然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络,结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量,和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单,再判断退款规则,再调用退款接口,再发送通知。workflow 里可以用大模型,也可以不用大模型。它和 agent 的区别是:workflow 的路径主要由人或程序提前写好;agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚:workflows 是 LLM 和工具通过预定义代码路径编排;agents 则是 LLM 动态决定自己的流程和工具使用。 这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包,包含 instructions、metadata 和可选资源,比如 scripts、templates,Claude 会在相关任务中自动使用。 另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context:这次对话/这次任务临时放进来的信息。 Memory:跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息,比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息,比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化,而是系统把相关历史信息保存下来,在需要时重新塞回 context。 5 个帖子 - 4 位参与者 阅读完整话题
目前我在一家电商公司,手里有一个 AI 生图 Web 项目。现阶段项目主要是基于一些 workflow 调用 API 进行生图,还没有发展到 Agent 形态。 最近我发现,很多中转站宣称“全量支持 OpenAI compatible 接口和参数”,但实际使用下来,这类说法的价值很有限,甚至会误导开发者。 以最常见的结构化输出为例,也就是 JSON 格式化输出。大部分低价中转站底层并不是调用真正的 OpenAI 标准 API,而是使用 GPT 订阅账号、ChatGPT/Codex 后端,甚至有些还会混用能力更弱的模型。这样一来,即使请求里传了 OpenAI compatible 的 response_format 、 json_schema 、 strict 等参数,也不代表这些参数真的会在 API 层被严格执行。 实际结果是,请求可能只是被中转站转写成 prompt,再交给 GPT/Codex 类渠道处理。模型输出本身具有随机性,一旦没有真正的 schema 约束,就会出现偶发问题:比如额外增加字段、缺失字段、字段类型错误,甚至返回的内容根本不是合法 JSON。 如果项目里再叠加重试、修复、二次解析等机制,虽然可以提高成功率,但也会带来明显副作用:响应时间变长、成本上升、链路复杂度增加,用户体验下降。对于追求代码质量和系统稳定性的开发者来说,这类补丁式处理也会显得很别扭。 以上,如果因为预算或者其他某些因素不得不基于中转进行开发的情况下,最好还是注意一下 1 个帖子 - 1 位参与者 阅读完整话题
大佬们,Codex 逆向绕过或者破解 App ,是不是只能进行官方的 Cyber 认证才能做?有没有其他绕过的方式? 3 个帖子 - 3 位参与者 阅读完整话题
在找工作过程中突然有来了个短信找我要邮件地址进行沟通 后面在邮件中进行沟通给出了一个朝九晚五,福利待遇十分好的岗位,以为天上掉馅饼了。 但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号,请大伙凑个热闹看看软件是不是骗子软件。 警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载,或在虚拟环境中试用。
在找工作过程中突然有来了个短信找我要邮件地址进行沟通 后面在邮件中进行沟通给出了一个朝九晚五,福利待遇十分好的岗位,以为天上掉馅饼了。 但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号,请大伙凑个热闹看看软件是不是骗子软件。 警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载,或在虚拟环境中试用。
在找工作过程中突然有来了个短信找我要邮件地址进行沟通 后面在邮件中进行沟通给出了一个朝九晚五,福利待遇十分好的岗位,以为天上掉馅饼了。 但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号,请大伙凑个热闹看看软件是不是骗子软件。 警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载,或在虚拟环境中试用。
求助: 就是在开发h5的时候 跳转一个空白页面会进行微信oauth2授权,完成之后跳到B页面,但是这个时候在B页面侧拉返回的时候,会出现: 会出现空白页(android 和 ios 都会出现),而不是重新授权,企业微信应用中打开就会重新授权(ios 会出现) B页面侧拉返回,需要俩次才能推出应用 使用 window.location.replace 方法。 想要的一个效果: 客户打开 链接 跳转空白页授权,授权完成之后跳转B页面,B页面侧拉返回推出,而不是再回到授权的页面。这个有解决方案吗? 1 个帖子 - 1 位参与者 阅读完整话题
最近在使用paseo 进行远程开发,但发现在电脑端cc使用 /resume 恢复的会话中 不包含我在移动端对话的内容。 请问各位大佬,这个会话内容是通的么,是否可以恢复? 4 个帖子 - 4 位参与者 阅读完整话题
先看结果. 方法:在系统提示词加上 你需要在<think></think>中深思熟虑后再进行回复 note:注意标签为<think>而非<thinking> thinking level:max 即可.最早是因为我的客户端和中转站八字不合死活不思考发现的. 9 个帖子 - 6 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 / 我的开源项目完整开源,无未开源部分: 是 / 我的开源项目已链接认可 LINUX DO 社区: 是 / 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 / 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 / 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 项目介绍 :这是一个让 Codex 能通过本地网关使用 DeepSeek Web 的桥接项目,适合个人学习、研究和非商业使用。 关于封号 : 最重要的点就是有佬回应我说关于 封号问题 我从测试以来接入过openclaw 现在接入我自己的软件上的翻译跟AI自动回复,目前是0封号,这个需要佬们自行测试! 开源地址 GitHub - db9cd2fgbj-hash/codex-deepseek-bridge · GitHub 2 个帖子 - 1 位参与者 阅读完整话题
求一些额度比较多的公益站,用于codexcli 进行开发。 拜托了,球球了 2 个帖子 - 2 位参与者 阅读完整话题
今天发现我用l站注册的公益站莫名其妙多了一个令牌,并且还自己去福利站进行签到。签到完之后又去消耗我的token。这个公益站只绑定了我的l站账号,有没有佬友遇见过相同情况的? 1 个帖子 - 1 位参与者 阅读完整话题
有些接口只支持 V1completions,如何去适配message和response,我尝试用 CodeX 帮我进行适配,但是总会出现莫名其妙的问题,想知道有没有一种 skill 或者是一种可以参考的,或者是现成的方案 3 个帖子 - 3 位参与者 阅读完整话题
目前想基于一个github项目进行二开,有以下几点需求: 1、首先对项目进行全面的审计,起码要搞清楚每个文件是干嘛的,细致到系统函数最好,重点是新会话不需要重新读源码就能知道每个文件是干嘛的,因为需要改动的部分比较多,一个会话肯定搞不完。 2、能否有一个需求任务进度追踪skills,就是基于我的需求进行更细致的拆分,然后记录了这个会话完成了哪些需求,修改了哪些文件,便于新会话接着这个进度继续。 3、现在佬们都用什么记忆系统,用了一些要么觉得太重,要么占用会话上下文太多,要么触发时机,记录内容不太符合自身需求。 1 个帖子 - 1 位参与者 阅读完整话题
血的教训,帐号之前要求进行身份认证,使用persona认证,查了下闲鱼上可以帮过,说包过,确实认证是过了,走完了认证流程,结果帐号立马被封,连带的IP上其他正常帐号也被封。 1 个帖子 - 1 位参与者 阅读完整话题
突然想到:用户进行一次输入后,如果 Claude Code 调用了 5 次工具,是不是就相当于向 API 发送了五遍带上工具输出的完整上下文?我之前就知道 cache 的 计价会便宜,但是没把 toolcall 和这个联系起来。 也就是说算上 prompt cache,N 轮工具调用的 agent 的 input 费用应该是: input 费用 ≈ 全价 × 总新增部分(工具返回等增量) + 10% × Σ(N 轮请求时的 context 前缀长度) 假设用户在 context 已用 100k token 时发了一句话,Claude Code 进行了 N 次工具调用,那这 100k token 就要按缓存价收 N 次钱。如果是 DeepSeek,上面的 10% 变成 0.8%(梁圣的恩情还不完)。 我的疑惑是:这个按 N 轮重复计费合理吗?tool call 的返回不像用户输入那样可能隔很久才来,基本就几秒到几十秒。而现在的计费模式下,cache 从 disk 搬回 GPU 的每次 move 都要收全价 input 的 10%。 当然我也知道 decode 对长前缀的 attention 开销是每轮真实发生的,所以最朴素的设计应该是:超过某个 context 长度后,decode 价格阶梯上涨。(比如 minimax 搞得那个,当然我不支持他) 或许可以把现在这个"10% × N 次"的 cache 计费理解成"前缀越长 decode 越贵"的一种等效——总价差不多,只是记在了输入侧。但 10% 这个系数显然偏高(DeepSeek 做到了 0.8%),是不是可以把 10%理解成 Anthropic 这类头部闭源模型的品牌溢价 + 长前缀 decode 成本的打包等效? 恳请佬友们解个惑 1 个帖子 - 1 位参与者 阅读完整话题