进行 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

【开源推广】搭建个人影像站，可接入 AI 进行图片分析，图片可在地图上有迹可循，边界地球可展示旅行足迹

LinuxDo 最新话题 · 2026-06-11 23:09:19+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出赛博风格的个人影像站，几乎零成本部署使用，页面效果如图：首页公开图片展示图片详情相册足迹边界地球管理员上传页管理员控制台仓库地址： GitHub - Space3044/Pixel-Space · GitHub 技术栈如图：功能概览如图：部署方式 1.在 cloudflare 中创建 D1 数据库，命名为 pixel-space，将 Pixel-Space/db/schema.sql at main · Space3044/Pixel-Space · GitHub 填入 D1 控制台并运行。 2.在 cloudflare 中创建 R2 桶，命名为 pixel-space。 3.fork 本仓库，将 Pixel-Space/wrangler.toml at main · Space3044/Pixel-Space · GitHub 文件中的 database_id 填写自己真实创建的 D1 数据库的 id。 4.在 cloudflare pages 创建项目，连接 github 仓库。 pnpm build 构建命令 dist 输出目录生产环境变量如下： # Telegram 原始图片存档 # 创建 tg 机器人，创建 tg 频道，将机器人添加为频道管理员 TG_BOT_TOKEN= TG_CHAT_ID= # 兼容 OpenAI 的 AI 代理认证密钥 # 推荐自部署 CPA，这样就可以长久只使用一个 Key PROXY_KEY= # 高德地图前端 JS API 配置（国内地图） # 高德开发者平台新建项目，添加 Key，选择 Web 端，设置域名白名单 AMAP_JS_KEY= AMAP_SECURITY_JS_CODE= # 高德地图 Web 服务密钥（服务端国内静态地图） # 高德开发者平台添加 Key，选择 Web 服务 AMAP_WEB_KEY= # Mapbox 公共令牌（全球地图及静态地图生成） # Mapbox 注册我使用的是 Proton Mail，虚拟 0 刀卡，设置域名白名单 MAPBOX_PUBLIC_TOKEN= # MapTiler 密钥（全球地理编码） # 直接邮箱注册 MAPTILER_KEY= # Cloudflare Turnstile 访客验证，使用验证码获取原图时使用 # cloudflare 创建 turnstile 组件 TURNSTILE_SECRET_KEY= VITE_TURNSTILE_SITE_KEY= # Cloudflare Access 生产环境管理员认证 # cloudflare zero trust 下访问控制新建一个应用程序，保护 /upload*,/library*,/api/admin/* 三个路径，策略选电子邮件，填入管理员邮箱 CF_ACCESS_AUD= CF_ACCESS_TEAM_DOMAIN= 变量具体说明：仓库内提示词可以借鉴优化： Pixel-Space/db/ai-prompt.example.md at main · Space3044/Pixel-Space · GitHub 本项目通过 https://linux.do/t/topic/1179841 获得灵感，更偏向于个人使用。本项目的边界地球交互参考并改写自 @lsy 佬的 https://github.com/lsy2246/newechoes/blob/master/src/components/WorldHeatmap.tsx tips：如果图片的exif自带经纬度信息可以自动逆位置名称，不带经纬度信息只能手动锚点或搜索定位。尼康相机如果机身没带 GPS 模块，可通过 SnapBridge 连接相机，拍摄时通过手机获取位置信息传到相机写入 exif（我最近才知道，我目前上传图片都是手动凭记忆定位） 1 个帖子 - 1 位参与者阅读完整话题

相关专题

关于boost功能的一个疑问

LinuxDo 最新话题 · 2026-06-11 23:08:31+08:00 · tech

如果别人在我的帖子上加了boost，后面我帖子进行修改，那么加上boost的佬友会收到通知吗？我似乎从来没收到过这种通知？我感觉是否有这种通知会好一点？这样也可以看boost提出的问题，也可以修改帖子的内容来回复一下？这个通知功能会在始皇曾经说不修改boost特性的范围之外吗 3 个帖子 - 3 位参与者阅读完整话题

使用fable vibe一个小游戏，进行到一半报错 violate our Usage Policy

LinuxDo 最新话题 · 2026-06-11 22:55:47+08:00 · tech

我都没有Prompt，AI自己生成的技术方案，要实现一个游戏技能，结果就违反政策了，要求改Prompt，这咋办？ A/这操作让我没法继续啊 11 个帖子 - 7 位参与者阅读完整话题

记录一次 Business 套餐错误充值的经历

LinuxDo 最新话题 · 2026-06-11 19:48:23+08:00 · tech

分享一次自己的踩坑经历，给大家提个醒。我明天的 Business 套餐就要进行第二次续费了，目前用的是泰区优惠订阅。因为明天就是下个月套餐的更新时间，我想着提前看一下是不是需要手动充值，于是打开了结算界面。结果看到里面有一个“额度余额”之类的入口，我当时误以为这是后续自动续费用的钱包或者账本，于是就往里面充了 1300 THB（折合快300 RMB）。充完之后越想越不对劲，去网上一查才发现，这个余额并不是会员套餐续费用的，而是当前套餐调用超额之后，类似 Codex 等额外用量产生费用时才会扣的额度。当场泪目。更难受的是，这个余额好像还有 12 个月有效期，过期就没了。也就是说，如果后面不用到这些额外额度，这笔钱基本就亏麻了，呜呜。所以提醒大家，以后一定要注意：Business 套餐续费只要绑定的信用卡里有足够支付下个月扣款的金额就行，不要看到“额度余额”就以为是续费账户，更不要随便往里面充值。看到这里的陌生人，可以留下一个赞安慰一下我吗？帮我飞升一下 3 级，感激不尽。 3 个帖子 - 2 位参与者阅读完整话题

我想想目前，大家经常说的名词有哪些啊，agent, MCP, tools, Plugin, Prompt, workflow，Hook，skill，harness，memory/context大概就是这些吧，为了方便大家理解，和大佬指正错误，我将按名词进行解释：

LinuxDo 最新话题 · 2026-06-11 17:55:32+08:00 · tech

agent 是智能体的意思，什么是智能体呢，为啥不叫AI了啊，也不叫大模型了，其实这并不是孤立的概念，AI中文就是人工智能，英文全称：Artificial Intelligence，其实就是计算机科学的一个分支，用来研究开发模拟，延伸人的理论方法技术和应用研究。大模型是ai具象化的技术产品，大模型还分了LLM语言大模型、VLM视觉大模型、MLLM多模态、技术上又出现了很多细节，比如混合专家模型-MOE。 MCP 是定的ai识别的上下文协议，用来，调用外部的服务器，返回固定内容信息的一个规则，大家都用这个规则，不就方便了ai调用外部工具获取信息了。方便打通不同企业数据库和ai的交互。 tools 就是工具的意思，这里和mcp紧密相连，tools泛指一类工具，遵循的上下文协议也未必是mcp。方便ai通过这个工具进行获取信息。 plugin是插件的意思，就是个扩展包，这不是ai独有的概念，浏览器有插件，任何应用都可能有插件，一个插件里面东西就多了，可以包含skill，agents，hooks，mcp severs等内容。 prompt是提示词的意思，大模型学的东西多了，大模型要在知识汪洋中预测你想要的下一个词，简直不要太难，那么就帮她缩小范围降低幻觉，那就是定人物，定任务范围，定目标，这样将结合以上的信息，进行数据处理，就大大降低了，大模型胡说八道的可能性。大模型本身就是个统计学问题，根本不具备任何智慧，和反思能力，并非动态进化的，而是提前通过人类社会无数的现有文档，向量化，然后通过多维向量的训练出来的，一个具备无数维度的数学矩阵，通过通过上下文的切割成token又称词元，一个词元就是一个数字，多个词元就组成了一个数学矩阵，将这个数学矩阵扔到transform架构的数学矩阵中。我也不知道是不是百亿参数是不是也决定了词元的数量呢，会影响回应呢？ workflow就是工作流，针对一项工作设计的工作流程，使其完成特定的任务，取代繁重的工作。 hook钩子的意思，什么是钩子啊就是，当执行到特定情况或者涉及特殊判断的时候就会触发的程序，相当于一个钩子，勾住了你的工作流，在特定情况下触发，进而保证进程的稳定和顺利。 skill技能的意思，技能可以是一个md说明的工作文档，也可以是md说明文档加一些小程序、或者一些模板的综合体，目标就是让大模型能按你的md说明文档进行工作。 harness就是一个工作台，工作台上啥也有，自由搭配，想用啥就用啥，比如有plugin、tools、prompt、workflow、hook、skill、和设定好的agent。 AI / 人工智能 └── 大模型 / LLM / VLM / MLLM └── Agentic System / 智能体系统 ├── Prompt：给模型的指令 ├── Context：当前任务上下文 ├── Memory：可长期保存或检索的历史信息 ├── Tools：模型可调用的外部能力 │ └── MCP：连接 tools / resources / prompts 的标准协议之一 ├── Workflow：预设流程 ├── Hook：生命周期触发器 ├── Skill：可复用能力包 ├── Plugin：可安装扩展包 └── Harness：运行框架 / 执行外壳 agent 是配置了 instructions、tools，以及可选运行行为的 LLM MCP Server 可以向 AI 应用暴露 resources、prompts 和 tools。这样不同 AI 应用和不同外部系统之间就不用每次都重新写一套私有接口。 Tool：一个具体能力 MCP Tool：通过 MCP 协议暴露出来的 tool MCP Server：把一组 tools / resources / prompts 提供给 AI 应用 Agent：根据任务需要决定是否调用这些工具 plugin 可能包含 tools、skills、agents、hooks、MCP servers 等内容。简单说，plugin 是“打包和分发能力”的方式。 prompt 帮模型缩小范围，降低幻觉。这个是对的。OpenAI 文档也把 prompt engineering 描述为编写有效指令，让模型更稳定地产生符合要求的内容。大模型本质上是通过大量数据训练出来的神经网络，它没有人类意义上的主观意识，也不会在普通对话中自动修改自己的模型参数。它的回答来自当前输入、上下文、训练得到的参数，以及推理时的生成过程。我们看到的“推理”“反思”“自我检查”，更多是模型在特定提示、上下文或工具流程下表现出来的能力，而不是人类式的自我意识。 Token：文本被切分后的处理单位。 Token ID：token 被映射成的数字编号。 Embedding：token ID 进入模型后对应的向量表示。 Parameter：模型训练出来的权重和偏置。 Context window：一次输入/输出能处理的 token 上限。 Training tokens：训练时看过的数据 token 数量。 Vocabulary size：分词器支持的 token 种类数量。文本会先被 tokenizer 切成 token，再映射成 token ID。模型会把 token ID 转成向量表示，也就是 embedding，然后送入 Transformer 网络中计算。Transformer 通过注意力机制和多层神经网络，结合上下文预测后续 token。参数量指的是模型内部训练出来的权重数量，和输入 token 数不是同一个概念。 Workflow 是预先设计好的流程。它强调“步骤固定、路径清楚、可控性强”。比如先读订单，再判断退款规则，再调用退款接口，再发送通知。workflow 里可以用大模型，也可以不用大模型。它和 agent 的区别是：workflow 的路径主要由人或程序提前写好；agent 的路径更多由模型根据目标和中间结果动态决定。 Anthropic 对这个区别说得很清楚：workflows 是 LLM 和工具通过预定义代码路径编排；agents 则是 LLM 动态决定自己的流程和工具使用。这个方向对。Anthropic 的 Agent Skills 文档也把 skill 描述为模块化能力包，包含 instructions、metadata 和可选资源，比如 scripts、templates，Claude 会在相关任务中自动使用。另一个官方指南也说 Skills 可以是由 instructions、scripts、resources 组成的文件夹 Context：这次对话/这次任务临时放进来的信息。 Memory：跨会话保存、以后还能拿出来用的信息。 Context 是模型当前这次任务能看到的信息，比如用户问题、系统指令、聊天历史、检索到的文档、工具返回结果等。Memory 是被长期保存、之后还能被取出来的信息，比如用户偏好、项目背景、历史决策、常用规则等。Memory 不是模型参数本身发生了变化，而是系统把相关历史信息保存下来，在需要时重新塞回 context。 5 个帖子 - 4 位参与者阅读完整话题

相关专题

关于使用中转站进行开发的一些坑

LinuxDo 最新话题 · 2026-06-11 17:32:48+08:00 · tech

目前我在一家电商公司，手里有一个 AI 生图 Web 项目。现阶段项目主要是基于一些 workflow 调用 API 进行生图，还没有发展到 Agent 形态。最近我发现，很多中转站宣称“全量支持 OpenAI compatible 接口和参数”，但实际使用下来，这类说法的价值很有限，甚至会误导开发者。以最常见的结构化输出为例，也就是 JSON 格式化输出。大部分低价中转站底层并不是调用真正的 OpenAI 标准 API，而是使用 GPT 订阅账号、ChatGPT/Codex 后端，甚至有些还会混用能力更弱的模型。这样一来，即使请求里传了 OpenAI compatible 的 response_format 、 json_schema 、 strict 等参数，也不代表这些参数真的会在 API 层被严格执行。实际结果是，请求可能只是被中转站转写成 prompt，再交给 GPT/Codex 类渠道处理。模型输出本身具有随机性，一旦没有真正的 schema 约束，就会出现偶发问题：比如额外增加字段、缺失字段、字段类型错误，甚至返回的内容根本不是合法 JSON。如果项目里再叠加重试、修复、二次解析等机制，虽然可以提高成功率，但也会带来明显副作用：响应时间变长、成本上升、链路复杂度增加，用户体验下降。对于追求代码质量和系统稳定性的开发者来说，这类补丁式处理也会显得很别扭。以上，如果因为预算或者其他某些因素不得不基于中转进行开发的情况下，最好还是注意一下 1 个帖子 - 1 位参与者阅读完整话题

Codex 逆向检测触发 cyber 风控

LinuxDo 最新话题 · 2026-06-11 17:26:03+08:00 · tech

大佬们，Codex 逆向绕过或者破解 App ，是不是只能进行官方的 Cyber 认证才能做？有没有其他绕过的方式？ 3 个帖子 - 3 位参与者阅读完整话题

相关专题

[问与答] 大伙看看是不是骗子软件

v2ex · 2026-06-11 17:04:32+08:00 · tech

在找工作过程中突然有来了个短信找我要邮件地址进行沟通后面在邮件中进行沟通给出了一个朝九晚五，福利待遇十分好的岗位，以为天上掉馅饼了。但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号，请大伙凑个热闹看看软件是不是骗子软件。警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载，或在虚拟环境中试用。

相关专题

[问与答] 大伙看看是不是骗子软件

v2ex · 2026-06-11 16:56:03+08:00 · tech

在找工作过程中突然有来了个短信找我要邮件地址进行沟通后面在邮件中进行沟通给出了一个朝九晚五，福利待遇十分好的岗位，以为天上掉馅饼了。但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号，请大伙凑个热闹看看软件是不是骗子软件。警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载，或在虚拟环境中试用。

[问与答] 大伙看看是不是骗子软件

v2ex · 2026-06-11 16:40:20+08:00 · tech

在找工作过程中突然有来了个短信找我要邮件地址进行沟通后面在邮件中进行沟通给出了一个朝九晚五，福利待遇十分好的岗位，以为天上掉馅饼了。但是我发现他面试需要单独下载一个什么 Make 软件还要单独给出手机型号，请大伙凑个热闹看看软件是不是骗子软件。警惕天上馅饼。感觉不可能是真的。[捂脸] 请不要随意下载，或在虚拟环境中试用。

相关专题

佬们微信oauth2静默授权返回问题

LinuxDo 最新话题 · 2026-06-11 10:17:33+08:00 · tech

求助：就是在开发h5的时候跳转一个空白页面会进行微信oauth2授权，完成之后跳到B页面，但是这个时候在B页面侧拉返回的时候，会出现：会出现空白页（android 和 ios 都会出现），而不是重新授权，企业微信应用中打开就会重新授权（ios 会出现） B页面侧拉返回，需要俩次才能推出应用使用 window.location.replace 方法。想要的一个效果：客户打开链接跳转空白页授权，授权完成之后跳转B页面，B页面侧拉返回推出，而不是再回到授权的页面。这个有解决方案吗？ 1 个帖子 - 1 位参与者阅读完整话题

paseo 如何在电脑端 cc 中恢复对话

LinuxDo 最新话题 · 2026-06-11 09:07:00+08:00 · tech

最近在使用paseo 进行远程开发，但发现在电脑端cc使用 /resume 恢复的会话中不包含我在移动端对话的内容。请问各位大佬，这个会话内容是通的么，是否可以恢复？ 4 个帖子 - 4 位参与者阅读完整话题

相关专题

教你肘出mythos（fable）原始思维链

LinuxDo 最新话题 · 2026-06-10 23:51:37+08:00 · tech

先看结果. 方法:在系统提示词加上你需要在<think></think>中深思熟虑后再进行回复 note:注意标签为<think>而非<thinking> thinking level:max 即可.最早是因为我的客户端和中转站八字不合死活不思考发现的. 9 个帖子 - 6 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-10 20:14:35+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是 / 我的开源项目完整开源，无未开源部分：是 / 我的开源项目已链接认可 LINUX DO 社区：是 / 我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是 / 以上选择我承诺是永久有效的，接受社区和佬友监督：是 / 以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出项目介绍：这是一个让 Codex 能通过本地网关使用 DeepSeek Web 的桥接项目，适合个人学习、研究和非商业使用。关于封号：最重要的点就是有佬回应我说关于封号问题我从测试以来接入过openclaw 现在接入我自己的软件上的翻译跟AI自动回复，目前是0封号，这个需要佬们自行测试！开源地址 GitHub - db9cd2fgbj-hash/codex-deepseek-bridge · GitHub 2 个帖子 - 1 位参与者阅读完整话题

求GPT公益站

LinuxDo 最新话题 · 2026-06-10 16:41:30+08:00 · tech

求一些额度比较多的公益站，用于codexcli 进行开发。拜托了，球球了 2 个帖子 - 2 位参与者阅读完整话题

相关专题

公益站被盗号？

LinuxDo 最新话题 · 2026-06-10 16:35:45+08:00 · tech

今天发现我用l站注册的公益站莫名其妙多了一个令牌，并且还自己去福利站进行签到。签到完之后又去消耗我的token。这个公益站只绑定了我的l站账号，有没有佬友遇见过相同情况的？ 1 个帖子 - 1 位参与者阅读完整话题

相关专题

佬们是怎么处理协议适配的

LinuxDo 最新话题 · 2026-06-10 16:17:40+08:00 · tech

有些接口只支持 V1completions，如何去适配message和response，我尝试用 CodeX 帮我进行适配，但是总会出现莫名其妙的问题，想知道有没有一种 skill 或者是一种可以参考的，或者是现成的方案 3 个帖子 - 3 位参与者阅读完整话题

基于github项目二开过程中所需要的skills疑问

LinuxDo 最新话题 · 2026-06-10 16:07:30+08:00 · tech

目前想基于一个github项目进行二开，有以下几点需求： 1、首先对项目进行全面的审计，起码要搞清楚每个文件是干嘛的，细致到系统函数最好，重点是新会话不需要重新读源码就能知道每个文件是干嘛的，因为需要改动的部分比较多，一个会话肯定搞不完。 2、能否有一个需求任务进度追踪skills，就是基于我的需求进行更细致的拆分，然后记录了这个会话完成了哪些需求，修改了哪些文件，便于新会话接着这个进度继续。 3、现在佬们都用什么记忆系统，用了一些要么觉得太重，要么占用会话上下文太多，要么触发时机，记录内容不太符合自身需求。 1 个帖子 - 1 位参与者阅读完整话题

谨慎使用闲鱼上的Persona认证服务，认证完帐号集体被封

LinuxDo 最新话题 · 2026-06-10 15:25:42+08:00 · tech

血的教训，帐号之前要求进行身份认证，使用persona认证，查了下闲鱼上可以帮过，说包过，确实认证是过了，走完了认证流程，结果帐号立马被封，连带的IP上其他正常帐号也被封。 1 个帖子 - 1 位参与者阅读完整话题

Agent工具调用与 Prompt Cache 计费的一些疑惑

LinuxDo 最新话题 · 2026-06-10 14:46:56+08:00 · tech

突然想到：用户进行一次输入后，如果 Claude Code 调用了 5 次工具，是不是就相当于向 API 发送了五遍带上工具输出的完整上下文？我之前就知道 cache 的计价会便宜，但是没把 toolcall 和这个联系起来。也就是说算上 prompt cache，N 轮工具调用的 agent 的 input 费用应该是： input 费用 ≈ 全价 × 总新增部分（工具返回等增量） + 10% × Σ(N 轮请求时的 context 前缀长度) 假设用户在 context 已用 100k token 时发了一句话，Claude Code 进行了 N 次工具调用，那这 100k token 就要按缓存价收 N 次钱。如果是 DeepSeek，上面的 10% 变成 0.8%（梁圣的恩情还不完）。我的疑惑是：这个按 N 轮重复计费合理吗？tool call 的返回不像用户输入那样可能隔很久才来，基本就几秒到几十秒。而现在的计费模式下，cache 从 disk 搬回 GPU 的每次 move 都要收全价 input 的 10%。当然我也知道 decode 对长前缀的 attention 开销是每轮真实发生的，所以最朴素的设计应该是：超过某个 context 长度后，decode 价格阶梯上涨。（比如 minimax 搞得那个，当然我不支持他）或许可以把现在这个"10% × N 次"的 cache 计费理解成"前缀越长 decode 越贵"的一种等效——总价差不多，只是记在了输入侧。但 10% 这个系数显然偏高（DeepSeek 做到了 0.8%），是不是可以把 10%理解成 Anthropic 这类头部闭源模型的品牌溢价 + 长前缀 decode 成本的打包等效？恳请佬友们解个惑 1 个帖子 - 1 位参与者阅读完整话题

相关专题

/tag/进行