预设 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-07 09:03:54+08:00 · tech

我问它为什么notion有教育免费的。他说是预支未来、培养用户习惯不自觉地带上了“国产工具更良心”的预设！！ 13 个帖子 - 10 位参与者阅读完整话题

【开源】我对一个开源画布进行了二改，支持自定义供应商、导演台功能、全景图功能、预设提示词功能等

LinuxDo 最新话题 · 2026-06-01 21:07:11+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出各位佬好！我现在向各位佬介绍一下我用一个多月二改出来的一个项目，我叫他开源画布，项目地址是 https://github.com/ganbo-gab/open-storyboard-canvas ，如果各位佬身边有需要画布做图片等朋友，可以让他们看看我这个开源画布，各位佬如果觉得项目写得不错可以给一个星。接下来就简单介绍一下我的这个项目，他是基于一个开源画布项目进行的改写。首先是画布分为画布项目和提示词库，画布项目就是正常画布管理，然后提示词库是我学习了站内的大佬的画布，觉得这个提示词库挺好的，于是我也加上了，如图：可以搜索提示词，还能收藏提示词、把提示词直接导入画布里。我在做这个项目的时候就觉得，既然开源，就应该照顾到大部分人，让大家都能搭配自己的供应商，所以我就做了一个支持多种格式的“添加服务商功能” 然后考虑到做图片的人可能不会添加配置，所以我就加上了一键导入的功能，就是复制教程提示词，然后把自己的渠道的API文档一起发给AI，然后AI返回一段json，json导入这里，然后补充一些key和配置的信息就可以用了。每个人心中都有自己的提示词，我认为一个开源项目就应该给够大家自由度和便利度，所以我设置了提示词管理和提示词预设。提示词管理就是可以修改我内置的所有功能的提示词，提示词预设便是我单独开的一个提示词渠道，可以在画布里直接使用预设提示词做图片。（这里有个小插曲，当时我在做这个项目的时候，即梦推出了cli，当时还是所有人都能登录即梦cli，我一看，即梦每天送积分，相当于做图片无限用了，然后当我做完了即梦cli的接入的时候，他即梦改规则了，只能高级会员才能登录，就有点难绷吧，不过我还是保留了这个功能，这里就不放出来展示了。）讲完了设置层面，现在进入画布里画布里左边栏有资产、AI图片、全景图、导演台这四个功能。资产就是你做完图片后，就会在资产里，然后资产里可以快捷搜索图片、快捷命名。 AI图片，点击后会在画布出现一个框，各位可以选择使用上方的一些功能，也能使用自己的预设提示词，然后画布还支持摄像机控制功能，点击后节点上方就会出现这里是我对libtv功能的模仿，用过的佬应该看得出来。然后AI图片节点左边可以连接图片，AI图片框里支持@连接的图片。然后双击空白画布可以上传图片、创造AI图片节点、创造全景图节点。然后是全景图功能这里有AI生成全景图、图生全景图，还有720度和360度，反正就是做得很杂，其实差别都不怎么大，具体效果佬可以看看我的仓库地址上的演示。最后是导演台功能这个功能是我觉得做得最好的功能了，这个功能是我跟AI写了几天写出来的，体验方面其实和rhtv很像，我的这个导演台功能支持关联图片，然后支持自定义人物动作、添加路人、添加建筑道具等建模，然后可以给每个人描述对应的提示词，截图并且一键导入到画布里，具体的我也说不清楚哈哈，各位佬如果感兴趣的话可以去体验一番。原谅我表达能力不怎么强哈哈，加入L站80天了，总算交出了一份学习作业了。在L站我学习了很多，在L站我跟着各位佬学习搭建域名邮箱、自建号池，然后将自己所学拿去创造，创造出价值。这个项目是我用codex+trellis去做的，做下来整体感觉很好，开发过程中我用了很多佬的公益站，还有学习搭建的号池，真心感谢各位佬。在写帖子之前我其实都在想到时候写的时候说些什么，但是现在在写的时候就不知道怎么说了哈哈。是L站让我加深了对AI的认知，我也在L站里感受到了各位佬的热情、强大。各位的观点也给我这位大学生提供了许多参考，未来我还会继续在L站学习的！接下来我想继续学习搭建agent，多学多做！学AI，上L站！ 2 个帖子 - 2 位参与者阅读完整话题

小米17pro专用拍照预设包

LinuxDo 最新话题 · 2026-05-26 16:17:11+08:00 · tech

求助下有没有各位佬友有17pro专用拍照预设包啊，网上看到很多模板，好像是不需要调参数，照片直出，有没有佬友试过，会不会卡啊，有的话能不能发个包我也想试试不调参数，照片直出 1 个帖子 - 1 位参与者阅读完整话题

[分享创造] 开发了个小工具： OKSSH - 一键 SSH 脚本执行器

v2ex · 2026-05-22 09:34:57+08:00 · tech

此工具只有一个目的，一键连接 ssh 并执行预设的脚本。以前经常有个场景，网站出问题了，需要排查原因，赶紧打开 ssh 工具，选择服务器，定位日志目录，定位日志目录通常要点很多次，有时还记不住目录，来回找，查看日志的命令还不熟悉，打不出来。虽然现在很多工具都有预置命令的功能，但是不好用，那时就想要是能一键查看就好了。现在有了 AI ，于是写了这个工具。地址： https://github.com/yafoo/okssh 有同样需求的可以试试。工具目前还有 3 个问题： 1. 连接部分 linux 服务器，光标位置不对，错乱 2. 连接 windows 服务器，脚本不会自动执行（本来会执行的，后来改的不行了） 3. 理论上，当命令有多行时，应该执行完一条后再执行下一条，让 AI 写，AI 解决不了，给它提供了个思路，虽然现在解决了，但总感觉这种方式不好，不可靠希望懂行的朋友给看看，怎么解决这 3 个问题。另外为了安全，现在只监听 127.0.0.1 ，因为数据无加密，界面无登录。

[分享创造] 开发了个小工具： OKSSH - 一键 SSH 脚本执行器

v2ex · 2026-05-22 09:34:57+08:00 · tech

此工具只有一个目的，一键连接 ssh 并执行预设的脚本。以前经常有个场景，网站出问题了，需要排查原因，赶紧打开 ssh 工具，选择服务器，定位日志目录，定位日志目录通常要点很多次，有时还记不住目录，来回找，查看日志的命令还不熟悉，打不出来。虽然现在很多工具都有预置命令的功能，但是不好用，那时就想要是能一键查看就好了。现在有了 AI ，于是写了这个工具。地址： https://github.com/yafoo/okssh 有同样需求的可以试试。工具目前还有 3 个问题： 1. 连接部分 linux 服务器，光标位置不对，错乱 2. 连接 windows 服务器，脚本不会自动执行（本来会执行的，后来改的不行了） 3. 理论上，当命令有多行时，应该执行完一条后再执行下一条，让 AI 写，AI 解决不了，给它提供了个思路，虽然现在解决了，但总感觉这种方式不好，不可靠希望懂行的朋友给看看，怎么解决这 3 个问题。另外为了安全，现在只监听 127.0.0.1 ，因为数据无加密，界面无登录。

[分享创造] 开发了个小工具： OKSSH - 一键 SSH 脚本执行器

v2ex · 2026-05-22 09:26:03+08:00 · tech

此工具只有一个目的，一键连接 ssh 并执行预设的脚本。以前经常有个场景，网站出问题了，需要排查原因，赶紧打开 ssh 工具，选择服务器，定位日志目录，定位日志目录通常要点很多次，有时还记不住目录，来回找，查看日志的命令还不熟悉，打不出来。虽然现在很多工具都有预置命令的功能，但是不好用，那时就想要是能一键查看就好了。现在有了 AI ，于是写了这个工具。地址： https://github.com/yafoo/okssh 有同样需求的可以试试。工具目前还有 3 个问题： 1. 连接部分 linux 服务器，光标位置不对，错乱 2. 连接 windows 服务器，脚本不会自动执行（本来会执行的，后来改的不行了） 3. 理论上，当命令有多行时，应该执行完一条后再执行下一条，让 AI 写，AI 解决不了，给它提供了个思路，虽然现在解决了，但总感觉这种方式不好，不可靠希望懂行的朋友给看看，怎么解决这 3 个问题。另外为了安全，现在只监听 127.0.0.1 ，因为数据无加密，界面无登录。

[分享创造] 开发了个小工具： OKSSH - 一键 SSH 脚本执行器

v2ex · 2026-05-22 09:08:23+08:00 · tech

此工具只有一个目的，一键连接 ssh 并执行预设的脚本。以前经常有个场景，网站出问题了，需要排查原因，赶紧打开 ssh 工具，选择服务器，定位日志目录，定位日志目录通常要点很多次，有时还记不住目录，来回找，查看日志的命令还不熟悉，打不出来。虽然现在很多工具都有预置命令的功能，但是不好用，那时就想要是能一键查看就好了。现在有了 AI ，于是写了这个工具。地址： https://github.com/yafoo/okssh 有同样需求的可以试试。工具目前还有 3 个问题： 1. 连接部分 linux 服务器，光标位置不对，错乱 2. 连接 windows 服务器，脚本不会自动执行（本来会执行的，后来改的不行了） 3. 理论上，当命令有多行时，应该执行完一条后再执行下一条，让 AI 写，AI 解决不了，给它提供了个思路，虽然现在解决了，但总感觉这种方式不好，不可靠希望懂行的朋友给看看，怎么解决这 3 个问题。另外为了安全，现在只监听 127.0.0.1 ，因为数据无加密，界面无登录。

[开源推广]兼容酒馆角色卡、世界书、预设的一个QQ Bot框架

LinuxDo 最新话题 · 2026-05-19 20:31:15+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 github.com GitHub - Xeltra233/MimirLink: 面向 QQ 的长期记忆 Tavern 运行时，支持 SQLite... 面向 QQ 的长期记忆 Tavern 运行时，支持 SQLite 记忆、角色数据库生命周期、上下文感知与运维面板软件是我空闲的时候vibe coding制作的，感谢前辈的努力，当时写这个是因为，在和群友的bot大乱斗中，显得我的bot很笨，即使提示词很丰富，角色在实际表现中也显得很扁平化，感觉都一个味道，想到之前玩酒馆的那段时光，就想把它的系统拿过来，让角色显得很有个性。目前聊天主链路没有问题，但是内置的工具调用还是有问题的，当然很大的问题还是因为提示词太重。调试角色卡、预设可以使用mcp外接cc，靶场的调试agent能力太弱，干脆就使用cc了。对于社区的拿过来的预设在聊天场景中最好简化，否则文本太长和回复时间过长，纯文本角色卡应该没有问题不敢说100%保住，前端角色卡需要自信适配正则过滤，变量卡在此系统下可能不完全兼容或者有未知的bug 1 个帖子 - 1 位参与者阅读完整话题

试用了一下Deepseek V4 Pro Max的agent coding【vibe coding能力】

LinuxDo 最新话题 · 2026-05-16 22:54:00+08:00 · tech

测试agent：Claude code ＆ reasonix 测试预设： Auto ＆ Pro only 编程语言：lua 实现要求：绘制脚本菜单、图形，与游戏场景下的part资源进行调控，开发一个地板上的经验被磁吸到玩家角色后吸收指导：纯 vibe coding 结果：失败有感：使用auto的时候花费较少，编程能力无明显亮点；使用Pro only的时候花费提升3倍以上，编程能力略小幅提高。第一轮编辑：模型提供了开发前提清单，经过核对后确认功能可以实现，模型自己进行第一轮开发。 deepseek模型的上下文能力有待继续观察，已经指定工作path却还是选择在桌面同步更新，不知道为什么。第二到四轮，有多次最基础格式规范问题导致的运行不成功，不会使用控制台输出日志，强硬选择直接在画面叠加层显示，第二至三轮均运行后卡死，因为deepseek没有考虑并发工具栈承受能力，至此已经花费2元。第五到六轮，位置复写失败，部分事件在给出的教程明确写明不支持的情况依旧尝试，出错后仍然坚持错误开发路线，强行纠正后报告无法开发，试验结束。个人认为唯一的优点就是不会触发道德约束，能够进行网络（发包、收包、劫持等）操作，不支持image识别，现在所有tui都有点问题，感觉乱糟糟的 6 个帖子 - 3 位参与者阅读完整话题

佬友们有写作游戏文案的AI推荐吗

linux.do · 2026-05-05 09:57:12+08:00 · tech

我目前还在用自费的gpt5.1+酒馆+类脑预设自己在做第二人称的html游戏的demo 体感其实还行，但遇到细节和要求有点流口水，不过这个价格也已经很棒了，大概写一晚上用1美金的样子要求是可以破限的？而且写第二人称+游戏文本的描述比较好看deepseekv4似乎在角色扮演上不错，那游戏文本写作如何呢？ claude也还没试过…写其他的效果确实也不错来着，就是贵？谢谢各位佬 1 个帖子 - 1 位参与者阅读完整话题

[分享创造] [开源] 只需一张图片，助你打破次元壁，实现和任何想聊天的角色对话，支持音色复刻、角色预设

v2ex.com · 2026-05-01 22:06:02+08:00 · tech

大家好！ gpt image 2 的生图效果已经可以以假乱真，基于图片，我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址： https://github.com/datascale-ai/opentalking OpenTalking 默认 avatar 模型是 flashtalk ，为了帮助大家快速体验，整条链路只需要本地部署一个模型服务（ FlashTalk WebSocket ）； LLM 、STT 、TTS 全部走阿里云百炼 API （ OpenAI 兼容端点 + DashScope 实时 ASR/TTS ），也可无痛切换为自己启动或者 OmniRT 部署的自定义模型服务。完整安装说明、模型权重下载和分布式部署见 docs/ quickstart.md 、docs/ deployment.md 和 docs/ hardware.md 。开箱即用的实时链路：从 LLM 回复、流式 TTS ，到字幕事件、状态事件和 WebRTC 播放，全部在一条链路中完成。除了对话之外，电商带货、新闻主播、创意演唱/模仿秀都可实现，您可以开发更多的模式。话不多说，上图 OWO：（炉石酒馆鲍勃） https://i.imgur.com/GWDcF9t.png （初音未来 Miku ） https://i.imgur.com/MtgAwSK.png 项目基于 Apache License 2.0 协议开源，欢迎大家来跑一跑，提提 Issue 或者 PR ！本项目仅用于学习研究，请勿用于违法犯罪。

[分享创造] [开源] 只需一张图片，助你打破次元壁，实现和任何想聊天的角色对话，支持音色复刻、角色预设

v2ex.com · 2026-05-01 22:06:02+08:00 · tech

大家好！ gpt image 2 的生图效果已经可以以假乱真，基于图片，我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址： https://github.com/datascale-ai/opentalking OpenTalking 默认 avatar 模型是 flashtalk ，为了帮助大家快速体验，整条链路只需要本地部署一个模型服务（ FlashTalk WebSocket ）； LLM 、STT 、TTS 全部走阿里云百炼 API （ OpenAI 兼容端点 + DashScope 实时 ASR/TTS ），也可无痛切换为自己启动或者 OmniRT 部署的自定义模型服务。完整安装说明、模型权重下载和分布式部署见 docs/ quickstart.md 、docs/ deployment.md 和 docs/ hardware.md 。开箱即用的实时链路：从 LLM 回复、流式 TTS ，到字幕事件、状态事件和 WebRTC 播放，全部在一条链路中完成。话不多说，上图 OWO：（炉石酒馆鲍勃） https://i.imgur.com/GWDcF9t.png （初音未来 Miku ） https://i.imgur.com/MtgAwSK.png 项目基于 Apache License 2.0 协议开源，欢迎大家来跑一跑，提提 Issue 或者 PR ！

我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

www.v2ex.com · 2026-04-29 15:46:44+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

www.v2ex.com · 2026-04-29 14:46:44+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

www.v2ex.com · 2026-04-29 12:00:18+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

[OpenAI] 我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

v2ex.com · 2026-04-29 12:00:18+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

[OpenAI] 我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

v2ex.com · 2026-04-29 11:40:07+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

[OpenAI] 我做了一个 AI 电商生图工具： 13 场景预设 + 数据全在浏览器（1 毛 6 一张）

v2ex.com · 2026-04-29 11:29:16+08:00 · tech

上周朋友拍亚马逊主图找棚 2000 起步，下午想发个 sample 图给运营审单只能干等到晚上；想换个海报背景叫设计也是几百起，改三版人就疯了。我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA：土土金 Tutujin — https://studio.tutujin.com （生图驱动靠 gpt-image-2,和 nano-banana ）不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ，把 12 个电商高频生图场景做成卡片（产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体），加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转，可以选 gpt-image-2 或 nano-banana-2 。本帖讲清五件事：它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号，没有邀请码，本帖发完不会再编辑加二维码。为什么我做这个国内 AI 生图工具不少，自己用过一圈痛点很普遍：必须登录、必须绑手机。你只想试一下，先验证码。包月 / 包年套餐。这个月没用够钱不退；下月用超了又得囤。数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。电商场景缺位。大多工具是泛用 AIGC ，「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。我反过来做：不要登录。打开就用，浏览器是客户端。按 token 算账。生一张算一张，没用就不扣。数据全在 IndexedDB 。10 GB 配额，刷新不丢，跨设备不同步——这是 trade-off ，下面会说。场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来，但 3 周成本能接受，失败了至少把 React 19 + Vite 8 这套新栈练手了。演示一遍：从打开到出图进首页第一张就是「自由生图」，画布很干净：左边 prompt 输入和参考图上传，右边模型选择和尺寸。打字、回车、3-8 秒出图。参考图直接拖进来，自动 presigned URL 上传到 S3 （我自己的桶兜底，未来支持用户配自己的）。生成完图自动入库，缩略图（ 768px webp ）和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份加密的 prompt vault （ XOR + base64 运行时解码）。你只填业务描述（「我要给这双跑鞋拍个夏日海边的营销海报」），专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。老实说一句：vault 加密不是核心防御。XOR 谁都能逆，prompt 真要找还是能找出来。我做这层只是劝退脚本扒站，不假装能防 GPT-4 。点历史里任一张图：弹出大图 + 完整 prompt + 参数（ 720x1280 / 4k / gpt-image-2 ）+ 时间戳。三个动作按钮：复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏继续编辑 — 把这张图作为参考图加入下一轮生成（典型 image-to-image ）下载原图 / 删除历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度（ 4.8 MB / 10240 MB ）。导出 JSON 备份这事也支持。技术栈和架构选择工具党可能感兴趣的几个决定：纯前端 SPA ，没有后端服务。除了一个 vite plugin 的 presigned URL middleware （持有 S3 凭据，给参考图上传发短期 URL ），整个产品是静态文件。部署在宝塔 + nginx ，发布流程就是 vite build && rsync dist/ 。技术栈：TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板。每次 NewAPI 调用记一行：endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。超时分层。生图主流程 300 秒（ 4k + 复杂 prompt + n=2 偶见 90s+，2 分钟会误报超时；上周朋友试了说撞到了，拉到 5 分钟）。测试连接 90 秒（最小尺寸生图，连不通快速反馈）。余额查询 15 秒（ dashboard/billing 是元数据接口）。历史 thumb 后台升级。早期版本 thumb 长边只有 256 ，4 月份某次改到 768 。但旧记录里仍是 256 ，看着糊。所以加了升级路径：hydrate 完成后 requestIdleCallback 调度，遍历 BlobRecord ，width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等，单会话只跑一次。下次进历史页，旧图自己变清晰。 v0.13 暗色高奢摄影棚设计。底色 #0A0A0B ，accent 香槟金 #C9A96E ，hover 铜橘 #E8A063 ，每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline （ Linear / Vercel 共识）。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。数据本地的 trade-off 。换设备数据不会过来，浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步（密钥不在我服务器），不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容： curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可： from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例（ JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl ）。 Agent 工具方面准备了 5 件套：Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册，直接看、直接抄。现在能用 + 怎么收费网址： https://studio.tutujin.com 要 key 。两条路：用任何 OpenAI 兼容的 sk-（包括我提供的中转）。中转走 https://api.tutujin.com ，按 token 计费，没月费没年费没充值送活动。配你自己的 OpenAI key 也行， base_url 改回 OpenAI 即可。不收注册费，没有 Pro / 团队版，没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。源码暂时不开源。理由是 vault 一开就废了；不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线（透明）图片上传 BFF （ presigned URL 抽出 vite plugin 做 standalone Node + PM2 ，目前静态部署上传走不通）移动端适配（ 750px 以下还有几处 layout 崩）自定义场景（用户保存自己的 prompt 模板进 vault ）端到端加密的可选云同步（解决换设备问题）提示词市场（用户上传公开 prompt + 别人 fork ）这是真路线，不是 PR 用画饼。图片上传 BFF 这周大概做不完，下周做。写在最后 3 周写完到上线这事，独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码，是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ，写不出审美。网址放这： https://studio.tutujin.com 。要 key 自己填，不收捐款，不发邀请码。试了觉得有问题——越狠越好，评论或站内信都行。

【开源自荐】DeepSeek++：为网页版DeepSeek引入记忆体系、SKILL体系和预设提示词功能

linux.do · 2026-04-28 14:04:43+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出作为DS的狂热粉丝，本人经常使用DeepSeek。但是DS官方网页版的功能过于简单，于是本人借鉴Claude Code和Claude桌面版开发了一个谷歌插件对其进行增强。核心功能链接在readme底部项目地址 github.com GitHub - zhu1090093659/deepseek-pp: 🧠 为 DeepSeek 网页版注入 Agentic 记忆系统 + Skill 技能系统的... 🧠 为 DeepSeek 网页版注入 Agentic 记忆系统 + Skill 技能系统的 Chrome 扩展 2 个帖子 - 2 位参与者阅读完整话题

[分享创造] 我做了一个免费的简历生成网站

v2ex.com · 2026-04-26 16:05:35+08:00 · tech

预设了 9 个样式，也可以自定义一些布局、颜色，可以通过 ai 匹配你的简历和岗位要求，生成一些优化建议，自己设置 ai 的 api key ，有 openai ，gemini ，claude ，还有国产千问等，gemini 和 qianwen 免费量还挺多的。所有的数据存在用户本地浏览器，简历数据存在 indexeddb ，ai api key 存在了 localstorage ，所以隐私很安全。详细功能录了一个 B 站小视频: https://www.bilibili.com/video/BV1bDoZBXE9z/?share_source=copy_web&vd_source=20223375480b7bd01486a8c311403786 项目地址： https://github.com/ttang1024/Smart_CV

/tag/预设