我问它为什么notion有教育免费的。 他说是 预支未来、培养用户习惯 不自觉地带上了“国产工具更良心”的预设!! 13 个帖子 - 10 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 各位佬好!我现在向各位佬介绍一下我用一个多月二改出来的一个项目,我叫他开源画布,项目地址是 https://github.com/ganbo-gab/open-storyboard-canvas ,如果各位佬身边有需要画布做图片等朋友,可以让他们看看我这个开源画布,各位佬如果觉得项目写得不错可以给一个星。 接下来就简单介绍一下我的这个项目 ,他是基于一个开源画布项目进行的改写。首先是画布分为画布项目和提示词库,画布项目就是正常画布管理,然后提示词库是我学习了站内的大佬的画布,觉得这个提示词库挺好的,于是我也加上了,如图: 可以搜索提示词,还能收藏提示词、把提示词直接导入画布里。 我在做这个项目的时候就觉得,既然开源,就应该照顾到大部分人,让大家都能搭配自己的供应商,所以我就做了一个支持多种格式的“添加服务商功能” 然后考虑到做图片的人可能不会添加配置,所以我就加上了 一键导入 的功能,就是复制教程提示词,然后把自己的渠道的API文档一起发给AI,然后AI返回一段json,json导入这里,然后补充一些key和配置的信息就可以用了。 每个人心中都有自己的提示词,我认为一个开源项目就应该给够大家自由度和便利度,所以我设置了提示词管理和提示词预设。提示词管理就是可以修改我内置的所有功能的提示词,提示词预设便是我单独开的一个提示词渠道,可以在画布里直接使用预设提示词做图片。 (这里有个小插曲,当时我在做这个项目的时候,即梦推出了cli,当时还是所有人都能登录即梦cli,我一看,即梦每天送积分,相当于做图片无限用了,然后当我做完了即梦cli的接入的时候,他即梦改规则了,只能高级会员才能登录,就有点难绷吧,不过我还是保留了这个功能,这里就不放出来展示了。) 讲完了设置层面,现在进入画布里 画布里左边栏有 资产、AI图片、全景图、导演台这四个功能。 资产就是你做完图片后,就会在资产里,然后资产里可以快捷搜索图片、快捷命名。 AI图片,点击后会在画布出现一个框,各位可以选择使用上方的一些功能,也能使用自己的预设提示词,然后画布还支持摄像机控制功能,点击后节点上方就会出现 这里是我对libtv功能的模仿,用过的佬应该看得出来。然后AI图片节点左边可以连接图片,AI图片框里支持@连接的图片。 然后双击空白画布可以上传图片、创造AI图片节点、创造全景图节点。 然后是全景图功能 这里有AI生成全景图、图生全景图,还有720度和360度,反正就是做得很杂,其实差别都不怎么大,具体效果佬可以看看我的仓库地址上的演示。 最后是导演台功能 这个功能是我觉得做得最好的功能了,这个功能是我跟AI写了几天写出来的,体验方面其实和rhtv很像,我的这个导演台功能支持关联图片,然后支持自定义人物动作、添加路人、添加建筑 道具等建模,然后可以给每个人描述对应的提示词,截图并且一键导入到画布里,具体的我也说不清楚哈哈,各位佬如果感兴趣的话可以去体验一番。 原谅我表达能力不怎么强哈哈,加入L站80天了,总算交出了一份学习作业了。在L站我学习了很多,在L站我跟着各位佬学习搭建域名邮箱、自建号池,然后将自己所学拿去创造,创造出价值。这个项目是我用codex+trellis去做的,做下来整体感觉很好,开发过程中我用了很多佬的公益站,还有学习搭建的号池,真心感谢各位佬。 在写帖子之前我其实都在想到时候写的时候说些什么,但是现在在写的时候就不知道怎么说了哈哈。是L站让我加深了对AI的认知,我也在L站里感受到了各位佬的热情、强大。各位的观点也给我这位大学生提供了许多参考,未来我还会继续在L站学习的! 接下来我想继续学习搭建agent,多学多做! 学AI,上L站! 2 个帖子 - 2 位参与者 阅读完整话题
求助下有没有各位佬友有17pro专用拍照预设包啊,网上看到很多模板,好像是不需要调参数,照片直出,有没有佬友试过,会不会卡啊,有的话能不能发个包我也想试试不调参数,照片直出 1 个帖子 - 1 位参与者 阅读完整话题
此工具只有一个目的,一键连接 ssh 并执行预设的脚本。以前经常有个场景,网站出问题了,需要排查原因,赶紧打开 ssh 工具,选择服务器,定位日志目录,定位日志目录通常要点很多次,有时还记不住目录,来回找,查看日志的命令还不熟悉,打不出来。虽然现在很多工具都有预置命令的功能,但是不好用,那时就想要是能一键查看就好了。 现在有了 AI ,于是写了这个工具。 地址: https://github.com/yafoo/okssh 有同样需求的可以试试。 工具目前还有 3 个问题: 1. 连接部分 linux 服务器,光标位置不对,错乱 2. 连接 windows 服务器,脚本不会自动执行(本来会执行的,后来改的不行了) 3. 理论上,当命令有多行时,应该执行完一条后再执行下一条,让 AI 写,AI 解决不了,给它提供了个思路,虽然现在解决了,但总感觉这种方式不好,不可靠 希望懂行的朋友给看看,怎么解决这 3 个问题。 另外为了安全,现在只监听 127.0.0.1 ,因为数据无加密,界面无登录。
此工具只有一个目的,一键连接 ssh 并执行预设的脚本。以前经常有个场景,网站出问题了,需要排查原因,赶紧打开 ssh 工具,选择服务器,定位日志目录,定位日志目录通常要点很多次,有时还记不住目录,来回找,查看日志的命令还不熟悉,打不出来。虽然现在很多工具都有预置命令的功能,但是不好用,那时就想要是能一键查看就好了。 现在有了 AI ,于是写了这个工具。 地址: https://github.com/yafoo/okssh 有同样需求的可以试试。 工具目前还有 3 个问题: 1. 连接部分 linux 服务器,光标位置不对,错乱 2. 连接 windows 服务器,脚本不会自动执行(本来会执行的,后来改的不行了) 3. 理论上,当命令有多行时,应该执行完一条后再执行下一条,让 AI 写,AI 解决不了,给它提供了个思路,虽然现在解决了,但总感觉这种方式不好,不可靠 希望懂行的朋友给看看,怎么解决这 3 个问题。 另外为了安全,现在只监听 127.0.0.1 ,因为数据无加密,界面无登录。
此工具只有一个目的,一键连接 ssh 并执行预设的脚本。以前经常有个场景,网站出问题了,需要排查原因,赶紧打开 ssh 工具,选择服务器,定位日志目录,定位日志目录通常要点很多次,有时还记不住目录,来回找,查看日志的命令还不熟悉,打不出来。虽然现在很多工具都有预置命令的功能,但是不好用,那时就想要是能一键查看就好了。 现在有了 AI ,于是写了这个工具。 地址: https://github.com/yafoo/okssh 有同样需求的可以试试。 工具目前还有 3 个问题: 1. 连接部分 linux 服务器,光标位置不对,错乱 2. 连接 windows 服务器,脚本不会自动执行(本来会执行的,后来改的不行了) 3. 理论上,当命令有多行时,应该执行完一条后再执行下一条,让 AI 写,AI 解决不了,给它提供了个思路,虽然现在解决了,但总感觉这种方式不好,不可靠 希望懂行的朋友给看看,怎么解决这 3 个问题。 另外为了安全,现在只监听 127.0.0.1 ,因为数据无加密,界面无登录。
此工具只有一个目的,一键连接 ssh 并执行预设的脚本。以前经常有个场景,网站出问题了,需要排查原因,赶紧打开 ssh 工具,选择服务器,定位日志目录,定位日志目录通常要点很多次,有时还记不住目录,来回找,查看日志的命令还不熟悉,打不出来。虽然现在很多工具都有预置命令的功能,但是不好用,那时就想要是能一键查看就好了。 现在有了 AI ,于是写了这个工具。 地址: https://github.com/yafoo/okssh 有同样需求的可以试试。 工具目前还有 3 个问题: 1. 连接部分 linux 服务器,光标位置不对,错乱 2. 连接 windows 服务器,脚本不会自动执行(本来会执行的,后来改的不行了) 3. 理论上,当命令有多行时,应该执行完一条后再执行下一条,让 AI 写,AI 解决不了,给它提供了个思路,虽然现在解决了,但总感觉这种方式不好,不可靠 希望懂行的朋友给看看,怎么解决这 3 个问题。 另外为了安全,现在只监听 127.0.0.1 ,因为数据无加密,界面无登录。
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 github.com GitHub - Xeltra233/MimirLink: 面向 QQ 的长期记忆 Tavern 运行时,支持 SQLite... 面向 QQ 的长期记忆 Tavern 运行时,支持 SQLite 记忆、角色数据库生命周期、上下文感知与运维面板 软件是我空闲的时候vibe coding制作的,感谢前辈的努力,当时写这个是因为,在和群友的bot大乱斗中,显得我的bot很笨,即使提示词很丰富,角色在实际表现中也显得很扁平化,感觉都一个味道,想到之前玩酒馆的那段时光,就想把它的系统拿过来,让角色显得很有个性。 目前聊天主链路没有问题,但是内置的工具调用还是有问题的,当然很大的问题还是因为提示词太重。调试角色卡、预设可以使用mcp外接cc,靶场的调试agent能力太弱,干脆就使用cc了。 对于社区的拿过来的预设在聊天场景中最好简化,否则文本太长和回复时间过长,纯文本角色卡应该没有问题不敢说100%保住,前端角色卡需要自信适配正则过滤,变量卡在此系统下可能不完全兼容或者有未知的bug 1 个帖子 - 1 位参与者 阅读完整话题
测试agent:Claude code & reasonix 测试预设: Auto & Pro only 编程语言:lua 实现要求:绘制脚本菜单、图形,与游戏场景下的part资源进行调控,开发一个地板上的经验被磁吸到玩家角色后吸收 指导:纯 vibe coding 结果:失败 有感:使用auto的时候花费较少,编程能力无明显亮点;使用Pro only的时候花费提升3倍以上,编程能力略小幅提高。第一轮编辑:模型提供了开发前提清单,经过核对后确认功能可以实现,模型自己进行第一轮开发。 deepseek模型的上下文能力有待继续观察,已经指定工作path却还是选择在桌面同步更新,不知道为什么。 第二到四轮,有多次最基础格式规范问题导致的运行不成功,不会使用控制台输出日志,强硬选择直接在画面叠加层显示,第二至三轮均运行后卡死,因为deepseek没有考虑并发工具栈承受能力,至此已经花费2元。 第五到六轮,位置复写失败,部分事件在给出的教程明确写明不支持的情况依旧尝试,出错后仍然坚持错误开发路线,强行纠正后报告无法开发,试验结束。 个人认为唯一的优点就是不会触发道德约束,能够进行网络(发包、收包、劫持等)操作,不支持image识别,现在所有tui都有点问题,感觉乱糟糟的 6 个帖子 - 3 位参与者 阅读完整话题
我目前还在用自费的gpt5.1+酒馆+类脑预设 自己在做第二人称的html游戏的demo 体感其实还行,但遇到细节和要求有点流口水,不过这个价格也已经很棒了,大概写一晚上用1美金的样子 要求是可以破限的?而且写第二人称+游戏文本的描述比较好 看deepseekv4似乎在角色扮演上不错,那游戏文本写作如何呢? claude也还没试过…写其他的效果确实也不错来着,就是贵? 谢谢各位佬 1 个帖子 - 1 位参与者 阅读完整话题
大家好! gpt image 2 的生图效果已经可以以假乱真,基于图片,我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址: https://github.com/datascale-ai/opentalking OpenTalking 默认 avatar 模型是 flashtalk ,为了帮助大家快速体验,整条链路只需要本地部署 一个 模型服务( FlashTalk WebSocket ); LLM 、STT 、TTS 全部走阿里云百炼 API ( OpenAI 兼容端点 + DashScope 实时 ASR/TTS ),也可无痛切换为自己启动或者 OmniRT 部署的自定义模型服务。完整安装说明、模型权重下载和分布式部署见 docs/ quickstart.md 、docs/ deployment.md 和 docs/ hardware.md 。 开箱即用的实时链路:从 LLM 回复、流式 TTS ,到字幕事件、状态事件和 WebRTC 播放,全部在一条链路中完成。 除了对话之外,电商带货、新闻主播、创意演唱/模仿秀都可实现,您可以开发更多的模式。 话不多说,上图 OWO: (炉石酒馆鲍勃) https://i.imgur.com/GWDcF9t.png (初音未来 Miku ) https://i.imgur.com/MtgAwSK.png 项目基于 Apache License 2.0 协议开源,欢迎大家来跑一跑,提提 Issue 或者 PR !本项目仅用于学习研究,请勿用于违法犯罪。
大家好! gpt image 2 的生图效果已经可以以假乱真,基于图片,我们的项目 OpenTalking 利用 soulx-flashtalk-14b 模型可以实现可动的对话交互。 GitHub 地址: https://github.com/datascale-ai/opentalking OpenTalking 默认 avatar 模型是 flashtalk ,为了帮助大家快速体验,整条链路只需要本地部署 一个 模型服务( FlashTalk WebSocket ); LLM 、STT 、TTS 全部走阿里云百炼 API ( OpenAI 兼容端点 + DashScope 实时 ASR/TTS ),也可无痛切换为自己启动或者 OmniRT 部署的自定义模型服务。完整安装说明、模型权重下载和分布式部署见 docs/ quickstart.md 、docs/ deployment.md 和 docs/ hardware.md 。 开箱即用的实时链路:从 LLM 回复、流式 TTS ,到字幕事件、状态事件和 WebRTC 播放,全部在一条链路中完成。 话不多说,上图 OWO: (炉石酒馆鲍勃) https://i.imgur.com/GWDcF9t.png (初音未来 Miku ) https://i.imgur.com/MtgAwSK.png 项目基于 Apache License 2.0 协议开源,欢迎大家来跑一跑,提提 Issue 或者 PR !
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
上周朋友拍亚马逊主图找棚 2000 起步,下午想发个 sample 图给运营审单只能干等到晚上;想换个海报背景叫设计也是几百起,改三版人就疯了。 我不做电商。但听完这事我觉得 AI 真能干。3 周用 Claude Code 撸了个 SPA: 土土金 Tutujin — https://studio.tutujin.com (生图驱动靠 gpt-image-2,和 nano-banana ) 不啰嗦先说它是什么。一个跑在浏览器里的纯前端 SPA ,把 12 个电商高频生图场景做成卡片(产品主图 / 模特换装 / 营销海报 / 详情页长图 / 白底图 / 节日促销 / 多角度 / 细节材质 / 尺寸标注 / 核心卖点 / 场景合成 / 社交媒体),加一个完全自由的生图模式。模型走 OpenAI Images API 兼容的 NewAPI 中转,可以选 gpt-image-2 或 nano-banana-2 。 本帖讲清五件事:它能干嘛、我为什么做、技术栈、30 秒接进你自己的代码、trade-off 。不喊口号,没有邀请码,本帖发完不会再编辑加二维码。 为什么我做这个 国内 AI 生图工具不少,自己用过一圈痛点很普遍: 必须登录、必须绑手机。你只想试一下,先验证码。 包月 / 包年套餐。这个月没用够钱不退;下月用超了又得囤。 数据在别人服务器上。你做的图、上传的参考图、prompt 历史都在云端。换工具就搬家。 电商场景缺位。大多工具是泛用 AIGC ,「白底图」「模特换 N 套衣服」「详情页长图」这种电商真实需求要你自己去调 prompt 。 我反过来做: 不要登录。打开就用,浏览器是客户端。 按 token 算账。生一张算一张,没用就不扣。 数据全在 IndexedDB 。10 GB 配额,刷新不丢,跨设备不同步——这是 trade-off ,下面会说。 场景 prompt 我帮你调好。专业相机、布光、品牌四要素这些用户不该操心。 「 AI 生图工具早就一堆了你做这个图啥」——我也不知道做不做得起来,但 3 周成本能接受,失败了至少把 React 19 + Vite 8 这套新栈练手了。 演示一遍:从打开到出图 进首页第一张就是「自由生图」,画布很干净:左边 prompt 输入和参考图上传,右边模型选择和尺寸。打字、回车、3-8 秒出图。 参考图直接拖进来,自动 presigned URL 上传到 S3 (我自己的桶兜底,未来支持用户配自己的)。生成完图自动入库,缩略图( 768px webp )和原图分别存 IndexedDB 的两个 blob 字段——之后翻历史不会卡。 12 个电商场景背后有一份 加密的 prompt vault ( XOR + base64 运行时解码)。你只填业务描述(「我要给这双跑鞋拍个夏日海边的营销海报」),专业相机参数、布光、构图、品牌一致性这些由 vault 自动注入。 老实说一句:vault 加密 不是核心防御 。XOR 谁都能逆,prompt 真要找还是能找出来。我做这层只是劝退脚本扒站,不假装能防 GPT-4 。 点历史里任一张图:弹出大图 + 完整 prompt + 参数( 720x1280 / 4k / gpt-image-2 )+ 时间戳。三个动作按钮: 复用参数 — 把这条历史的 prompt 和尺寸塞回输入栏 继续编辑 — 把这张图作为参考图加入下一轮生成(典型 image-to-image ) 下载原图 / 删除 历史页 13 个 chip 筛选、按时间倒序、底部本地存储进度( 4.8 MB / 10240 MB )。导出 JSON 备份这事也支持。 技术栈和架构选择 工具党可能感兴趣的几个决定: 纯前端 SPA ,没有后端服务 。除了一个 vite plugin 的 presigned URL middleware (持有 S3 凭据,给参考图上传发短期 URL ),整个产品是静态文件。部署在宝塔 + nginx ,发布流程就是 vite build && rsync dist/ 。 技术栈:TypeScript 6 strict / React 19.2 / Vite 8 / TailwindCSS 3.4 / Zustand 4.5 / Dexie 4 / Zod 3.23 / AWS SDK v3 。 API 调用日志面板 。每次 NewAPI 调用记一行:endpoint / model / 耗时 / 输入 tokens / 输出 tokens / 花费 USD / HTTP code / 错误归类。500 条会话上限 + IndexedDB 持久化 5000 条。 sk-* / Bearer / JWT 在落库前自动 redact 掉——我不想把 API key 长期存浏览器历史里。 超时分层 。生图主流程 300 秒( 4k + 复杂 prompt + n=2 偶见 90s+,2 分钟会误报超时;上周朋友试了说撞到了,拉到 5 分钟)。测试连接 90 秒(最小尺寸生图,连不通快速反馈)。余额查询 15 秒( dashboard/billing 是元数据接口)。 历史 thumb 后台升级 。早期版本 thumb 长边只有 256 ,4 月份某次改到 768 。但旧记录里仍是 256 ,看着糊。所以加了升级路径:hydrate 完成后 requestIdleCallback 调度,遍历 BlobRecord ,width<600 的用 OffscreenCanvas + fullBlob 重生 768 thumb 写回 IDB 。串行 + 静默 + 幂等,单会话只跑一次。下次进历史页,旧图自己变清晰。 v0.13 暗色高奢摄影棚设计 。底色 #0A0A0B ,accent 香槟金 #C9A96E ,hover 铜橘 #E8A063 ,每张卡有 inset 0 1px 0 rgba(255,255,255,0.06) 顶光 hairline ( Linear / Vercel 共识)。display 字体 Fraunces 。这是我最舍得花时间打磨的部分。 数据本地的 trade-off 。换设备数据不会过来,浏览器清缓存就丢——这是事实。当前妥协是支持 JSON 导出 / 导入备份。V2 计划做端到端加密的可选云同步(密钥不在我服务器),不打算做强制账号系统。 30 秒接进你自己的代码 API 端点 100% OpenAI Images API 兼容: curl -X POST https://api.tutujin.com/v1/images/generations \ -H "Authorization: Bearer $YOUR_KEY" \ -H "Content-Type: application/json" \ -d '{"model":"gpt-image-2","prompt":"白底机械键盘电商主图","n":1,"size":"1024x1024","quality":"2k"}' 任何 OpenAI SDK 把 base_url 指过来即可: from openai import OpenAI client = OpenAI(api_key="...", base_url="https://api.tutujin.com/v1") img = client.images.generate(model="gpt-image-2", prompt="...", size="1024x1024") 站点 /docs 页有完整 OpenAPI 3.1 spec / Postman collection / 10 种语言示例( JS / Python / Go / Rust / Swift / Java / PHP / Ruby / C# / curl )。 Agent 工具方面准备了 5 件套:Claude Code Skill / AGENTS.md / Cursor & Windsurf Rules / OpenAI Tool Spec / MCP Server 。这些都不用注册,直接看、直接抄。 现在能用 + 怎么收费 网址: https://studio.tutujin.com 要 key 。两条路: 用任何 OpenAI 兼容的 sk-(包括我提供的中转)。中转走 https://api.tutujin.com ,按 token 计费,没月费没年费没充值送活动。 配你自己的 OpenAI key 也行, base_url 改回 OpenAI 即可。 不收注册费,没有 Pro / 团队版,没有联盟分销。我现在还不知道这模式跑不跑得通——大概率还要调几次定价。 源码暂时不开源。理由是 vault 一开就废了;不开源至少能让脚本扒站慢一点。但 Agent 5 件套和完整 API 文档都公开。 V2 路线(透明) 图片上传 BFF ( presigned URL 抽出 vite plugin 做 standalone Node + PM2 ,目前静态部署上传走不通) 移动端适配( 750px 以下还有几处 layout 崩) 自定义场景(用户保存自己的 prompt 模板进 vault ) 端到端加密的可选云同步(解决换设备问题) 提示词市场(用户上传公开 prompt + 别人 fork ) 这是真路线,不是 PR 用画饼。图片上传 BFF 这周大概做不完,下周做。 写在最后 3 周写完到上线这事,独立开发者用 Claude Code 真的可行——但说实话最累的不是写代码,是 v0.13 设计那一周从早到晚搭 token 、改阴影、试 hairline 。AI 写得了 React ,写不出审美。 网址放这: https://studio.tutujin.com 。要 key 自己填,不收捐款,不发邀请码。试了觉得有问题——越狠越好,评论或站内信都行。
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 作为DS的狂热粉丝,本人经常使用DeepSeek。但是DS官方网页版的功能过于简单,于是本人借鉴Claude Code和Claude桌面版开发了一个谷歌插件对其进行增强。 核心功能 链接在readme底部 项目地址 github.com GitHub - zhu1090093659/deepseek-pp: 🧠 为 DeepSeek 网页版注入 Agentic 记忆系统 + Skill 技能系统的... 🧠 为 DeepSeek 网页版注入 Agentic 记忆系统 + Skill 技能系统的 Chrome 扩展 2 个帖子 - 2 位参与者 阅读完整话题
预设了 9 个样式,也可以自定义一些布局、颜色,可以通过 ai 匹配你的简历和岗位要求,生成一些优化建议,自己设置 ai 的 api key ,有 openai ,gemini ,claude ,还有国产千问等,gemini 和 qianwen 免费量还挺多的。所有的数据存在用户本地浏览器,简历数据存在 indexeddb ,ai api key 存在了 localstorage ,所以隐私很安全。 详细功能录了一个 B 站小视频: https://www.bilibili.com/video/BV1bDoZBXE9z/?share_source=copy_web&vd_source=20223375480b7bd01486a8c311403786 项目地址: https://github.com/ttang1024/Smart_CV