现在有没有什么skill或者技巧 可以让ai生成程序对应的交互原型图的吗? 类似墨刀那种原型图的感觉 2 个帖子 - 2 位参与者 阅读完整话题
rt,打算开一个Claude跟codex的20x,可惜我目前的交互方式都是人工copy文档给两个AI,想问问有什么方法可以让Claude code 跟 codex互相交互呢?而且有没有佬友可以分享下自己平时使用协作下来的时候感觉他们各自擅长什么?谢谢啦 4 个帖子 - 4 位参与者 阅读完整话题
有没有什么大模型在视频通话的时候,能根据谈话要求及时地展示交互式的一些图片或者视频动画,以便于我更好理解内容? 1 个帖子 - 1 位参与者 阅读完整话题
我是一个后端研发,我把服务后端所有逻辑都写好了,接口都已经完成,怎么让AI帮我写一个可以交互调试的前端代码。现在让AI根据后端接口写前端,他给我写的就是接口调试列表,我应该怎么描述让他给我写个可以进行简单的交互的前端代码,比如使用什么前端技术或者什么交互方式,求群里大佬指导一下。ps:后端用的是python. 6 个帖子 - 6 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 用最近大佬们的公益站额度vibe coding了一个pi的供应商模型交互式配置扩展,主要是自己有时候不想装claude、hermes这些重型(对于小维护)agent,单纯给小设备维护,顺便配置到自己的newapi使用。 已经开源,MIT协议;大家感兴趣可以说下载试试。链接: Interactive provider and model manager for pi coding agent. 第一次发这个板块,不足之处请佬们指出批评 1 个帖子 - 1 位参与者 阅读完整话题
交互写的太抽象了 16 个帖子 - 16 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 前期提要: 【开源】【最幻想的一集】AI 实时生成所有图文内容的交互式剧情游戏,内测期间免费玩,体验可视化、沉浸式、个性化的“参与式幻想” 开发调优 本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 1. 前言 … 发布5天来,InfiPlot已经收获了超过200个star,十分感谢佬友们的鼓励。 github.com GitHub - zonghaoyuan/infiplot: InfiPlot is the world's first interactive plot... InfiPlot is the world's first interactive plot game that AI generates all text and images in real-time. InfiPlot是全球首个由 AI 实时生成全部图文内容的交互式剧情游戏 这几天我们招募到了几位新成员,大家都对开发infiplot充满激情。 我们也收到了佬友们大量的反馈,我们非常重视这些反馈。 除了许多bug修复和ui美化外,这几天对游戏功能、游玩体验和自部署体验都做了许多更新。这里分类整理下,欢迎感兴趣的佬友试用新增的功能。 1. 新增游戏功能 1.1 配置玩家名字 在开始游玩前或者游玩过程中,你可以在设置里配置你的名字,这样游玩过程中npc就会以你的名字呼唤你。而且tts模型会让角色用ta的音色,有情感地念出你的名字。 1.2 自由输入交互动作 之前我们还只支持在ai生成的几个预设选项中做选择,现在你已经可以自由输入交互动作了。ai会判断你的交互是否触发新的剧情分支,如果触发,则会自动跳转到新的剧情分支。 1.3 历史记录回看 游玩过程中,你是不是也会想要回看过去的交互记录和剧情?我们已经加上了这个功能: 1.4 画面识别功能开关 如果你对目前尚不成熟的视觉识别交互功能不太满意,或者只是想要摸摸画面而不触发交互,可以在设置里关闭点击画面识别功能: 此外,我们已经修复了点击剧情框时触发画面识别的bug,所以连续点击剧情框时也不会再因为误触画面识别而中断游玩体验。 1.5 图集导出、剧情分享和载入 对于你觉得好玩、好看、想要保存的剧情,现在可以一键导出全部高清原图,还可以下载你喜欢的角色的角色形象照: 也可以下载为.infiplot格式的文件,直接分享给他人游玩。 infiplot格式格式经过了二进制加密压缩,实现了非常极致的压缩比,所以无需担心分享时因为文件体积过大而不方便分享。 首页的开始按钮右侧新增了载入.infiplot文件的入口: 2. 游玩体验优化 2.1 配置自己的mimo tts apikey 由于小米Mimo tts模型的rpm和tpm限制,使用公用tts key时一旦同时游玩的玩家数量较多,就经常会触发限流,静默静音。因此我们加上了自带配音Key功能,你可以跟着我们的教程配置小米Mimo平台的apikey,从而享受更稳定的配音体验。 mimo tts目前限时免费,玩家无需担心成本问题。 我们之后会把demo的tts服务切换到stepfun,将为佬友带来更高质量、更稳定、更低延迟的配音体验。 2.2 移动端兼容 优化了竖屏状态下的图片生成逻辑和交互体验,以后出门在外也可以随时玩InfiPlot啦: 2.3 绘画风格升级 对绘画风格的选择器做了大幅重构,现在可以借助参考图选择你喜欢的绘画风格了 并且我们还增加了更多的可选风格,甚至包括适合小朋友玩的绘本和涂鸦风格,小朋友可以和自己的小宠物用绘本风格一起出去玩了~ 2.4 图片代理 针对部分用户所在地区网络稳定性较差的问题,我们新增了基于cloudflare worker的图片代理功能。图片加载速度更多,稳定性更高。 worker地址: github.com GitHub - zonghaoyuan/infiplot-image-proxy: Tiny Cloudflare Worker image proxy for InfiPlot —... Tiny Cloudflare Worker image proxy for InfiPlot — CORS + edge cache + HTTP/2 stability (dodges Chrome ERR_QUIC_PROTOCOL_ERROR progressive paint). Optional, one-click deploy. 有需求的佬可以跟着我们的部署教程部署。 2.5 延迟优化 我们通过对剧情生成引擎的架构优化,减少了串行部分,改为更多并行调用,从而将生成延迟整体降低了15s左右,玩家现在可以体验到更加流畅的游玩体验。 3. 自部署体验优化 3.1 多provider兼容 InfiPlot自部署时,文本、识图和图像模型现在均支持配置自定义的openai、claude或gemini兼容的provider,未来还将支持连接你的comfyui生成图片。 有自部署需求的佬可以根据项目readme里的配置教程连接自己的provider。 3.2 支持docker compose部署 除了vercel和cloudflare一键部署,我们还为有本地部署和本地模型需求的用户新增了docker compose部署支持: mkdir infiplot && cd infiplot curl -fsSL https://raw.githubusercontent.com/zonghaoyuan/infiplot/main/docker-compose.yml -o docker-compose.yml curl -fsSL https://raw.githubusercontent.com/zonghaoyuan/infiplot/main/.env.example -o .env.local 执行上面的三行命令,然后根据配置教程修改.env.local,配置你自己的provider,然后执行: docker compose up -d 4. 写在最后 InfiPlot还在快速迭代中,目前剧情生成框架和延迟优化是研发的重点和硬骨头。 不可否认的是,游玩过程中剧情逻辑性和生成速度可能还存在不少bug和不尽如人意的地方。 但是,这几天我们与部分用户的交流发现,已经有深度用户会每天花2个小时以上的时间在InfiPlot上,并称InfiPlot满足了他之前很难被同类非ai驱动的产品满足的幻想需求。 用户分享的游玩体验里,InfiPlot满足了许多我们几位开发者从未设想过的幻想 只能说,人类对InfiPlot的开发程度,还远不足百分之一 希望大家也能用InfiPlot满足自己独一无二的幻想需求,欢迎回帖提供反馈~ 2 个帖子 - 2 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 先放上链接,如有bug和建议欢迎佬们多多提出 github.com GitHub - Waldmeinsamkeit/Serenity-map: 一个人与agent协作探索深挖的无限画布 一个人与agent协作探索深挖的无限画布 最近X上的女股神Serenity以半年4500%的收益冠绝群雄,我深度研究了她的方法论后我发现,这种刨根问底,发散扩散的思维可以运用到任何行业,如果让ai来辅助,做到人机交互,我们普通人是否在大A也能有对抗机构,提前布局,或者能运用到自己的学习和生活中去。希望在AI时代,AI的便利不会让人失去深度思考的能力。 ## 功能特性 - 无限画布:基于 tldraw,支持缩放、拖拽、选择、编辑、箭头和连线。 - 学习卡片:每张卡片包含标题、摘要、正文、标签、状态和 AI 可读 metadata。 - 语义连线:支持 `contains`、`causes`、`supports`、`questions`、`blocks`、`related` 等关系类型。 - AI Context:将当前画布导出为 AI 可读的结构化节点、边、邻域和 Mermaid 图。 - AI Patch:使用 JSON Patch 风格操作安全地新增、更新、删除、连接、断开或移动节点。 - Obsidian Markdown:支持 vault-ready Markdown 导出与导入,包含 frontmatter、wikilink、tags 和 Mermaid。 - 本地保存:通过 Node 本地存储 API 将画布快照保存到 `store/canvas-default.json`。 - MCP Server:提供本地 stdio MCP 服务,方便 agent 读取上下文、导出 Markdown、校验和应用 Patch。 以下是产品的截图: 如何使用 告诉自己的agent,claude,codex,openclaw等任意agent,读取skills下的目录,连接上本项目的mcp。 say:使用项目的skill分析一下物理ai的产业链,或者机器人产业链or其他你想深入了解的东西。 如果想从节点出发,也可以告诉他节点的名称即可,让他从任意节点再次发散思考,或者你自己添加节点,添加证据链。 最后 如果有自己的tushare,grokapi等适合深度搜索和财经数据的来源,也可以让自己的agent整理后接入,遵循skills目录下的工作流即可 感谢站内各位佬们的公益站,让每个人都有能将自己的想法变成现实的能力 1 个帖子 - 1 位参与者 阅读完整话题
下载地址: https://drive.google.com/drive/folders/1qDYvycW4Ki0gAppMGhvSixUCioIRXcmN 前俩天我公布了我写的通过本地 LLM 来实现接近 ChatGPT 功能的工具 Bonsai, 这是我这个系列工具的第二个。 这是一个新的观念,就是可以把所有的浏览器交互都通过本地大模型来实现
下载地址: https://drive.google.com/drive/folders/1qDYvycW4Ki0gAppMGhvSixUCioIRXcmN 前俩天我公布了我写的通过本地 LLM 来实现接近 ChatGPT 功能的工具 Bonsai, 这是我这个系列工具的第二个。 这是一个新的观念,就是可以把所有的浏览器交互都通过本地大模型来实现
微软在年度开发者大会上展示了两款处于早期阶段的硬件概念,试图把人工智能从笔记本屏幕和应用程序中解放出来,放到人们更容易接触的专用设备上。 其中一款是可放在桌面的迷你立方体设备,带有触摸屏和语音控制;另一款则是可穿戴设备,微软高管 Steven Bathiche 将其称为“可穿戴访问徽章”,既可以夹在衣物上,也可以挂在脖子上佩戴。 这两款原型都围绕 AI 代理设计,尤其面向开发者和技术从业者常用的写作、润色代码等场景。 微软的思路是让这些 AI 工具始终保持“触手可及”,而不是每次都依赖笔记本电脑或桌面显示器来访问。 CEO 萨提亚·纳德拉则把这类设备定义为一种“新的外形”,暗示微软正在重新思考 AI 不应只存在于手机和个人电脑中,也可能需要更小、更贴身的硬件载体。 在演示中,最受关注的是那款可穿戴徽章,因为它具备指纹激活功能,并内置一枚小型摄像头。 Bathiche 在现场将徽章对准观众,并要求它拍照后发送给自己,系统据称完成了这项指令。 微软表示,这枚摄像头不只是为了拍摄图像,更重要的是让 AI 代理获得更多环境信息,从而更好理解用户所处场景,并据此采取行动。 不过,这种持续感知环境的能力也伴随着熟悉的隐忧。 业内此前已有类似产品引发关于视觉数据如何记录、存储以及在何种条件下被使用的讨论,Meta 的 AI 眼镜就曾面临类似质疑。 微软目前并未确认这两款设备是否会走向商业化,而是先由数百名员工进行内部测试,测试结果将用于后续设计决策。 微软在可穿戴硬件领域的过往并不算顺利。 其曾被寄予厚望的 HoloLens 混合现实头显,尽管研发多年并拿到过美国陆军的高调合同,最终仍难以打开市场,微软也在 2024 年表示停止生产 HoloLens。 与此同时,Google近期也释放出重返智能眼镜领域的信号,显示科技公司正尝试借助更成熟的 AI,尤其是代理式系统,重新证明可穿戴设备的价值。 整体来看,微软这次展示的原型传递出一个清晰信号:公司不再把 AI 仅仅视为软件能力,而是认为它未来可能需要一层专属硬件来承载。 但这套设想能否在受控测试之外真正成立,仍有待观察。 查看评论
IT之家 6 月 3 日消息,今天,智元正式开源 AGIBOT WORLD 2026 数据集第二期主题“多样交互(Rich Interaction)”。 据介绍,这是行业首个聚焦物理交互的开源具身数据集,面向世界模型、神经仿真器、物理感知以及表征学习等具身智能研究,系统记录机器人与真实物理世界之间复杂、高密度、非理想的交互过程,旨在补齐当前世界模型训练中长期缺失的真实物理交互数据。 官方称,本期“多样交互”数据集,是首次将具身智能的数据范式从“学习成功动作”推进到“理解完整的物理分布”。唯有汲取真实而丰富的交互数据,机器人才能洞悉物理世界的运行法则。 IT之家注意到,目前本期数据集已在 Hugging Face 平台开放下载。
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 1. 前言 本人是《完蛋!我被美女包围了!》、《千恋万花》、《底特律:变人》这种互动剧情类游戏的忠实爱好者,上个月看到 flipbook 发布,他们用多模态模型实现的全新UI交互形态让我很受震撼,于是萌生了做这个项目的想法。 项目名叫InfiPlot,有无穷多种剧情、无限长度剧情的意思。佬们可以直接访问 infiplot.com 开始游玩。(目前内测期间,是可以免费玩的。API成本就当作从L站学知识的回报吧,我是真的很希望有更多人可以体验到这种新的交互模式) 开源地址: github.com GitHub - zonghaoyuan/infiplot: InfiPlot is the world's first interactive plot... InfiPlot is the world's first interactive plot game that AI generates all text and images in real-time. InfiPlot是全球首个由 AI 实时生成全部图文内容的交互式剧情游戏 在线体验: infiplot.com InfiPlot — AI 实时交互剧情游戏 InfiPlot 是一款用 AI 实时生成图片、语音与剧情分支的交互式剧情游戏 Demo。 项目目前部署在vercel上,如果佬友所在地区访问体验不佳的话,可以尝试打开科学上网。 支持vercel/cloudflare一键部署,cf 部署需要 Workers Paid Plan,推荐用vercel一键部署: 2. 项目介绍 2.1 设计思路 InfiPlot参考了互动剧情游戏的设计,让用户从2-3个选项中选择一个选项来推动剧情的发展。 为了实现这个交互设计,我们让每个故事以一连串场景的形式展开,每个场景由一张ai绘制的背景图和一个情节树组成,情节树中包含了这个场景内的剧情分支、人物对话和交互选项。 自定义交互输入目前在roadmap中,我们会尽快实现 除了点击选项外,你还可以点击场景图中的任何位置触发交互。然后InfiPlot会根据识别到的点击位置,决定要如何回应,比如根据点击位置推进到之前不存在的剧情分支。 这个功能参考了flipbook,未来将会作为InfiPlot最重要的功能来开发 2.2 工作原理 我们用了multi-agent架构来提升剧情连贯性、角色一致性和整体的剧情质量。我们将agent分为架构师、编剧、角色设计师、场景布置师、画家五个职能,让他们之间相互配合来编排和交付前端显示的内容。 他们都学习了对应行业的专业知识,比如编剧学习了电影行业的知识,能够设计出更加跌宕起伏、有吸引力的情节。 multi-agent架构图: 2.3 一些有趣的技术细节 a. 关于tts配音 我们目前使用了mimo-v2.5-tts系列模型来配音,从而实现了基于每个角色不同的人设来设计音色,而且可以根据剧情的变化设计声音的情绪。 实际体验中,可爱妹子会用很kawaii的声音,班主任则会是那种听起来就很沉稳靠谱的音色。正常情况下是正常说话,但是如果你把角色逼急了,她/他可能会很生气地冲你大叫。当然,如果你成功攻略了某个角色,ta也可能会变得更加娇羞。没有任何音色或情绪是预先设定好的。 加上tts模型是在项目最开始时没有预想到的。只是因为我们讨论时考虑到视觉小说都会为角色配音,如果InfiPlot是静音的,沉浸感会大打折扣。 最开始我们选择了edge-tts模型(是的我们真的用过这个模型),发出的声音很鬼畜。后来换到minimax的tts模型,充了几十块钱跑了几次测试就花完了,后来才发现逆天的minimax设计一次音色要3块钱,怎么不去抢。前天minimax m3发布的时候,本来期待值拉满,结果又拉了,难评啊难评。 最终我们发现大善人mimo的tts模型是免费的,而且质量还挺高,于是就实现了上面所说的定制音色和情绪的功能,体验还不错。(不过由于mimo tts模型有rpm限制,我们后期可能会增加前端自定义mimo apikey的功能,也会同时找mimo客服申请更高的rpm限额,尽可能给大家跟好的游玩体验) b. 关于生图模型的选择 毫无疑问,生图模型是InfiPlot的技术难度最大的部分。我们需要延迟极低,同时成本也极低,质量还可靠的模型。 此处应该摆出一张三色图: 然而还真让我们找到了这种模型:z-image-turbo和flux.2 9b,在runware.ai上的价格都极低。而且最快甚至可以在0.5s内出图! 当然0.5s是理论速度,实测runware上flux.2 9b的出图时间在2s内。 由于z-image-turbo不支持上传多张参考图,就无法实现角色和场景的一致性,因此最终生图模型选用了flux.2 9b,单图成本$0.00078。 不过因为参数量较小,目前仍然会出现角色长出三只手或者有重影之类的问题,暂时还没找到特别好的优化办法,佬友们如果有办法的话可以支个招。 2.4 游玩体验 坦率地讲,目前InfiPlot的游玩体验只能达到60分(满分100分),之所以现在就把它发出来,一方面是想要收集更多的用户反馈,另一方面也是因为我们的资源有限,希望能得到更多的关注和更多成员的加入。 我会建议佬们现阶段游玩时,优先选择更偏向红果短剧而非豆瓣top250的剧情设定。这是因为InfiPlot目前生成内容的质量还很难和优质的导演、编剧的创作质量竞争,但是对于一些无脑情节,玩起来确实还是蛮爽的。 比如我就会玩一些,“穿越回研一,发表nature和n篇顶会,3年拿到博士学位,评上杰青,建立百人课题组”之类的剧情。只能说,当天才少年的感觉真tm爽啊 当然,我们的最终目标一定是实现比肩优质剧情小说、真人互动游戏的内容质量和游玩体验。佬友们可以期待一下(如果进展顺利的话) 目前InfiPlot还只支持生成基于图片的场景描绘,但用图生视频模型实现动态场景图已经在roadmap里了。 3. 游戏截图 下面放一些我们测试过程中截取的比较好看的游戏截图(附剧情概要): 【黄昏归途】 他总在黄昏时分,于空无一人的车站遇见少女。她带他穿越时间的缝隙,回到故乡被毁灭前的最后一天。每一次循环,他都必须在拯救她与拯救世界之间做出选择。 【社团存亡日】 濒临废部的动画社,唯一社员是总在睡觉的怪人。新来的转校生社长发现,只要完成怪人的“日常委托”,社员就会增加一人,而这些人,都来自被遗忘的动画世界。 【花魁的刀】 她是吉原最负盛名的花魁,舞姿倾城,面具下的真实身份却是令江户幕府闻风丧胆的传奇忍者。当幕府密探踏入花街,刀光与花影将同绽。 下面是一些我们测试游玩体验的过程中觉得质量很高的截图,剧情概要在测试时没存就不放了 一行小字 : 上面这些截图并不全是用flux.2 9b生成的,佬友们如果觉得在线demo里的生图质量不够满意的话,可以自部署之后换更高质量的生图模型。 如果佬友们感兴趣,我们之后也可以加上预制游戏的功能,这样就可以用时间换质量,在不牺牲游玩体验的前提下享受最佳的画面表现。 我们未来可能会用InfiPlot制作一些精品游戏发布到steam,佬们可以期待一下。 4. 写在最后,关于团队 我们团队的成员来自清华大学、兰州大学、西安交大等高校。目前团队还在招募新成员,如果佬友们感兴趣加入的话,欢迎论坛私信或者邮件联系我(最好带上简单的自我介绍) 邮箱:[email protected] 我们几个人目前都是兼职开发InfiPlot,而且大部分时候是远程合作(甚至有在澳洲的同学),所以时间和地点上不会太有压力。 遵守社区规定,这里就不放内测用户群的二维码了,感兴趣的佬可以去网站或者github项目页找到qq群二维码和群号,欢迎来和我们聊天! 最后最后,求回复求star(应该不违反社区规定吧) 谢谢佬友们,爱你们 11 个帖子 - 4 位参与者 阅读完整话题
IT之家 6 月 3 日消息,OpenAI 今天(6 月 3 日)发布博文,宣布为 Codex 推出 Sites 功能,目前以预览版形式,面向 Business 和 Enterprise 订阅用户开放, 可以创建和共享交互式托管网站和应用程序。 Sites 是用户展示创意的全新平台,Codex 会将用户的想法、分析和计划转化为仪表盘、规划器、评审工作区、项目看板、作品展示区和轻量级工具。IT之家附上相关截图如下: 用户可以通过 URL 分享给团队指定用户,为团队提供一个共享空间,以便他们共同探索工作、贡献想法、跟踪进度并共同决策。 例如,财务主管可以将静态电子表格转换为交互式情景规划器,让高管能够在实时 Web 应用程序中调整假设。
这个交互很棒啊 回帖舒服一些 7 个帖子 - 5 位参与者 阅读完整话题