Omni - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-09 07:37:14+08:00 · tech

我真的服了，Omni 堪称最蠢人脸限制，我拿个 GPT 生的人物全身图进去，只要带脸的（哪怕明显是国漫 cg 脸），都说违反政策。我请问呢？我又没让他去做什么 nsfw，再说 nsfw 你又不支持。目前看来好像只有在 flow 里用 Gemini 自己生成的人是能用的，而且要保存为角色，你只把图片下载下来再传是不行的。Gemini 人脸又实在是印度味太重天下苦 Seedance 久矣，奈何这些友商没一个争气的啊 3 个帖子 - 3 位参与者阅读完整话题

OmniGate:代理+直连双模式，自动切换中转站

LinuxDo 最新话题 · 2026-06-08 16:36:03+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出上次注册之后一直没使用，结果给我账号删了，自此只能观摩不可评论，今天趁着这个机会成功上车。那给大家介绍一下我最近写的软件： OmniGate 功能介绍一处配置，处处使用，不需要一个供应商配置好几遍支持直连、代理双模式。代理就是可以添加好多个供应商，自动异常时轮换，可以 24 小时不停机，支持热切换，不需要重启客户端，直连就是直接添加供应商到配置文件。快速管理系统Prompt、配置文件。快捷拉取 /models 不再需要手动填写。 2 个帖子 - 1 位参与者阅读完整话题

gpt bug team福利

LinuxDo 最新话题 · 2026-06-08 16:05:28+08:00 · tech

发个福利吧 omnitok.xyz OMNITOK - AI API Gateway 秘钥（点击了解更多详细信息）无aff 1 个帖子 - 1 位参与者阅读完整话题

Omni flash相比之前的veo3.1水印位置高了不少，更难裁切了

LinuxDo 最新话题 · 2026-06-08 14:29:27+08:00 · tech

之前的在底部稍微裁切就行了，现在这个裁切损失太大了，佬们这种水印能去掉吗，本地跑的也行，试过一个vsr，很老了，去不掉 2 个帖子 - 1 位参与者阅读完整话题

[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

v2ex · 2026-06-07 04:43:15+08:00 · tech

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者，我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成，如果不满意往往只能换提示词全部推翻重来。为了解决这个痛点，我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演，通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目，希望能听到各位的反馈。 Gemini Omni Video 简介简单来说，这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中，你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景，AI 就会为你生成视频。最重要的是，如果对生成的细节不满意，你可以直接给它下指令，比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图，在保留原有画面的基础上实时重新渲染，而不是瞎猜重做。 Gemini Omni Video 的特点为了让它真正好用并且能用于生产环境，我在开发时侧重了以下几个核心体验：拒绝“抽卡”，支持对话式持续迭代：这是它最大的不同点。系统会保留你的会话上下文，你可以一帧一帧地迭代，调整取景、切换风格、延长时长，甚至替换某个角色，而不会丢失之前做好的部分。就像是视频版的“版本控制”。多模态输入，统一工作流：无论你扔给它一段剧本、一张产品图，还是一段语音备忘录，甚至三者同时输入，它都能理解并融合生成一段连贯的视频，省去了手动合成的麻烦。自带音效与角色一致性：每次生成的视频都自带同步的音效（环境音、特效声等视觉对齐音频）。此外，它支持跨片段保持人物面部、服装和风格的一致性，非常适合做系列短片。一键 4K 多格式输出：描述一次你的视频，就能自动适配并导出 16:9 （ YouTube ）、9:16 （ TikTok/Reels ）或 1:1 格式的 4K 视频，系统会自动重新构图，无需手动裁剪。所有成片均自带完全的商业使用权。如何使用？整个流程非常符合直觉，从白纸到最终成品只需要简单的三步：布置舞台：丢入你的原始素材，比如文本脚本、参考照片或音频剪辑，AI 会自动读取并构建一个统一的创意大纲。导演场景：告诉 AI 你的诉求：摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确，AI 都能智能适应并补全剩余细节。持续打磨：预览视频后，用大白话提出修改意见（如“前奏剪短点”、“放大产品”）。每一轮修改都会保留好的部分并修复瑕疵，满意后直接导出 4K 成片。使用网址： https://geminiomnivideo.ai 以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布，只需要不到五分钟时间。个人独立开发不易，欢迎大家来试玩体验！如果使用中遇到任何 bug 或者有新的功能建议，请直接在帖子里留言，我会第一时间跟进解答和修复。感谢大家支持！

[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

v2ex · 2026-06-07 03:43:15+08:00 · tech

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者，我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成，如果不满意往往只能换提示词全部推翻重来。为了解决这个痛点，我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演，通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目，希望能听到各位的反馈。 Gemini Omni Video 简介简单来说，这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中，你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景，AI 就会为你生成视频。最重要的是，如果对生成的细节不满意，你可以直接给它下指令，比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图，在保留原有画面的基础上实时重新渲染，而不是瞎猜重做。 Gemini Omni Video 的特点为了让它真正好用并且能用于生产环境，我在开发时侧重了以下几个核心体验：拒绝“抽卡”，支持对话式持续迭代：这是它最大的不同点。系统会保留你的会话上下文，你可以一帧一帧地迭代，调整取景、切换风格、延长时长，甚至替换某个角色，而不会丢失之前做好的部分。就像是视频版的“版本控制”。多模态输入，统一工作流：无论你扔给它一段剧本、一张产品图，还是一段语音备忘录，甚至三者同时输入，它都能理解并融合生成一段连贯的视频，省去了手动合成的麻烦。自带音效与角色一致性：每次生成的视频都自带同步的音效（环境音、特效声等视觉对齐音频）。此外，它支持跨片段保持人物面部、服装和风格的一致性，非常适合做系列短片。一键 4K 多格式输出：描述一次你的视频，就能自动适配并导出 16:9 （ YouTube ）、9:16 （ TikTok/Reels ）或 1:1 格式的 4K 视频，系统会自动重新构图，无需手动裁剪。所有成片均自带完全的商业使用权。如何使用？整个流程非常符合直觉，从白纸到最终成品只需要简单的三步：布置舞台：丢入你的原始素材，比如文本脚本、参考照片或音频剪辑，AI 会自动读取并构建一个统一的创意大纲。导演场景：告诉 AI 你的诉求：摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确，AI 都能智能适应并补全剩余细节。持续打磨：预览视频后，用大白话提出修改意见（如“前奏剪短点”、“放大产品”）。每一轮修改都会保留好的部分并修复瑕疵，满意后直接导出 4K 成片。使用网址： https://geminiomnivideo.ai 以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布，只需要不到五分钟时间。个人独立开发不易，欢迎大家来试玩体验！如果使用中遇到任何 bug 或者有新的功能建议，请直接在帖子里留言，我会第一时间跟进解答和修复。感谢大家支持！

gemini视频编辑

LinuxDo 最新话题 · 2026-06-05 13:57:59+08:00 · tech

之前的学生会员，现在使用gemini pro去让他帮我用omni修改视频，但是总是显示视频编辑功能尚未在所在地区推出，在问他就是抱歉，他弄错了，可以用。但是就是用不了，有佬知道是什么原因吗？ 2 个帖子 - 2 位参与者阅读完整话题

感觉自己比年龄老引发失眠

LinuxDo 最新话题 · 2026-06-03 10:44:07+08:00 · tech

Neuroscience News – 2 Jun 26 Feeling Older Than Your Age Triggers Insomnia - Neuroscience News Feeling older than your chronological age causes insomnia and poor physical health. Est. reading time: 6 minutes [!quote]+ 一项新的研究揭示了慢性睡眠障碍和全身健康衰退背后的深层心理驱动因素。研究表明，“年龄差异”，即一个人主观感觉的年龄与实际年龄不符，是破坏性睡眠结果的一个强大的独立预测因素。将在 2026 年睡眠年会上发表的一项新研究发现，感觉自己比实际年龄大的成年人报告的睡眠结果较差，包括失眠症状较多、睡眠相关损伤较大、睡眠规律性较低，而这些睡眠结果又与自我报告的身体健康状况较差有关。感觉自己比同龄人年龄大的成年人报告了更多的失眠症状、更多的睡眠相关损伤、更低的总体睡眠健康水平和更低的睡眠规律性。中介分析进一步发现，年龄差异越大，自我报告的身体健康状况越差，这与失眠严重程度、睡眠规律性和睡眠相关损伤有间接关系。因为你对衰老的心理认知会改变你对生物的自上而下的执行控制。2026 年睡眠研究》表明，年龄差异是失眠和睡眠不规律的主要独立预测因素。当您的头脑中出现衰老、高压力的身份时，就会转化为一种过度亢奋的状态，从而助长失眠症状，破坏身体保持睡眠规律的自然能力。通过你的睡眠质量直接产生强大而间接的多米诺骨牌效应。平行调解分析证明，年龄差距过大是一种生物触发器。感觉自己比实际年龄大，会导致失眠严重程度、睡眠不规律和日间睡眠障碍大幅上升，而这些睡眠障碍反过来又会成为降低自我报告的身体健康水平的主要引擎。数据表明，控制主观年龄是健康寿命的关键要求。由于即使剔除抑郁和焦虑等因素，这些与睡眠有关的负面因素仍然很重要，因此直接解决主观年龄问题提供了一种新的临床途径。改变您的心理感受，让自己感觉更年轻，有助于保护您的睡眠指标，保护您的日间功能和整体生活质量。 2 个帖子 - 1 位参与者阅读完整话题

[开源自荐] - OmniKB 快速构建发布（个人/团队）小型wiki知识库问答

LinuxDo 最新话题 · 2026-06-03 10:42:17+08:00 · tech

本帖使用社区开源推广，符合推广要求。我申明并遵循社区要求的以下内容：我的帖子已经打上开源推广标签：是我的开源项目完整开源，无未开源部分：是我的开源项目已链接认可 LINUX DO 社区：是我帖子内的项目介绍，AI生成、润色内容部分已截图发出：是以上选择我承诺是永久有效的，接受社区和佬友监督：是以下为项目介绍正文内容，AI生成、润色内容已使用截图方式发出 github.com GitHub - fivif/OmniKB: Universal AI Knowledge Base Agent Universal AI Knowledge Base Agent [! ] 功能简述支持上传各种文档，图片支持URL摄取网络资源将摄入资源转变为wiki页支持快速定制并发布自定义场景 [! ]-场景发布演示 [!danger]具体介绍测试晚点补，先睡觉了，通宵了。 1 个帖子 - 1 位参与者阅读完整话题

惠普推出 OmniDesk 迷你主机：英特尔酷睿 Ultra Series 3 处理器，支持雷电共享功能

IT之家 · 2026-06-01 23:13:18+08:00 · tech

IT之家 6 月 1 日消息，据外媒 Notebookcheck 报道，惠普今天在台北电脑展 2026 期间推出全新 OmniDesk 迷你主机，新品搭载英特尔酷睿 Ultra Series 3 处理器，将于今年 8 月上市。 IT之家从原报道获悉，这款迷你主机采用英特尔最新的酷睿 Ultra Series 3 处理器，集成 NPU 神经网络引擎，可驱动 AI 加速、本地 AI 智能体。同时，这款迷你主机拥有 Thunderbolt Share 雷电共享特性，用户可使用一套键鼠控制两台电脑，并在多台电脑之间无缝传输文件、图片及视频等。此外，这款迷你主机最多可连接四台 4K 显示器，配备两个雷电 4 接口。新品面向内容创作者等高阶用户，售价暂未公开。相关阅读：《让 Win11 PC 共享文件、外设，英特尔发布 Thunderbolt Share 雷电共享技术》

PaddleOCR-VL-1.6 更新发布继续登顶 OmniDocBench

LinuxDo 最新话题 · 2026-05-28 22:39:58+08:00 · tech

业界领先的轻量级文档解析视觉语言模型 PaddleOCR-VL-1.6 (0.9B) 。该模型以 96.3% 精度刷新 OmniDocBench v1.6，文本、公式、表格识别全面领先，并在古籍、生僻字、印章、图表等多场景能力显著增强，支持以 Markdown 和 JSON 格式输出结构化结果。仓库地址： GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. · GitHub 权重： PaddlePaddle/PaddleOCR-VL-1.6 · Hugging Face 官网使用： PaddleOCR - 文档解析与智能文字识别 | 支持API调用与MCP服务 - 飞桨星河社区 1 个帖子 - 1 位参与者阅读完整话题

MiMo-V2-Pro / Omni 模型下线通知 | 2026.6.30 正式下线

LinuxDo 最新话题 · 2026-05-28 22:26:13+08:00 · tech

随着 MiMo V2.5 系列全面上线并稳定运行，为帮助开发者迁移到推理能力更强、性价比更高的新模型，计划正式下线以下模型：下线模型及系统替换模型： mimo-v2-pro → 替换为 mimo-v2.5-pro mimo-v2-omni → 替换为 mimo-v2.5 下线时间安排：北京时间 2026.6.1 00:00 ：下线模型自动切换为新版本模型，调用 MiMo-V2-Pro / Omni 的请求将自动转发至对应的 V2.5 模型，并按照新版模型计价。北京时间 2026.6.30 00:00 ：旧模型下线，旧版本模型名称失效，调用旧版本模型名称的请求将会收到报错，务必在此之前，完成模型替换并充分测试验证。摘自：Xiaomi MiMo API 开放平台团队 1 个帖子 - 1 位参与者阅读完整话题

佬友们有没有omni-flash或者veo 3的链接

LinuxDo 最新话题 · 2026-05-27 19:31:48+08:00 · tech

想要了解一下ai视频，佬友们是否有omni-flash或者veo 3的代充的链接或者中转站。急需佬友分享。 1 个帖子 - 1 位参与者阅读完整话题

实测部分场景，谷歌 Omni 可以平替 seedance2

V2EX - 技术 · 2026-05-26 18:02:32+08:00 · tech

排除电影打斗场景谷歌新发的全能模型 Omni flash 效果还是不错的在短视频电商这种短视频领域还是平替 sd2 (目前 sd2 唯一缺点就是太贵了）而且 gpt-image-2 + omni flash 这样分镜图去搞视频也没问题（参照以前 gptimg2 + sd2/sora2 模式）以前用故事板分享帖子 https://www.v2ex.com/t/1211030 实测 Omni 图生视频，环游世界的视频（纯人物照+提示词生成）视频效果看这里完整提示词和视频当然整体 sd2 实属第一流的存在

实测部分场景，谷歌 Omni 可以平替 seedance2

V2EX - 技术 · 2026-05-26 17:02:32+08:00 · tech

排除电影打斗场景谷歌新发的全能模型 Omni flash 效果还是不错的在短视频电商这种短视频领域还是平替 sd2 (目前 sd2 唯一缺点就是太贵了）而且 gpt-image-2 + omni flash 这样分镜图去搞视频也没问题（参照以前 gptimg2 + sd2/sora2 模式）以前用故事板分享帖子 https://www.v2ex.com/t/1211030 实测 Omni 图生视频，环游世界的视频（纯人物照+提示词生成）视频效果看这里完整提示词和视频当然整体 sd2 实属第一流的存在

[分享创造] 都说谷歌 Omni 拉跨，但是实测部分场景完全可以平替 Seedance2

v2ex · 2026-05-26 11:33:59+08:00 · tech

前面发过 gpt-image-2 + seedance2 组合工作流是现在的 AI 视频当红炸子鸡然后紧接着谷歌 I/O 大会发布大家期待的 Gemini Omni 一直赢得了大家的差评效果还是打不过字节的 seedance2 但是实测下来，除了电影、打斗这种高强度高要求的场景首发的 Omni Flash 还是可以胜任许多场景。比如下面这个旅游转场效果短视频效果很好，可以平替 sd2 （目前 sd2 就是太贵）提示词和视频效果可以直接去这里查看👉 谷歌 Omni Flash 图生视频画布模板

有无google omni反代或者其他视频反代有没有推荐的项目

LinuxDo 最新话题 · 2026-05-25 17:28:46+08:00 · tech

铁铁们给个推荐求个视频模型反代项目目前找到了veo的一般般呀有没有什么其他模型的可以蹭蹭的 1 个帖子 - 1 位参与者阅读完整话题

[推广] [推广]Google I/O 发布的 Gemini Omni Flash，对话式视频编辑体验分享

v2ex · 2026-05-24 22:38:36+08:00 · tech

最近试了下 Google 在 I/O 2026 发布的 Gemini Omni Flash ，说下感受。这个模型最大的不同是可以通过对话来编辑视频。生成一个片段后，你可以直接说"把背景换成海滩"、"放慢镜头"、"加个人在右边"，它会在保留其他内容的基础上只改你说的部分。不用像 Sora 那样每次都重新生成整个片段。几个关键点： - 支持多模态输入：文本+图片+音频+视频可以一起喂进去 - 输出 10 秒片段，带同步音频 - YouTube Shorts 免费用，Gemini 应用需要 AI Plus （$7.99/月） - 开发者 API 还没开放，说是"几周内" - 所有输出强制带 SynthID 水印和 Sora 2 比：Sora 角色一致性更好，能生成 25 秒片段； Omni Flash 胜在多模态输入和对话编辑，迭代成本低很多。限制也不少：10 秒上限、不能编辑语音（防 deepfake ）、文字渲染不太准、复杂运动场景偶尔会崩。如果想快速体验视频生成，可以看看 [gemini omni]( https://www.veol.ai?utm_source=v2ex ) ，支持最高 4K 输出，按量计费从 $0.15 起。有用过的 V 友吗？感觉对话式编辑这个方向挺对的，但 10 秒限制确实有点短。

小米 Standard 月度套餐 2亿Token 随便蹬

LinuxDo 最新话题 · 2026-05-24 21:07:24+08:00 · tech

模型：MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS、MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS 额度：200,000,000 Credits 编程工具支持： OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具有效期至 2026-05-28 23:59 (UTC) APIKey:dHAtYzhtOXM1N2kxNGtjcDR4NDNzaGkxazBjMm81ZGxobHV6cDFkc3ZmaHMxNWRtOGd4 为避免机器人爬走Key，已用base64编码，有需要的可以发给AI解码使用定期更新使用量 1 个帖子 - 1 位参与者阅读完整话题

Google更新，seedance绝尘领先

LinuxDo 最新话题 · 2026-05-24 11:52:27+08:00 · tech

flow上试用了一下，现在只有omni flash，感觉除了新增了一个画布功能，omni flash对比veo3.1毫无进步。seedance没有对手啊。话说各位佬用什么来做ai视频，现在seedance还有平替吗？ 3 个帖子 - 3 位参与者阅读完整话题

/tag/Omni