WWW.YOUINFO.SITE
标签聚合 Omni

/tag/Omni

LinuxDo 最新话题 · 2026-06-09 07:37:14+08:00 · tech

我真的服了,Omni 堪称最蠢人脸限制,我拿个 GPT 生的人物全身图进去,只要带脸的(哪怕明显是国漫 cg 脸),都说违反政策。我请问呢?我又没让他去做什么 nsfw,再说 nsfw 你又不支持。 目前看来好像只有在 flow 里用 Gemini 自己生成的人是能用的,而且要保存为角色,你只把图片下载下来再传是不行的。Gemini 人脸又实在是印度味太重 天下苦 Seedance 久矣,奈何这些友商没一个争气的啊 3 个帖子 - 3 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-08 16:36:03+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 上次注册之后一直没使用,结果给我账号删了,自此只能观摩不可评论,今天趁着这个机会成功上车。 那给大家介绍一下我最近写的软件: OmniGate 功能介绍 一处配置,处处使用,不需要一个供应商配置好几遍 支持直连、代理双模式。代理就是可以添加好多个供应商,自动异常时轮换,可以 24 小时不停机,支持热切换,不需要重启客户端,直连就是直接添加供应商到配置文件。 快速管理系统Prompt、配置文件。 快捷拉取 /models 不再需要手动填写。 2 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-07 04:43:15+08:00 · tech

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者,我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成,如果不满意往往只能换提示词全部推翻重来。 为了解决这个痛点,我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演,通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目,希望能听到各位的反馈。 Gemini Omni Video 简介 简单来说,这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中,你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景,AI 就会为你生成视频。 最重要的是,如果对生成的细节不满意,你可以直接给它下指令,比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图,在保留原有画面的基础上实时重新渲染,而不是瞎猜重做。 Gemini Omni Video 的特点 为了让它真正好用并且能用于生产环境,我在开发时侧重了以下几个核心体验: 拒绝“抽卡”,支持对话式持续迭代: 这是它最大的不同点。系统会保留你的会话上下文,你可以一帧一帧地迭代,调整取景、切换风格、延长时长,甚至替换某个角色,而不会丢失之前做好的部分。就像是视频版的“版本控制”。 多模态输入,统一工作流: 无论你扔给它一段剧本、一张产品图,还是一段语音备忘录,甚至三者同时输入,它都能理解并融合生成一段连贯的视频,省去了手动合成的麻烦。 自带音效与角色一致性: 每次生成的视频都自带同步的音效(环境音、特效声等视觉对齐音频)。此外,它支持跨片段保持人物面部、服装和风格的一致性,非常适合做系列短片。 一键 4K 多格式输出: 描述一次你的视频,就能自动适配并导出 16:9 ( YouTube )、9:16 ( TikTok/Reels )或 1:1 格式的 4K 视频,系统会自动重新构图,无需手动裁剪。所有成片均自带完全的商业使用权。 如何使用? 整个流程非常符合直觉,从白纸到最终成品只需要简单的三步: 布置舞台: 丢入你的原始素材,比如文本脚本、参考照片或音频剪辑,AI 会自动读取并构建一个统一的创意大纲。 导演场景: 告诉 AI 你的诉求:摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确,AI 都能智能适应并补全剩余细节。 持续打磨: 预览视频后,用大白话提出修改意见(如“前奏剪短点”、“放大产品”)。每一轮修改都会保留好的部分并修复瑕疵,满意后直接导出 4K 成片。 使用网址: https://geminiomnivideo.ai 以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布,只需要不到五分钟时间。个人独立开发不易,欢迎大家来试玩体验!如果使用中遇到任何 bug 或者有新的功能建议,请直接在帖子里留言,我会第一时间跟进解答和修复。感谢大家支持!

v2ex · 2026-06-07 03:43:15+08:00 · tech

Gemini Omni Video 。作为一个经常需要做短视频和宣发物料的开发者,我苦于现在市面上的 AI 视频工具大多都是“一锤子买卖”——也就是所谓的抽卡式生成,如果不满意往往只能换提示词全部推翻重来。 为了解决这个痛点,我基于 Google 的 Gemini Omni 模型开发了这个对话式视频生成器。你可以把它当成你的私人 AI 导演,通过不断对话就能精雕细琢出想要的 4K 视频。今天想在 V 站和大家真诚分享一下这个项目,希望能听到各位的反馈。 Gemini Omni Video 简介 简单来说,这是一款将视频制作转化为“创意对话”的 AI 视频生成器。在这个 Gemini Omni AI Video 工具中,你不需要面对复杂的剪辑时间线。你只需要用自然语言描述一个场景,AI 就会为你生成视频。 最重要的是,如果对生成的细节不满意,你可以直接给它下指令,比如“让光线更暖一些”、“镜头慢一点”、“背景加上雨天效果”。它能理解你的真实意图,在保留原有画面的基础上实时重新渲染,而不是瞎猜重做。 Gemini Omni Video 的特点 为了让它真正好用并且能用于生产环境,我在开发时侧重了以下几个核心体验: 拒绝“抽卡”,支持对话式持续迭代: 这是它最大的不同点。系统会保留你的会话上下文,你可以一帧一帧地迭代,调整取景、切换风格、延长时长,甚至替换某个角色,而不会丢失之前做好的部分。就像是视频版的“版本控制”。 多模态输入,统一工作流: 无论你扔给它一段剧本、一张产品图,还是一段语音备忘录,甚至三者同时输入,它都能理解并融合生成一段连贯的视频,省去了手动合成的麻烦。 自带音效与角色一致性: 每次生成的视频都自带同步的音效(环境音、特效声等视觉对齐音频)。此外,它支持跨片段保持人物面部、服装和风格的一致性,非常适合做系列短片。 一键 4K 多格式输出: 描述一次你的视频,就能自动适配并导出 16:9 ( YouTube )、9:16 ( TikTok/Reels )或 1:1 格式的 4K 视频,系统会自动重新构图,无需手动裁剪。所有成片均自带完全的商业使用权。 如何使用? 整个流程非常符合直觉,从白纸到最终成品只需要简单的三步: 布置舞台: 丢入你的原始素材,比如文本脚本、参考照片或音频剪辑,AI 会自动读取并构建一个统一的创意大纲。 导演场景: 告诉 AI 你的诉求:摄像机角度、节奏、色调或情绪。无论指令是模糊还是精确,AI 都能智能适应并补全剩余细节。 持续打磨: 预览视频后,用大白话提出修改意见(如“前奏剪短点”、“放大产品”)。每一轮修改都会保留好的部分并修复瑕疵,满意后直接导出 4K 成片。 使用网址: https://geminiomnivideo.ai 以上就是关于这款 Gemini Omni Video AI 的简单介绍。从脑海里的粗略概念到发布,只需要不到五分钟时间。个人独立开发不易,欢迎大家来试玩体验!如果使用中遇到任何 bug 或者有新的功能建议,请直接在帖子里留言,我会第一时间跟进解答和修复。感谢大家支持!

LinuxDo 最新话题 · 2026-06-03 10:44:07+08:00 · tech

Neuroscience News – 2 Jun 26 Feeling Older Than Your Age Triggers Insomnia - Neuroscience News Feeling older than your chronological age causes insomnia and poor physical health. Est. reading time: 6 minutes [!quote]+ 一项新的研究揭示了慢性睡眠障碍和全身健康衰退背后的深层心理驱动因素。研究表明,“年龄差异”,即一个人主观感觉的年龄与实际年龄不符,是破坏性睡眠结果的一个强大的独立预测因素。 将在 2026 年睡眠年会上发表的一项新研究发现,感觉自己比实际年龄大的成年人报告的睡眠结果较差,包括失眠症状较多、睡眠相关损伤较大、睡眠规律性较低,而这些睡眠结果又与自我报告的身体健康状况较差有关。 感觉自己比同龄人年龄大的成年人报告了更多的失眠症状、更多的睡眠相关损伤、更低的总体睡眠健康水平和更低的睡眠规律性。中介分析进一步发现,年龄差异越大,自我报告的身体健康状况越差,这与失眠严重程度、睡眠规律性和睡眠相关损伤有间接关系。 因为你对衰老的心理认知会改变你对生物的自上而下的执行控制。2026 年睡眠研究》表明,年龄差异是失眠和睡眠不规律的主要独立预测因素。当您的头脑中出现衰老、高压力的身份时,就会转化为一种过度亢奋的状态,从而助长失眠症状,破坏身体保持睡眠规律的自然能力。 通过你的睡眠质量直接产生强大而间接的多米诺骨牌效应。平行调解分析证明,年龄差距过大是一种生物触发器。感觉自己比实际年龄大,会导致失眠严重程度、睡眠不规律和日间睡眠障碍大幅上升,而这些睡眠障碍反过来又会成为降低自我报告的身体健康水平的主要引擎。 数据表明,控制主观年龄是健康寿命的关键要求。由于即使剔除抑郁和焦虑等因素,这些与睡眠有关的负面因素仍然很重要,因此直接解决主观年龄问题提供了一种新的临床途径。改变您的心理感受,让自己感觉更年轻,有助于保护您的睡眠指标,保护您的日间功能和整体生活质量。 2 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-03 10:42:17+08:00 · tech

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出 github.com GitHub - fivif/OmniKB: Universal AI Knowledge Base Agent Universal AI Knowledge Base Agent [! ] 功能简述 支持上传各种文档,图片 支持URL摄取网络资源 将摄入资源转变为wiki页 支持快速定制并发布自定义场景 [! ]-场景发布演示 [!danger]具体介绍测试晚点补,先睡觉了,通宵了。 1 个帖子 - 1 位参与者 阅读完整话题

IT之家 · 2026-06-01 23:13:18+08:00 · tech

IT之家 6 月 1 日消息,据外媒 Notebookcheck 报道,惠普今天在台北电脑展 2026 期间推出全新 OmniDesk 迷你主机,新品搭载英特尔酷睿 Ultra Series 3 处理器,将于今年 8 月上市。 IT之家从原报道获悉, 这款迷你主机采用英特尔最新的酷睿 Ultra Series 3 处理器 ,集成 NPU 神经网络引擎,可驱动 AI 加速、本地 AI 智能体。 同时, 这款迷你主机拥有 Thunderbolt Share 雷电共享特性 ,用户可使用一套键鼠控制两台电脑,并在多台电脑之间无缝传输文件、图片及视频等。 此外,这款迷你主机最多可连接四台 4K 显示器,配备两个雷电 4 接口。新品面向内容创作者等高阶用户,售价暂未公开。 相关阅读: 《 让 Win11 PC 共享文件、外设,英特尔发布 Thunderbolt Share 雷电共享技术 》

LinuxDo 最新话题 · 2026-05-28 22:39:58+08:00 · tech

业界领先的轻量级文档解析视觉语言模型 PaddleOCR-VL-1.6 (0.9B) 。该模型以 96.3% 精度刷新 OmniDocBench v1.6,文本、公式、表格识别全面领先,并在古籍、生僻字、印章、图表等多场景能力显著增强,支持以 Markdown 和 JSON 格式输出结构化结果。 仓库地址: GitHub - PaddlePaddle/PaddleOCR: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages. · GitHub 权重: PaddlePaddle/PaddleOCR-VL-1.6 · Hugging Face 官网使用: PaddleOCR - 文档解析与智能文字识别 | 支持API调用与MCP服务 - 飞桨星河社区 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-28 22:26:13+08:00 · tech

随着 MiMo V2.5 系列全面上线并稳定运行,为帮助开发者迁移到推理能力更强、性价比更高的新模型,计划正式下线以下模型: 下线模型及系统替换模型: mimo-v2-pro → 替换为 mimo-v2.5-pro mimo-v2-omni → 替换为 mimo-v2.5 下线时间安排: 北京时间 2026.6.1 00:00 :下线模型自动切换为新版本模型,调用 MiMo-V2-Pro / Omni 的请求将自动转发至对应的 V2.5 模型,并按照新版模型计价。 北京时间 2026.6.30 00:00 :旧模型下线,旧版本模型名称失效,调用旧版本模型名称的请求将会收到报错,务必在此之前,完成模型替换并充分测试验证。 摘自:Xiaomi MiMo API 开放平台团队 1 个帖子 - 1 位参与者 阅读完整话题

V2EX - 技术 · 2026-05-26 18:02:32+08:00 · tech

排除电影 打斗场景 谷歌新发的全能模型 Omni flash 效果还是不错的 在短视频 电商 这种短视频领域还是平替 sd2 (目前 sd2 唯一缺点就是太贵了) 而且 gpt-image-2 + omni flash 这样分镜图去搞视频也没问题 (参照以前 gptimg2 + sd2/sora2 模式) 以前用故事板分享帖子 https://www.v2ex.com/t/1211030 实测 Omni 图生视频,环游世界的视频(纯人物照+提示词 生成) 视频效果看这里 完整提示词和视频 当然整体 sd2 实属第一流的存在

V2EX - 技术 · 2026-05-26 17:02:32+08:00 · tech

排除电影 打斗场景 谷歌新发的全能模型 Omni flash 效果还是不错的 在短视频 电商 这种短视频领域还是平替 sd2 (目前 sd2 唯一缺点就是太贵了) 而且 gpt-image-2 + omni flash 这样分镜图去搞视频也没问题 (参照以前 gptimg2 + sd2/sora2 模式) 以前用故事板分享帖子 https://www.v2ex.com/t/1211030 实测 Omni 图生视频,环游世界的视频(纯人物照+提示词 生成) 视频效果看这里 完整提示词和视频 当然整体 sd2 实属第一流的存在

v2ex · 2026-05-26 11:33:59+08:00 · tech

前面发过 gpt-image-2 + seedance2 组合工作流是现在的 AI 视频 当红炸子鸡 然后紧接着 谷歌 I/O 大会发布 大家期待的 Gemini Omni 一直赢得了大家的差评 效果还是打不过字节的 seedance2 但是实测下来,除了电影、打斗 这种高强度高要求的场景 首发的 Omni Flash 还是可以胜任许多场景。 比如下面这个旅游转场效果短视频 效果很好,可以平替 sd2 (目前 sd2 就是太贵) 提示词和视频效果 可以直接去这里查看👉 谷歌 Omni Flash 图生视频画布模板

v2ex · 2026-05-24 22:38:36+08:00 · tech

最近试了下 Google 在 I/O 2026 发布的 Gemini Omni Flash ,说下感受。 这个模型最大的不同是可以通过对话来编辑视频。生成一个片段后,你可以直接说"把背景换成海滩"、"放慢镜头"、"加个人在右边",它会在保留其他内容的基础上只改你说的部分。不用像 Sora 那样每次都重新生成整个片段。 几个关键点: - 支持多模态输入:文本+图片+音频+视频可以一起喂进去 - 输出 10 秒片段,带同步音频 - YouTube Shorts 免费用,Gemini 应用需要 AI Plus ($7.99/月) - 开发者 API 还没开放,说是"几周内" - 所有输出强制带 SynthID 水印 和 Sora 2 比:Sora 角色一致性更好,能生成 25 秒片段; Omni Flash 胜在多模态输入和对话编辑,迭代成本低很多。 限制也不少:10 秒上限、不能编辑语音(防 deepfake )、文字渲染不太准、复杂运动场景偶尔会崩。 如果想快速体验视频生成,可以看看 [gemini omni]( https://www.veol.ai?utm_source=v2ex ) ,支持最高 4K 输出,按量计费从 $0.15 起。 有用过的 V 友吗?感觉对话式编辑这个方向挺对的,但 10 秒限制确实有点短。

LinuxDo 最新话题 · 2026-05-24 21:07:24+08:00 · tech

模型:MiMo-V2.5-Pro、MiMo-V2.5、MiMo-V2.5-TTS-VoiceClone、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS、MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS 额度:200,000,000 Credits 编程工具支持: OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具 有效期至 2026-05-28 23:59 (UTC) APIKey:dHAtYzhtOXM1N2kxNGtjcDR4NDNzaGkxazBjMm81ZGxobHV6cDFkc3ZmaHMxNWRtOGd4 为避免机器人爬走Key,已用base64编码,有需要的可以发给AI解码使用 定期更新使用量 1 个帖子 - 1 位参与者 阅读完整话题