WWW.YOUINFO.SITE
标签聚合 1k

/tag/1k

v2ex · 2026-06-09 21:45:28+08:00 · tech

我们最近在做实时数字人开源项目,OpenTalking 。项目开源大概一个月左右,现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功,但对一个比较重、比较工程向的数字人项目来说,反馈比我预期好不少。所以想简单复盘一下,我觉得这一个月里可能有几件事做对了。 GitHub: https://github.com/datascale-ai/opentalking 官网: https://www.opentalking.net 它做的事情其实挺直接:把一个数字人从“能生成一段视频”,往“能实时和人对话”推了一步。 不是只给你一个 talking head 模型,然后让你自己去接语音、接大模型、接前端、接播放链路;而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象,也可以直接在 Web 页面里试一轮实时对话。 第一个感受是,这个方向确实有人需要。 过去一年看了不少数字人项目和 Demo ,很多效果都挺惊艳,但我自己真正想上手的时候,经常会卡在另一个问题上:这个东西能不能跑起来?能不能接自己的 LLM ?能不能换自己的声音?能不能在浏览器里实时说话?能不能部署到自己的 GPU 机器上? 也就是说,大家缺的可能不只是一个更强的模型,而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目,而是更像一个数字人实验台:你可以先跑通最小链路,再慢慢换模型、换声音、换形象、换后端。 第二个我觉得比较重要的是,没有一上来就把门槛拉满。 数字人项目很容易变成这样:一堆模型权重、一堆环境依赖、一堆服务要启动,最后 README 看完人已经累了。效果可能很好,但普通开发者第一步就被挡住了。 所以 OpenTalking 现在尽量把路线拆开: 最简单可以用 mock 模式,不需要下载数字人模型,先把前端、对话、语音和 WebRTC 播放跑起来。 如果想看真实视频效果,可以走 QuickTalk 或 Wav2Lip local ,在消费级显卡上先试起来。 如果更关心私有化,可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。 如果追求更高质量或者远端多卡部署,再接 OmniRT 和 FlashTalk 。 这几个路线听起来只是文档组织问题,但我觉得对开源项目挺关键的。很多用户不是不愿意试,而是不知道自己应该从哪一步开始。 第三个是,我们花了不少时间在“不性感但很有用”的地方。 比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。 这些东西单独拿出来都不像一个很大的 feature ,但它们决定了一个人 clone 项目之后,会不会真的继续往下跑。 我现在越来越觉得,开源项目的第一印象不只是截图和 demo ,还是用户第一次执行命令时的体验。他遇到问题的时候,项目有没有告诉他下一步该看哪里。 第四个是,数字人项目一定要多放真实场景。 只讲 LLM 、TTS 、WebRTC 、audio2video ,其实大家很难有感觉。因为这些词很多人已经看麻了。 所以我们在 README 里放了一些更具体的 demo ,比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美,而是让人更快理解:这个框架大概可以往哪些方向长。 比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流,都是可以继续试的方向。 第五个是,边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的,也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座,把不同模型、语音服务、前端交互和播放链路接到一起。 模型后端可以是 local ,也可以是 mock 、direct_ws ,或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑,高质量模型也可以放到远端 GPU/NPU 机器上。 把边界讲清楚之后,大家反而更容易判断它有没有用:如果你只想找一个模型,可能它不是最直接的答案;但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统,它会更合适。 最后也同步一下后面想继续补的东西。 现在项目还很早期,很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。 如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手,或者只是想研究实时数字人的工程链路,可以试一下 OpenTalking 。 GitHub: https://github.com/datascale-ai/opentalking 官网: https://www.opentalking.net 欢迎 star 、issue 、PR ,也欢迎直接提部署问题。这个方向现在还挺早,很多东西都需要在真实机器和真实场景里慢慢打磨。

v2ex · 2026-06-09 20:25:34+08:00 · tech

我们最近在做实时数字人开源项目,OpenTalking 。项目开源大概一个月左右,现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功,但对一个比较重、比较工程向的数字人项目来说,反馈比我预期好不少。所以想简单复盘一下,我觉得这一个月里可能有几件事做对了。 GitHub: https://github.com/datascale-ai/opentalking 官网: https://www.opentalking.net 它做的事情其实挺直接:把一个数字人从“能生成一段视频”,往“能实时和人对话”推了一步。 不是只给你一个 talking head 模型,然后让你自己去接语音、接大模型、接前端、接播放链路;而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象,也可以直接在 Web 页面里试一轮实时对话。 第一个感受是,这个方向确实有人需要。 过去一年看了不少数字人项目和 Demo ,很多效果都挺惊艳,但我自己真正想上手的时候,经常会卡在另一个问题上:这个东西能不能跑起来?能不能接自己的 LLM ?能不能换自己的声音?能不能在浏览器里实时说话?能不能部署到自己的 GPU 机器上? 也就是说,大家缺的可能不只是一个更强的模型,而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目,而是更像一个数字人实验台:你可以先跑通最小链路,再慢慢换模型、换声音、换形象、换后端。 第二个我觉得比较重要的是,没有一上来就把门槛拉满。 数字人项目很容易变成这样:一堆模型权重、一堆环境依赖、一堆服务要启动,最后 README 看完人已经累了。效果可能很好,但普通开发者第一步就被挡住了。 所以 OpenTalking 现在尽量把路线拆开: 最简单可以用 mock 模式,不需要下载数字人模型,先把前端、对话、语音和 WebRTC 播放跑起来。 如果想看真实视频效果,可以走 QuickTalk 或 Wav2Lip local ,在消费级显卡上先试起来。 如果更关心私有化,可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。 如果追求更高质量或者远端多卡部署,再接 OmniRT 和 FlashTalk 。 这几个路线听起来只是文档组织问题,但我觉得对开源项目挺关键的。很多用户不是不愿意试,而是不知道自己应该从哪一步开始。 第三个是,我们花了不少时间在“不性感但很有用”的地方。 比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。 这些东西单独拿出来都不像一个很大的 feature ,但它们决定了一个人 clone 项目之后,会不会真的继续往下跑。 我现在越来越觉得,开源项目的第一印象不只是截图和 demo ,还是用户第一次执行命令时的体验。他遇到问题的时候,项目有没有告诉他下一步该看哪里。 第四个是,数字人项目一定要多放真实场景。 只讲 LLM 、TTS 、WebRTC 、audio2video ,其实大家很难有感觉。因为这些词很多人已经看麻了。 所以我们在 README 里放了一些更具体的 demo ,比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美,而是让人更快理解:这个框架大概可以往哪些方向长。 比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流,都是可以继续试的方向。 第五个是,边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的,也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座,把不同模型、语音服务、前端交互和播放链路接到一起。 模型后端可以是 local ,也可以是 mock 、direct_ws ,或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑,高质量模型也可以放到远端 GPU/NPU 机器上。 把边界讲清楚之后,大家反而更容易判断它有没有用:如果你只想找一个模型,可能它不是最直接的答案;但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统,它会更合适。 最后也同步一下后面想继续补的东西。 现在项目还很早期,很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。 如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手,或者只是想研究实时数字人的工程链路,可以试一下 OpenTalking 。 GitHub: https://github.com/datascale-ai/opentalking 官网: https://www.opentalking.net 欢迎 star 、issue 、PR ,也欢迎直接提部署问题。这个方向现在还挺早,很多东西都需要在真实机器和真实场景里慢慢打磨。

IT之家 · 2026-06-08 08:12:30+08:00 · tech

IT之家 6 月 8 日消息,HKC 现已在京东上架一款隐刃 L1 拉伸手机游戏手柄,该产品采用 USB-C 接口,定价为 169 元, 首发价 159 元 。 京东 HKC 隐刃 L1 拉伸手机游戏手柄 券后 159 元 领 10 元券 该手柄采用人体工程学设计,带有 RGB 灯效,重量 230g,手柄背面带有防滑激光纹路和可拆卸硅胶垫片,支持 214mm 长度内手机。 该手柄使用微软 Xbox 同类型振动马达,配备 500 万次寿命霍尔摇杆,提供了 1KHz 回报率,配备了可活动 USB-C 接口,支持“充电透传不掉线”。 IT 之家附手柄参数: 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包

v2ex · 2026-06-04 23:13:12+08:00 · tech

V 站大佬们!我们的项目在昨天破 1K star 了!这个项目只做了 25 天,对于我们来说是莫大的鼓励。同时,也被知乎官方纳入"今日十大开源项目"。这个离不开大家的支持~ 为了回馈 V 站大佬们的支持,我们把新鲜出炉的 windows 一键部署整合包提免费供给大家: Github 传送: https://github.com/datascale-ai/opentalking 视频教程: https://www.bilibili.com/video/BV17P7Z6qE8f/?vd_source=4820076c616e58ceb357c528a571ff11 整合包链接: https://pan.quark.cn/s/3a26349c9a04 关于提取码,只要大家加 QQ 群(群号: 1103327938, 加群问题的答案是 opentalking )私聊管理员在 github 点了 star 的截图就好~ 希望大家理解,我们是为了提高项目影响力,这样才能吸引开源贡献者一起和我们共建! 麻烦走过路过感兴趣的可以支持我们,在 Github 点个 Star! !!! 你们的支持是我们一直保持免费和开源的力量! 欢迎大家体验!多多提意见!

v2ex · 2026-06-04 14:16:58+08:00 · tech

V 站大佬们!我们的项目在昨天破 1K star 了!这个项目只做了 25 天,对于我们来说是莫大的鼓励。期间也有小惊喜,被**知乎官方纳入"今日十大开源项目"**。所有的成就离不开大家的支持~ 为了回馈 V 站大佬们的支持,我们把新鲜出炉的 windows 一键部署整合包提免费供给大家,目前已经在 3050 显卡的电脑上测试过。 Github 传送: https://github.com/datascale-ai/opentalking 视频教程: https://www.bilibili.com/video/BV17P7Z6qE8f/?vd_source=4820076c616e58ceb357c528a571ff11 整合包链接: https://pan.quark.cn/s/3a26349c9a04 关于提取码,只要大家加 QQ 群(群号: 1103327938, 加群问题的答案是 opentalking )私聊管理员在 github 点了 star 的截图就好~ 希望大家理解,我们是为了提高项目影响力,这样才能吸引开源贡献者一起和我们共建! 麻烦走过路过感兴趣的可以支持我们,在 Github 点个 Star! !!!我们仍然在努力完善项目,如有问题欢迎给我门提 Issues ,贡献代码,帮助我们改进。 你们的支持是我们一直保持免费和开源的力量! 欢迎大家体验!多多提意见!

LinuxDo 最新话题 · 2026-06-03 17:35:21+08:00 · tech

tp-cn59k0q1k8zkmjmip91jchljx2pzztmv3a6h80usx26nn63u https://token-plan-cn.xiaomimimo.com/v1 https://token-plan-cn.xiaomimimo.com/anthropic 套餐权益 模型 mimo-v2.5-pro、mimo-v2.5、mimo-v2.5-asr、mimo-v2.5-tts-voiceclone、mimo-v2.5-tts-voicedesign、mimo-v2.5-tts、mimo-v2-pro、mimo-v2-omni、mimo-v2-tts 额度 11,000,000,000 Credits 编程工具 支持 OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具 其他权益 非高峰期(北京时间每日00:00-08:00) 0.8x 系数消耗;TTS 系列模型限时免费使用 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-06-02 18:20:57+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:54:44+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:54:44+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:44:18+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:24:22+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:15:54+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:07:19+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 17:01:34+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 16:42:52+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。

v2ex · 2026-06-02 16:37:25+08:00 · tech

各位好,最近遇到个头疼的事想听听大家的建议。 公司位于上海,这个月要搬新办公室,跟现在的地点直线距离 21km 。我的通勤直接拉满,单程从 70 分钟变成了 140 分钟。 这种通勤距离确实接受不了,所以想尝试争取大礼包走人。 但目前心里没底,因为合同里写了:“基于公司生产运营需要,甲方可在适当范围内适当调整乙方的具体岗位和工作地点,乙方应予配合。” 不知有没有老哥处理过类似情况?合同里这个“适当范围”的界定,在实际仲裁或者谈判中资方能占多大理?我如果以此为由拒绝搬迁去新址,能拿到补偿吗?求指点迷津。