Talk - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-11 09:33:32+08:00 · tech

还好之前能接码的时候闲的没事用Talkatone注册了whatsApp 现在codex能用上了,哈哈哈 1 个帖子 - 1 位参与者阅读完整话题

[推广] 一个开源实时数字人项目，一个月到 1.1K Star，复盘我们做对了什么

v2ex · 2026-06-09 21:45:28+08:00 · tech

我们最近在做实时数字人开源项目，OpenTalking 。项目开源大概一个月左右，现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功，但对一个比较重、比较工程向的数字人项目来说，反馈比我预期好不少。所以想简单复盘一下，我觉得这一个月里可能有几件事做对了。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 它做的事情其实挺直接：把一个数字人从“能生成一段视频”，往“能实时和人对话”推了一步。不是只给你一个 talking head 模型，然后让你自己去接语音、接大模型、接前端、接播放链路；而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象，也可以直接在 Web 页面里试一轮实时对话。第一个感受是，这个方向确实有人需要。过去一年看了不少数字人项目和 Demo ，很多效果都挺惊艳，但我自己真正想上手的时候，经常会卡在另一个问题上：这个东西能不能跑起来？能不能接自己的 LLM ？能不能换自己的声音？能不能在浏览器里实时说话？能不能部署到自己的 GPU 机器上？也就是说，大家缺的可能不只是一个更强的模型，而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目，而是更像一个数字人实验台：你可以先跑通最小链路，再慢慢换模型、换声音、换形象、换后端。第二个我觉得比较重要的是，没有一上来就把门槛拉满。数字人项目很容易变成这样：一堆模型权重、一堆环境依赖、一堆服务要启动，最后 README 看完人已经累了。效果可能很好，但普通开发者第一步就被挡住了。所以 OpenTalking 现在尽量把路线拆开：最简单可以用 mock 模式，不需要下载数字人模型，先把前端、对话、语音和 WebRTC 播放跑起来。如果想看真实视频效果，可以走 QuickTalk 或 Wav2Lip local ，在消费级显卡上先试起来。如果更关心私有化，可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。如果追求更高质量或者远端多卡部署，再接 OmniRT 和 FlashTalk 。这几个路线听起来只是文档组织问题，但我觉得对开源项目挺关键的。很多用户不是不愿意试，而是不知道自己应该从哪一步开始。第三个是，我们花了不少时间在“不性感但很有用”的地方。比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。这些东西单独拿出来都不像一个很大的 feature ，但它们决定了一个人 clone 项目之后，会不会真的继续往下跑。我现在越来越觉得，开源项目的第一印象不只是截图和 demo ，还是用户第一次执行命令时的体验。他遇到问题的时候，项目有没有告诉他下一步该看哪里。第四个是，数字人项目一定要多放真实场景。只讲 LLM 、TTS 、WebRTC 、audio2video ，其实大家很难有感觉。因为这些词很多人已经看麻了。所以我们在 README 里放了一些更具体的 demo ，比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美，而是让人更快理解：这个框架大概可以往哪些方向长。比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流，都是可以继续试的方向。第五个是，边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的，也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座，把不同模型、语音服务、前端交互和播放链路接到一起。模型后端可以是 local ，也可以是 mock 、direct_ws ，或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑，高质量模型也可以放到远端 GPU/NPU 机器上。把边界讲清楚之后，大家反而更容易判断它有没有用：如果你只想找一个模型，可能它不是最直接的答案；但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统，它会更合适。最后也同步一下后面想继续补的东西。现在项目还很早期，很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手，或者只是想研究实时数字人的工程链路，可以试一下 OpenTalking 。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 欢迎 star 、issue 、PR ，也欢迎直接提部署问题。这个方向现在还挺早，很多东西都需要在真实机器和真实场景里慢慢打磨。

v2ex · 2026-06-09 20:25:34+08:00 · tech

我们最近在做实时数字人开源项目，OpenTalking 。项目开源大概一个月左右，现在 GitHub 到了 1.1K Star (感谢 V 站各位大佬的支持)。这个数字当然谈不上什么大成功，但对一个比较重、比较工程向的数字人项目来说，反馈比我预期好不少。所以想简单复盘一下，我觉得这一个月里可能有几件事做对了。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 它做的事情其实挺直接：把一个数字人从“能生成一段视频”，往“能实时和人对话”推了一步。不是只给你一个 talking head 模型，然后让你自己去接语音、接大模型、接前端、接播放链路；而是把这些七七八八的东西先接到一起。你可以换模型、换声音、换形象，也可以直接在 Web 页面里试一轮实时对话。第一个感受是，这个方向确实有人需要。过去一年看了不少数字人项目和 Demo ，很多效果都挺惊艳，但我自己真正想上手的时候，经常会卡在另一个问题上：这个东西能不能跑起来？能不能接自己的 LLM ？能不能换自己的声音？能不能在浏览器里实时说话？能不能部署到自己的 GPU 机器上？也就是说，大家缺的可能不只是一个更强的模型，而是一条能从 Demo 走到应用的工程链路。 OpenTalking 一开始就是围着这个问题做的。我们没有把它设计成“展示某个模型效果”的项目，而是更像一个数字人实验台：你可以先跑通最小链路，再慢慢换模型、换声音、换形象、换后端。第二个我觉得比较重要的是，没有一上来就把门槛拉满。数字人项目很容易变成这样：一堆模型权重、一堆环境依赖、一堆服务要启动，最后 README 看完人已经累了。效果可能很好，但普通开发者第一步就被挡住了。所以 OpenTalking 现在尽量把路线拆开：最简单可以用 mock 模式，不需要下载数字人模型，先把前端、对话、语音和 WebRTC 播放跑起来。如果想看真实视频效果，可以走 QuickTalk 或 Wav2Lip local ，在消费级显卡上先试起来。如果更关心私有化，可以继续接本地 SenseVoice 、CosyVoice 和 QuickTalk 。如果追求更高质量或者远端多卡部署，再接 OmniRT 和 FlashTalk 。这几个路线听起来只是文档组织问题，但我觉得对开源项目挺关键的。很多用户不是不愿意试，而是不知道自己应该从哪一步开始。第三个是，我们花了不少时间在“不性感但很有用”的地方。比如统一启动脚本、模型 backend 解耦、avatar 预热和缓存、权重下载说明、Windows / WSL2 文档、benchmark 、本地 STT/TTS provider 、WebUI 里的状态展示。这些东西单独拿出来都不像一个很大的 feature ，但它们决定了一个人 clone 项目之后，会不会真的继续往下跑。我现在越来越觉得，开源项目的第一印象不只是截图和 demo ，还是用户第一次执行命令时的体验。他遇到问题的时候，项目有没有告诉他下一步该看哪里。第四个是，数字人项目一定要多放真实场景。只讲 LLM 、TTS 、WebRTC 、audio2video ，其实大家很难有感觉。因为这些词很多人已经看麻了。所以我们在 README 里放了一些更具体的 demo ，比如手机实录、电商带货、新闻主播、陪伴角色、创意演唱之类的。它们不是为了证明效果已经完美，而是让人更快理解：这个框架大概可以往哪些方向长。比如 AI 客服、直播数字人、私有数字人助手、互动陪伴、内容生成工作流，都是可以继续试的方向。第五个是，边界要说清楚。 OpenTalking 不是说所有模型都是自己训练的，也不是说开箱就能直接商用。它更像是一个实时数字人产品的工程底座，把不同模型、语音服务、前端交互和播放链路接到一起。模型后端可以是 local ，也可以是 mock 、direct_ws ，或者接 OmniRT 这种外部推理服务。轻量模型可以先在本地跑，高质量模型也可以放到远端 GPU/NPU 机器上。把边界讲清楚之后，大家反而更容易判断它有没有用：如果你只想找一个模型，可能它不是最直接的答案；但如果你想做一个能对话、能换角色、能部署、能继续二次开发的数字人系统，它会更合适。最后也同步一下后面想继续补的东西。现在项目还很早期，很多地方都不够顺。接下来会继续补 Windows / WSL2 一键化、更多显卡 benchmark 、更多本地模型路线、avatar 资产管理、长会话体验、打断和音画同步这些工程问题。如果你也在做 AI 客服、直播数字人、陪伴类角色、私有化数字人助手，或者只是想研究实时数字人的工程链路，可以试一下 OpenTalking 。 GitHub： https://github.com/datascale-ai/opentalking 官网： https://www.opentalking.net 欢迎 star 、issue 、PR ，也欢迎直接提部署问题。这个方向现在还挺早，很多东西都需要在真实机器和真实场景里慢慢打磨。

Talkatone的废号，通过迂回的方式成功接收openai验证码，顺便把whatsapp也盘活了

LinuxDo 最新话题 · 2026-06-06 10:42:58+08:00 · tech

用了一年多的openai账户，今天codex突然要接码，绑的是Talkatone号码，现在接码要开套餐（以前免费），codex可以用whatsapp接码方式，但whatsapp接码可以使用语音通话形式接码，抱着试一下的心态竟然接码成功，成功登录whatsapp，最后codex用whatsapp成功登录。简单的操作步骤 1、whatsapp通过语音通话形式接受Talkatone验证码完成登录（目前可以正常接受，短信不行，必须开套餐）。 2、codex登录用whatsapp接码瞬间感觉Talkatone又行了佬友还有talkatone号码的可以试一下。细想好像接码问题又解决了，动手能力强的佬友们行动起来 1 个帖子 - 1 位参与者阅读完整话题

codex 需要 whats的验证

LinuxDo 最新话题 · 2026-06-04 05:33:56+08:00 · tech

那个佬试下talkatone 注册whats 是否可行不开1刀接语音验证码过wh，登入后wh，在用talkatone，手机号选择 whats 过验证 whatsapp 是否收到验证码 1 个帖子 - 1 位参与者阅读完整话题

[实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

V2EX - 技术 · 2026-06-02 21:49:04+08:00 · tech

V 站大佬们！我们的实时数字人 OpenTalking 支持视频克隆模式啦！同时支持调整面部动作幅度，能玩出来很抽象的东西哈哈哈~ 麻烦走过路过感兴趣的可以支持我们，在 Github 点个 Star! ！！！你们的支持是我们一直保持免费和开源的力量！ Github 传送: https://github.com/datascale-ai/opentalking 视频演示: https://www.bilibili.com/video/BV1d6VB6iE15/?vd_source=4820076c616e58ceb357c528a571ff11 欢迎大家体验！多多提意见！

[实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

V2EX - 技术 · 2026-06-02 21:49:04+08:00 · tech

V 站大佬们！我们的实时数字人 OpenTalking 支持视频克隆模式啦！同时支持调整面部动作幅度，能玩出来很抽象的东西哈哈哈~ 麻烦走过路过感兴趣的可以支持我们，在 Github 点个 Star! ！！！你们的支持是我们一直保持免费和开源的力量！ Github 传送: https://github.com/datascale-ai/opentalking 视频演示: https://www.bilibili.com/video/BV1d6VB6iE15/?vd_source=4820076c616e58ceb357c528a571ff11 欢迎大家体验！多多提意见！

[实时数字人开源项目] 重磅更新！实时数字人支持视频克隆模式！

V2EX - 技术 · 2026-06-02 21:49:04+08:00 · tech

V 站大佬们！我们的实时数字人 OpenTalking 支持视频克隆模式啦！同时支持调整面部动作幅度，能玩出来很抽象的东西哈哈哈~ 麻烦走过路过感兴趣的可以支持我们，在 Github 点个 Star! ！！！你们的支持是我们一直保持免费和开源的力量！ Github 传送: https://github.com/datascale-ai/opentalking 视频演示: https://www.bilibili.com/video/BV1d6VB6iE15/?vd_source=4820076c616e58ceb357c528a571ff11 欢迎大家体验！多多提意见！

v2ex · 2026-06-02 20:56:15+08:00 · tech