我觉得transformer架构完全可以为聋哑人做一些事情。

发布时间：2026-06-09T11:08:56+08:00 阅读：0 分类：tech

我突然在想transformer底层是预测，那是不是聋哑人能够通过默念，识别唇语，结合语境，再通过tts将声音输出出去。

即便唇语的识别可能不太精准，但transformer不就是为此服务的吗。

识别：“我想。。饭。。果”

通过transformer识别预测：“我想吃饭和水果”

那岂不是全天下都无哑巴了。

佬们觉得能实现吗。

2 个帖子 - 2 位参与者

来源: LinuxDo 最新话题查看原文

延伸阅读

为什么说Linux搞砸了一切

表面上锅的传导路径如下 bohe → hub → Neo → 机房 → 42 → L站实际上谜底就在谜面上 L站 → ...

大家有什么好的移动端实时人像分割方案吗。看过 PaddleSeg ，和 mediapipe ，在低端手机上性能还是不够...

招商万事达招行app上申请万事达普卡，填写信息后直接可以领取，西安有很多线下网点可以立即领卡，我去了学校附近的一家招商...

佬们，公司有用钉钉 AI 表格吗，就是多维表，看了下跨表同步都要收费了，价格可以谈的吗，好像最低买 20 人，年付的 ...

codex与vm虚拟机

各位佬我看到一个codex的操作界面图片，请问这种是在宿主机上安装的codex，然后codex执行是在vm虚拟机中执行...

Gxxszb 相关页面

延展页面 · www.gxxszb.com

延展页面 · www.tcti.cn

延展页面 · www.youinfo.site

延展页面 · www.aizhushou.shop

Oaglz · Whitepaper Change AI

延展页面 · www.youinfo.site

App 专题内容

延展页面 · fifa-new-ng.com.cn

Document Goal 专题内容

延展页面 · www.tcti.cn

I4yw · Follow Behavior Careers

延展页面 · www.aizhushou.shop

Sae X · Comment

延展页面 · www.aizhushou.shop

Image Internet Lead 专题内容

延展页面 · www.tcti.cn

Access Fifa Com 首页热点

延展页面 · access-2026-fifa.com.cn