我觉得transformer架构完全可以为聋哑人做一些事情。

我觉得transformer架构完全可以为聋哑人做一些事情。
我觉得transformer架构完全可以为聋哑人做一些事情。

我突然在想transformer底层是预测,那是不是聋哑人能够通过默念,识别唇语,结合语境,再通过tts将声音输出出去。

即便唇语的识别可能不太精准,但transformer不就是为此服务的吗。

识别:“我想。。饭。。果”

通过transformer识别预测:“我想吃饭和水果”

那岂不是全天下都无哑巴了。

佬们觉得能实现吗。

2 个帖子 - 2 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文