Typeless 后端用的是什么模型来做语音识别服务的?

Typeless 后端用的是什么模型来做语音识别服务的?
Typeless 后端用的是什么模型来做语音识别服务的?

感觉和去年的识别率完全不一样了,去年的识别率没有现在这么高
去年应该是用的 Whisper Large,加上一些自己的技术改良。
那现在是不是用的 GPT-Realtime-Whisper 那个语音识别模型?或者是完全他们自研的新模型?

目前免费版的 Typeless 识别准确率已经到了很夸张的程度,不知道 Pro 版会不会有提升。直接套那些付费的 API 接口,能不能实现同样的效果?

10 个帖子 - 7 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文