WWW.YOUINFO.SITE
标签聚合 stt

/tag/stt

v2ex · 2026-05-31 23:11:15+08:00 · tech

最近这一年的语音技术,包括 stt 和 tts 发展的都很快,市面上也出现了想 typeless 这类 voice 的 ai 产品形态,但是像是电影里面那种 jarvis 或者 samantha 形态的产品似乎还没怎么出现。 想问问 v 友们是怎么看待语音交互这种形态的,类似的场景可能是如果有一封邮件进来,然后直接说一句话,ai 就能帮你处理好这样。但是语音这种低信息密度的形式,能够支撑这样的产品吗?我对这些还是挺疑惑的。

v2ex · 2026-05-31 19:37:50+08:00 · tech

最近这一年的语音技术,包括 stt 和 tts 发展的都很快,市面上也出现了想 typeless 这类 voice 的 ai 产品形态,但是像是电影里面那种 jarvis 或者 samantha 形态的产品似乎还没怎么出现。 想问问 v 友们是怎么看待语音交互这种形态的,类似的场景可能是如果有一封邮件进来,然后直接说一句话,ai 就能帮你处理好这样。但是语音这种低信息密度的形式,能够支撑这样的产品吗?我对这些还是挺疑惑的。

v2ex · 2026-05-31 15:07:12+08:00 · tech

最近这一年的语音技术,包括 stt 和 tts 发展的都很快,市面上也出现了想 typeless 这类 voice 的 ai 产品形态,但是像是电影里面那种 jarvis 或者 samantha 形态的产品似乎还没怎么出现。 想问问 v 友们是怎么看待语音交互这种形态的,类似的场景可能是如果有一封邮件进来,然后直接说一句话,ai 就能帮你处理好这样。但是语音这种低信息密度的形式,能够支撑这样的产品吗?我对这些还是挺疑惑的。

v2ex · 2026-05-25 20:33:49+08:00 · tech

大家好,我最近做了一个网站:QuestTree https://www.questtree.net/ 它是一个面向家长、学生和教育者的学习资源导航站。 我做这个网站的原因是:网上学习资源太多了,但大部分只是简单堆链接。家长真正遇到的问题往往不是“有没有资源”,而是: 孩子注意力不集中,该先从哪里开始? 屏幕时间太多,怎么建立更健康的边界? 想让孩子接触 AI ,但怎么用才安全、理性? 孩子对 STEM / 数学 / 生物 / 环境科学 / 艺术音乐感兴趣,有哪些适合的入门资源? 资源很多,但到底什么时候用、怎么用、适合什么年龄? 所以 QuestTree 的思路不是做一个“大而全的资源列表”,而是把资源按真实场景和学习目标整理成更清晰的路径。 目前网站主要包含: AI Literacy:家庭如何安全、批判性地使用 AI 工具 Screen Time Overload:屏幕时间、边界和日常习惯 Concentration and Focus Issues:注意力和专注力问题 STEM Interests and Exploration:把抽象科学兴趣变成可探索的项目 学科资源:Math 、Biology 、Earth & Environment 、Arts & Music 等 网站现在还在早期阶段,内容偏英文和国际化语境。 我希望它之后能变成一个更实用的“家庭学习支持入口”:不是替代课程平台,而是帮家长和学生更快找到适合当前问题的资源和下一步。 欢迎大家看看,也想听听反馈: 这个方向有没有价值? 信息结构是否清楚? 家长/学生实际会不会这样找资源? 有没有哪些主题更值得优先补充? 网址: https://www.questtree.net/ 谢谢。

v2ex · 2026-05-25 19:04:34+08:00 · tech

大家好,我最近做了一个网站:QuestTree https://www.questtree.net/ 它是一个面向家长、学生和教育者的学习资源导航站。 我做这个网站的原因是:网上学习资源太多了,但大部分只是简单堆链接。家长真正遇到的问题往往不是“有没有资源”,而是: 孩子注意力不集中,该先从哪里开始? 屏幕时间太多,怎么建立更健康的边界? 想让孩子接触 AI ,但怎么用才安全、理性? 孩子对 STEM / 数学 / 生物 / 环境科学 / 艺术音乐感兴趣,有哪些适合的入门资源? 资源很多,但到底什么时候用、怎么用、适合什么年龄? 所以 QuestTree 的思路不是做一个“大而全的资源列表”,而是把资源按真实场景和学习目标整理成更清晰的路径。 目前网站主要包含: AI Literacy:家庭如何安全、批判性地使用 AI 工具 Screen Time Overload:屏幕时间、边界和日常习惯 Concentration and Focus Issues:注意力和专注力问题 STEM Interests and Exploration:把抽象科学兴趣变成可探索的项目 学科资源:Math 、Biology 、Earth & Environment 、Arts & Music 等 网站现在还在早期阶段,内容偏英文和国际化语境。 我希望它之后能变成一个更实用的“家庭学习支持入口”:不是替代课程平台,而是帮家长和学生更快找到适合当前问题的资源和下一步。 欢迎大家看看,也想听听反馈: 这个方向有没有价值? 信息结构是否清楚? 家长/学生实际会不会这样找资源? 有没有哪些主题更值得优先补充? 网址: https://www.questtree.net/ 谢谢。

LinuxDo 最新话题 · 2026-05-21 16:19:04+08:00 · tech

STT/ASR在站内已经看到很多推荐了,不过很多是API或者实时服务。 我的需求是: 转录时长在1-3小时不等的中文(夹杂英文单词)访谈录音。 不要求实时转录。 区分说话人(通常是2个)。 - 需要一个交互UI,能够实现: 关联切分的录音到单句。点击可以播放对应单句的语音,便于修改文字。(出于研究目的,不能完全交给机器转录) 能够添加术语、热词表。 简单的规整,如删除语病、语气词等。 去年曾经用过科大讯飞的方案,倒是符合要求,但当时发现讯飞的转录效果不如Gemini 2.5 Pro的多模态转录。虽然后者不方便单句修改,但也凑合用了。现在又要处理一些录音,不知道有没有熟悉这方面的佬推荐一下 2 个帖子 - 2 位参与者 阅读完整话题

v2ex · 2026-05-13 19:07:29+08:00 · tech

背景 迫于穷,私人开发机是一个破旧的 mbp15 ,不搞 opencore 的情况下只能停留在 macOS 12 版本,无法使用 Ghostty 所以尝试通过 swift 语法降级并放弃一些依赖系统高版本的功能。 使用体验 部分放弃的功能并非主线功能,所以影响不大,只要核心功能不出 bug 。 代码仓库: https://github.com/laojianzi/ghostty-monterey 从官方 issues 来看,还是有一小部分还在使用低系统的人群的,所以放出来看看对大家有没有帮助,有什么问题反馈后我会抽时间处理一下。

v2ex · 2026-05-13 09:44:06+08:00 · tech

最近用 ghostty 和 cmux 遇到很多奇怪的 bug ,warp 好用但很多功能我用不上 我烧了几天的 token ,vibe 了一个专为 AI coding 设计的 terminal —— kooky ✅一键启动 Claude Code/Codex 等各种 agent ✅ Vertical tabs + split pane ,多 Workspace 管理+分屏并行 ✅ Agent 状态展示 ✅ Git 分支/变化,Node/Python/Proxy 等各环境展示以及一键切换 ✅ 本地运行, 无云服务和功能 ✅基于 libghostty GPU 渲染,丝滑使用 欢迎大家使用体验(给我找 bug 项目已开源,可以直接下 release 包使用,也可以自己 build 魔改 🔗 https://github.com/iAmCorey/kooky

v2ex · 2026-05-13 09:44:06+08:00 · tech

最近用 ghostty 和 cmux 遇到很多奇怪的 bug ,warp 好用但很多功能我用不上 我烧了几天的 token ,vibe 了一个专为 AI coding 设计的 terminal —— kooky ✅一键启动 Claude Code/Codex 等各种 agent ✅ Vertical tabs + split pane ,多 Workspace 管理+分屏并行 ✅ Agent 状态展示 ✅ Git 分支/变化,Node/Python/Proxy 等各环境展示以及一键切换 ✅ 本地运行, 无云服务和功能 ✅基于 libghostty GPU 渲染,丝滑使用 欢迎大家使用体验(给我找 bug 项目已开源,可以直接下 release 包使用,也可以自己 build 魔改 🔗 https://github.com/iAmCorey/kooky

v2ex · 2026-05-13 09:44:06+08:00 · tech

最近用 ghostty 和 cmux 遇到很多奇怪的 bug ,warp 好用但很多功能我用不上 我烧了几天的 token ,vibe 了一个专为 AI coding 设计的 terminal —— kooky ✅一键启动 Claude Code/Codex 等各种 agent ✅ Vertical tabs + split pane ,多 Workspace 管理+分屏并行 ✅ Agent 状态展示 ✅ Git 分支/变化,Node/Python/Proxy 等各环境展示以及一键切换 ✅ 本地运行, 无云服务和功能 ✅基于 libghostty GPU 渲染,丝滑使用 欢迎大家使用体验(给我找 bug 项目已开源,可以直接下 release 包使用,也可以自己 build 魔改 🔗 https://github.com/iAmCorey/kooky