audio - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

Wow~ 圣经！

LinuxDo 最新话题 · 2026-06-11 01:32:14+08:00 · tech

Audio priscos illos viros probos atque sapientes, die Iovis — quartus is hebdomadis dies habetur — pecuniam suam in plebem erogasse, ne quis egestate premeretur. Pullum aureum alienis pueris donasse, quod et suus puer hoc cibo delectaretur; aquam nigram dulcem aliis senibus praebuisse, quod suus quoque senex eam libenter hauriret. O priscam virtutem! O sapientiam maiorum! Si quidem tales sint viri, ut quisque quinquaginta sestertios alteri det, omnes carnem vescentur, civitas concordia florebit. O vere sapientes! 27 个帖子 - 27 位参与者阅读完整话题

语音克隆方面我个人认为Fish Audio吊打MiniMax

LinuxDo 最新话题 · 2026-05-27 01:00:01+08:00 · tech

我今天有个项目要用到语音克隆转台词，我找到了一个母版。然后从早上测到现在。在MINIMAX充了会员调用API，然后就一天的时间，我试用了有二三十次吧。我充的会员就没钱了给我干成负数了，并且出来的效果真的拉中之拉，（他根本没有客服，所有加入群的全是吐槽的）然后我又让CODEX（推荐和这模型一样拉中之拉）和CLAUDE（推荐Fish)分别推荐最后找到,完美解决。各位佬大们，用MINIMAX之前一定要测测。全是血泪啊我充的声贝还不能算余额。有需要的佬友免费送声贝，CALL我即可。还有10W额度，我要和MINIMAX说白白了。 5 个帖子 - 4 位参与者阅读完整话题

AudioMass – 核心不到 100KB，在线、开源，多轨音频编辑器

小众软件 · 2026-05-25 14:43:04+08:00 · tech

AudioMass 是一款免费、开源、完全运行在浏览器里的音频编辑工具。不用下载、不用安装，无后台服务，打开网页就能直接处理音频文件，所有操作都在本地浏览器完成。核心 JS 文件只有 100KB 大小。@Appinn AudioMass 主要功能 AudioMass 可以直接在音轨中录音、导入现有音

Stability AI 推出音频模型 Stability Audio 3.0，可生成最长 6 分钟专业级歌曲

IT之家 · 2026-05-20 23:42:09+08:00 · tech

IT之家 5 月 20 日消息，据外媒 TechCrunch 今晚报道，AI 初创公司 Stability AI 推出全新音频生成模型家族 Stability Audio 3.0，其顶级版本据称可生成长达六分钟以上的专业级音乐。 Stability AI 此次共推出了四款不同规格的模型，分别为：45900 万参数的小型 XFS 与小型版、14 亿参数的中型版，以及 27 亿参数的大型版。其中，两款小型模型专注于设备端运行，可本地生成两分钟以内的声音与音乐。中型和大型模型则展现出更强的架构控制力，能够创作长达 6 分钟 20 秒的完整乐曲，并精准维持音乐结构与旋律基调。这一长度与 2024 年该公司推出的 Stable Audio 2.0 相比，实现了翻倍以上的跨越。为了回馈开源社区，Stability AI 已将小型 SFX、小型及中型模型开源，公众可以自由下载并修改权重。不过，最顶尖的大型模型目前仅通过 API 与付费托管服务提供，且年营收超过 100 万美元（IT之家注：现汇率约合 682.1 万元人民币）的企业必须购买商业授权。为了规避合规风险，Stability AI 在去年就已同华纳音乐集团、环球音乐集团达成深度合作。该公司强调，此次推出的最新音频模型全量基于合法授权的数据集训练而成。 Stability AI 目前正紧锣密鼓地为专业音乐人打造一套全新产品线，不过尚未公布具体功能细节。为了推进该项目，曾先后担任环球音频与芬达首席数字官的伊桑 · 卡普兰已正式加盟，负责领衔专业音乐产品业务。

linux.do · 2026-04-24 21:40:34+08:00 · tech

阶跃星辰发布 StepAudio 2.5 ASR 自动语音识别模型：推理速度提升 400%，定价骤减 90% - IT之家 1 个帖子 - 1 位参与者阅读完整话题

阶跃星辰发布 StepAudio 2.5 ASR 自动语音识别模型：推理速度提升 400%，定价骤减 90%

www.ithome.com · 2026-04-24 21:19:21+08:00 · tech

IT之家 4 月 24 日消息，阶跃星辰今日宣布推出新一代自动语音识别模型 StepAudio 2.5 ASR。该模型的核心突破在于率先将大语言模型的推理加速技术引入语音识别领域，在推理速度与转写精度两个维度均有显著提升，主要面向会议转写、语音交互、输入法、媒体内容处理、长音频识别等场景。传统语音识别模型受限于自回归生成机制，需要逐个 Token 依次输出，效率较低。StepAudio 2.5 ASR 采用 ASR+MTP-5 深度融合架构，将此前应用在 Step 3.5 Flash 大模型上的 MTP（IT之家注：多 Token 预测）技术移植至语音识别领域。该技术使模型能够一次预测多个候选 Token，并通过并行验证机制快速确认结果，打破了传统自回归机制逐个输出的效率瓶颈。实测数据显示，模型推理速度提升 400%、时延降低 60%，推理峰值达 500 tokens/s，推理成本直降 80%。以 5 分钟左右的音视频为例，几乎可以实现即时转写。在转写精度方面，StepAudio 2.5 ASR 在覆盖新闻播报、会议访谈及强噪声环境的多个中英文权威测试集上，综合转写精度达到业内 SOTA 水准。在 LibriSpeech 等中英文 10 个权威开源测试集上的综合错误率均低于竞品。针对长音频处理这一语音识别领域的长期痛点，行业内通常依赖“切片-转写-拼接”方案，即把音频切成若干小段分别识别再合并，但这种方式容易造成上下文信息割裂 —— 模型在转写后半段内容时，可能已经“忘记”了开头信息。StepAudio 2.5 ASR 复用了大语言模型原生的 32K 上下文窗口能力，支持端到端一次性读入最长 30 分钟的连续音频，无需分段切割。在 30 分钟满载输入测试中，模型没有出现随时间推移精度衰减的情况。定价方面，StepAudio 2.5 ASR 仅为 0.15 元 / 小时，约为此前 Step ASR 2 的十分之一。目前，该模型已全量上线阶跃星辰开放平台和 Step Plan，开发者可通过官网体验使用。相关阅读：《人人都能是配音导演，阶跃星辰发布语音生成模型 StepAudio 2.5 TTS 》参考资料：阶跃星辰开放平台： https://platform.stepfun.com/docs/zh/guides/models/stepaudio-2.5-asr Step Plan： https://platform.stepfun.com/docs/zh/step-plan/integrations/audio-api 体验中心： https://www.stepfun.com/studio/audio ?tab=speech-recognition Demo Page： https://stepaudiollm.github.io/step-audio-2.5-asr/ Model Card： https://stepaudiollm.github.io/step-audio-2.5-asr/model-card/

[分享创造] 希声 (Still) ：为 Audiobookshelf 打造的 iOS 原生客户端

v2ex.com · 2026-04-23 13:54:48+08:00 · tech

去年从 Plex 迁移到了 Audiobookshelf ，找了一圈没有找到自己满意的客户端。主要是现有的 App 功能设计对我来说有些复杂，UI 也不够简洁。所以决定自己开发一款，经过几个月的打磨，我觉得已经达到了我心中理想的样子，所以分享一下。关于设计我个人非常喜欢 Apple 自家 App 的风格，所以希声 (Still) 在设计上遵循 Apple 的设计规范，UX 细节上参考了 Books / Podcasts / Music. 名字来源于《道德经》里的“大音希声”。核心功能有声书与播客沉浸、极简的播放界面跨设备实时同步收听进度下载到本地，随时随地离线畅听接下来播放队列，连续播放不间断睡眠定时、倍速与音量增强一应俱全自动跳过片头片尾，为你省时间支持主屏幕小组件与车载 CarPlay 电子书支持 EPUB 、PDF 、CBZ 格式自定义排版（字号、字体与间距）多种阅读主题模式随心切换跨设备实时同步阅读进度更多自定义首页版块排序 OIDC 单点登录 (SSO) Custom Header 支持多服务器/账号切换下载 App Store 搜索「希声」「 Still 」或者直接访问链接: https://apps.apple.com/cn/app/%E5%B8%8C%E5%A3%B0-%E4%B8%BA-audiobookshelf-%E6%89%93%E9%80%A0/id6754208326 说明：希声本身不提供任何媒体内容，需要自行搭建 Audiobookshelf 服务端使用。详情： https://www.audiobookshelf.org

[分享创造] 希声 (Still) ：为 Audiobookshelf 打造的 iOS 原生客户端

v2ex.com · 2026-04-23 13:39:03+08:00 · tech

去年从 Plex 迁移到了 Audiobookshelf ，找了一圈没有找到自己满意的客户端。主要是现有的 App 功能设计对我来说有些复杂，UI 也不够简洁。所以决定自己开发一款，经过几个月的打磨，我觉得已经达到了我心中理想的样子，所以分享一下。关于设计我个人非常喜欢 Apple 自家 App 的风格，所以希声 (Still) 在设计上遵循 Apple 的设计规范，UX 细节上参考了 Books / Podcasts / Music. 名字来源于《道德经》里的“大音希声”。核心功能有声书与播客沉浸、极简的播放界面跨设备实时同步收听进度下载到本地，随时随地离线畅听接下来播放队列，连续播放不间断睡眠定时、倍速与音量增强一应俱全自动跳过片头片尾，为你省时间支持主屏幕小组件与车载 CarPlay 电子书支持 EPUB 、PDF 、CBZ 格式自定义排版（字号、字体与间距）多种阅读主题模式随心切换跨设备实时同步阅读进度更多自定义首页版块排序 OIDC 单点登录 (SSO) Custom Header 支持多服务器/账号切换下载 App Store 搜索「希声」「 Still 」或者直接访问链接: https://apps.apple.com/cn/app/%E5%B8%8C%E5%A3%B0-%E4%B8%BA-audiobookshelf-%E6%89%93%E9%80%A0/id6754208326 说明：希声本身不提供任何媒体内容，需要自行搭建 Audiobookshelf 服务端使用。详情： https://www.audiobookshelf.org

[分享创造] 希声 (Still) ：为 Audiobookshelf 打造的 iOS 原生客户端

v2ex.com · 2026-04-23 13:12:39+08:00 · tech

去年从 Plex 迁移到了 Audiobookshelf ，找了一圈没有找到自己满意的客户端。主要是现有的 App 功能设计对我来说有些复杂，UI 也不够简洁。所以决定自己开发一款，经过几个月的打磨，我觉得已经达到了我心中理想的样子，所以分享一下。关于设计我个人非常喜欢 Apple 自家 App 的风格，所以希声 (Still) 在设计上遵循 Apple 的设计规范，UX 细节上参考了 Books / Podcasts / Music. 名字来源于《道德经》里的“大音希声”。核心功能有声书与播客沉浸、极简的播放界面跨设备实时同步收听进度下载到本地，随时随地离线畅听接下来播放队列，连续播放不间断睡眠定时、倍速与音量增强一应俱全自动跳过片头片尾，为你省时间支持主屏幕小组件与车载 CarPlay 电子书支持 EPUB 、PDF 、CBZ 格式自定义排版（字号、字体与间距）多种阅读主题模式随心切换跨设备实时同步阅读进度更多自定义首页版块排序 OIDC 单点登录 (SSO) Custom Header 支持多服务器/账号切换下载 App Store 搜索「希声」「 Still 」或者直接访问链接: https://apps.apple.com/cn/app/%E5%B8%8C%E5%A3%B0-%E4%B8%BA-audiobookshelf-%E6%89%93%E9%80%A0/id6754208326 说明：希声本身不提供任何媒体内容，需要自行搭建 Audiobookshelf 服务端使用。详情： https://www.audiobookshelf.org

[分享创造] 希声 (Still) ：为 Audiobookshelf 打造的 iOS 原生客户端

v2ex.com · 2026-04-23 12:18:54+08:00 · tech

去年从 Plex 迁移到了 Audiobookshelf ，找了一圈没有找到自己满意的客户端。主要是现有的 App 功能设计对我来说有些复杂，UI 也不够简洁。所以决定自己开发一款，经过几个月的打磨，我觉得已经达到了我心中理想的样子，所以分享一下。关于设计我个人非常喜欢 Apple 自家 App 的风格，所以希声 (Still) 在设计上遵循 Apple 的设计规范，UX 细节上参考了 Books / Podcasts / Music. 名字来源于《道德经》里的“大音希声”。核心功能有声书与播客沉浸、极简的播放界面跨设备实时同步收听进度下载到本地，随时随地离线畅听接下来播放队列，连续播放不间断睡眠定时、倍速与音量增强一应俱全自动跳过片头片尾，为你省时间支持主屏幕小组件与车载 CarPlay 电子书支持 EPUB 、PDF 、CBZ 格式自定义排版（字号、字体与间距）多种阅读主题模式随心切换跨设备实时同步阅读进度更多自定义首页版块排序 OIDC 单点登录 (SSO) Custom Header 支持多服务器/账号切换下载 App Store 搜索「希声」「 Still 」或者直接访问链接: https://apps.apple.com/cn/app/%E5%B8%8C%E5%A3%B0-%E4%B8%BA-audiobookshelf-%E6%89%93%E9%80%A0/id6754208326 说明：希声本身不提供任何媒体内容，需要自行搭建 Audiobookshelf 服务端使用。详情： https://www.audiobookshelf.org

[分享创造] 希声 (Still) ：为 Audiobookshelf 打造的 iOS 原生客户端

v2ex.com · 2026-04-23 12:18:54+08:00 · tech

去年从 Plex 迁移到了 Audiobookshelf ，找了一圈没有找到自己满意的客户端。主要是现有的 App 功能设计对我来说有些复杂，UI 也不够简洁。所以决定自己开发一款，经过几个月的打磨，我觉得已经达到了我心中理想的样子，所以分享一下。关于设计我个人非常喜欢 Apple 自家 App 的风格，所以希声 (Still) 在设计上遵循 Apple 的设计规范，UX 细节上参考了 Books / Podcasts / Music. 名字来源于《道德经》里的“大音希声”。核心功能有声书与播客沉浸、极简的播放界面跨设备实时同步收听进度下载到本地，随时随地离线畅听接下来播放队列，连续播放不间断睡眠定时、倍速与音量增强一应俱全自动跳过片头片尾，为你省时间支持主屏幕小组件与车载 CarPlay 电子书支持 EPUB 、PDF 、CBZ 格式自定义排版（字号、字体与间距）多种阅读主题模式随心切换跨设备实时同步阅读进度更多自定义首页版块排序 OIDC 单点登录 (SSO) Custom Header 支持多服务器/账号切换下载 App Store 搜索「希声」「 Still 」或者直接访问链接: https://apps.apple.com/cn/app/%E5%B8%8C%E5%A3%B0-%E4%B8%BA-audiobookshelf-%E6%89%93%E9%80%A0/id6754208326 说明：希声本身不提供任何媒体内容，需要自行搭建 Audiobookshelf 服务端使用。详情： https://www.audiobookshelf.org

/tag/audio