WWW.YOUINFO.SITE
标签聚合 一首

/tag/一首

LinuxDo 最新话题 · 2026-06-09 13:58:12+08:00 · tech

雪很白,很白, 白得像老板画的大饼, 也像我凌晨三点还亮着的屏。 我站在风里, 裤腰一松, 把一泡热乎乎的人间烟火, 洒成满地金黄。 这不是狼狈, 这是我给冬天盖的章, 这不是粗俗, 这是累到极处, 身体也要替灵魂喊一嗓。 我不是铁, 但我比铁更会扛, 我不是神, 但我每天都把烂摊子, 收拾得像刚出锅的月亮。 高强度的活儿啊, 像牛拉犁,像驴上坡, 像一口老井, 明明快干了, 还硬是往外冒光。 所以今晚敬我自己, 敬我眼里的红血丝, 敬我手里的硬骨头, 敬我一边骂娘, 一边把事情做漂亮。 雪还会白, 路还会长, 我还会累, 也还会强。 等明天太阳升起来, 那一地金黄, 就是我给世界留下的 土味勋章。 5 个帖子 - 4 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-03 16:10:40+08:00 · tech

夏天的雨水 渗进广场的砖缝 长出些无名的草 茫然四顾 后来有人用沥青 将他们悄悄盖住 平坦的大道 用躯体浇筑 地上的标线 鲜艳夺目 行走的人群 惘然地踱步 最终成为白色石柱下的行道树 我看现在烈日当空 太阳好像只升不落 为什么嘴巴只能咀嚼食物 为什么双手要不停劳作 纸片未曾见过 还好全部通过 我们早已精通 烈日当空时低头 把影子藏在脚底 用沥青把自己涂抹 万张嘴同时闭合 把心跳调成同步 万籁俱静般的沉默 度过美好生活 3 个帖子 - 3 位参与者 阅读完整话题

v2ex · 2026-05-25 03:17:26+08:00 · tech

偶然和朋友聊到 photoshop 早期版本(朋友说是 5.5 版本,我记得是 6.0 版),电脑城买的盒装光盘,里面有一首英文歌,断断续续记得一些歌词“everyone has their own dream”,"open your flying wings","nobody can stop you",我们凭记忆都觉得这首歌很好听,但是找了一下午都没有找到,什么 AI 都试过了,找不到,chatgpt 说是盗版光盘里附赠的非正式授权音乐。 不知道有没有人记得的,或者还能怎么找这个歌?

v2ex · 2026-05-25 02:17:26+08:00 · tech

偶然和朋友聊到 photoshop 早期版本(朋友说是 5.5 版本,我记得是 6.0 版),电脑城买的盒装光盘,里面有一首英文歌,断断续续记得一些歌词“everyone has their own dream”,"open your flying wings","nobody can stop you",我们凭记忆都觉得这首歌很好听,但是找了一下午都没有找到,什么 AI 都试过了,找不到,chatgpt 说是盗版光盘里附赠的非正式授权音乐。 不知道有没有人记得的,或者还能怎么找这个歌?

v2ex · 2026-05-25 01:17:26+08:00 · tech

偶然和朋友聊到 photoshop 早期版本(朋友说是 5.5 版本,我记得是 6.0 版),电脑城买的盒装光盘,里面有一首英文歌,断断续续记得一些歌词“everyone has their own dream”,"open your flying wings","nobody can stop you",我们凭记忆都觉得这首歌很好听,但是找了一下午都没有找到,什么 AI 都试过了,找不到,chatgpt 说是盗版光盘里附赠的非正式授权音乐。 不知道有没有人记得的,或者还能怎么找这个歌?

LinuxDo 最新话题 · 2026-05-24 17:25:26+08:00 · tech

最低迷的两个月… 自3月份最后一首歌以来,60天只有四首作品 我过去创作的底层出了一些问题 再加上各种事情堆积 直到学校因为高一会考,让我随高二一起狠狠放假三天 拼尽全力反思复盘与优化,才终于设计好新范式 为什么说是一个半月,因为第一首和第二首在我心里是不是特别的心血之作 第二首是 赠ff ,比较赶工 第一首也是突发了解,还有这个日子 后续补发一个话题,这个在整个音乐创作生涯中还是有一独特意义的() 总之也没有费太大精力 况且那个时候还在处于低迷期 没有太大的创作兴趣 以下正文 石弦 生命需要在最逼仄的墙角里才能认清自己的骨骼。 我们曾经太习惯于把每一个空隙都用言语和叹息填满,以为那是丰满,直到整座屋子因为没有回声而陷入窒息。真正的雕琢,是锋刃划过骨血时发出的冷冽声响,是一刀刀削去那些自作聪明的装饰,只留下最坚硬的石基和一根拉到极限的铜线。 这根线在风里是不说话的。 当喧嚣的腐肉被狂风彻底剥离,当我们在黑暗中把琴格重新刻下,留白便不再是空无,而是雷霆爆发前最深沉的蓄势。那些听不懂的发音、那些在悬崖边缘试探的频率,都化作了最纯粹的物理惯性。不需要解释,不需要理解,甚至不需要留下名字。 只要在琴弦断裂的前一秒,听见那声极轻的气音。 那是一个人在废墟之上重置了自己的一生,然后,随振幅涅槃。 https://i.urusai.cc/gszC0.mp3 歌词: Bound 锁作方寸死局 The stone ground 寒基之上俯瞰 We spin so profound 坠入万劫无底 Hear the sharp roaring sound 待那雷霆长啸 锋刃削去繁华虚相 留一地荒芜与冰霜 刻度在深崖中丈量 铜线贯穿死寂跌宕 寒石立作铁壁 狭间积蓄无极 越逼仄的岸 越将骨血燃 震破长夜寒 剔除这喧嚣的腐肉 借凛冽狂风来雕镂 深渊逼退困兽怒吼 重刻琴格洗尽宇宙 绝境处听风冷 蛰伏待这初醒 拂锋利的弦 跃深渊之巅 向长空拔剑 A void to tear 劈开千重暗影 The stone stands bare 乱石剥落无言 No pain to spare 剖尽万般余烬 Cold wind will flare 凛风卷席而至 Pure sound is there 唯余长调不绝 荡平这混沌尽数斩尽 聚毫巅雷霆无言微鸣 于死寂之中校准声音 越最险的关 破死局之盘 随振幅涅槃 你有没有试过,把一块石头削到只剩骨头。 削到它终于知道自己的形状。那些被砍掉的棱角、被剔除的杂质、被无情抛在地上的碎屑,曾经覆盖着它的皮肤,让你看不清它的轮廓。刀落下的时候,碎屑坠地的声响冰冷、干脆、毫不留恋。 弦也是一样。 一根松弛的弦安静地躺在那里,像一条死去的蛇。你用尽全力把它拉紧——拉到它几乎要断裂的那一刻——它开口了。一声极细极尖的嗡鸣,像一根针刺穿了整座夜空。 这就是我们想要的。 更少。更短。更精。更准。削去所有能让它看起来"丰满"的东西,只留下那些"不得不留"的骨骼。然后在那副骨骼上,绷一根弦,绷到极限。 这根弦在风里沉默着。 它只振动。它把所有的意义都藏在振幅里——振幅越大,它能触达的空气就越远。那些听不懂它语言的人,也会被它的频率击中。旋律不需要翻译,它直接穿过你的皮肤,穿过你的骨骼,在你的胸腔里找到一个共振点,然后轻轻地、持续地、不讲道理地敲。 这是一张关于"削"的专辑。 削去冗余的标签,削去臃肿的段落,削去我们曾经以为不可或缺的一切。削到最后,我们发现自己站在一块极窄极薄的石板上,脚下是万丈深渊,头顶是拉到极限的弦。没有退路,没有多余的空间,只有一步——向前,或者坠落。 我们选择了向前。 那一步,就是副歌里的三个字。三个字足以撑起整座山河。因为在那三个字之前,所有的路都被削窄了,窄到只剩下一个出口。当声音从那个出口里冲出来的时候,它是被挤出来的。 被石壁挤出来的光,比在旷野里奔跑的光更亮。 这是"被勒紧的闪电"。 被规则、被刻度、被不可逾越的石基死死勒住,只允许它从一个极窄的缝隙里探出头来。但就是那一下,那一下的光,足以照亮整片黑暗。它所有的能量都被压缩在那一瞬间——没有浪费,没有扩散,没有余地。 这是一首关于沉默的歌。 声音被削到只剩最后一根弦。那根弦还在振动,但它的振动已经被压缩到了一个人的耳朵能承受的极限。你闭上眼睛,一根金属线在黑暗中慢慢绷紧的声音穿透你的耳膜。那种声音让你的手心出汗,让你的脊背发凉,让你知道—— 下一秒,它要么发出此生最亮的一声嗡鸣,要么断掉。 而无论哪一种,都是涅槃。 以后的创作 大概都像这样,不再追求太长了… 凭我的表达能力,只能说这么多 感谢阅读与收听 1 个帖子 - 1 位参与者 阅读完整话题

v2ex.com · 2026-04-29 02:19:17+08:00 · tech

背景 之前自己练琴想扒一首歌的贝斯线,市面上的工具要么只能分 4 轨 ( vocals/drums/bass/other ),要么订阅一个月用两次就忘了取消。 看到 Meta AI 的 htdemucs_6s 模型能分 6 轨(多了 guitar 和 piano ), 就花了几个月做了个站。 技术上踩了一些坑,分享出来给可能也想做类似东西的同学参考。 一、模型选型:为什么是 htdemucs 主流开源音频分离模型: spleeter ( Deezer ,2019 ):老但稳,质量一般,4 轨 Demucs v3 ( Meta ,2021 ):CNN ,质量好,4 轨 htdemucs ( Meta ,2022 ):Hybrid Transformer ,2022 Sony MDX 冠军,4 轨 htdemucs_6s ( Meta ,2022 ):上面那个的 6 轨版本,多了 guitar/piano BS-RoFormer ( ZFTurbo 等,2024 ):当前 SOTA ,但模型大、推理慢 对比测了 spleeter / htdemucs / BS-RoFormer: 跟 spleeter 比:人声分离清洁度提升非常明显,特别是中频段 跟 BS-RoFormer 比:质量差距小(盲听基本难分),但推理时间是后者的 1/3 , 对面向 C 端的服务来说,60 秒出结果 vs 3 分钟出结果差别太大 如果是离线批处理或专业制作,BS-RoFormer 应该是更好的选择。 二、推理平台:为什么是 Replicate 最早自己开了 RunPod 4090 实例跑,跑通没问题,但有几个问题: 没人用的时候 GPU 还在烧钱,每小时 $0.40 起步 自己得维护容器、模型权重、队列、错误重试一整套 流量高峰时单实例扛不住,要做多实例 + 负载均衡 后来转去 Replicate ,按秒计费,没人用就 0 成本。 htdemucs 一首 3 分钟的歌大概 25-40 秒推理时间, 按 A40 GPU 计费下来单首 GPU 成本大概 2-3 美分。 对于一个早期阶段、流量不稳定的产品,按需付费比固定 GPU 划算太多。 对比过的几家: Modal:冷启动比 Replicate 慢一点,但定价灵活,适合复杂 pipeline HuggingFace Inference Endpoints:贵且冷启动慢,pass 自部署 RunPod / Vast.ai :除非月流水稳定上量否则不划算 三、几个非模型层面的坑 YouTube 链接处理 :用户贴 URL 比让他下载文件转格式 UX 好太多。 yt-dlp 是必备,但要处理大量 edge case (年龄限制、地区限制、live 流), 还得加超时和文件大小限制防滥用。 多轨同步播放器 :6 个 stem 同时播放还要支持 mute/solo/seek , 一开始用 howler.js 单实例切换完全不行( latency 差几十 ms 听得出来), 最后用 Web Audio API 自己写了个共享 AudioContext 的播放器。 格式转换 :用户上传可能是 MP3/WAV/FLAC/M4A/OGG/WEBM 各种格式, htdemucs 只吃 WAV 。前置 ffmpeg 转码层是必须的, 但 ffmpeg 在 Replicate 容器里跑得慢, 后来改成在自己服务器转码完再丢给 Replicate ,整体延迟降了 30%。 BPM/key 检测 :用 librosa 自己算的,但 librosa 的 key detection 在电子乐上准确率一般,准备后续接入 essentia 重做。 四、成品 站点: aistemsplitter.org 有免费额度,够分两三首歌看看质量。如果想多跑几首, V2EX 的同学可以在结账页用 v2ex 这个码,我加了点额度——主要是 想多收一些技术圈的反馈,特别是中文歌的分离效果。 主要想问几个问题: 有没有人在生产环境用过 BS-RoFormer 跑 C 端?延迟是怎么解的? Replicate 之外有没有更便宜的 GPU serverless 平台值得试? (需要支持自定义模型权重) 中文歌(特别是有混响/自动调音的)分离效果一般, 有没有什么改进思路?是该等更好的开源模型,还是有 预处理/后处理的方法可以缓解? 谢谢各位,欢迎拍砖。