大佬们有什么快的办法吗 ?因为平时在MAc M4上用自己的 GPU 加速.mp4转文字,几十个视频也就算了,现在要跑900 多个,怕Mac烧掉… 服务器:腾讯云 Linux x86、4 核、3.6G 内存、没有 GPU,真顶不住啊。。 有没有什么出奇制胜的办法。。。 1 个帖子 - 1 位参与者 阅读完整话题
标题: Viko:一款开源的本地音视频图片处理工具 批量处理多个视频/图片要转格式、压体积、批量加水印,素材不必上传云端;不记 FFmpeg 命令。 把音视频/图片的转换、压缩、水印、降噪、元数据编辑收进一个工具里,支持批量任务队列,默认参数开箱即用,需要时再精调码率、分辨率、编码器。所有处理都在本机完成, 素材不必上传云端 。 核心亮点 一站式媒体处理 :转换器、压缩器、水印、降噪、元数据编辑,常用能力集中在一个应用里,不用在多个工具之间来回跳。 批量任务队列 :多文件一次拖入,统一配置或逐条微调;任务记录可搜索、排序,一键打开输出目录。 默认即用,也可精调 :不懂编码参数也能直接出结果;需要时可调 CRF/VBR 、分辨率、编码器,还支持极速模式与 GPU 硬件加速( NVENC / QSV / VideoToolbox 等,视系统环境而定)。 本地优先,隐私可控 :媒体引擎基于 Rust ffmpeg-next 集成,文件留在本机,适合对素材隐私有要求的创作者和小团队。 跨平台桌面应用 :支持 macOS ( Apple Silicon )、 Windows ,基于 Tauri 2 + React 构建,体积相对 Electron 更轻。 能力一览: 转换器 :批量转码音视频/图片,支持 GIF 等动图输出 压缩器 :一键批量压缩,可调质量 水印 :文本/图片水印,便于品牌与版权标注 降噪 :音视频降噪,适合日常素材优化 元数据 :视频/音频/图片元数据批量编辑 我的文件 :处理结果集中管理 运行界面截图 访问与下载 本项目完全开源,提供各平台安装包下载。 下载安装 : https://avi.2342342.xyz GitHub 开源地址 : https://github.com/boy-lin/viko 安装后打开即可使用,首次处理可直接采用默认参数;有进阶需求时再逐步调整即可。 技术栈 如果你对 Tauri + FFmpeg 集成感兴趣,这个项目也许值得一看: 前端 :React 18 + TypeScript + Vite + Tailwind CSS + Zustand 桌面端 :Tauri 2 媒体引擎 :Rust ffmpeg-next 8.x ( codec / format / filter / scaling / resampling ) License :MIT ,欢迎 Fork 二次开发 从源码运行: git clone https://github.com/boy-lin/viko.git cd viko corepack enable && pnpm install pnpm check:deps # macOS / Linux 检查 FFmpeg 开发库 pnpm tauri:dev 适合谁用 内容创作者 :批量转码、压缩、加水印 隐私敏感用户 :素材不上传云端,数据留在本机 开发者 :基于 Tauri + FFmpeg 二次扩展 入门用户 :默认参数即用,逐步学习进阶选项
微信正与华为、小米、荣耀、OPPO、vivo 等多家主流手机厂商深度合作,推出基于 A2A(Agent-to-Agent)协作机制的助手能力。 腾讯客服对此予以确认,表示该功能允许由手机厂商的系统 AI 助手直接向微信发送指令,微信负责执行并返回结果,目前已有手机厂商完成了接入。 核心功能包括通过系统语音助手发起与指定好友的音视频通话、发送微信消息等,具体功能会根据各厂商的适配情况逐步完善。 https://mp.weixin.qq.com/s/ct41S2D6UM2umzqwSDaWcQ 3 个帖子 - 3 位参与者 阅读完整话题
IT之家 6 月 3 日消息,京东今日宣布推出 JoyAI-Echo 长音视频生成框架,号称直接解决行业头疼已久的三大难题 —— 角色易崩、声音乱变、生成缓慢。 同时还实现了“对话式编辑”功能 ,不用再为改一个镜头重跑整条视频。 京东官方表示, JoyAI-Echo 的发布,标志着京东在长视频生成领域进入全球第一梯队 。 据介绍,JoyAI-Echo 框架内置了一个专门的记忆库,能在多镜头生成过程中,持续保存并调用角色的外观特征和说话人音色信息。实测结果显示, 长达 5 分钟的视频里,角色身份、视觉形象和声音音色都能保持高度一致 ,再也不会出现“同一个人演着演着变成另一个人”的尴尬情况。 团队提出了记忆驱动后训练流程,结合 SFT、跨模态 RLHF 和 Distribution Matching Distillation(DMD)技术,不仅提升了生成质量,还实现了推理加速, DMD 一项技术就带来约 7.5 倍的速度提升 。JoyAI-Echo 还加入了智能“导演助理”——Director Agent,支持自然语言说需求,自动拆分成剧本、角色、场景和镜头。 另外,JoyAI-Echo 还配套了专门的实时超分模块,通过单步超分就能生成高分辨率视频和精细化音频,并支持两档分辨率提升:736×1280 → 1152×1920 和 736×1280 → 1472×2560。 IT之家附项目页和 GitHub 代码仓库如下: GitHub: https://github.com/jd-opensource/JoyAI-Echo 项目主页: https://echo-team-joy-future-academy-jd.github.io/Echo-LongVideo-Page/
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
yt-dlp https://www.douyin.com/video/6963263655114722595 --cookies-from-browser chrome 通过 yt-dlp 下载抖音视频,已经加上使用浏览器 cookie 了,但还是报下面这个错误 WARNING: [Douyin] 6963263655114722595: Failed to parse JSON: Expecting value in '': line 1 column 1 (char 0) ERROR: [Douyin] 6963263655114722595: Fresh cookies (not necessarily logged in) are needed; please report this issue on https://github.com/yt-dlp/yt-dlp/issues?q= , filling out the appropriate issue template. Confirm you are on the latest version using yt-dlp -U File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/common.py", line 765, in extract ie_result = self._real_extract(url) File "/opt/homebrew/Cellar/yt-dlp/2026.3.17_2/libexec/lib/python3.14/site-packages/yt_dlp/extractor/tiktok.py", line 1484, in _real_extract raise ExtractorError( 'Fresh cookies (not necessarily logged in) are needed', expected=not self._get_cookies(self._WEBPAGE_HOST).get('s_v_web_id')) 不知道是不是我使用的姿势不对,请教各位指点下。
IT之家 6 月 2 日消息,据IT之家小伙伴今日反馈,腾讯客服最新回复显示, 微信正在与华为、荣耀、小米、OPPO、vivo 等手机厂商合作推出 A2A 助手能力 。 用户可以通过手机语音助理发起微信音视频通话或向指定好友发送消息。该功能基于 A2A(Agent-to-Agent)协作机制, 由厂商 AI 助手向微信发起指令,微信负责执行并返回结果 ,全程采用双重授权机制,保障数据安全与隐私合规。合作旨在以更自然的方式将微信能力融入您的日常使用中。 腾讯客服还表示, 相关功能正在逐步开放中 。 IT之家查询发现,微信此前面向各大手机厂商开放过类似功能,不过在 2025 年有大量网友表示功能失效,看来是收回了权限。 根据博主 @旺仔百事通 的说法,荣耀的部分手机已经率先将这一功能带了回来: 荣耀 YOYO 智能体更新到 90.10.30.063 及以上版本,微信更新到 8.0.72 及以上版本 可以使用 YOYO 给微信好友发消息、打语音或者视频电话 目前首批已支持 荣耀 Magic8 系列、 荣耀 500 系列、荣耀 X70 还有博主测试了 荣耀 500 Pro 、Magic 8 Pro 手机,确实可以实现通过 YOYO 发起音视频通话或向指定好友发送消息。 大家在 IT之家微信号 回复“ 微信 ”两字,即可获取当前最新官方内部版微信下载。
最近把一篇 WebRTC + gRPC 音视频通话方案做了脱敏整理,主要讨论复杂局域网/受限网络里,Android 终端之间做实时音视频时,信令、媒体链路和自恢复能力应该怎么拆。 这篇不是完整生产配置,而是一个架构复盘。重点是几个边界: - gRPC 信令层负责设备状态、会话控制和事件分发。 - WebRTC 负责 SDP/ICE 、track 和媒体传输。 - Android 客户端负责权限、采集、播放、UI 状态和资源释放。 - RTC Gateway 需要承担自动发现、状态同步、故障恢复和观测入口。 - 音频质量、弱网恢复、设备重启、会话残留这些问题不能只靠业务层 timeout 判断。 文章地址: https://www.lodan.me/posts/webrtc-grpc-lan-call-architecture/ 想请教大家:在局域网或受限网络里做 WebRTC 时,你们更倾向把信令网关做成独立服务,还是内置到客户端/边缘节点?故障恢复通常靠 WebSocket 重连、gRPC stream ,还是自定义心跳/发现机制?
最近把一篇 WebRTC + gRPC 音视频通话方案做了脱敏整理,主要讨论复杂局域网/受限网络里,Android 终端之间做实时音视频时,信令、媒体链路和自恢复能力应该怎么拆。 这篇不是完整生产配置,而是一个架构复盘。重点是几个边界: - gRPC 信令层负责设备状态、会话控制和事件分发。 - WebRTC 负责 SDP/ICE 、track 和媒体传输。 - Android 客户端负责权限、采集、播放、UI 状态和资源释放。 - RTC Gateway 需要承担自动发现、状态同步、故障恢复和观测入口。 - 音频质量、弱网恢复、设备重启、会话残留这些问题不能只靠业务层 timeout 判断。 文章地址: https://www.lodan.me/posts/webrtc-grpc-lan-call-architecture/ 想请教大家:在局域网或受限网络里做 WebRTC 时,你们更倾向把信令网关做成独立服务,还是内置到客户端/边缘节点?故障恢复通常靠 WebSocket 重连、gRPC stream ,还是自定义心跳/发现机制?
解决什么问题 刷 B 站 / YouTube 学技术,1 小时的硬核内容 (e.g. JavaScript 源码解读、 李沐讲论文、Andrej Karpathy 的 LLM 公开课),不想从头看一遍。 丢链接进去 → 1-3 分钟 → 拿到一份结构化 markdown 笔记。 主要功能 多平台:B 站 / YouTube / 抖音 / 快手 / 小宇宙(podcast 也能笔记化) 笔记里自动插入视频截图 + 时间戳跳转链接 多种风格模板:详细笔记 / 教程指南 / 学术论文 / 思维导图 大纲 批量任务:粘贴一堆链接 UP 主、收藏列表、视频合集,一次跑完 合集:把同主题笔记归到一个合集 + 一键融合成总结 导出 PDF / DOCX / PPTX / HTML 4 种格式 视频理解(VIP):抽关键帧 → Vision AI 看画面,适合实操类视频 (软件 demo 、菜谱、健身动作 这种纯靠音频抽不到信息的) 邀请系统上线 V 站福利 带邀请码注册:200 积分(普通 100) 不用邀请码直接进首页注册也行,只是少 100 积分。 注册地址: https://www.bilinote.app/ V2EX-WWTN75WG V2EX-ZGM834XJ V2EX-QPWMSGK2 V2EX-JGYC78PF V2EX-DR4CTKXJ V2EX-QQK6HD9F V2EX-SD9YKZTE V2EX-RF0WFP63 V2EX-32XRB3YH V2EX-YH713MBZ V2EX-21KAV6Q8 V2EX-GX17C49E V2EX-FFA6169Z V2EX-59YFPDTG V2EX-5XA1CDHM V2EX-RY5NY871 V2EX-G1X5VCNS V2EX-4YQ80DWH V2EX-0TY5AEP5 V2EX-FZ1HADJS
macOS上安装了夸克,它把文件空格预览音视频都改成他自己了,不是系统自带的了,怎么修改回来。太流氓了,没找到修改的地方,难道只能删除么,我也就只用夸克用下它的网盘下东西 —————————— 看错了,预览还是系统自带的 4 个帖子 - 4 位参与者 阅读完整话题
求助帖,有没有可以搜索抖音特定月份的特定视频的方法呢。 比如说我想搜索3月份,重生题材的短剧改怎么搜索定位呢,有什么办法吗,搜出来都是近几天的。 1 个帖子 - 1 位参与者 阅读完整话题
[网站自荐] 几分钟内为视频生成 Netflix 级别字幕 CoffeeTrans: 一键式为音视频生成 Netflix 级别的精准时间轴字幕 大家好,很高兴在这里向各位介绍我的新产品 CoffeeTrans 。这是一款针对音频或者视频的上传、字幕识别、翻译、导出的一键式转录翻译平台 网址 : https://coffeetrans.app 为什么开发 CoffeeTrans ? 我的大学专业是计算机,接触过很多国外高质量课程,社区贡献了很多高质量的课程翻译,但是更多的课程没有人搬运,我自己英语还做不到流畅的正常速度观看吸收,因此想做一个自己的翻译工具 我知道社区有一些开源的实现,我自己也跑过,老实说对于普通人来说存在一些问题:安装有门槛容易包错、需要比较好的机器性能才能跑比较大的 Whisper 模型,转录速度比不够快、翻译经常抽风,跑到一半直接断了、字幕烧录非常的吃机器性能,一套流程下来耗时挺长的,当然如果是偶尔使用还是可以接受的 又有很多人会说了,这不就调用一下转录模型和大模型进行翻译吗?是的,这个承认,但是多少产品不是这样呢,一个功能到一个产品是有很多坑要踩的 另外就是国外也有很多类似的平台,不过很多聚焦于全视频处理平台,转录和翻译是其中的一小部分,额度很小并且比较贵,对于专门做转录和翻译的选择会更少 最后,因为自己也想搓一个就做了 为什么取名叫 CoffeeTrans ? 我希望泡杯咖啡的时间就能完成高质量的翻译过程,所以就叫 CoffeeTrans 了 核心特点 快速翻译 :相比本地 Whisper 转录,使用 CoffeeTrans 的转录更快,2 小时的视频可以在几分钟内转录完成 批量处理 :可以上传多个文件同时转录翻译 多语言支持 :这应该是转录翻译的基本功能 高质量翻译 :基于最新的大语言模型,翻译质量有保障。 上下文感知 :在翻译之前会整体扫描一遍上下文,自动提取术语、关系等,后续翻译都会携带上下文,保证翻译的连续性和准确性 多格式支持 :支持常见的音视频格式 精准时间轴 :生成的字幕时间轴非常准确,对于需要处理字幕的人来说非常有用 字幕导出 :支持导出为 srt 方便二次修改 支持一次翻译为多种语言 :可以一次性选择翻译为多种目标语言,极大的减少工作量,节省 credits 智能去除语气词 :智能去除语气词,让字幕更加自然流畅 技术选型 转录:使用了云服务商提供的 API 翻译:使用大模型做上下文提取 + 翻译 存储:Cloudflare R2 字幕烧录:Modal 动态创建 worker 应用场景 学生 :学习国外优质课程 独立开发 :发布自己的多语言版本介绍 法律/金融/医疗专业人士 :高效翻译专业领域的视频观看 内容创作者 :将自己的课程发布到全球,获取全球观众 ... 免费用户有 30 积分的额度(相当于 30 分钟的转录或者 30 分钟的翻译,一分钟的转录或者翻译消耗 1 个积分) 立即体验 : https://coffeetrans.app 感谢大家的支持!有任何使用问题或功能建议,欢迎在这里交流!
[网站自荐] 几分钟内为视频生成 Netflix 级别字幕 CoffeeTrans: 一键式为音视频生成 Netflix 级别的精准时间轴字幕 大家好,很高兴在这里向各位介绍我的新产品 CoffeeTrans 。这是一款针对音频或者视频的上传、字幕识别、翻译、导出的一键式转录翻译平台 网址 : https://coffeetrans.app 为什么开发 CoffeeTrans ? 我的大学专业是计算机,接触过很多国外高质量课程,社区贡献了很多高质量的课程翻译,但是更多的课程没有人搬运,我自己英语还做不到流畅的正常速度观看吸收,因此想做一个自己的翻译工具 我知道社区有一些开源的实现,我自己也跑过,老实说对于普通人来说存在一些问题:安装有门槛容易包错、需要比较好的机器性能才能跑比较大的 Whisper 模型,转录速度比不够快、翻译经常抽风,跑到一半直接断了、字幕烧录非常的吃机器性能,一套流程下来耗时挺长的,当然如果是偶尔使用还是可以接受的 又有很多人会说了,这不就调用一下转录模型和大模型进行翻译吗?是的,这个承认,但是多少产品不是这样呢,一个功能到一个产品是有很多坑要踩的 另外就是国外也有很多类似的平台,不过很多聚焦于全视频处理平台,转录和翻译是其中的一小部分,额度很小并且比较贵,对于专门做转录和翻译的选择会更少 最后,因为自己也想搓一个就做了 为什么取名叫 CoffeeTrans ? 我希望泡杯咖啡的时间就能完成高质量的翻译过程,所以就叫 CoffeeTrans 了 核心特点 快速翻译 :相比本地 Whisper 转录,使用 CoffeeTrans 的转录更快,2 小时的视频可以在几分钟内转录完成 批量处理 :可以上传多个文件同时转录翻译 多语言支持 :这应该是转录翻译的基本功能 高质量翻译 :基于最新的大语言模型,翻译质量有保障。 上下文感知 :在翻译之前会整体扫描一遍上下文,自动提取术语、关系等,后续翻译都会携带上下文,保证翻译的连续性和准确性 多格式支持 :支持常见的音视频格式 精准时间轴 :生成的字幕时间轴非常准确,对于需要处理字幕的人来说非常有用 字幕导出 :支持导出为 srt 方便二次修改 支持一次翻译为多种语言 :可以一次性选择翻译为多种目标语言,极大的减少工作量,节省 credits 智能去除语气词 :智能去除语气词,让字幕更加自然流畅 技术选型 转录:使用了云服务商提供的 API 翻译:使用大模型做上下文提取 + 翻译 存储:Cloudflare R2 字幕烧录:Modal 动态创建 worker 应用场景 学生 :学习国外优质课程 独立开发 :发布自己的多语言版本介绍 法律/金融/医疗专业人士 :高效翻译专业领域的视频观看 内容创作者 :将自己的课程发布到全球,获取全球观众 ... 免费用户有 30 积分的额度(相当于 30 分钟的转录或者 30 分钟的翻译,一分钟的转录或者翻译消耗 1 个积分) 立即体验 : https://coffeetrans.app 感谢大家的支持!有任何使用问题或功能建议,欢迎在这里交流!