✅ 支持 MP4 / MOV / WEBM / MP3 / WAV 等常见格式
✅ 流程:Extract Audio -> 语音识别 -> 输出文本
ℹ️ 说明:当前使用 Whisper tiny,在同音字和口语场景下会有精度上限。
ℹ️ 建议:先点“开始转文字”,再点“网Page版豆包”一键打开并Paste润色,可明显提升可读性。
选择视频或音频文件
Click or drag video here / 音频
支持 MP4、MOV、WEBM、MP3、WAV 等 | 首次将加载 FFmpeg;模型来源可在Page面底部切换 local/r2
正在初始化...