✅ 支持 MP4 / MOV / WEBM / MP3 / WAV 等常见格式
✅ 流程:提取音频 -> 语音识别 -> 输出文本
ℹ️ 说明:当前使用 Whisper tiny,在同音字和口语场景下会有精度上限。
ℹ️ 建议:先点“开始转文字”,再点“网页版豆包”一键打开并粘贴润色,可明显提升可读性。
选择视频或音频文件
点击或拖拽视频 / 音频
支持 MP4、MOV、WEBM、MP3、WAV 等 | 首次将加载 FFmpeg;模型来源可在页面底部切换 local/r2
正在初始化...