Scribe —— 99 种语言实时转录,超越 Whisper 的语音转文字模型
🎙 ElevenLabs 推出 Scribe :一个超高准确性的语音转文字模型,能处理复杂真实场景的音频,支持99种语言转录,自动标记说话人切换和单词时间点,还能识别背景中的笑声等非语音事件,结构化数据输出方便开发者直接调用
📊 在多个国际测试中,Scribe 表现超越 Gemini、Whisper 等热门模型,尤其在意大利语、英语等97种小语种中错误率最低,让不同语言的语音识别更可靠。 开发者还可通过 API 接入获取带详细标记的JSON文本,普通用户也能在后台直接上传音视频生成格式化的文字稿 后续还会推出低延迟版本,适合实时场景使用
📝 在语音转文字的模型迭代下,我相信接下来会有更多的语音原生的产品出现
🎙 ElevenLabs 推出 Scribe :一个超高准确性的语音转文字模型,能处理复杂真实场景的音频,支持99种语言转录,自动标记说话人切换和单词时间点,还能识别背景中的笑声等非语音事件,结构化数据输出方便开发者直接调用
📊 在多个国际测试中,Scribe 表现超越 Gemini、Whisper 等热门模型,尤其在意大利语、英语等97种小语种中错误率最低,让不同语言的语音识别更可靠。 开发者还可通过 API 接入获取带详细标记的JSON文本,普通用户也能在后台直接上传音视频生成格式化的文字稿 后续还会推出低延迟版本,适合实时场景使用
📝 在语音转文字的模型迭代下,我相信接下来会有更多的语音原生的产品出现