ElevenLabs 发布转录模型 Scribe v2,支持 90 多种语言
ElevenLabs 推出 Scribe v2 转录模型 ,专注于离线批量转录和字幕制作场景。该模型在英语中的词错率约为 5% ,在印地语等 90 多种语言中低于 10% 。 Scribe v2 已集成至 ElevenLabs Studio,支持超过 10 小时 的大文件处理,并符合 GDPR 和 HIPAA 等合规要求。其功能包括支持自定义术语的 Keyterm Prompting 以及智能多说话人日志。 亮点特性 适用于大规模转录和字幕:Scribe v2 专为批量转录、字幕制作和标题生成设计,其稳定性和准确度比 Scribe v1 更高,能够处理长音频、停顿、语调变化和长时间静音。模型支持 90 多种语言,适用于跨语种场景。 关键词提示:提供关键词提示功能,用户可提供多达 100 个词语或短语,模型会根据上下文决定何时准确转录这些术语,适合技术文档、品牌名等。 内置实体检测支持 56 类实体的检测,并给出精确的时间戳,可用于识别个人信息、健康数据或支付信息。 多语言自动转录:无需手工分段即可处理单个文件中的多语言内容。 企业级功能提供智能说话人分离、精确的字级时间戳、动态音频标签...
