Meta 发力语音到语音翻译(S2ST)

2022年6月13日,Meta (之前的脸书)发表了一篇关于“语音到语音直接翻译(S2ST)方法”的帖子。S2ST消除了语音转换中的文本生成步骤,因此包括了无书写系统的语言。

通常,S2ST需要语音识别,然后是文本到文本的翻译,最后是文本到语音的转换。

Meta的多语言无文本S2ST方法在一种系统训练中使用系统处理的音频样本,该公司将其描述为“挖掘语音到语音数据”。它使用大量的语音样本,包括他们自己的Meta AI FAIR S2ST和多语言Vox Populi音频数据集。