Facebook AI 的语音翻译模型仍饱受质疑

语音翻译(S2ST)正在成为语言行业的一个热门词汇,S2ST完全绕过了转录音频和翻译转录文本的步骤,使其成为一个更直接的过程。S2ST的一个主要参与者便是谷歌,据报道,其2021年6月改版的Translatotron 2的表现优于其2019年的前身。

尽管如此,STT(语音转文本)仍有其市场份额和支持者,甚至在探索S2ST的公司中也是如此。2021年9月,视频会议平台Zoom公布了为通话提供实时、多语言转录和翻译的计划。

如今,自称为 "AI社区 "的Hugging Face——一家主要依靠志愿者来实验数据集和机器学习模型的软件公司——宣布发布与Facebook AI合作创建的最先进的语音翻译模型。这些模型建立在之前合作的另一个基础模型Wav2Vec 2.0的基础上,该模型于2020年12月推出,自2021年9月初以来下载超过29000次。

Hugging Face最初的推文链接到的模型——自2021年9月以来被下载了801次——该模型允许用户将英语语音转换成德语文本。然而,Facebook AI在其公告中表示,语音转文字模型还可以将英语翻译成阿拉伯语、加泰罗尼亚语和土耳其语;并链接到这四个模型。

但批评者迅速就指出了模型的缺点以及他们的怀疑。其中一人表示,模型“令人兴奋,但是距离阿拉伯语的高质量翻译还有很长的路要走。比如,提供的第二个en-ar示例明显不对”。

另一条充满讽刺意味的推文质问Facebook,“真的有进步了吗?”并附了一条2017年丑闻事件的报道链接,在该事件中,Facebook的错误机译曾导致一名无辜男子被捕。