正式的译文——Alexa机器翻译的突出表现

近期,亚马逊的 Alexa 人工智能团队在国际口语机器翻译大会(IWSLT)中表现突出,该团队旨在开发一个机器翻译(MT)系统,该系统可以根据目标读者和语境将源语文本翻译为不同风格的译文。

其中,亚马逊的英译日作品质量表现明显高于其他作品。如俚语等高度依赖语境的文本,机器翻译很难做到将其翻译为语言风格更为正式的译文,而且不同语言对正式性的标准并不相同。

该公司在8月15日的一篇博文中写道:“机器翻译通常只提供一个版本的译文,并不考虑文本的适用范围及目标读者。”不考虑语境的机器翻译虽然在多数情况下能够满足需求,但要知道不同地区在语言使用上存在差异,这一点却被忽略了。”

在社会语言学领域,语言在风格上存在正式程度的差异。例如,第一个句子“我准备去商店,你想让我帮你买点什么吗?”就比第二个句子“我要去商店,你要什么?”更正式,前者可能会更适用于同事之间的交谈或一些正式的场合,而后者更符合朋友和家人之间的说话模式。

“机器自由选择的译本可能会在语言正式性的选择上出差错,对于不同文化背景的读者或在不同场景中,这种译文可能显得不合时宜甚至粗鲁。”亚马逊的博客文章写道。

通过对语言数据中的正式和非正式语言进行注释,再加上后期编辑技术,亚马逊有望创建一个更精准的机器翻译系统,使译文语言风格、语言正式程度更适配于当前语境及目标读者。在上述英译日作品中,该系统正确使用适当正式性语言风格的比率为95.5%,正确使用非正式性语言风格的比率则达到100%。