改善机器翻译的秘诀

近日,翻译自动化用户协会(TAUS)的创始人Jaap van der Meer发文,就当前机器翻译(MT)领域面临的发展问题,从机器翻译开发者和机器翻译使用者(主要指译者)以及行业整体现状等角度进行分析并给出了针对性建议。文章最后,作者分享了TAUS探索的改善机器翻译的“三步走”秘诀,以期推动机器翻译的整体进步。

作者指出,当前机器发展面临诸多藩篱,如开发者过度关注大型机器翻译模型而忽视了数据工作,对于机器翻译定制化功能的发展“得过且过”;译者多转入译后编辑,但一定程度忽视了自身的能动性和行业洞察力;行业整体对机器翻译仍存有戒备,缺少创新性思维,仅把机器翻译当作整个翻译流程的附加物而忽视其发展潜力。

最后,作者分享了TAUS机器翻译“三步走”的秘诀:

  1. 评估:提高对机器翻译产出文本的质量要求。TAUS不满足于市面上基础翻译机器的产出质量,自己训练和定制不同的翻译引擎,并根据客户的需求筛选其中翻译质量最高的一款。
  2. 构建:TAUS利用自己的数据市场和客户资料库等在人类语言项目平台上构建特定的训练数据集。
  3. 翻译:生成改进版的机器翻译文本。经过以上两个步骤,产出的文本基本可以达到直接交付给客户,无需译后编辑的程度。