Google Translate 在卢旺达语里翻车

一年前这个月,谷歌翻译新增卢旺达语,一种主要在卢旺达、布隆迪、刚果民主共和国、乌干达和坦桑尼亚使用的语言。而据新闻网站《The East African报道,尽管花了一年时间来完善,讲卢旺达语的人表示谷歌翻译的译文仍然很 "搞笑"。

报道称,谷歌翻译会在一些基本的短语上出问题,比如 "nagushatse ndakuburaa"——意思是 "我找你,但没找到",却被翻译为 "I married you, I missed you."(我娶过你,我错过你)。

对于免费的在线机器翻译(MT)系统来说,俚语也是个问题。据调查,互联网上只有不到0.01%的卢旺达语内容。机器翻译引擎依赖之前翻译过的和本地的语言材料来学习,如果某种语言的信息是有限的,那么它的机器译文质量也会受限。具体到卢旺达语的情况,《The East African》推测,问题的根源在于缺乏在线的源语言内容。