MT 助力美移民法庭解决原住民语言障碍

MultiLingual最近一篇文章关注了机器翻译和小众语言移民之间的问题。对于使用西班牙语等语言资源丰富的难民而言,在美国寻求庇护都可能很复杂,更不用说那些使用小众语言的难民了。比如从中南美洲而来的人,虽然大多数会说西班牙语,但对一些来自乡村或偏远地区的人而言,美国相关法院没有适配的口译员。有时还需要跨州调配口译员来处理移民案件,而且可能还需要两名口译员合作,一名译员从土著语翻译为西班牙语,另一名译员从西班牙语翻译为英语。

为解决这一语言问题,来自南加州大学(USC)的研究小组开展了一个项目,为K’iche’土著语言使用者开发机器翻译,该土著语言在美国移民法院中需求量很大。目前研究人员正聚焦于文本机器翻译,进行英语和K’iche’语互译,帮助难民和律师更高效地进行案件沟通。而且他们计划未来几年内开发语音翻译系统。

K’iche’是美洲原住民语言之一,需求量较大,还有更多的土著语言未受到重视,如危地马拉和墨西哥原住民使用的土著语,可能只有不到200万人在使用,但它们都是美国移民法院常见的25中语言之一。

研究员表示,由于缺少文本数据,很难为这些语言开发高质量的机器翻译,目前K’iche’项目只有不到3万句语料数据,这一机器翻译系统无法完全解决现存问题,但至少能帮助减少一些语言障碍。