谷歌发布数据集解决机翻技术中的性别偏差

据MultiLingual 网站报道,谷歌四名研究人员于6月下旬发布了一个名为“Wikipedia Translated Biographies”(维基百科传记翻译)的数据集,以期解决神经机器翻译(NMT)技术中的性别偏差。

该数据集包含维基百科上的人物(有标记性别)、摇滚乐队(标为不分性别)、运动队(标为不分性别)条目。谷歌称,该数据集已显著改善性别相关语言的翻译速度,但仍需继续改进。