腾讯公开文本翻译模型训练方法和文本翻译方法专利

近日,腾讯科技(深圳)有限公司公布“一种文本翻译模型的训练方法、文本翻译的方法及装置”专利,该专利于2020年11月13日申请,2021年1月22日公开,公开号为CN112257472A。

根据专利摘要,本申请公开了一种基于人工智能技术实现的文本翻译模型训练方法和文本翻译方法,具体涉及自然语言处理领域以及机器学习领域,文本翻译模型训练方法包括:获取第一文本以及第二文本;若第一文本以及第二文本满足文本对齐条件,则获取第一待训练平行文本;基于第一待训练平行文本所包括的第一句子,通过文本翻译模型获取第一翻译文本;根据第一翻译文本以及第二句子,对文本翻译模型进行训练。

申请实施例还提供了一种相关装置,能够将自动抓取到的文本进行对齐处理,从而生成用于模型训练的平行语料,由此实现模型的自我训练。(来源