IIT马德拉斯学院启动创建AI与语言科技研究所

近期 IIT马德拉斯学院宣布:现已创办专攻印度语言技术发展的研究所。

在获得 Nilekani慈善机构资助的3.6亿印度卢比(约合452.091万美元)后,Nilekani Center AI4Bharat 于2022年7月28日正式启动。相比于其他语言如英语或中文,人工智能和语言技术发展在印度历来不备重视,此研究所旨在推动印度当地语言的技术发展。

Nilekani Center AI4Bharat以印度著名企业家Nandan Nilekani的名字命名。他指出:“‘数字印度Bhashini任务’现已启动,目标是以'协作式人工智能'为设计核心,用本地语言向市民提供所有的服务和信息。AI4Bharat将进一步促进和加速作为公共产品的印度语言人工智能任务,它与‘数字印度Bhashini 任务’的目标也是完全一致的。”

印度拥有400多种语言,是世界上语言最多样化的国家之一。然而,该国的本土语言在网络和科技领域的存在感相对较低。例如,尽管印度的母语人口在世界上排名第四,但印地语在互联网上的使用率却排在第35位。由于研究人员可用的数据集较为有限,近年来印度语言并没有从语言技术改进中获益良多。

然而,微软研究人员Anoop Kunchukuttan表示,Nilekani Center AI4Bharat将改变这一局面。虽然印度语言人工智能开发技术非常昂贵,但像Nilekani慈善机构这样的组织已强力支持创建开源人工智能行动。通过创建数据集和预训练模型,Nilekani Center AI4Bharat领导层希望私营领域的的初创公司和其他公司能够充分利用这项研究,推动印度语言的技术进步。

IIT马德拉斯学院计算机科学与工程系教授Mitesh Khapra称:“鉴于印度语言的丰富多样性和快速扩张的数字化世界,推动语言技术大力进步惠及大众十分重要。英语和一些语言的语言技术已明显提高,但印度语言在这一方面却相对滞后,Nilekani Center AI4Bharat将致力于弥补这一差距。”