BigScience 推出大型语言模型 BLOOM 开源计划

人工智能研究倡议组织 BigScience 近日推出一项大型语言模型(LLM)BLOOM 的开源计划,旨在推广语言模型技术,打造目前规模最大的语言模型。

文章指出,与其他语言模型不同,BLOOM 基本对任何个人和组织开放。此前 Meta 公司的 OPT-175B 是目前最具开源性的语言模型,但其仅对研究人员开放且不得商用。在发布会上,BLOOM 项目的开发者表示,“这只是个开始。工作室仍在对这个模型进行测验和修补,BLOOM 未来可期。”

2021年,Hugging Face发起 BigScience 倡议,旨在让语言模型“民主化”。这次项目开发者共有1000多名研究员,分布在60多个国家。BLOOM 除了对大批用户开源,也能够处理46种不同的语言和方言以及13种程序语言。这与主流的模型大不相同,后者一般每次只专注一种或两种语言(多数是英语和汉语)。

相关人员表示,BLOOM 能够提供规模最大的语言模型,也能够提高语言模型研究的关注度,促进相关研究的发展,这个开源项目意义重大。