Sailor2 是为东南亚地区打造的多语言语言模型。提供 1B、8B 和 20B 参数规模的模型。

1b 8b 20b

462 两天前

自述文件

logo

Sailor2 是一项社区主导的倡议,旨在将最先进的多语言语言模型引入东南亚 (SEA)。我们的研究突出表明,对于生产用途,人们对 **8B 和 20B** 参数范围内的模型有强烈需求,同时对于诸如推测解码和研究目的等专业应用,也需要 **1B 模型**。这些模型在 **Apache 2.0 许可证** 下发布,提高了整个地区对先进语言技术的可访问性。

Sailor2 建立在强大的多语言模型 Qwen 2.5 的基础之上,并持续在 5000 亿个词元上进行预训练,以更好地支持 15 种语言的统一模型。这些语言包括英语、中文、缅甸语、宿务语、伊洛卡诺语、印尼语、爪哇语、高棉语、老挝语、马来语、巽他语、塔加拉族语、泰语、越南语和瓦雷语。通过满足对多样化、强大和易访问的语言模型日益增长的需求,Sailor2 致力于为东南亚地区服务不足的地区提供开放、包容和易访问的多语言大型语言模型。Sailor2 模型有三个尺寸:1B、8B 和 20B,它们分别扩展自 Qwen2.5 的基础模型 0.5B、7B 和 14B。