🪐 一系列小型模型,参数量分别为 135M、360M 和 1.7B,使用新的高质量数据集进行训练。

135m 360m 1.7b

169K 5 months ago

自述文件

SmolLM 是一系列小型语言模型,有三种尺寸可供选择:参数量分别为 135M、360M 和 1.7B。

参考

博客文章

Hugging Face