🪐 一系列小型模型,参数分别为 135M、360M 和 1.7B,在新高质量数据集上训练。

135m 360m 1.7b

188.4K 6 个月前

自述文件

SmolLM 是一系列小型语言模型,提供三种尺寸:135M、360M 和 1.7B 参数。

参考文献

博客文章

Hugging Face