🪐 一个包含 135M、360M 和 1.7B 参数的小型模型系列,在新的高质量数据集上训练。

135m 360m 1.7b

80.1K 2 个月前

自述文件

SmolLM 是一个包含三种大小的 小型语言模型系列:135M、360M 和 1.7B 参数。

参考资料

博客文章

Hugging Face