🪐 一系列小型模型,包含 135M、360M 和 1.7B 参数,训练于新的高质量数据集。

135m 360m 1.7b

80.1K 2 个月前

自述文件

SmolLM 是一个包含三种尺寸的小型语言模型系列:135M、360M 和 1.7B 参数。

参考资料

博客文章

Hugging Face