一个由 Mistral AI 与 NVIDIA 合作开发的 120 亿参数模型,拥有 128k 上下文长度,性能处于同尺寸模型中的领先水平。

工具 12b

488.4K 3 个月前

自述文件

Mistral NeMo 是与 NVIDIA 合作开发的 120 亿参数模型。Mistral NeMo 提供高达 128k 个 token 的大上下文窗口。它的推理能力、世界知识和编码准确率在同尺寸模型中处于领先水平。由于它依赖于标准架构,Mistral NeMo 易于使用,可以轻松地替换任何使用 Mistral 7B 的系统。

nemo-base-performance.png

参考资料

博客

Hugging Face