Mistral AI 与 NVIDIA 合作构建的先进的 12B 模型,具有 128k 上下文长度。

工具 12b

1.3M 7 个月前

Readme

Mistral NeMo 是一个由 NVIDIA 合作构建的 12B 模型。 Mistral NeMo 提供高达 128k 个 token 的大上下文窗口。 它的推理、世界知识和编码准确性在其规模类别中处于最先进水平。 由于它依赖于标准架构,因此 Mistral NeMo 易于使用,并且可以在任何使用 Mistral 7B 的系统中直接替换。

nemo-base-performance.png

参考

博客

Hugging Face